ik_llama.cpp/ggml-cuda/common.cuh at ba055973159dfd0c77f372d33e6ebbbdda97866a

mirror of https://github.com/ikawrakow/ik_llama.cpp.git synced 2026-04-27 01:49:28 +00:00

Files

Johannes Gäßler 8c1fed631e CUDA: faster q2_K, q3_K MMQ + int8 tensor cores (#7921 )

* CUDA: faster q2_K, q3_K MMQ + int8 tensor cores

* try CI fix

* try CI fix

* try CI fix

* fix data race

* rever q2_K precision related changes

2024-06-14 18:41:49 +02:00

View Raw