ik_llama.cpp/llama.cpp at b97ca431db35ec96a339a721acb1219c1dd78bed

mirror of https://github.com/ikawrakow/ik_llama.cpp.git synced 2026-03-12 06:50:08 +00:00

Files

Johannes Gäßler 16b9cd1939 Convert vector to f16 for dequantize mul mat vec (#1913 )

* Convert vector to f16 for dmmv

* compile option

* Added compilation option description to README

* Changed cmake CUDA_ARCHITECTURES from "OFF" to "native"

2023-06-19 10:23:56 +02:00

122 KiB

Raw Blame History

View Raw

122 KiB Raw Blame History

122 KiB

Raw Blame History