ik_llama.cpp/examples/llama-bench/llama-bench.cpp at 3208660d20db57e27ea98f4773bb7c3ad210c4e6

mirror of https://github.com/ikawrakow/ik_llama.cpp.git synced 2026-03-08 04:50:13 +00:00

Files

Kawrakow d239dabcc6 Graph parallel for Qwen-3.5-MoE (#1347 )

* Graph parallel for Qwen3.5-MoE

* Add --max-gpu to llama-bench

* Fix graph reuse when not all GPUs participate in self-attention

2026-03-02 07:48:43 +01:00

View Raw