ik_llama.cpp/llama.cpp at b7d8f29a1c26af6f5216091d3736d6b22913188c

mirror of https://github.com/ikawrakow/ik_llama.cpp.git synced 2026-04-24 16:39:45 +00:00

Files

jiez e9f7c11748 llama : add gguf_remove_key + remove split meta during quantize (#6591 )

* Remove split metadata when quantize model shards

* Find metadata key by enum

* Correct loop range for gguf_remove_key and code format

* Free kv memory

---------

Co-authored-by: z5269887 <z5269887@unsw.edu.au>

2024-04-12 13:45:06 +03:00

657 KiB

Raw Blame History

View Raw

657 KiB Raw Blame History

657 KiB

Raw Blame History