Set kv cache size to f16 by default

abetlen · abetlen · commit 6e298d8fca1e · 2023-04-14T22:21:19.000-04:00
diff --git a/llama_cpp/llama.py b/llama_cpp/llama.py
@@ -21,7 +21,7 @@ def __init__(
         n_ctx: int = 512,
         n_parts: int = -1,
         seed: int = 1337,
-        f16_kv: bool = False,
+        f16_kv: bool = True,
         logits_all: bool = False,
         vocab_only: bool = False,
         use_mmap: bool = True,