NVIDIA · MrGeva · Aug 27, 2025 · Aug 28, 2025 · Aug 28, 2025 · coderabbitai
@@ -75,7 +75,7 @@ def parse_kv_cache_metrics(log_output: str, free_mem_ratio: float = 0.8):
 
     # Simple patterns based on actual log format
     patterns = {
-        "current_cache_size": r"Current cache size:\s*(\d+)",
+        "current_cache_size": r"Current cache size \(MB\):\s*(\d+)",
         "free_mem_pre_mb": r"Free memory before forward pass \(MB\):\s*(\d+)",
         "free_mem_post_mb": r"Free memory after forward pass \(MB\):\s*(\d+)",
     }
@@ -89,6 +89,10 @@ def parse_kv_cache_metrics(log_output: str, free_mem_ratio: float = 0.8):
             print(f"  ✅ Found {metric_name}: {value}")
         else:
             print(f"  ❌ Could not find {metric_name}")
+    try:
+        metrics["current_cache_size"] = metrics["current_cache_size"] * 1024 * 1024
+    except KeyError:
+        print("  ❌ Could not find current_cache_size")
 
     # Calculate new_cache_size using the same formula as in resize_kv_cache
     # new_cache_size = free_mem_post * 1024 * 1024 * free_mem_ratio + current_cache_size