LLM Capacity Planner 是一个面向大模型私有化部署的容量规划工具,用于模型选型、显存估算、KV Cache 计算、上下文/并发评估 ...