As a consultant, I spend a lot of time in PowerPoint. Data doesn’t drive decisions, narrative does, and, love it or hate it, ...
所谓“最好”,取决于你的具体用途和硬件条件。当前值得重点关注的模型包括:适合代码和系统工程的 GLM-5,适合数学和推理的 DeepSeek-V3.2 Speciale,以及适合自主 Agent 工作流的 Kimi K2.5 或 MiMo-V2-Flash。 现在最好的开源 LLM 是哪个? 没有一个模型能适合所有场景。
这项由美团、香港大学、香港中文大学、中国科学院自动化研究所、南京大学、哈尔滨工业大学、澳大利亚阿德莱德大学机器学习研究所、慕尼黑路德维希马克西米利安大学、中国科学技术大学以及伦敦玛丽女王大学等多所机构联合完成的研究,以综述论文形式发表于2026年,论文编号为arXiv:2606.15932,感兴趣的读者可通过该编号查询完整原文。