点击上方“Deephub Imba”,关注公众号,好文章不错过 !2025年LLM领域有个有意思的趋势:与其继续卷模型训练,不如在推理阶段多花点功夫。这就是所谓的推理时计算(Test-Time / Inference-Time ...
2026年2月5日,AI行业发生了一件载入史册的事。OpenAI和Anthropic在相隔不到20分钟的时间内,分别发布了GPT-5.3-Codex和Claude Opus 4.6——两个代表完全不同进化方向的顶级模型。一个学会了"自我繁殖": ...
第一,智能体部署的性价比超高:仅激活 30 亿参数,即可实现媲美激活参数量高出 10–20 倍模型的性能,为智能体部署提供极高的性价比。(达到了Sonnet4.5的水平。) 其次,长程推理、工具调用能力出色。通过精心设计的训练方案,该模型在长程推理、复杂工具调用以及执行失败后的恢复方面表现出色,确保在动态编码任务中具备稳健性能。 第三,集成方式也很灵活。适配多种 CLI ...