此前行业盲目推崇 “Token 最大化”,不计成本使用旗舰大模型推高企业开支,如今高昂推理成本倒逼企业转向务实的小模型经济学。核心思路是任务分层、多模型混合调度,简单需求交付平价模型,复杂推理启用高端模型,大幅压缩算力支出。DeepSeek ...