普林斯顿大学最近搞了个CEO-Bench,让AI运营一家虚拟SaaS初创,为期500天。 谁曾想,14位硅基CEO上场,只有4个保住了本金。 至少现在,还是个大问号。 当然,也有一些能力突出的模型,已经展现出潜力了—— Fable 5,500天到账4715万美元,全世界最强「AI老板」。 人工智能CEO大赛 在正式开始观看本场「AI翻车」名场面前,先讲讲游戏规则。 启动状态:本金100万美金,零客 ...
研究团队提出了一种无训练、即插即用的解码策略——Confident Decoding(置信解码)。 传统认知默认:随着网络深度单调递增,思考结果也会变得更准确。 各类开源自回归大语言模型(LLM)的生成,也总是从最后一层输出。 然而,来自Qwen团队、清华大学、南洋 ...