FrontierMath 是一个分量极重的高级数学推理能力评估基准。它由 Epoch AI 联手 60 多位顶级数学家共同打造,参与者包括多位菲尔兹奖得主和国际数学奥林匹克竞赛的资深命题人。
【环球网科技综合报道】2025年1月20日,据路透社消息,近日,人工智能公司OpenAI宣布,其新推理AI模型“o3 mini”的版本已经完成,并计划在几周内正式推出。OpenAI的首席执行官Sam Altman在社交媒体平台上发文透露了这一消息。
在社交媒体上,OpenAI 的人工智能推理专家诺姆・布朗(Noam Brown)表示,目前存在大量关于人工智能的 “模糊炒作”,这引起了他的关注。尽管他承认人工智能领域的进步带来了乐观的前景,但他也指出仍有许多研究问题亟待解决,并强调 OpenAI ...
OpenAI 也完全支持我们维护一个单独的、未公开保留的数据集的决定,这是一种额外的保护措施,可以防止过度拟合并确保准确的进度测量。自最初设计之时起,FrontierMath 就被定位并展示为一种评估工具,我们相信这些安排反映了这一目的。
如果不看OpenAI这场风波,FrontierMath是一套含金量非常高的测试基准,由全球六十余位数学家联手命题,包括教授、IMO命题人、菲尔兹奖获得者,其中就有大牛陶哲轩等人。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、MiniMax海螺语音全球同 ...
o1/o3带火的推理计算Scaling,原来谷歌早在今年8月就曾探讨过。来自斯坦福、牛津以及谷歌DeepMind的团队提出通过重复采样来扩展推理计算量——结果在编码任务中将性能最多提高40%。不过也有网友指出了背后的局限性。
OpenAI正在内部测试其全新「Operator」功能,标志着AI即将从被动助手转变为主动解决问题的超级智能体。预计这些智能体能独立完成从软件开发到复杂财务分析等任务,革命性地替代人类在多个领域的工作。
1 月 20 日消息,科技媒体 TechCrunch 昨日(1 月 19 日)发布博文,报道称 Epoch AI 因未及时披露 OpenAI 的资助而引发争议,其开发的数学基准测试 FrontierMath 的客观性受到质疑。
OpenAI,有大事发生!最近各种爆料频出,比如OpenAI已经跨过「递归自我改进」临界点,o4、o5已经能自动化AI研发,甚至OpenAI已经研发出GPT-5?OpenAI员工如潮水般爆料,疯狂暗示内部已开发出ASI。
IT之家 1 月 20 日消息,今日,OpenAI 首席执行官山姆・阿尔特曼(Sam Altman)通过社交媒体平台 X 澄清,尽管公司长期致力于开发比人类更聪明的通用人工智能(AGI),但目前尚未实现这一目标。这一声明旨在回应近期关于 OpenAI ...
外媒称,OpenAI开发出了首款用于「长寿」的AI模型 ——GPT-4b micro,预计将人类寿命延长10年。 与其他预测蛋白质结构的AI不同,GPT-4b micro更像是一位「蛋白质社交专家」,能够精准预测不同蛋白质之间的互动方式。