在过去的三个月里,中国大模型创业公司DeepSeek和AI应用创业公司Manus如同一股狂潮,激荡着全球AI市场,快速改变着硅谷、阿里巴巴等巨头们的既定发展路径。根据DeepSeek的研究,投入2048张英伟达H800芯片以及558万美元的训练成本,他们研发的DeepSeek-V3已与OpenAI的明星模型GPT-4o相媲美,令人赞叹不已。
官方介绍,QwQ-32B 模型仅有 320 亿参数,然而其性能却能与拥有 6710 亿参数的满血版 DeepSeek R1 相媲美。尽管阿里云尚未发布完整的技术报告,但官方数据足以展现其强大实力。在编程竞赛(LiveCodeBench)和美国数学竞赛 ...
Hace poco, la empresa china de inteligencia artificial (IA) DeepSeek causó sensación en el mundo con el lanzamiento de su ...
1 天
什么值得买社区频道 on MSN阿里开源的Android手机离线LLM应用,完全释放手机中的AI潜力!随着 AI 技术的飞速发展,越来越多的应用和工具开始尝试将 AI 任务带到移动端。然而,尽管许多智能应用可以运行在手机上,通常都需要依赖云端计算,导 ...
1 天
知乎 on MSN拥有Deepseek、可灵AI等现象级国产大模型,中国AI资产是否被低估?2024年底我在推特上看到这么一条推文,时间是恰逢DeepSeek声名鹊起的时刻,但这个博主并没有一味的提DeepSeek,而是是说中国的AI军团不只是DeepSeek,还有一大堆的干将。
由于中国AI企业DeepSeek开发出了高性能的低成本大语言模型,2025年1月下旬,英伟达(NVIDIA)等美国高科技公司的股价暴跌。“DeepSeek冲击”这一说法,可能模仿了前苏联在1957年成功发射全世界第一颗人造卫星“斯普特尼克1号(Spu ...
Qwen 团队是中国电商巨头阿里巴巴的一个部门,专注于开发其不断扩展的开源 Qwen 大语言模型(LLM)系列。该团队推出了 QwQ-32B,这是一种新的 320 亿参数推理模型,旨在通过强化学习(RL)提高复杂问题解决任务的性能。
阿里巴巴在香港的股价一度飙升8.2%,为近两周来的最大盘中涨幅,推动中国科技股指数上涨约5%,有望创下自2021年以来的最强收盘价。在中国大陆,拥有人工智能代理产品的焦点科技股份有限公司股价涨停,涨幅达10%。包括软件制造商赛意信息科技股份有限公司在 ...
在初始阶段专门针对数学和编码任务扩展强化学习,没有依赖传统的奖励模型,而是使用一个数学问题准确性验证器来确保最终解决方案的正确性,并使用一个代码执行服务器来评估生成的代码是否成功通过预定义的测试用例。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果