在过去的三个月里,中国大模型创业公司DeepSeek和AI应用创业公司Manus如同一股狂潮,激荡着全球AI市场,快速改变着硅谷、阿里巴巴等巨头们的既定发展路径。根据DeepSeek的研究,投入2048张英伟达H800芯片以及558万美元的训练成本,他们研发的DeepSeek-V3已与OpenAI的明星模型GPT-4o相媲美,令人赞叹不已。
官方介绍,QwQ-32B 模型仅有 320 亿参数,然而其性能却能与拥有 6710 亿参数的满血版 DeepSeek R1 相媲美。尽管阿里云尚未发布完整的技术报告,但官方数据足以展现其强大实力。在编程竞赛(LiveCodeBench)和美国数学竞赛 ...
Hace poco, la empresa china de inteligencia artificial (IA) DeepSeek causó sensación en el mundo con el lanzamiento de su ...
随着 AI 技术的飞速发展,越来越多的应用和工具开始尝试将 AI 任务带到移动端。然而,尽管许多智能应用可以运行在手机上,通常都需要依赖云端计算,导 ...
2024年底我在推特上看到这么一条推文,时间是恰逢DeepSeek声名鹊起的时刻,但这个博主并没有一味的提DeepSeek,而是是说中国的AI军团不只是DeepSeek,还有一大堆的干将。
由于中国AI企业DeepSeek开发出了高性能的低成本大语言模型,2025年1月下旬,英伟达(NVIDIA)等美国高科技公司的股价暴跌。“DeepSeek冲击”这一说法,可能模仿了前苏联在1957年成功发射全世界第一颗人造卫星“斯普特尼克1号(Spu ...
Qwen 团队是中国电商巨头阿里巴巴的一个部门,专注于开发其不断扩展的开源 Qwen 大语言模型(LLM)系列。该团队推出了 QwQ-32B,这是一种新的 320 亿参数推理模型,旨在通过强化学习(RL)提高复杂问题解决任务的性能。
阿里巴巴在香港的股价一度飙升8.2%,为近两周来的最大盘中涨幅,推动中国科技股指数上涨约5%,有望创下自2021年以来的最强收盘价。在中国大陆,拥有人工智能代理产品的焦点科技股份有限公司股价涨停,涨幅达10%。包括软件制造商赛意信息科技股份有限公司在 ...
DeepSeek今年1月底推出AI模型R1,其以极低成本达到与OpenAI o1模型一样的表现,让外界相当惊艷,如今DeepSeek又有大动作,日前宣布举行「开源周」,共开源5个代码库(repository),以完全透明的方式分享公司新进展 ...
随着美国关税政策的不确定性增加,台湾外贸企业正面临挑战。为应对此一局势,B2B跨境外贸平台Alibaba.com(阿里巴巴国际站)27日在台北宣布三大商家扶持计画,包括结合AI技术与在地资源在台湾五地成立「五大智能外贸育成区域中心」、上线全新「台湾汽 ...
IT之家2 月 25 日消息,联想集团在今晚的 YOGA AIPC 新品品鉴活动上宣布,通过深度融合 DeepSeek 端侧大模型,联想天禧个人智能体系统(天禧 AS)迎来升级,并宣布成为“全球首家在 AI PC 端侧本地部署和运行 DeepSeek 大模型的 AI 终端品牌”。 联想一同推出了部署 ...
琼海党政电子办公系统已正式上线DeepSeek大模型AI智能助手。目前,琼海市党政电子办公系统DeepSeek大模型AI智能助手具备智能写作、文件速读、智能校审等多个功能,琼海干部可通过琼海市党政电子办公系统进行使用,DeepSeek大模型AI智能助手能快速理解使用者 ...