英伟达重磅推出专为长语境推理设计的全新Rubin CPX GPU,承诺为客户带来前所未有的投资回报率! 9月9日,花旗在最新研报中称,英伟达在AI基础设施峰会上推出专为长语境推理设计的全新Rubin CPX GPU,承诺为客户带来前所未有的投资回报率——每投入1亿美元可 ...
花旗称,英伟达推出专为长语境推理设计的Rubin CPX GPU,承诺为客户带来50倍投资回报率,远超GB200 NVL72的10倍回报率。该芯片在注意力机制方面性能较GB300 NVL72提升3倍。英伟达GB300 NVL72系统在MLPerf推理基准测试中创下新纪录。这些发布表明推理时代已经到来。
本文来自“HotChips 2025合集”,本文所有资料都已上传至“智能计算芯知识”星球对应的AI+芯片技术峰会专栏。 下载链接: 105+份GPU技术报告合集 100+份AI Agent技术报告合集 清华大学:DeepSeek报告13部曲合集 浙江大学:DeepSeek技术20篇(合集) 330+份DeepSeek技术报告 ...
英伟达推新产品的速度,是很快的,特别是现在需要不断证明自己领先的位置。 英伟达Rubin CPX 是 GPU 设计新的思路,采用了解耦推理的方式,把长上下文处理和生成任务拆分开来,还搭配大容量 GDDR7 显存打造了新的 GPU。 这种设计考虑到了算力和内存需求的差异 ...
全球AI算力芯片领域的领军者英伟达近日发布了一款专为长上下文场景设计的GPU——Rubin CPX。这款芯片旨在显著提升AI推理效率,尤其适用于编程、视频生成等需要处理超长上下文窗口的应用领域。 英伟达首席执行官黄仁勋指出,Rubin CPX是全球首款专为处理数 ...
英伟达今日正式发布面向大规模上下文处理的专用GPU——Rubin CPX,这款硬件专为高负载任务设计,涵盖生成视频、大规模代码处理等需要处理海量上下文信息的场景。通过将AI提示理解与响应生成环节解耦,英伟达宣称该产品可显著提升客户的工作效率。 作为Vera ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果