cuda - 搜索 News

来自MSN2 天

DeepSeek 绕开 CUDA 垄断，针对英伟达 PTX 进行优化实现最大性能，英伟 ...

这风向，怎么一下子就变了，回答区真有多少是搞编程的？越底层的模拟跟适配，性能越强，我以为这是大家都知道的真理。我举个例子看大家能不能懂： Java 号称的跨平台，是构建了一个Java虚拟机，这个虚拟机本身作为一个平台。相对与计算机体系来说，这算是一个比较上层的指令。由于所有代码都基于 Java 虚拟机这个平台，它可以做到二进制跨平台。而 C/C++ ...

2 天

曝DeepSeek绕过CUDA！为适配中国国产GPU做准备跳出英伟达限制

这也说明DeepSeek拥有一些擅长写PTX语言的内部开发者。

3 天

绕过英伟达CUDA框架！DeepSeek或将兼容国产GPU，迎接AI技术新纪元

近年来，人工智能技术发展迅猛，尤其在大语言模型（Large Language Models, LLMs）领域，各大公司纷纷角逐。近日，外媒Tom’s Hardware报道，DeepSeek公司在其最新研发的大语言模型中，成功绕过了英伟达的CUDA框架 ...

腾讯网2 天

DeepSeek绕过CUDA！为适配中国国产GPU做准备

2月5日消息，DeepSeek全球爆火，再一次引发外界对GPU算力限制话题的关注。据报道，DeepSeek开发的大语言模型绕过了英伟达的CUDA框架，正为未来兼容国产GPU芯片做准备。众所周知，英伟达的CUDA（Compute Unified ...

10 天

“DeepSeek甚至绕过了CUDA”，论文细节再引热议，工程师灵魂提问 ...

DeepSeek做了PTX级别的优化不意味着完全脱离了CUDA生态，但确实代表他们有优化其他GPU的能力。来自Mirae Asset Securities ...

2 天

DeepSeek积极适配国产GPU，绕开英伟达CUDA

DeepSeek自上线以来便以迅猛的速度在全球范围内获得了广泛关注，其日活用户数在短时间内突破2000万，成为全球增速最快的AI应用之一。作为一家中国人工智能初创企业，外部算力 ...

6 天

绕开CUDA！DeepSeek准备适配国产GPU

DeepSeek真的绕过了CUDA，那这件事意味着什么？对此，北京航空航天大学黄雷副教授接受采访时表示，绕过CUDA，可以直接根据GPU的驱动函数做一些新的开发，从而实现更加细粒度的操作。譬如DeepSeek在多节点通信时绕过了 CUDA 直接使用 ...

8 天

“DeepSeek甚至绕过了CUDA”，工程师灵魂提问：英伟达护城河还在吗？

来自 Mirae Asset Securities Research （韩国未来资产证券）的分析称，V3的硬件效率之所以能比Meta等高出10倍，可以总结为“他们从头开始重建了一切”。在使用英伟达的H800 ...

中华网7 天

业内：DeepSeek或准备适配国产GPU 绕过CUDA展现工程实力

尽管春节假期已经过半，但“来自东方的神秘力量的 DeepSeek”仍在全球范围内引起热议。各路业内人士从不同角度分析 DeepSeek 的模型和技术。韩国 Mirae Asset Securities Research 的一名分析师在 X ...

腾讯网6 天

绕开CUDA，DeepSeek为国产GPU“破局”？

对于长期苦于CUDA生态限制的AMD以及国内的GPU公司来说，这无疑是一个绝佳的机会。事实上，在此前DeepSeek本地部署的文档中，已经明确支持华为昇腾芯片。可以预见的是，华为等国内GPU公司针对DeepSeek训练的硬件升级已经在紧锣密鼓地攻克中 ...

10 天

“DeepSeek 甚至绕过了英伟达 CUDA”，论文细节再引热议

来自 Mirae Asset Securities Research （韩国未来资产证券）的分析称，V3 的硬件效率之所以能比 Meta 等高出 10 倍，可以总结为“他们从头开始重建了一切”。在使用英伟达的 H800 GPU 训练 DeepSeek-V3 时，他们针对自己的需求把 132 个流式多处理器（SMs）中的 20 个修改成负责服务器间的通信，而不是计算任务。

3 天

DeepSeek积极筹备适配国产GPU，绕开英伟达CUDA

DeepSeek自上线以来便以迅猛的速度在全球范围内获得了广泛关注，其日活用户数在短时间内突破2000万，成为全球增速最快的AI应用之一。作为一家中国人工智能初创企业，外部算力（主要是GPU）限制逐渐成为制约其进一步发展的瓶颈，如今他们正致力于通过优 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果