DeepSeek真的绕过了CUDA,那这件事意味着什么?对此,北京航空航天大学黄雷副教授接受采访时表示,绕过CUDA,可以直接根据GPU的驱动函数做一些新的开发,从而实现更加细粒度的操作。 譬如DeepSeek在多节点通信时绕过了 CUDA 直接使用 PTX(Parallel Thread Execution),其最多只能实现以算法的方式来高效利用硬件层面的加速。
关于 DeepSeek 技术创新的讨论也非常多。很多人认为,DeepSeek 在硬件受限的条件下被逼走出了一条不同于 OpenAI 等狂堆算力的道路,用一系列技术创新来减少模型对算力的需求,同时获得性能提升。
快科技2月2日消息,最快的N卡和最快的A卡跑DeepSeek谁更快?最新消息显示,RTX 5090在DeepSeek R上的推理性能比AMD的 RX 7900 XTX快得多,性能至少翻了一倍。 测试显示,在多个DeepSeek R1型号中,RTX 5090明显领先于RX 7900 XTX,也比RTX 4090快了不少。 在Distill Qwen 7b和Distill Llama 8b模型中,该R ...
关于 DeepSeek 技术创新的讨论也非常多。很多人认为,DeepSeek 在硬件受限的条件下被逼走出了一条不同于 OpenAI 等狂堆算力的道路,用一系列技术创新来减少模型对算力的需求,同时获得性能提升。
最近,Gmail 用户面临着一场前所未有的网络安全危机。根据报道,这种攻击被认为是迄今为止最复杂的网络钓鱼攻击,甚至让一些知名的安全专家也差点中招。攻击者利用人工智能技术,伪装成 Google ...
OpenAI全力反扑了,也在开源这件事上开始反思了。在1月最后一天,OpenAI发布了免费版的o3 mini,技术报告显示它的低配版超过了o1 mini,中高配版本的各项基准测试,基本上都超过了o1。OpenAI踩着它在去年底定下的Deadline,如期发布了o3 mini,并没有完全反映出已经改变了的AI竞争游戏规则。o3 mini的价格相比o1 ...
在2025年的春节前夕,大模型领域迎来了一场意想不到的“狂欢”。DeepSeek,这家初出茅庐的大模型公司,以一记重拳震撼了整个AI界——它正式开源了DeepSeek-R1,这款模型在数学、代码及自然语言推理等方面,与OpenAI的o1正式版并驾齐驱。
1.大道求简。 中国古代的道家文化有个词叫大道至简,这原本并没有写在老子的《道德经》里,是后人概括提炼出来,而与道家文化相吻合。 道家探索的“终极奥义”,追求简单朴素的表达,不要绕弯,不要复杂,这是探索的出发点。
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com本文的作者是李锡涵(Xihan ...
比如龙年春晚,李白的AI虚拟形象出现在西安分会场的上空,一曲将进酒,上演了一场跨越古今的时空对话。而一只突然出现的圆滚滚的3D卡通AI虚拟大熊猫,和现场明星一同打起了八段锦,萌翻全场。
DeepSeek-R1的推出,不仅是中国AI领域技术上的大突破,更是全球科技竞争中的一次重要转折点,而美国AI相关股价大跌,就是它打破美国在AI绝对领先的最现实的印证。美国的科技霸权主义或可暂时阻碍中国的发展,但中国AI企业凭借自主创新和技术突破,成功开辟了一条具有中国特色的发展道路,不仅是中国强国建设、民族复兴的康庄大道,也是中国谋求人类进步、世界大同的必由之路。香港走在中国式现代化道路的前端, ...