训练生成式AI模型本身已是一项成本高昂、能耗巨大的工作。随着超大规模数据中心和前沿研究机构竞相扩展边缘推理与智能体AI能力,GPU的部署正变得愈加复杂,尤其是在内存层面。
快科技5月24日消息,据报道,为解决长期困扰AI芯片的“内存墙”问题,全球内存与封装产业正评估一种全新架构:将GPU与HBM拆分开来独立封装,再通过光学互联技术桥接数据传输。
IT之家 8 月 15 日消息,英特尔本月初发布了 Arc 显卡驱动 32.0.101.6987,为部分酷睿 Ultra 处理器集成的 Arc 核显带来了一项功能 ——Shared GPU Memory Override(共享 GPU 内存覆盖)。 英特尔在发行说明指出:“英特尔图形软件现支持在 Windows 10/11 系统上,为特定英特尔酷 ...
Hello folks,我是 Luga,今天我们继续来聊一下人工智能生态相关技术 - 用于加速构建 AI 核心算力的 GPU 硬件技术。 随着人工智能、渲染、仿真技术以及支持高动态范围(HDR)的 4K 显示器逐渐进入主流市场,GPU(图形处理单元)的内存需求也在迅速增长 ...
英伟达推出Rubin CPX GPU,拆分推理阶段效率提升6.5倍,2026年出货。 通过发布Rubin CPX,英伟达将推理计算过程拆分为上下文与生成两个阶段,分别由两块GPU运算,效率最高可达现有旗舰机架的6.5倍。 全球人工智能算力芯片龙头英伟达周二宣布,推出专为长上下文工作负载设计的专用GPU Rubin CPX,用于翻倍提升当前AI推理运算的工作效率,特别是编程、视频生成等需要超长上下文 ...