Kernel API - 搜索 News

InfoQ中国 on MSN

从龙蜥孵化到上游贡献：SGLang tracing 与 AI agent 调优实践

编者按：大模型推理的性能瓶颈往往隐藏在 Prefill 与 Decode 的交错调度、多卡间的数据同步、以及 Continuous Batch ...

Tencent News

OpenAI发布首款芯片，只花了九个月

文章转载于APPSO就在刚刚，OpenAI 史上首颗芯片诞生了。名字相当火辣，叫 Jalapeño，墨西哥辣椒（doge）。它是 OpenAI 的第一颗「Intelligence ...

红板报 on MSN

英伟达MoE新开源：一行import，微调加速3.7倍

兼容HuggingFace Transformers的API ...

GitHub

xkatld/lxdapi-web-server

这是一个完整的 LXD 容器管理解决方案，包含高性能 Go 后端服务和多种前端插件，为主机商提供完整的 LXD 容器销售与管理功能。详细的安装和使用文档，请参考项目 Wiki。联系需要加群讨论的可以先加微信fsynetcom记得备注。

7 天

AI芯片战场的竞争，正愈演愈烈。 6月25日，三条消息集中出现。英伟达的2026年股东大会上，公司创始人兼CEO黄仁勋继续强化AI基建、AI工厂和“Token经济”的叙事；OpenAI联手博通，发布首款自研AI推理芯片Jalapeño，试图把模型、产品和底层硬件更紧密地绑定；高通发布了数据中心整体战略，推出Dragonfly数据中心产品组合，并拿下Meta、微软等客户。三家巨头的不同布局，背后却 ...

Tencent News

微软 Foundry 新增生产级智能体运行时、工具链与管控能力

微软在旧金山举办的 Build 2026 大会上正式发布 Foundry 的多项新功能。Nick Brady 在一篇博客文章中将 Foundry 称为“AI 智能体从实验落地到生产系统的平台”，他表示此次发布为开发者带来了生产级智能体所需的“运行时、工具、记忆、场景对齐、模型、可观测性与管控能力”，而不仅仅是新的模型端点。 Foundry 是微软打造的“AI 应用与智能体工厂”，一个统一的 A ...

雷峰网

MiniMax M3 实测：第一流的模型，已经对执行层动手了

导语：M3 舞剑，意在 Claude Code。雷峰网讯一款开源模型，能否同时拥有顶级编程能力、超长上下文理解能力和原生多模态能力？这几乎就是 Agent 的全部意涵。而我们提出这个问题，是因为从 OpenClaw ...

中关村在线台式电脑频道

小米MiMo-V2.5-Pro-UltraSpeed正式发布 1T参数模型

据悉，UltraSpeed模式采用限时开放、申请制体验。 API同步上线，定价为MiMo-V2.5-Pro的3倍，同时提供输出速度约10倍的提升（仅支持API体验，不支持TokenPlan）。由于高速推理资源供给有限，本次体验时间仅限 2026年6月9日至6月23日23:59。

21IC电子网

一套完整的NPU机器人视觉伺服系统——米尔RK3576

[导读]项目背景：随着嵌入式 AI 技术的快速发展，边缘计算设备的算力不断提升，使得在低功耗、低成本的嵌入式平台上部署深度学习模型成为可能。本项目基于瑞芯微 RK3576 芯片的 NPU（神经网络处理单元）加速能力，结合 YOLOv5 目标检测模型，实现了一套完整的机器人视觉伺服控制系统。本项目是一个学习实践项目，旨在深入理解以下技术：项目背景：随着嵌入式AI 技术的快速发展，边缘计算设备的算力 ...

18 天

全网首份指令级拆解：看华为昇腾 950DT 芯片如何撬动 DeepSeek 75%降价 ...

距离正式上线华为云还有两个月，华为的最新 AI 芯片昇腾 950DT，已经被提前放到了显微镜下。近日，华尔街知名半导体研究机构 SemiAnalysis 已经率先拿到样机，围绕 950 系列运行 DeepSeek V4 的推理链路进行了 Trace ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果

从龙蜥孵化到上游贡献：SGLang tracing 与 AI agent 调优实践

OpenAI发布首款芯片，只花了九个月

英伟达MoE新开源：一行import，微调加速3.7倍

xkatld/lxdapi-web-server

黄仁勋回应AI泡沫：AI基建是人类历史上最大规模基建

微软 Foundry 新增生产级智能体运行时、工具链与管控能力

MiniMax M3 实测：第一流的模型，已经对执行层动手了

最新Linux台式电脑性价比推荐剪辑师从粗剪到调色全链路支持

小米MiMo-V2.5-Pro-UltraSpeed正式发布 1T参数模型

一套完整的NPU机器人视觉伺服系统——米尔RK3576

全网首份指令级拆解：看华为昇腾 950DT 芯片如何撬动 DeepSeek 75%降价 ...

从龙蜥孵化到上游贡献：SGLang tracing 与 AI agent 调优实践

OpenAI发布首款芯片，只花了九个月

英伟达MoE新开源：一行import，微调加速3.7倍

xkatld/lxdapi-web-server

黄仁勋回应AI泡沫：AI基建是人类历史上最大规模基建

微软 Foundry 新增生产级智能体运行时、工具链与管控能力

MiniMax M3 实测：第一流的模型，已经对执行层动手了

最新Linux台式电脑性价比推荐 剪辑师从粗剪到调色全链路支持

小米MiMo-V2.5-Pro-UltraSpeed正式发布 1T参数模型

一套完整的NPU机器人视觉伺服系统——米尔RK3576

全网首份指令级拆解：看华为昇腾 950DT 芯片如何撬动 DeepSeek 75%降价 ...

最新Linux台式电脑性价比推荐剪辑师从粗剪到调色全链路支持