近日,OpenAI 研究科学家 Leo Gao 在接受《麻省理工科技评论》的独家采访时透露,他们构建了一种全新的实验性大型语言模型——权重稀疏 Transformer(weight-sparse transformer)。它的性能远不及 GPT-5 ...
从资本市场视角看,Gemini 3的发布同样增强投资信心。谷歌DeepMind首席执行官戴密斯·哈萨比斯在发布前强调,尽管私募市场存在泡沫风险,但谷歌拥有坚实的营收基础——其云业务季度销售额已达150亿美元,并将公司现阶段的投入状态形容为“全情投入” ...
在如今的 AI 领域,大多数大语言模型在很大程度上仍以「黑箱」方式工作,即使是专业的研究者也难以完全理解它们的内部计算过程。因此,提升模型的透明度有助于分析和解释大语言模型产生幻觉、行为不稳定或在关键场景做出不可靠判断的潜在原因。
人工智能领域近期迎来一项重要进展,研究人员在破解大型神经网络内部运作机制方面取得突破性成果。通过构建具有特殊结构的神经网络模型,科学家们为理解复杂人工智能系统的决策过程提供了全新视角,这项研究有望推动更安全可靠的人工智能技术应用。
简单来说,在这项研究中,OpenAI研究员们的核心思路是:训练神经元连接少、但神经元数量多的稀疏模型,让神经网络变得简单,也更容易理解。
过去两个月,Google 几乎复刻了 Sam Altman 的营销手法,从 Gemini 著名宣传委员 Logan Kilpatrick 到 CEO 皮查伊,内部人员不断在社交平台打哑谜,推波助澜,将外界对 Gemini 3 的期待值不断拔高。
过去几个月,大型人工智能公司在印度动作频频。首先是 Perplexity AI 公司与印度第二大移动网络运营商 Airtel 合作,在印度免费提供其高级 Pro 版本。他们免费赠送了一份价值约 17000 卢比(约合人民币 1365 ...
过去两个月,Google 几乎复刻了 Sam Altman 的营销手法,从 Gemini 著名宣传委员 Logan Kilpatrick 到 CEO 皮查伊,内部人员频繁在社交平台打哑谜,推波助澜,将外界对 Gemini 3 的期待值不断拔高。
OpenAI指出,当前ChatGPT背后的语言模型结构复杂,其具体工作原理尚未被完全掌握。此次研究就是为了缩小这一认知差距。研究人员提出的核心思路是训练稀疏模型,这类模型神经元连接少,但神经元数量多,通过简化神经网络结构,使其更易理解。
01.“2025是智能体元年”?卡帕西泼冷水:距离真正“能干活”还有十年 Dwarkesh Patel:那我们来谈谈教育吧,还有Eureka这些项目。你现在在做什么?有没有考虑回去开个AI实验室继续搞研究? Andrej ...
一张投票图近期刷爆全网:69% 的网友坚信,谷歌下一代 AI 模型 Gemini 3.0 将在下周正式亮相。就在舆论发酵之际,谷歌 CEO 劈柴在社交平台抛出两个「若有所思」的表情,没有多余解释,却让全网期待值直接拉满 —— 这波暗示,无疑坐实了传闻 ...