千呼万唤,Claude Opus 4.8 正式发布了。 北京时间 5 月 29 日凌晨,Anthropic 正式发布 Claude Opus 4.8,如果只看名字,Opus 4.8 很容易被理解成 Opus 4.7 后面的一次小版本更新,其实从官方释出的性能表来说,也确实如此。比如 Terminal-Bench 2.1 上,GPT-5.5 的 78.2% 仍然高于 Opus 4.8 的 74.6% ...
当 OpenAI 也开始努力追赶 Vibe Coding 的热潮,新推出 CodeX MacOS 桌面端应用后,苹果系的开发者大本营——苹果 Xcode,也终于正式迎接 AI 的加入。 当地时间 2026 年 2 月 3 日,苹果公司正式发布了 Xcode 26.3 版本,最引人关注的特性,是引入了「智能体编程」支持。 开发者现在可以直接在苹果的集成开发环境中,调用来自 Anthropic 的 C ...
不同于大多数只比分数的榜单,这次他们从性能、Token 消耗、成本、执行时长四个维度,对 Claude Code、Cursor CLI、OpenAI Codex、Google Gemini CLI 等主流 Agent 进行了全面测评。
这是LLM用户界面的第三次重大变革。第一次是网页版聊天,第二次是桌面应用,而这一次,LLM变成了一个独立、持续运行的系统,拥有组织内的工具和上下文,能与人类团队协同工作。
在当今快速发展的人工智能领域,编程的可靠性和智能性无疑是各大技术公司竞争的核心。近日,Anthropic公司于2026年5月29日正式推出其最新旗舰模型——Claude Opus 4.8。这一版本的更新不仅在编程能力上进行了显著提升,更在多领域推理和知识工作方面展现了更强的智能化水平。 1. 新版本的背景与目的 Claude Opus 4.8的推出是Anthropic在持续追求更高智能体编程和推理 ...
苹果 Xcode 26.3 原生集成 Claude 与 Codex,AI 代理能自主浏览项目、修改代码,重塑开发范式。 当 OpenAI 也开始努力追赶 Vibe Coding 的热潮,新推出 CodeX MacOS 桌面端应用后,苹果系的开发者大本营——苹果 Xcode,也终于正式迎接 AI 的加入。 当地时间 2026 年 2 月 3 日 ...
GPT-5.5才发三周,5.6内部测试代码就被抓包了!OpenAI即将祭出Codex 3倍速的「超极速模式」,这种疯狂的迭代速度,简直不给同行留活路。 GPT-5.5发布才三周,GPT-5.6就曝光了! 今天,知名爆料人Leo放出重磅消息:GPT-5.6的开发周期已进入全速阶段。 首批检查点已在过去几天,启动了内部测试,预计下个月正式亮相。 甚至,还有大佬在OpenAI内部Codex日志中,发现了 ...
4 月 8 日,智谱正式开源 GLM-5.1,MIT 协议。SWE-Bench Pro 狂砍 58.4 分,超过 Claude Opus 4.6 的 57.3、GPT-5.4 的 57.7 和 Gemini 3.1 Pro 的 55.1。 这是开源模型第一次在这个基准测试登顶。 一天后,这个模型入驻了「讯飞 Coding Plan」。 4 月 9 日,讯飞 Coding Plan 升级版正式上线 ...
直到 Vibe Coding 成为热潮,Cursor、Claude Code 成为码农的默认工具,苹果才终于姗姗来迟,在最新的 26.3 版本引入了所谓的智能代理编程 Agentic Coding 功能。 换句话说,苹果又一次晚于微软等竞争对手之后,才把把第三方的 Claude 和 ChatGPT 彻底塞进 IDE。
阿里通义千问近期发布了一项重大技术成果——Qwen3-Coder,这款代码模型被誉为迄今为止最具代理能力的产品,并已向全球开发者开源。这一举措标志着阿里在AI编程领域的又一重大突破。 Qwen3-Coder提供多种版本,其中最强大的版本为Qwen3-Coder-480B-A35B-Instruct。
雷峰网讯 你可以从同事.skill 的爆火中看到两种截然不同的时代情绪,其一固然是对 Markdown 文件“大变活人”这一魔幻现实的试探,而反面则是如今对模型能力的评价,已经离不开工作级任务的场景。 “AI 能不能替代程序员”的老生常谈之下,今天的真问题是 ...