当下AI模型领域呈现出颠覆固有认知的发展态势:2025年初问世的四十亿参数小型模型,如今在标准推理基准评测中,性能已然赶超参数量达到自身七倍的大尺寸模型。 谷歌Gemma 3 ...
Skills是Anthropic在2025年底推出的AI代理技能扩展机制,其核心是将“如何完成某类任务”的指令、脚本和模板打包成标准化的能力模块。 每个Skill本质上Skills 是一个包含指令、脚本和资源的文件夹,用于教会大模型如何更好地执行特定任务,根目录包含一个带YAML元数据的SKILL.md文件,描述技能的名称、用途和触发条件。目录内还可以包含Python脚本、参考文档、模板文件等资源 ...
Agent Skills 本质上是一类 SKILL.md 文件。它们可以扩展 Claude Code 和其他 AI 编程助手的能力。安装一个 skill,就相当于给 agent 增加了一份专门的工作手册。 Agent Skills 本质上是一类 SKILL.md 文件。 它们可以扩展 Claude Code 和其他 AI 编程助手的能力。安装一个 skill,就相当于给 agent 增加了一份专门 ...
点击上方“Deephub Imba”,关注公众号,好文章不错过 !微调LocateAnything-3B,实现当图像中有 300+ 个密集重叠目标、人工标注不可行时的实用方案。假设手头有一批种子发芽托盘、谷物质检图像或植物学调查照片。每张图像包含 100–500+ ...
Fable 5 是过去半年最受市场期待的模型,而在真正发布之后,它又迅速成为“最具争议”的模型。除了安全禁令外,它的使用体验反差也相当明显:在一些任务里,Fable 5 ...
AI助手总犯同一个错?别急着换模型,微软开源“工作手册”,准确率飙升,微软,编程,智能体 ...
Claude Code 日安装量已经达到 2900 万次。这意味着有海量开发者每天都在用这个工具,但其中绝大多数人可能还在用我凌晨两点的那种方式:问一句,答一句,确认一句,改一句。 Claude Code 创始人 Boris Cherny 在斯坦福 CS146S 课上说的那句话——很多人把 Claude Code 用成了「纯聊天框」,看似提效,实则效率不高。 更扎心的是,Claude Code 日 ...
中国空调,在欧洲被抢疯了。 最离谱的是,一台空调硬是被抢出了演唱会门票和限量球鞋发售时的阵仗:海外网友蹲库存,跨境找货,还有人把 AI Agent 都派上了用场。 毫不夸张地说,这是 AI 最有力的一集。 为了买到一台美的移动式空调 PortaSplit,奥地利人 Denis Yurchak 折腾了整整两天:开车横穿 200 公里,多方周转,甚至让 3 个 AI agent 全天候盯着库存。 最后 ...
这项由佐治亚理工学院、弗吉尼亚理工大学、卡内基梅隆大学、加州大学伯克利分校、剑桥大学和微软研究院新英格兰分部联合开展的研究,发表于2026年第43届国际机器学习大会(ICML 2026),会议地点为韩国首尔,论文编号为arXiv:2606.10587。
这项研究由阿里巴巴Qwen大模型应用团队联合中山大学、香港中文大学、北京大学、苏黎世联邦理工学院及苏黎世大学共同完成,以预印本形式于2026年6月2日发布在arXiv平台,论文编号为arXiv:2606.03980。有兴趣深入了解的读者可通过该编号查阅完整论文。 **当AI给AI打分,这件事比想象中复杂得多** ...