AI 的时代,时间真的过得飞快—— 指挥大语言模型编程的「vibe coding」仿佛就兴起于昨天,实际上它被《柯林斯英语词典》评为年度词汇都过去半年多了。 图|Cycode 只是在 AI 遍地之后,「用 AI 写程序」逐渐不是那么让人兴奋了,和养龙虾一起变成了那些「AI 极客」们日常生活的一部分。 但在今年的 Google I/O 和 WWDC ...
There was an error while loading. Please reload this page.
叠甲: 本次并非严格意义上的 benchmark 评测,测试 Case是一次围绕单个长链路 Agent 任务的体验观察记录,不构成对模型的全面定论捏。 GLM5.2 这次测试Case是做一个「AI 网站聚合平台」的 HTML 单页。 这对我来说也挺省事的。。。 请完成一个「AI 工具导航站」的完整开发任务,要求从需求理解到页面生成、数据整理、代码实现、运行检查、问题修复全部独立完成。  任务目标: ...
企业AI账单失控,“模型路由器”成降本杀手锏。该技术按任务复杂度智能调度大小AI模型,最高狂砍97%算力开支且不降质。目前巨头与初创全面入局,资本重金押注,这道“控费阀门”已成AI基建赛道不可忽视的新风口。
6月30日,美团发布新一代基础大模型LongCat-2.0。模型采用MoE架构,总参数1.6万亿,每个Token激活参数约480亿。 正式发布前,LongCat-2.0曾匿名“Owl ...
最近,GLM 5.2 接连刷屏,国产模型又热闹起来了。 加上 DeepSeek V4、MiniMax M3,还有阶跃星辰的 Step-3.7-Flash,国产大模型这一波可以说是你追我赶,热度一下子又上来了。 可能有小伙伴对阶跃模型不熟悉哈,阶跃也是AI六小虎之一。 对于我们这些AI博主来说,日常就会使用到这些模型。针对这几个模型的使用大体分为两类。 这一档代表的是各家最强模型,通常适合复杂推理、 ...
高盛7月3日研报指出,DeepSeek自7月中旬起实施高峰时段价格调整,并不意味着需求走弱,反而反映出国内AI模型需求持续旺盛、算力资源趋紧,行业竞争正在从早期激进的价格战,逐步回归更理性的定价框架。
特稿|格局重塑、技术主权、实体落地——从三个关键词看6月全球AI领域发展 加拿大总理卡尼表示,美国政府利用出口管制指令对上述两款新模型施加限制,这表明过度依赖美国AI模型存在风险。
Yo, whatss up ?! 大家好! This is B&B in your house。 我这段时间一直在琢磨自己整一个agent。这原因嘛,想必大家都懂,这天杀的anthropic不知道上辈子遭了咱们什么样的迫害,逮着咱就是一通乱封。
1. DeepSeek V4 正式版 7 月中旬上线,工作时段 API 价格翻倍 DeepSeek 向 API 用户官宣,V4 正式版计划于 7 月中旬上线,同步引入峰谷定价机制,高峰时段调用价格为平时的 2 倍。 高峰时段为每日北京时间 ...