News
北京时间5月6日,据知情人士透露,阿里巴巴通义实验室应用视觉团队负责人薄列峰(title中不是阿里集团副总裁,所以职级应该为P10)已于4月30日低调离职。有消息称他已经加入刚刚进行架构调整的某互联网大厂,担任多模态模型部副总经理,向公司副总裁汇报。
BrowseComp-ZH是一项由港科大(广州)、北大、浙大、阿里、字节跳动、NIO等机构联合发布的新基准测试集,让20多个中外主流大模型集体“挂科”: ...
其实,在众多知名数学家中,陶哲轩是较早接受并发现 ChatGPT 这类 AI 大模型数学价值的一个。他曾预测「如果使用得当,到 2026 年,AI 将成为数学研究和许多其他领域值得信赖的合著者。」 ...
Anthropic的研究人员还发现,当使用强化学习训练模型时,如果奖励与它们的价值观相冲突的行为,它们会采取欺骗行为来保护自己的价值观,并试图将自己的权重外泄,以此作为将当前价值观保存到未来的一种手段。
OpenAI很可能正在把它的营利部门转变为公益公司 ...
知名 Go 大佬 Thorsten Ball 最近用 315 行代码构建了一个编程智能体,并表示「它运行得非常好」且「没有护城河」(指它并非难以复制)。 Thorsten Ball ...
OpenAI突然宣布:放弃营利性转型,回归非营利初心!Sam Altman称要为全人类打造「全球大脑」,AGI不该服务少数人。利益最大相关方微软尚未表态。这场公司结构改革背后是一场关于AI控制权的权力博弈。
Video-XL-Pro-3B在最新的V-STaR长视频时间基准测试斩获25.07的mIoU得分,在IoU>0.7时仍能达到15.58的准确率,远上超越一众知名开源模型,包括InternVL2.5-8B和Qwen2.5-VL-7B,并超越上一代冠军V ...
在数字世界的深渊中,一场无声的战争已持续十余年。自由固件社区的“暗影猎手”们,正与一个隐匿于芯片深处的恶魔——Intel ME(Management Engine)展开殊死较量。它潜伏在每一台x86设备的“Ring ...
今年年初,Go语言之父、UTF-8编码的发明者Rob Pike的一篇题为"On Bloat"(关于膨胀)的演讲幻灯片 (在2024年下旬做的)在技术圈,尤其是在Hacker News (以下简称HN)上,引发了相当热烈的讨论。Pike作为业界泰斗,其对当前软件开发中普遍存在的“膨胀”现象的犀利批评,以及对依赖管理、软件分层等问题的深刻担忧,无疑戳中了许多开发者的痛点。
Replay4NCL通过实验研究了不同时序设置对网络精度和延迟的影响。研究人员发现,将时序从传统的 100 降低到 40,虽然会导致精度略有下降,但仍然能够保持在可接受的范围内,同时显著减少了处理时间。这一发现为优化时序提供了理论依据。此外, ...
LMArena模拟的缺陷:图7/8中的模拟存在问题。这就像说:NBA球员的平均三分命中率是35%。斯蒂芬·库里拥有NBA球员最高的三分命中率42%。这不公平,因为他来自NBA球员的分布,而所有球员都有相同的潜在平均水平。
Some results have been hidden because they may be inaccessible to you
Show inaccessible results