华尔街见闻 on MSN
花1500美元让AI“黑”自家App:GPT-5成功率70%,多数顶级模型交“零蛋”
知名安全研究员Kasra Rahjerdi自费1500美元测试多款主流大模型的自主渗透能力,结果显示GPT-5.5以70%的成功率遥遥领先,成为唯一具备较强实战漏洞挖掘能力的模型。DeepSeek V4 Pro虽成功率仅30%,但成本优势突出;Claude、Gemini等多数模型受安全护栏、推理偏差或API稳定性限制表现不佳,5款模型全部颗粒无收。
在AI时代创业,“勤奋”可能不再是褒义词,反而会掩盖企业问题的真相。 这个看似不符合常理的观点,自有底层逻辑。丹·苏利文(Dan Sullivan)和本杰明·哈迪(Benjamin ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果