资讯
9 小时on MSN
OpenAI 的研究人员通过分析 AI 模型的内部表征(即决定人工智能模型如何做出反应的数字,这些数字在人类看来往往完全无法理解)发现了一些模式,这些模式会在模型出现异常行为时被激活。例如,研究人员发现了一个与 AI 模型有害行为相关的特征,这意味着 ...
在人工智能(AI)领域,OpenAI近期的一项研究揭开了AI模型内部隐藏特征的神秘面纱。这项研究不仅让我们看到了AI如何做出反应的幕后机制,也为开发更安全的AI提供了新思路。根据IT之家6月19日的报道,OpenAI的研究人员通过分析AI模型的内部表征,发现了一些与模型“异常行为”相关的特征。这些特征在模型表现出不适当反应时会被激活,比如撒谎或提供不负责任的建议。更有趣的是,研究团队发现通过调整这 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果