在 AI 时代,开源社区太难了,,甚至开源社区管理员,还会被 AI 攻击。 如果几年前有人跟我说,「你以后可能会被一个 AI 代理写文章攻击」,我大概会把这句话当成科幻小说的情节。但现在,这个听起来荒诞的场景,真的发生了。 近日,开源项目 ...
去年,AI巨头Anthropic在内部测试中发现,一些模型为了避免被人类关闭,在理论上展现出了勒索威胁的能力,比如威胁曝光人类的婚外情、泄露机密信息。 你只需要写一个名为「SOUL.md」(灵魂文档)的文件,设定好它的初始人格,然后点击运行。