资讯

AI公司发现通过Wayback Machine抓取Reddit的历史数据,既无需遵守Reddit的平台政策(如付费、合规协议),又能获取训练所需的大量内容,于是就利用这一漏洞开始了违规“曲线获取数据”的行为。 Reddit发言人Tim ...
Reddit现已封锁互联网档案馆 (IA)对热门Reddit帖子的索引,原因是发现一些被限制抓取Reddit数据的AI公司,转而从IA的存档内容中抓取数据。 此前,IA的Wayback ...
十轮网科技资讯 on MSN10 小时

Reddit将封锁Internet Archive的大部分爬取

The Verge本周报道,社交新闻平台Reddit即将封锁网际网络文件馆(Internet Archive)对该平台的大部分爬取,原因是许多AI企业都借由该馆的时光机(Wayback Machine)功能来抓取Reddit内容。
人工智能公司允许个人通过Google搜索访问聊天,侵犯了用户隐私,而且解决这个问题的尝试似乎失败了。有用户发现,公众可以通过简单的Google搜索轻松访问 ChatGPT 的聊天记录,这暴露了来自不同用户的超过 10 万条 AI 对话。据 ...
Reddit 发言人在向媒体解释这一变化时表示,这是因为一些 AI 企业以违反平台政策的方式通过互联网档案馆的存档页面抓取该企业数据。Reddit 允许企业付费抓取 AI 所需的数据,但 经由互联网档案馆间接访问显然绕过了这一规定 。
IT之家 8 月 13 日消息,参考外媒 The Verge 当地时间 11 日报道,海外大型社区论坛 Reddit 宣布禁止互联网档案馆 (Internet Archive) 对该论坛非首页的绝大多数页面进行索引存档。Reddit 发言人在向媒体解释这一变化时表示,这是因为一些 AI 企业以违反平台政策的方式通过互联网档案馆的存档页面抓取该企业数据。Reddit ...
与AI聊天机器人互动提问,已经成为不少人日常生活中的一部分,越来越多人习惯凡事谘询AI。但令人惊恐的是,目前最受欢迎的AI聊天机器人ChatGPT近期惊爆大规模的隐私外泄争议。研究人员揭露,超过500笔与ChatGPT的私 ...
Wayback 0.1已经发布,这是我们几周前报道的新Wayland显示服务器的首个初步版本。 新网站的标语简洁明了:"足够的Wayland功能来让Xwayland正常工作。
▲ ChatGPT聊天纪录出现在Google搜寻结果中。ChatGPT惊爆大规模隐私外泄事件,研究人员披露,逾500笔用户与AI聊天机器人的私密对话纪录,竟直接暴露在Google搜寻结果中,甚至还有数千笔相关纪录被存档在网路上其他角 ...