资讯
AI公司发现通过Wayback Machine抓取Reddit的历史数据,既无需遵守Reddit的平台政策(如付费、合规协议),又能获取训练所需的大量内容,于是就利用这一漏洞开始了违规“曲线获取数据”的行为。 Reddit发言人Tim ...
Reddit宣布将封禁互联网档案馆(Internet Archive)的Wayback Machine工具,以防止人工智能公司非法抓取其数据。Reddit表示,已发现某些AI公司在通过Wayback Machine获取其数据,违反了平台政策。 此次封禁措施将于即日起逐步实施,Wayback Machine将不再能够爬取Reddit上的帖子详情页、评论和用户资料,仅能索引Reddit.com的主页。
Reddit现已封锁互联网档案馆 (IA)对热门Reddit帖子的索引,原因是发现一些被限制抓取Reddit数据的AI公司,转而从IA的存档内容中抓取数据。 此前,IA的Wayback Machine可靠地存档Reddit页面、用户资料和评论,这是其互联网存档使命的一部分。但今后,只有Reddit首页的截图会被存档。正如The ...
来自MSN10月
互联网档案馆网站时光机以只读模式重新上线,暂不 ...
IT之家 10 月 15 日消息,据 Internet Archive 互联网档案馆创始人 Brewster Kahle 的 X 平台动态,互联网档案馆的核心功能之一 Wayback Machine 网站时光机,现已 ...
此后,该网站的团队一直在努力恢复其服务。 上周,该网站恢复了广受欢迎的 Wayback Machine 网站,用户可以通过该网站查看当前网站和已关闭网站 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果