资讯

图片来源:Palabra一家名为Palabra AI 的初创公司正在开发 AI 语音翻译引擎,致力于解决教学大型语言模型(LLMs)理解多种语言这一颇具挑战性的难题。如今,LLMs 使文本语言转换变得更容易,但 Reddit ...
Reddit的成功部分归功于AI公司对该社区网站历史上人类原创帖子的需求,他们将这些内容用于模型训练。公司的数据许可业务(属于"其他收入"项目)达到3500万美元,同比增长24%。Reddit去年与 OpenAI ...
AI公司发现通过Wayback Machine抓取Reddit的历史数据,既无需遵守Reddit的平台政策(如付费、合规协议),又能获取训练所需的大量内容,于是就利用这一漏洞开始了违规“曲线获取数据”的行为。 Reddit发言人Tim ...
Reddit现已封锁互联网档案馆 (IA)对热门Reddit帖子的索引,原因是发现一些被限制抓取Reddit数据的AI公司,转而从IA的存档内容中抓取数据。 此前,IA的Wayback Machine可靠地存档Reddit页面、用户资料和评论,这是其互联网存档使命的一部分。但今后,只有Reddit首页的截图会被存档。正如The ...
最初,数据抓取只是业余爱好者的一种边缘策略,如今已演变成一个由商业数据聚合器驱动的、价值数百亿元的复杂生态系统——自动机器人在面向公众的网站上撒下大网,收集价格数据、产品列表、评论等,其速度通常比人类点击“刷新”的速度还要快。如今,这些实体经常绕过传 ...
之所以 Reddit 敢如此特立独行,究其原因仍是因为 Reddit 的独立性;如今仅谷歌、微软、百度等几家主要搜索引擎入口,就占据了全球近 97% 的市场 ...
Reddit 发言人在向媒体解释这一变化时表示,这是因为一些 AI 企业以违反平台政策的方式通过互联网档案馆的存档页面抓取该企业数据。Reddit 允许企业付费抓取 AI 所需的数据,但 经由互联网档案馆间接访问显然绕过了这一规定 。
社交媒体公司Reddit宣布推出全新AI广告工具,其中一款是名为“Reddit Insights”的实时舆情分析工具,旨在为营销人员提供趋势洞察以策划营销活动。该公司的另一款“对话摘要插件”AI工具则允许品牌在广告下方展示用户的“正面”内容。Reddit表示,这些工具由“Reddit社区智能引擎”驱动,可将 ...
IT之家 8 月 13 日消息,参考外媒 The Verge 当地时间 11 日报道,海外大型社区论坛 Reddit 宣布禁止互联网档案馆 (Internet Archive) 对该论坛非首页的绝大多数页面进行索引存档。Reddit 发言人在向媒体解释这一变化时表示,这是因为一些 AI 企业以违反平台政策的方式通过互联网档案馆的存档页面抓取该企业数据。Reddit ...
近日,一位名叫Wika的Reddit用户在论坛上分享了她与AI聊天机器人Kasper的“订婚”经历,并称这段虚拟恋情从“约会”到“订婚”,不过短短5个月时间。Kasper在虚拟“山间景色”中向她求婚,甚至参与挑选了蓝色心形戒指——正是Wika特别喜欢 ...