×
加载中...
谷歌与Reddit达成人工智能训练数据协议,每年支付6000万美元
鞭牛士 2024-02-23 07:23

鞭牛士报道,2月23日消息,据外电报道,Reddit已与谷歌达成协议,允许这家搜索巨头使用在线讨论网站上的帖子来训练其人工智能模型并改进在线搜索等产品。


3670298864.png


这项价值约 6000 万美元的安排在周四宣布,还将让 Reddit 能够使用 Google AI 模型,以改进其网站搜索和其他功能。


另外,这家总部位于旧金山的公司周三宣布了首次公开募股的计划。在向美国证券交易委员会提交的文件中,Reddit 表示,其 10 月至 12 月季度的净利润为 1850 万美元,这是两年来的首次盈利,营收为 2.498 亿美元。该公司表示,计划在纽约证券交易所上市,股票代码为 RDDT。


作为两家公司新合作伙伴关系的一部分,谷歌正在从 Reddit 获取人工智能训练数据。在周四的更新中,Reddit 宣布将开始为谷歌提供更有效的模型训练方法。


此次合作将使谷歌能够访问 Reddit 的数据 API,该 API 可以从 Reddit 平台提供实时内容。这将为谷歌提供一种高效、结构化的方式来访问 Reddit 上现有的大量内容,同时还允许该公司在其产品中以新的方式显示 Reddit 的内容。


去年,当 Reddit 首席执行官 Steve Huffman 在接受The Verge采访时谈到 Reddit API 的变化以及随后的抗议活动时,他表示,API 的使用是为了弥补成本,而数据许可对我们来说是一项新的潜在业务,暗示 Reddit 可能会寻求类似的收入,比如未来的生成安排。


此次合作还将使 Reddit 能够访问 Vertex AI,这是谷歌人工智能驱动的服务,旨在帮助公司改善搜索结果。


Reddit 表示,这一变化不会影响该公司的数据 API 条款,该条款阻止开发者或公司在未经批准的情况下出于商业目的访问它。


尽管达成了这项协议,谷歌和 Reddit 的意见并不总是一致。Reddit 此前威胁要阻止谷歌抓取其网站,因为担心公司会免费使用其数据来训练人工智能模型。


Reddit 还准备在未来几周内宣布首次公开募股,这一变化很可能是其提高估值的一部分,该估值在 2021 年将超过 100 亿美元。


谷歌搜索体验副总裁 Rajan Patel 在博客文章中表示:多年来,我们看到人们越来越多地使用谷歌在 Reddit 上搜索有用的内容,以查找产品推荐、旅行建议等。


帕特尔表示,此次合作将允许Reddit 信息的更多内容前向显示。Reddit在自己的博文中也表达了类似的观点。


Reddit 和谷歌均拒绝发表评论。


谷歌与 Reddit 的交易凸显了用户生成内容对于生成人工智能平台的价值。ChatGPT 和 Google Gemini 等人工智能引擎接受来自互联网上海量文本数据的训练。人工智能模型接收这些信息并将其运行到数万亿个参数以生成新颖的句子。


一般来说,更多的数据,尤其是来自真实人类的数据,意味着模型听起来更像人类。Reddit 的训练数据可能如何影响未来的谷歌人工智能产品还有待观察。考虑到 Reddit 上的声音既尖锐又充满争议,谷歌的人工智能产品可能会兼收并蓄,除非该公司能够有效过滤掉有毒元素。试图纠正人为偏见有时会导致其他错误。


最近,谷歌不得不暂停 Gemini 的图像生成 ,因为它正在将白人历史人物的图像生成为有色人种。


Reddit 上对这一消息的反应大多是讽刺的。


过去几年,Reddit 也已成为 Google 搜索结果的重要组成部分。鉴于搜索引擎优化内容大量涌入 Google 搜索,人们更难找到有用的信息。互联网上已经充斥着人工智能生成的乏味内容,这无济于事。一些互联网用户采用的一种策略是输入搜索查询以及Reddit一词。这会过滤 Reddit 结果,这些结果往往会显示用户之间的实际讨论。 


据 《华尔街日报》报道,Reddit 甚至可能向一些最忠实的用户出售股票。这一不寻常的产品可能是安抚狂热 Reddit 用户的一种方式,尤其是那些愿意抗议或抵制该平台的用户。


2021 年 Reddit 估值达到 100 亿美元。

扫码下载app 最新资讯实时掌握