

我facebook首席执行官马克·扎克伯格在一次新的采访中谈到了人工智能数据竞赛。
随着人工智能军备竞赛的升温,许多科技公司都在争相寻找新的数据来源。
但扎克伯格表示,“反馈循环”将更加有效对于训练人工智能模型比数据更重要。
meta首席执行官马克·扎克伯格对大型科技公司争夺人工智能训练数据的激烈看法是:这不是数据的问题。“我认为更有价值的是反馈循环,而不是任何形式的预先语料库,”扎克伯格在接受科技行业通讯《命令行》(Command Line)采访时表示。
反馈循环用于根据以前的输出,随着时间的推移重新训练和改进AI模型。例如,这些算法让人工智能模型知道自己什么时候犯了错误,并为它们提供数据来调整它们未来的表现。
本文仅对Business Insider订阅者开放。成为业内人士,现在就开始阅读。有账户吗?.
他说:“随着时间的推移,让很多人使用它,然后看到人们如何使用它,并在此基础上进行改进,这实际上将成为一件更具差异化的事情。”
有关的故事
为它们贪得无厌的人工智能模型获取新数据——从理论上讲,这将使它们变得更聪明——现在是竞相主导人工智能的公司的痴迷。
OpenAI、谷歌、亚马逊、meta等公司都在考虑一些大胆的解决方案。例如,据《纽约时报》报道,meta曾一度迫切需要数据,以至于考虑收购出版公司西蒙与舒斯特(Simon & Schuster),甚至冒着版权诉讼的风险来获取更多的数据。
解决数据有限问题的另一种方法是创建新数据,大型科技公司称之为“合成数据”。合成数据是人为生成的,旨在模拟现实世界事件生成的数据。扎克伯格很喜欢。
他说:“我认为将会有很多合成数据,在这些数据中,你会让模型尝试在不同的问题上反复研究,看看哪条路径最终有效,然后用它来强化。”
聊天机器人克劳德(Claude)的制造商Anthropic也将内部生成的数据输入到模型中。ChatGPT制造商OpenAI也在考虑,不过其首席执行官萨姆·奥特曼在去年5月的一次会议上表示,关键是要有一个“足够智能的模型来生成好的合成数据”。
虽然扎克伯格认为反馈循环是构建强大人工智能模型的关键,但依赖它们也存在风险。如果他们一开始就没有接受过“好数据”的训练,他们可能会加剧自己的一些错误、局限性和偏见。
Business Insider的母公司阿克塞尔·斯普林格(Axel Springer)签署了一项全球协议,允许OpenAI根据其媒体品牌的报道训练其模型。