当大多数人工智能高管都在争夺更多数据时，马克·扎克伯格表示，实际上有一些更“有价值”的东西

科技作者 / 花爷 / 2025-07-26 01:11

　　　　　　我facebook首席执行官马克·扎克伯格在一次新的采访中谈到了人工智能数据竞赛。　　随着人工智能军备竞赛的升温，许

　　我facebook首席执行官马克·扎克伯格在一次新的采访中谈到了人工智能数据竞赛。

　　随着人工智能军备竞赛的升温，许多科技公司都在争相寻找新的数据来源。

　　但扎克伯格表示，“反馈循环”将更加有效对于训练人工智能模型比数据更重要。

　　meta首席执行官马克·扎克伯格对大型科技公司争夺人工智能训练数据的激烈看法是:这不是数据的问题。“我认为更有价值的是反馈循环，而不是任何形式的预先语料库，”扎克伯格在接受科技行业通讯《命令行》(Command Line)采访时表示。

　　反馈循环用于根据以前的输出，随着时间的推移重新训练和改进AI模型。例如，这些算法让人工智能模型知道自己什么时候犯了错误，并为它们提供数据来调整它们未来的表现。

　　本文仅对Business Insider订阅者开放。成为业内人士，现在就开始阅读。有账户吗?．

　　他说:“随着时间的推移，让很多人使用它，然后看到人们如何使用它，并在此基础上进行改进，这实际上将成为一件更具差异化的事情。”

　　有关的故事

　　为它们贪得无厌的人工智能模型获取新数据——从理论上讲，这将使它们变得更聪明——现在是竞相主导人工智能的公司的痴迷。

　　OpenAI、谷歌、亚马逊、meta等公司都在考虑一些大胆的解决方案。例如，据《纽约时报》报道，meta曾一度迫切需要数据，以至于考虑收购出版公司西蒙与舒斯特(Simon & Schuster)，甚至冒着版权诉讼的风险来获取更多的数据。

　　解决数据有限问题的另一种方法是创建新数据，大型科技公司称之为“合成数据”。合成数据是人为生成的，旨在模拟现实世界事件生成的数据。扎克伯格很喜欢。

　　他说:“我认为将会有很多合成数据，在这些数据中，你会让模型尝试在不同的问题上反复研究，看看哪条路径最终有效，然后用它来强化。”

　　聊天机器人克劳德(Claude)的制造商Anthropic也将内部生成的数据输入到模型中。ChatGPT制造商OpenAI也在考虑，不过其首席执行官萨姆·奥特曼在去年5月的一次会议上表示，关键是要有一个“足够智能的模型来生成好的合成数据”。

　　虽然扎克伯格认为反馈循环是构建强大人工智能模型的关键，但依赖它们也存在风险。如果他们一开始就没有接受过“好数据”的训练，他们可能会加剧自己的一些错误、局限性和偏见。

　　Business Insider的母公司阿克塞尔·斯普林格(Axel Springer)签署了一项全球协议，允许OpenAI根据其媒体品牌的报道训练其模型。

分享到

声明：本文为用户投稿或编译自英文资料，不代表本站观点和立场，转载时请务必注明文章作者和来源，不尊重原创的行为将受到本站的追责；转载稿件或作者投稿可能会经编辑修改或者补充，有异议可投诉至本站。