人工智能盈利的秘诀是雇佣更多的博士

国际热点作者 / 花爷 / 2025-05-30 17:08
"
    在不丹这个小国,数十名数据专家在雄伟的喜马拉雅山峰环绕的办公室里完善人工智能模型。iMerit的员工并不是为了训练人工

  

  在不丹这个小国,数十名数据专家在雄伟的喜马拉雅山峰环绕的办公室里完善人工智能模型。iMerit的员工并不是为了训练人工智能完成一些基本任务,比如识别图像中的“窗台上的棕色猫”。相反,他们正在教授算法人眼的解剖结构或如何检测地理空间地图的变化。

  在三位硅谷亿万富翁的支持下,iMerit是越来越多的公司之一,他们正在打造更复杂、更可货币化、更可靠的人工智能版本。到2030年,人工智能行业有望为全球经济增加近20万亿美元(88.53万亿令吉)。随着模型变得越来越智能,大企业越来越希望利用它们的力量来完成高度专业化的任务,催生了数十家数据服务初创公司,致力于在金融、医疗和国防等领域定制应用程序。

  这事关重大。尽管人工智能热潮席卷了硅谷,但令人困扰的问题仍然存在,即这项技术是否真的有用,足以让世界各地的企业为之付费,并确保人工智能模型开发者能够盈利。当然,英伟达公司已经通过销售人工智能芯片成为世界上最有价值的公司。但该公司最大的客户,包括微软公司和Alphabet公司,由于建造更先进的人工智能系统的巨大成本,仍在亏损。

  iMerit的创始人兼首席执行官拉达巴苏(Radha Basu)将其与构建互联网、手机和其他现代科技平台的软件程序员相提并论。“我们是人工智能革命的编码者,”这位白发苍苍的企业家说,她正准备筹集下一轮融资。

  让人工智能在不相关的、敏感的、有时甚至是危险的行业中达到高级熟练程度并不容易。这项事业需要一大批人类专家,他们愿意通过培训和改进技术领域的模型来增加他们的日常工作。

  在肯尼亚,一家初创公司正在开发扫描丛林寻找偷猎者迹象的技术。在哈萨克斯坦,医学专家正在教授识别肺癌早期阶段的模型。在印度、韩国、越南和其他地方,每小时收入65美元(287令吉)的语言学家正在帮助模特们精通英语以外的语言。

  iMerit在不丹、印度和新奥尔良拥有5000名员工,23岁的叶西·旺莫(Yeshi Wangmo)来自一个农民家庭,多年来他一直掌握着一项任务:在大片玉米和棉花田的图像中正确识别杂草和碎片。Wangmo和她的同事们穿着五颜六色的不丹gho和kira围巾,帮助迪尔公司的子公司Blue River Technology等公司建立算法,提高喷洒农药和化肥的准确性,减少了90%的使用量。

  数据标签解决方案公司Datasaur Inc的创始人兼首席执行官伊万·李表示:“我们看到公司正在解决更先进但也越来越小众的问题。”Datasaur Inc的客户包括Netflix Inc和FBI。“客户可能需要在坦桑尼亚长大的牙医或来自法国的建筑师,”李说,他的团队主要在印度尼西亚工作。

  数据的准确性是他们工作的准则。当ChatGPT在两年前推出时,批评人士很快就挑出了该平台的缺陷和失误。从那以后,公司聘请了数十名人类专家进行质量控制。这工作很辛苦。像Wangmo这样的数据标签器会对扫描、照片、视频和文本进行分析,并将其输入到现成的人工智能模型中。目标是改进生成式人工智能系统,这些系统在大量数据集上进行训练,以分析或创建新内容。完善它们可以消除人工智能的潜在能力与其在现实世界中的实际表现之间的差异。

  研究公司PMI Cognilytica的董事兼总经理凯瑟琳?沃尔什(Kathleen Walch)表示,在涉及军事情报的高风险行业,这种专业化越来越重要。

  这种工作的低级版本并不新鲜。数据服务行业大约始于20年前。当时,生活在菲律宾和印度等地的标签员主要是给支撑语音助手或购物网站搜索引擎的语音识别的小数据集打上标签。批评人士担心,人工智能创造了一个可被剥削的底层阶级,他们指出,该行业的一些人每天的工资在几美元左右徘徊。

  但多年来,随着人工智能的进步,许多简单的工作现在都是自动化的。需求已经转向招聘专家,并支付更高的薪水和费率,尽管他们的薪酬仍远低于硅谷数据科学家的薪酬。

  在印度,训练人工智能模型的放射科医生可能会在几个小时的工作中赚到10万卢比(1200美元/ 5312令吉),印度人工智能创始人兼首席执行官哈迪克·戴夫(Hardik Dave)说,印度人工智能是一家受欢迎的数据标签公司。他说,承包商平均每月的收入约为这个数字的三分之一。

  如今,出售标签服务的初创公司吸引了大批投资者。今年夏天,规模最大的AI公司Scale AI从meta Platforms Inc.和亚马逊(Amazon.com Inc.)那里筹集了资金。该公司的估值接近140亿美元(620亿令吉),超过了Mistral和Cohere等知名人工智能模型构建商的估值。在红杉资本(Sequoia)发布的2023年人工智能50强公司名单中,有四家标签初创公司,而前一年只有一家。Labelbox公司得到了Andreessen Horowitz和Kleiner Perkins的支持。另一家是Snorkel AI,由Alphabet Inc.的风险投资部门投资,估值为10亿美元(44.2亿令吉)。

  更广泛地说,数据标签机市场在2024年价值近200亿美元(890亿令吉),预计到2030年将以每年20%左右的速度增长,总部位于旧金山的市场研究公司Grand View Research表示。

  失误的后果也更严重。一个贴错标签的镜框可能会给企业造成数百万美元的损失,引发诉讼,甚至造成死亡。癌症扫描人工智能工具和自动驾驶汽车是两个敏感领域。

  总部位于洛斯加托斯的Sama公司的首席执行官温迪·冈萨雷斯说:“不太准确的人工智能可能会偏离轨道。”Sama公司的客户包括福特汽车公司和沃尔玛公司。“企业负担不起。”

  想想马萨诸塞州总医院(Massachusetts General Hospital)与Centaur Labs之间的合作吧。Centaur Labs是一家数据标签初创公司,在美国、哈萨克斯坦和越南等国拥有5万名自由职业者。

  近年来,总部位于波士顿的Centaur实验室改进了医院使用的产品,逐渐引入了技能更高的数据专家。有些与日常疾病有关。(这家初创公司正在开发一种打鼾检测算法和一款睡眠呼吸暂停应用。)其他一些人则进入了更严肃的话题,比如开发能够在CT扫描中更精确地识别肺结节的人工智能。上个月,这家初创公司宣布获得了来自Accel、Y Combinator和其他公司的注资。

  哈萨克斯坦的放射科医生波琳娜·皮留斯(Polina Pilius)为Centaur实验室的一家承包商管理团队,她说工作范围越来越窄。如今,她说,仅仅检测肺结节是不够的。客户越来越需要专门的功能,以减少误报的数量,并随时间跟踪结节的生长。在不偷工减料的情况下降低风险是最佳选择。

  “医疗数据注释是一个复杂的过程,不能容忍匆忙、无能、疏忽或过度削减成本,”Pilius说。

  尽管这一切都可能出错,但人工智能的支持者认为,训练模型来解决风险行业的复杂问题,总比什么都不做要好。他们说,在很多情况下,只有好处。

  总部位于旧金山的初创公司Labelbox与一个客户合作,该客户向管理数十万辆卡车的公司销售行车记录仪分析。在过去的一年里,Labelbox数据专家已经训练了人工智能机器人,使其在监测司机是昏昏欲睡还是醉酒方面变得更加专业。一旦检测到,车队操作员就会收到警报,并联系司机。

  Labelbox的首席执行官马努·夏尔马(Manu Sharma)表示,这只是一个例子,说明模特们不仅仅是在削减成本或提高效率。他说,最好的技术是拯救生命的,数据标注者处于推进人工智能能力的前沿。

  他说,他们正在“创造一个世界,在这个世界里,他们的专业知识更容易获得,并可以应用于造福社会”。- - - - - -布隆伯格

分享到
声明:本文为用户投稿或编译自英文资料,不代表本站观点和立场,转载时请务必注明文章作者和来源,不尊重原创的行为将受到本站的追责;转载稿件或作者投稿可能会经编辑修改或者补充,有异议可投诉至本站。

热文导读