

罗德岛普罗维登斯:去年夏天之前,亚历克西斯·博根(Alexis“Lexi”Bogan)的声音充满活力。
她喜欢在车里大声唱泰勒·斯威夫特和扎克·布莱恩的民谣。她一直都在笑——即使是在把行为不端的学龄前儿童关在围栏里,或者在后院的火坑旁和朋友讨论政治的时候。高中时,她是合唱团的女高音。
然后那个声音消失了。
今年8月,医生切除了她大脑后部附近一个危及生命的肿瘤。一个月后,当呼吸管取出来的时候,博根吞咽困难,很难和父母说“嗨”。几个月的康复帮助她恢复了,但她的语言能力仍然受损。朋友、陌生人和她自己的家人都很难理解她想告诉他们什么。
今年4月,21岁的她恢复了原来的声音。不是真正的那个,而是由人工智能生成的语音克隆,她可以从手机应用程序中召唤出来。她十几岁时的声音经过15秒时间胶囊的训练——来自她为一个高中项目录制的烹饪演示视频——她的合成但听起来非常真实的人工智能声音现在几乎可以说任何她想说的话。
她在手机上输入几个单词或句子,应用程序就会立即大声朗读出来。
“嗨,能给我来一杯大杯冰红糖燕麦牛奶摇意式浓缩咖啡吗?”博根在星巴克得来速餐厅把手机举到车窗外,用人工智能的声音说道。
专家警告说,快速发展的人工智能语音克隆技术可能会放大电话诈骗,扰乱民主选举,并侵犯人们的尊严——无论是活着的还是死去的——他们从未同意将自己的声音重新创造出来,说出他们从未说过的话。
它被用来制作模仿乔·拜登总统的深度假语音电话给新罕布什尔州的选民。在马里兰州,当局最近指控一名高中体育主任使用人工智能生成一段虚假的校长种族主义言论的音频片段。
但博根和罗德岛生命医院集团的一组医生认为,他们已经发现了一种值得冒险的用途。博根是第一批能够用OpenAI的新语音引擎重建失去的声音的人之一,也是唯一一个有她这种情况的人。其他一些人工智能提供商,如创业公司ElevenLabs,已经为有语言障碍和失聪的人测试了类似的技术,其中包括一名律师,她现在在法庭上使用她的语音克隆。
布朗大学医学院和罗德岛医院的神经外科住院医生罗海德·阿里说:“我们希望随着技术的发展,莱西能成为一个开拓者。”他说,数以百万计的中风、咽喉癌或神经再生疾病患者可能从中受益。
“我们应该意识到风险,但我们不能忘记病人和社会利益,”另一位参与该试点项目的居民法蒂玛·米尔扎博士说。“我们能够帮助莱西找回她真实的声音,她能够用最真实的语言说话。”
已婚的米尔扎和阿里引起了聊天机器人制造商OpenAI的注意,因为他们之前在Lifespan研究过一个项目,利用人工智能聊天机器人简化患者的医疗同意书。今年早些时候,这家位于旧金山的公司在为其新型人工智能语音发生器寻找有前景的医疗应用时伸出了援手。
博根仍在缓慢地从手术中恢复。这种疾病始于去年夏天,症状是头痛、视力模糊和脸下垂,这让普罗维登斯市孩之宝儿童医院的医生们感到震惊。他们在她的脑干上发现了一个高尔夫球大小的血管肿瘤,并与血管和脑神经纠缠在一起。
“这是一场控制出血和取出肿瘤的战斗,”儿科神经外科医生康斯坦娜·斯沃科斯博士说。
斯沃科斯说,长达10个小时的手术,加上肿瘤的位置和严重程度,损害了博根的舌头肌肉和声带,妨碍了她进食和说话的能力。
博根说:“当我失声时,我的一部分身份就被夺走了。”
喂食管今年问世了。语言治疗仍在继续,使她能够在一个安静的房间里清晰地说话,但没有迹象表明她会完全恢复自然声音的清晰。
“在某种程度上,我开始忘记我听起来像什么,”博根说。“我已经习惯了我现在的声音。”
她住在普罗维登斯郊区北史密斯菲尔德,家里的电话一响,她就把电话推给母亲接。每当朋友们去喧闹的餐馆吃饭时,她都觉得自己是在给他们添麻烦。她的父亲听力受损,很难理解她的话。
回到医院后,医生们正在寻找一名试点患者来试验OpenAI的技术。
“Svokos博士首先想到的是Lexi,”Ali说。“我们联系了莱西,看她是否有兴趣,但不知道她会有什么反应。她愿意尝试一下,看看效果如何。”
博根不得不回到几年前,寻找合适的声音录音,以“训练”人工智能系统学习她的说话方式。这是一段视频,她在视频中解释了如何制作意大利面沙拉。
她的医生故意只给人工智能系统提供了一个15秒的片段。烹饪的声音使得视频的其他部分不完美。这也是OpenAI所需要的——比以前需要更长的样本的技术有所改进。
他们还知道,在15秒内获得一些有用的信息,对于未来那些在互联网上找不到自己声音痕迹的病人来说,可能是至关重要的。给亲戚留个简短的语音留言就足够了。
当他们第一次测试时,每个人都对语音克隆的质量感到震惊。偶尔出现的小故障——一个念错的单词,一个缺失的语调——几乎是察觉不到的。今年4月,医生为博根安装了一个只有她才能使用的定制手机应用程序。
“每次听到她的声音,我都很激动,”她的母亲帕梅拉·博根(Pamela Bogan)含着泪说。
莱西·博根补充说:“我觉得能再次拥有那种声音真是太棒了。”她说,这有助于“让我的信心恢复到这一切发生之前的水平。”
她现在每天使用这款应用大约40次,并发送反馈,希望能帮助未来的病人。她的第一个实验是在她担任助教的幼儿园和孩子们交谈。她输入了“哈哈哈哈哈”,期待着机器人的回复。令她吃惊的是,这听起来像她以前的笑声。
她在塔吉特百货(Target)和马歇尔百货(Marshall’s)用它询问在哪里可以找到商品。这帮助她和父亲重新建立了联系。这让她更容易点快餐。
博根的医生们已经开始克隆其他有意愿的罗德岛病人的声音,并希望将这项技术推广到世界各地的医院。OpenAI表示,在扩大语音引擎的使用方面,该公司正在谨慎行事,目前语音引擎尚未公开。
许多规模较小的人工智能初创公司已经向娱乐工作室出售语音克隆服务,或者让它们更广泛地使用。大多数语音生成设备供应商表示,他们禁止假冒或滥用,但他们在如何执行使用条款方面各不相同。
OpenAI负责该产品的杰夫·哈里斯(Jeff Harris)表示:“我们希望确保每个人的声音都在持续的基础上得到了同意。”“我们希望确保它不会被用于政治背景。因此,我们采取了一种非常有限的方法,将技术提供给谁。”
哈里斯说,OpenAI的下一步是开发一种安全的“语音认证”工具,这样用户就可以只复制自己的声音。他说,这可能“限制了像莱西这样突然失去语言能力的病人”。“所以我们确实认为,我们需要建立高度信任的关系,尤其是与医疗服务提供者的关系,让人们更不受限制地使用这项技术。”
博根专注于思考该技术如何帮助其他有类似或更严重语言障碍的人,这给她的医生留下了深刻的印象。
米尔扎说:“在整个过程中,她所做的部分工作就是思考如何调整和改变这种情况。”“她给了我们很大的鼓舞。”
虽然现在她必须摆弄她的手机才能让语音引擎说话,但博根设想了一种人工智能语音引擎,它可以改进语音恢复的旧疗法——比如机器人发声的电喉或语音假体——与人体融合或实时翻译单词。
她不太确定随着年龄的增长会发生什么,她的人工智能声音听起来仍然像她十几岁时的声音。她说,也许这项技术可以让她的人工智能声音“变老”。
现在,“尽管我不能完全恢复我的声音,但我有一些东西可以帮助我再次找到我的声音,”她说。——美联社
×