OpenAI碰瓷斯嘉丽·约翰逊!没必要,真没必要
前两周在OpenAI发布会上大放异彩的ChatGPT-4o Sky语音,最近悄然下架。
OpenAI发布会上展示的核心功能“多模态语音对谈”开放的进程再次延缓——在OpneAI官网上,GPT-4o向全部用户免费开放的时间从原来的几周,悄悄咪咪地改成了几个月。
OpenAI深更半夜发表推文,Sky声音已经撤掉
这当然可能和扩容时遇到的技术问题有关,但还有一个问题是,最近知名演员斯嘉丽·约翰逊的法律团队向OpenAI发了两封信,要求OpenAI公布ChatGPT-4o语音“Sky”(简直是斯嘉丽的谐音)的制作过程,因为这个声音听起来跟斯嘉丽·约翰逊简直是一个模子里刻出来的。
如果还是不好理解的话,你可以想象一下某导航软件推出新语音包,听起来激似林志玲,导航软件老板是林志玲粉丝,语音包名字还叫玲玲。
OpenAI官网还更新了Blog,极力辩解“Sky”跟斯嘉丽·约翰逊没有关系|OpenAI
斯嘉丽·约翰逊向美国媒体表示,听到Sky的声音后,她“感到震惊、愤怒”,不敢相信奥尔特曼竟然选了一个和自己声音一模一样的配音,“连我最亲密的朋友和新闻媒体都区分不出来”,约翰逊说。
尽管OpenAI坚称GPT-4o的声音绝不是斯嘉丽·约翰逊,OpenAI CTO米拉·穆拉蒂(Mira Murati)在接受采访时甚至说,“完全没有学斯嘉丽·约翰逊的意思,为了这个事我甚至得专门去听听斯嘉丽·约翰逊的声音是啥样的”。
不管穆拉蒂知不知道斯嘉丽·约翰逊,但OpenAI CEO奥尔特曼绝对知道,因为——
奥尔特曼是斯嘉丽粉头啊!
在GPT-4o发布之前,奥尔特曼就“碰瓷”过斯嘉丽·约翰逊。5月14日,奥尔特曼在X上发了一条推文,只有一个词,“her”。
这个词明确指向了2013年的科幻电影《她》。在这部电影里,男主角爱上了由斯嘉丽·约翰逊配音的人工智能Samantha,奥尔特曼也曾在采访中表示,《她》是他最喜欢的电影。
而据斯嘉丽写给媒体的信,奥尔特曼直到GPT-4o发布前两天还在极力邀请她配音。
“去年9月,我收到了奥尔特曼给GPT-4o配音的邀请。他告诉我,我的配音可以架起科技和创意之间的桥梁,让消费者在从人类到人工智能的巨变过程中感到舒适。他说他觉得我的声音会让人们感到安慰。”约翰逊写到。
但她出于个人原因,十分感动然后拒绝了奥尔特曼。
奥尔特曼并没有就此放弃,在ChatGPT发布会的前两天,他再次联系了约翰逊的经纪人,请求她重新考虑。但很显然,这是一招先斩后奏,在打电话之前,GPT-4o就已经做好了。
发布会之后,所有人都发现Sky的声音像约翰逊了,美国国民节目《周六夜现场》还公开吐槽GPT碰瓷,说不知道追求那个声音意义何在,如果声音离开了约翰逊本人的身体那谁还想听呢。
奥尔特曼:我想听
约翰逊在信里继续写到:
“由于OpenAI的行为,我被迫聘请了法律顾问……要求他们详细说明创建Sky的制作过程。”
在这之后,OpenAI就暂时关闭了Sky的语音。
Sky的声音怎么来的?
在约翰逊的要求下,OpenAI发Blog描述了GPT-4o语音的制作细节(虽然暂时没有其他证据证明OpenAI说的是真的)。
OpenAI称,他们从400个声音中挑选了五个月,才选出了GPT-4o的五个声音(分别是Breeze、Cove、Ember、Juniper 和 Sky)。他们和专业配音演员、经纪公司、选角导演和行业顾问合作完成了这个工作。
在选择合适的声音时,他们制定了一套标准,其中包括几个重要的考量角度:
1、背景丰富或会说多种语言的配音演员,加分
2、声音要给人一种“永恒(timeless)”的感觉
3、声音要平易近人,能激发信任
4、声音温暖、迷人、鼓舞人心、富有魅力,音调丰富
5、声音自然,易于聆听
虽然其中有些标准挺抽象的(比如说一个声音要怎么又有永恒感又平易近人?),但不得不说,DAN和Sky能有这么高的人气和感染力,和它们的声线是分不开的。
OpenAI表示,GPT-4的配音选拔是从2023年5月10日开始的,不到一周,他们收到了400多份配音申请。在试镜时,配音演员们需要朗读一份ChatGPT回复文案,文案内容包括了从正念冥想、旅行计划、到和用户聊天在内的一系列场景。
之后,OpenAI和每个配音演员讲解了GPT-4的功能、局限性和所涉及的风险,确保每个配音演员在加入之前都充分了解了语音模式的范围和意图。
OpenAI补充道:每位演员的报酬都高于市场最高水平,只要他们的声音在我们的产品中使用,这种报酬就会持续下去。但为了保护配音演员的隐私,OpenAI不能透露Sky配音演员的姓名。
这场争端对约翰逊来说是轻伤,对OpenAI来说可能是重伤。
在Deepfake之后,公众对于用AI技术换脸、换声音的潜在危险本来已经非常敏感了,OpenAI作为能左右行业风向的大佬,不仅没有在安全方面做出更大的努力,反而沾上了未经允许用公众人物声音“炼”AI的嫌疑,只能让人们对AI的信任更浅。
此外,OpenAI一直有跳票和“实物缩水”的前科,去年GPT-4的读图功能拖延了6个月才用上,今年发布会上所做的承诺也迟迟不兑现,不免让人觉得OpenAI是为了狙击接下来要发布新产品的谷歌而放出没有完全成熟的技术。经过了这次声音争端,GPT-4o的兑现时间再一次被延后了,属实有点搞笑。
甚至想问问奥尔特曼,GPT-4o的声音像不像《她》,真的那么重要吗?真的有用户在乎吗?
作者:翻翻
编辑:odette
本文来自果壳,未经授权不得转载.
如有需要请联系sns@guokr.com