出品 | 搜狐科技

作者:王一鸣

近日,GPT-4o高级语音功能(Voice Mode)上线,网友们纷纷发挥想象力,大显身手。

事实上香港码今晚开奖结果查询,GPT-4o高级语音早在6月底就发布了测试版本alpha,但因不符合“发布标准”而被推迟发布。

最初,高级语音版本中有一个叫“Sky”的声音,与《她》中斯嘉丽约翰逊的声音非常相似。约翰逊曾与该公司谈判,最终将这个声音删除。并表示,他们已经让其无法模仿任何其他人的声音,无论是个人还是公众人物,同时也屏蔽了与这些预设声音不同的输出。

GPT-4o虽然没有生命,但它非常活跃

新的语音模式很强大,说话时可以打断新澳好彩免费资料查询,还可以讲故事、模仿、实时翻译等多种方式。

因为实在太好玩了,网友们不断拿它开玩笑。比如有位网友让 GPT-4o 学习《星球大战》和《辛普森一家》里的尤达,最后把它们混合到了一起:

我也能用中文讲故事,虽然发音还不是很标准,“气”字读起来像日语。其实我还需要一些训练,才能逐渐变得更加“地道”:

你也可以与 GPT-4o “视频语音”聊天:

这意味着您可以与非常聪明且知识渊博的人进行“视频通话”。

其实视频里的人是开玩笑的:“猫咪的所作所为,只是它们想要谋杀你的信号而已。”用爪子按压你,只是为了确定你内脏的薄弱之处,坐在你的笔记本电脑上,是为了破坏你与外界的联系。视频里,猫咪在厕所里不吃东西,保持略显饥饿的状态,为伏击做准备。

,你会唱《一闪一闪小星星》吗?

虽然有些跑调,但是声音很真实,甚至还伴随着呼吸声。

挑战多语言也没问题澳门开奖直播免费观看,从英文→韩文→中文→法文→葡萄牙文→西班牙文→斯瓦希里文:

它还可以充当僚机,帮你实时翻译外国游戏:

OpenAI 推出 GPT-4o 高级语音功能,ChatGPT 还能这么玩?  第1张

试想一下如果你有一个不知道怎么过的关卡,你能直接通过询问分析来获得游戏策略吗?

在预报天气的时候,它还可以模拟环境声音(风、雷、交通警报器等)

天气预报的播报充满激情和表现力,未来电视台的天气预报节目可以发挥更多的想象力。

它可以用各种语调讲述睡前故事,甚至可以像舞台剧一样演唱:

这声音真实得可怕。

总体来说,每次提问一般需要几秒的时间才能做出回应,这可能和计算能力或者网络有关,但比起之前的版本要快很多。

“这不是文本转语音”

关于先进的语音功能,沃顿商学院副教授、《共享智能》一书的作者 Ethan 表示:

1.它的效果是很好的,当时就表现出来了。

2.显然它可以产生很多的声音效果,但是它也有很多的局限性。

3.这个很奇怪,很多无意识的线索(内容)让人感觉眼前的人是一个真实存在的人。

教授认为,虽然自己长期使用底层模型,但这种语音改变了AI交互的本质。

同时,未来AI也会变得更加人性化;如果以前你觉得要对AI礼貌,那么未来或许也需要“礼貌”地对待AI。

也就是说OpenAI 推出 GPT-4o 高级语音功能,ChatGPT 还能这么玩?,它能够感知情绪,未来它很可能会根据你说话的语气,输出自己的情绪。

此前处理语音时,需要将语音转化为文本,然后GPT语言模型理解并利用文本得到答案,进而大声读出来。

如今的 GPT-4o 具备多模态能力,可以直接理解音频并做出回应。这就好比有人在跟你聊天时,不需要把你说的话翻译成文字,再思考一下再回复你。所以这种方法也减少了延迟。