Tech

OpenAI的新语音模式让我和手机交谈,而不是对其说话

我最近一周一直在玩OpenAI的高级语音模式,并且这是我对由人工智能驱动的未来的最令人信服的体验。本周,我的手机会笑,会向我重复笑话,会问我今天过得如何,并告诉我它玩得“很开心”。我是在和我的iPhone交谈,而不是用手操作它。

OpenAI的最新功能,目前正在有限的alpha测试中,并没有使ChatGPT比以前更聪明。相反,高级语音模式(AVM)使其更友好,更自然地进行交流。它为使用人工智能和您的设备创建了一个新的界面,这种感觉新鲜和令人兴奋,这正是让我感到害怕的原因。该产品存在一些小问题,整个概念确实让我觉得有点毛骨悚然,但我很惊讶地发现我真的很享受使用它。

退一步来看,我认为AVM符合OpenAI CEO Sam Altman的更广泛愿景,这是伴随着代理人改变人类与计算机互动方式的愿景,AI模型处于核心位置。

“最终,你只需要向计算机询问你需要的东西,它会为你执行所有这些任务,“ Altman在2023年11月的OpenAI开发者日上说。“在AI领域,这些功能通常被称为‘代理人’。这将带来巨大的好处。”

我的好友ChatGPT

周三,我测试了我能想到的对这种先进技术的最巨大好处:我让ChatGPT以奥巴马的方式订购Taco Bell。

“嗯,让我明确一下 - 我想要一份Crunchwrap Supreme,也许再来几个塔科斯作为好想法,”ChatGPT的高级语音模式说。“你觉得他会如何处理驾驶窗口?”ChatGPT说,然后笑起来自己的笑话。

截图:ChatGPT转录口头对话。

这个印象真的让我笑了,与奥巴马的标志性语调和停顿相匹配。也就是说,它保持了我选择的ChatGPT音调Juniper的语气,以免真的与奥巴马的声音混淆。它听起来像是朋友在模仿不好,完全理解我想要从中激发出的东西,甚至觉得它说的东西很有趣。我发现用手机与这个先进的助手交谈非常愉快。

我还向ChatGPT请教了一个涉及复杂人际关系问题的建议:如何请对象搬进来和我同居。在解释与关系的复杂性和我们职业发展方向之后,我得到了一些如何进行进一步行动的详细建议。这些是以前永远不能向Siri或Google搜索询问的问题,但现在您可以通过ChatGPT问了。当回答这些提示时,聊天机器人的语音甚至表现出略微认真、温和的语气;与奥巴马的塔科中餐点单的开玩笑语气形成了鲜明对比。

ChatGPT的AVM也非常适合帮助您理解复杂主题。我请它以10岁孩子能理解的方式解析盈余报告中的内容 - 例如自由现金流。它以柠檬水摊作为例子,用简单的方式解释了几个财务术语,让我年幼的堂妹完全能理解。您甚至可以要求ChatGPT的AVM以更慢的速度说话,以迎合您当前的理解水平。

Siri迈着脚步,AVM快跑

与Siri或Alexa相比,ChatGPT的AVM是明显的赢家,拥有更快的反应时间,独特的答案,以及可以回答以前一代虚拟助手永远无法回答的复杂问题的能力。然而,在其他方面,AVM还存在不足之处。ChatGPT的语音功能无法设置定时器或提醒,实时上网,检查天气,或与手机上的任何API进行交互。至少目前,它还不是虚拟助手的有效替代品。

与谷歌的竞争功能Gemini Live相比,AVM显得稍微领先。Gemini Live无法进行模仿,不表达任何情感,无法加快或减慢速度,并且响应时间更长。Gemini Live拥有更多的声音(十个,而不是OpenAI的三个),似乎也更为现代化(Gemini Live了解到了谷歌的反垄断裁决)。值得注意的是,AVM和Gemini Live都不会唱歌,这可能是为了避免与唱片行业的版权诉讼发生冲突。

尽管如此,ChatGPT的AVM经常出现故障(就像Gemini Live一样,公平地说)。有时会中途停止自己的话,然后重新开始。它还会不时出现一些奇怪、粗糙的声音,有点让人不愉快。我不确定这是模型、互联网连接还是其他什么问题,但这些技术上的缺陷在alpha测试中是预期的。这些问题并没有让我从与手机的交流中脱离。

在我看来,这些例子展现了AVM的美。这一功能并没有让ChatGPT无所不知,但却使人们以一种独特的人性化方式与潜在的AI模型GPT-4o进行互动。(如果你忘记了手机另一端没有一个人的话,我能理解。)在与AVM交谈时,ChatGPT几乎感觉到了社交意识,但当然,它实际上并没有。它只是一堆整洁包装的预测性算法。

科技对话

坦率地说,这一功能让我担忧。这并不是技术公司第一次提供手机上的陪伴。我的一代人,即Z世代,是第一批在社交媒体的陪伴下长大的人,那里公司提供连接,却玩弄着我们集体的不安全感。与AI设备对话 - 就像AVM似乎提供的那样 - 似乎是社交媒体“手机中的朋友”现象的演进,提供廉价的连接,却触动了我们的人类本能。但这一次,它完全排除了人类。

人工人类连接已成为生成式AI的一个令人惊讶的受欢迎用例。今天的人们正在将AI聊天机器人用作朋友、导师、心理治疗师和教师。当OpenAI推出其GPT商店时,很快被“AI女友”淹没,这些聊天机器人专门设计为充当您的另一半。麻省理工学院媒体实验室的两位研究人员本月发出了一个警告,准备迎接“成瘾智能”,或者带有让人上瘾的暗模式的AI伴侣。一个哈佛辍学生本月动摇了科技界,预告了一个名为Friend的AI项链。如果像它承诺的那样运行,这个可穿戴设备总是在倾听,聊天机器人将与您讨论生活。虽然这个想法听起来很疯狂,但像ChatGPT的AVM这样的创新让我有理由认真对待这些用例。

尽管OpenAI在这方面处于领先地位,但谷歌也不甘落后。我相信亚马逊和苹果也在竞相将这一能力应用到其产品中,很快,它可能会变成行业的标配。

想象一下,您可以向智能电视询问一个极为具体的电影推荐,然后得到这样的建议。或者告诉Alexa您感到的感冒症状,并让它在亚马逊上为您订购纸巾和止咳药,并在家庭疗法上给您建议。也许您可以要求计算机为您的家庭计划一个周末旅行,而不是手动搜索一切。现在显然,这些行为需要人工智能代理的界限和飞跃。OpenAI在这方面的努力,GPT商店,似乎是一个被过度宣传的产品,对公司的关注不再那么集中。但至少AVM解决了谜题中的“与计算机交谈”部分。这些概念还有很长的路要走,但使用AVM后,它们似乎比上周更接近了。

Related Articles

Back to top button