5月20日消息,OpenAI公司發(fā)布推文,宣布將暫停供聊天機器人ChatGPT語音功能使用的“Sky” 語音,起因是用戶指出該聲音與美國知名女演員、女歌手斯嘉麗·約翰遜 (Scarlett Johansson) 的聲音十分相似。
OpenAI澄清表示,這是用超過400名配音演員聲音采集、篩選和數(shù)據(jù)訓練的,而非斯嘉麗·約翰遜的聲音。
OpenAI透露,未來幾周內(nèi),GPT-4o為ChatGPT Plus付費用戶提供新的語音模式,名為Alpha版本。借助GPT-4o,使用語音與 ChatGPT交互更加自然,可有效管理群組對話、過濾背景噪音等。
“展望未來,您可以期待更多選擇,因為我們計劃在 ChatGPT 中引入更多聲音,以更好地滿足用戶的不同興趣和偏好。”OpenAI表示。

據(jù)悉,5月14日,OpenAI推出可免費使用、可實時進行音頻、視覺和文本推理、短至232毫秒響應音頻輸入的全新旗艦AI模型GPT-4o,并將推出PC桌面版ChatGPT。
OpenAI CTO米拉·穆拉蒂 (Mira Murati)表示,在API使用方面,相比去年11月發(fā)布的GPT-4-turbo,GPT-4o價格降低一半(50%),速度提升兩倍(200%)。
OpenAI CEO奧爾特曼稱,新的GPT-4o是OpenAI有史以來最好的模型,它很智能,速度很快,是原生多模態(tài),并且它可供所有ChatGPT用戶使用,無論是免費版本還是付費GPT-4版。“這對我們的使命很重要,我們希望將出色的 AI 工具交到每個人手中。”
實際上,早在2023年9月,OpenAI引入了語音功能,為用戶提供另一種與 ChatGPT 交互的方式。
OpenAI表示,語音模式是ChatGPT中最受歡迎的功能之一。用戶聽到的五種不同聲音中的每一種都是經(jīng)過為期五個月的廣泛過程精心挑選的,涉及專業(yè)配音演員、人才機構(gòu)、選角導演和行業(yè)顧問。
“這些都是從我們合作創(chuàng)作的配音演員中采樣而來。”自去年初開始,OpenAI對用戶對該功能和個人聲音的反應方式進行測試,聲音包括Breeze、Cove、Ember、Juniper 和 Sky,
2023年5月,選角機構(gòu)和OpenAI選角總監(jiān)發(fā)出了人才招募。在不到一周的時間里,團隊收到了400多份配音和演員提交的作品。在試鏡時,演員們收到了一份包含ChatGPT 回復的腳本,并被要求將其錄制下來。這些樣本的范圍從回答有關(guān)正念的問題到集思廣益的旅行計劃,甚至參與有關(guān)用戶一天的對話。
隨后,選角團隊獨立審查并手工挑選了14名演員的初步名單。而OpenAI則最終選擇了五個聲音,并與演員討論了我們對人機交互的愿景以及語音模式的目標。
2023年6月、7月,OpenAI讓演員們飛到舊金山進行錄制,并與 OpenAI 產(chǎn)品和研究團隊進行面對面的會議。
2023 年9月25日,OpenAI將他們的聲音發(fā)布到 ChatGPT。
OpenAI指出,ChatGPT采取的聲音特征主要包括五個點:來自不同背景或會說多種語言的演員;感覺永恒的聲音;平易近人的聲音激發(fā)信任;溫暖、迷人、鼓舞人心、富有魅力的聲音和豐富的音調(diào);自然易聽。
OpenAI強調(diào),公司與配音行業(yè)密切合作,以確保采取正確的步驟來為 ChatGPT 配音。每個演員都會獲得高于市場最高水平的報酬,只要他們的聲音在產(chǎn)品中使用,這種情況就會持續(xù)下去。
“我們認為AI聲音不應該刻意模仿名人獨特的聲音——Sky的聲音不是模仿斯嘉麗·約翰遜,而是屬于不同專業(yè)女演員使用她自己自然說話的聲音。為了保護他們的隱私,我們不能透露我們配音員的名字。”OpenAI稱。
OpenAI強調(diào),整個過程涉及演員和選角團隊的廣泛協(xié)調(diào),歷時五個多月。公司將繼續(xù)與參與者合作,他們?yōu)?GPT-4o 中的音頻研究和新語音功能做出了額外的工作