OpenAI 在 5 月發表了 ChatGPT 新的高階語音模型,不僅回應速度更快、更即時,還可以當作即時口譯、可以判斷語氣聲調、甚至可以唱歌,但是這個高階語音模型一直沒有正式推出,直到近日終於要開始推送給 ChatGPT Plus 的使用者了。
可以使用的話會收到通知信
根據外媒的報導,OpenAI 最近開始針對 ChatGPT Plus 付費會員推送 ChatGPT 高階語音模型,但並非一次全部開放,而是逐步推送。
如果你是 ChatGPT Plus 會員並且想知道自己到底可不可以使用高階語音模型的話,除了可以自行點開 ChatGPT App 來測試看看以外,你還會收到一封通知信;有收到這封通知信就表示你已經可以使用 ChatGPT 高階語音模型的功能。
目前的 ChatGPT 雖然也可以語音對談,但是對談的結果最後會以文字對話的方式顯示,但是新版的似乎不會,所以如果你直接使用 ChatGPT 然後啟動語音對話功能後,發現最後沒有顯示文字的對話結果,那也表示你已經可以使用新的 ChatGPT 高階語音模型。
所有 Plus 會員在秋天都能用
雖然現在是逐步針對 ChatGPT Plus 會員推送高階語音模型的功能,但是 OpenAI 也有提到預計在今年秋季的時候開放所有的 ChatGPT Plus 會員使用。
至於是秋季的什麼時候目前還不確定。
ChatGPT 高階語音模型可以做什麼?
ChatGPT 高階語音模型和目前的語音功能最大差別之一就是在流暢度,互動的時候你會覺得好像真的在和真人對話一樣。
OpenAI's advanced voice-powered ChatGPT gets wider test – Axios https://t.co/2cJcB8uyxH #AI #ML #ArtificialIntelligence #MachineLearning #GenAI pic.twitter.com/proMaL8faI
— Evan Kirstel #B2B #TechFluencer (@EvanKirstel) July 31, 2024
即時語音翻譯
OpenAI 在發表會上還有示範讓 GPT-4o 當成即時翻譯機,它會用很口語化的方式在英文與不同語言之間做即時翻譯,而且不是很死板的完全照翻,會真的很像有一個朋友在幫你和外語者溝通那樣。
辨識聲音語調
ChatGPT 高階語音功能除了即時翻譯以外,還能夠理解和表達多種情緒, 並且生成多種情感表達的聲音。OpenAI 當時發表這項功能時,也展示了 GPT-4o 聽完一個笑話後也會像是正常人一樣的笑,而且是很自然的那種感覺。
讓 ChatGPT 作曲唱歌
你可以下指令給 ChatGPT,然後要求 ChatGPT 按照指令唱出旋律,中途還可以調整聲音語調、唱歌口氣的輕重,這些在 GPT-4o 模型下的 ChatGPT 高階語音模型下都可以做到。
還有視訊與畫面識別功能
當時 ChatGPT 在發布高階語音功能的同時,還有提到新版的 GPT-4o 還可以透過視訊辨識鏡頭所拍攝到的畫面,ChatGPT 可以看得出來兩個在猜拳的人誰輸誰贏。
還可以共享螢幕畫面,讓 ChatGPT 去分析你畫面上的內容,並進行更深入的互動。
就像有國外的網友在玩日本字幕的神奇寶貝遊戲時,一邊玩一邊把畫面拿給 ChatGPT 看,讓 ChatGPT 幫忙翻譯畫面上顯示的內容。
おもしろいChat GPT活用例。日本語のポケモンをリアルタイムで英語に翻訳してもらってプレイ。言語の壁はかなり崩れてきてますねpic.twitter.com/IdX0MI3qrR
— まかねこ (@makaneko_AI) July 31, 2024
如果你是 ChatGPT Plus 會員,希望可以早日體驗新版的語音模型,可以注意一下自己的信箱是不是有收到 OpenAI 寄來的通知信。