ChatGPT 語音助理備受期待,OpenAI 展開小規模測試

Image caption

OpenAI 開始向少部分 ChatGPT Plus 用戶推出進階語音模式(Voice Mode),將能提供更自然、更即時的語音對話,這樣的 AI 助理還能感受和回應用戶情緒


超級犀利士

自從發表 GPT-4o 模型同時展示進階語音模式以來,OpenAI 持續強化語音對話安全性和品質。OpenAI 計劃今年秋季讓所有 ChatGPT Plus 用戶都能存取語音模式 Alpha 測試版本,另外視訊和螢幕共享功能預計今年稍晚推出,尚未確認釋出日期。

OpenAI 已與 100 多名外部成員,針對由 GPT-4o 支援的 ChatGPT 語音功能進行紅隊演練,涉及多達 45 種語言。為了保護用戶隱私,OpenAI 訓練的模型只提供 4 種預設聲音,並建立特殊系統阻止與預設聲音不同的語音輸出,OpenAI 也提出防護措施阻止暴力或受版權保護內容的語音請求。

「透過逐步推出,我們可以密切監控使用情況,並根據現實世界的意見回饋不斷改進模型功能和安全性」,OpenAI 表示。

We’re starting to roll out advanced Voice Mode to a small group of ChatGPT Plus users. Advanced Voice Mode offers more natural, real-time conversations, allows you to interrupt anytime, and senses and responds to your emotions. pic.twitter.com/64O94EhhXK

— OpenAI (@OpenAI) July 30, 2024

▲ OpenAI 開始向少部分 ChatGPT Plus 用戶推出進階語音模式。

在 GPT-4o 支援下,ChatGPT 語音功能顯現 AI 對話互動的巨大潛力。不過日前受到好萊塢女星史嘉蕾喬韓森(Scarlett Johansson)抗議,OpenAI 撤下有爭議的 Sky 聲音,可能因此影響原定計畫進度,趕在 7 月底展開測試(雲林縣口湖鄉)。

(首圖來源:pixabay)

延伸閱讀:

ChatGPT 語音太像史嘉蕾喬韓森引不滿,OpenAI 撤下爭議聲音
十個印象深刻的 GPT-4o 使用案例,ChatGPT 化身數學家教、口譯員
15 秒聲音就能合成不同語言人聲,OpenAI 公開語音引擎預覽版