
據OpenAI官方消息,目前已經為其人工智能助理ChatGPT加入了新的語音和圖像功能。這些新功能讓使用者可以進行語音對話,或向ChatGPT展示他們正在討論的事物。這種更直覺的使用者界面將使得ChatGPT更具實用價值。
例如,當使用者在旅行中拍下一個地標,他們可以與ChatGPT進行即時對話,探討這個地標的有趣之處。當他們在家裡時,可以拍下冰箱的照片,以找出晚餐的菜單,並可以進一步詢問步驟來獲得食譜。
現在,使用者可以用語音與其助手進行來回的對話。無論是想講述睡前故事給家人聽,還是在晚餐桌上解決一場爭論,語音對話都能讓使用者更輕鬆地與ChatGPT互動。用戶只需在手機應用程式中進入設定中的新功能,選擇加入語音對話。然後,點擊主畫面右上角的耳機按鈕,並選擇自己喜歡的音色就可以對話。
新的語音功能由一個新的文字轉語音模型驅動,這個模型能夠從僅僅一些文字和幾秒鐘的範例語音中產生出人類般的語音。OpenAI與專業的語音演員合作創建了每一種語音。他們還使用了Whisper這個開源的語音識別系統,用於將使用者的語音轉化為文字。
現在,使用者可以向ChatGPT展示一張或多張圖片。無論是解決電器無法啟動的問題,拍照探索冰箱的內容以幫助規劃一頓飯,或者分析一個複雜的圖表以處理與工作相關的數據等,圖像的使用都將為使用者提供更多的方便。
用戶只需點擊右下角的相機按鈕,選擇要上傳的圖片,ChatGPT就會分析圖片並給出它的詮釋。這種新的圖像功能由OpenAI開發的現代化的圖像識別模型驅動,可以識別圖片中的對象,理解它們的相對位置和關係,並將這些資訊用於產生對話。