-
熱門新聞
-

OpenAI推出ChatGPT新功能! 現在能看圖片、聽聲音並進行對話

September 26, 2023
OpenAI近日公佈了一項重大突破,其人工智能助理ChatGPT現在具有了看、聽、說的能力。這項更新將為用戶提供更直接的接口,語音將在 iOS 和 Android 上提供,圖像將在所有平台上提供,並將在接下來的兩週內推出給Plus和Enterprise用戶。

聲音和影像的融合

據OpenAI官方消息,目前已經為其人工智能助理ChatGPT加入了新的語音和圖像功能。這些新功能讓使用者可以進行語音對話,或向ChatGPT展示他們正在討論的事物。這種更直覺的使用者界面將使得ChatGPT更具實用價值。

例如,當使用者在旅行中拍下一個地標,他們可以與ChatGPT進行即時對話,探討這個地標的有趣之處。當他們在家裡時,可以拍下冰箱的照片,以找出晚餐的菜單,並可以進一步詢問步驟來獲得食譜。

語音交流的新方式

現在,使用者可以用語音與其助手進行來回的對話。無論是想講述睡前故事給家人聽,還是在晚餐桌上解決一場爭論,語音對話都能讓使用者更輕鬆地與ChatGPT互動。用戶只需在手機應用程式中進入設定中的新功能,選擇加入語音對話。然後,點擊主畫面右上角的耳機按鈕,並選擇自己喜歡的音色就可以對話。

新的語音功能由一個新的文字轉語音模型驅動,這個模型能夠從僅僅一些文字和幾秒鐘的範例語音中產生出人類般的語音。OpenAI與專業的語音演員合作創建了每一種語音。他們還使用了Whisper這個開源的語音識別系統,用於將使用者的語音轉化為文字。

圖像的全新討論方式

現在,使用者可以向ChatGPT展示一張或多張圖片。無論是解決電器無法啟動的問題,拍照探索冰箱的內容以幫助規劃一頓飯,或者分析一個複雜的圖表以處理與工作相關的數據等,圖像的使用都將為使用者提供更多的方便。

用戶只需點擊右下角的相機按鈕,選擇要上傳的圖片,ChatGPT就會分析圖片並給出它的詮釋。這種新的圖像功能由OpenAI開發的現代化的圖像識別模型驅動,可以識別圖片中的對象,理解它們的相對位置和關係,並將這些資訊用於產生對話。

本文僅反映作者觀點,不代表科技財經立場。內容僅供參考,非投資建議。投資風險自負,作者與科技財經不承擔因交易產生的損失。

延伸閱讀