<video id="zjj55"><delect id="zjj55"></delect></video>

<big id="zjj55"><listing id="zjj55"><del id="zjj55"></del></listing></big>

<menuitem id="zjj55"><delect id="zjj55"><pre id="zjj55"></pre></delect></menuitem>

<output id="zjj55"></output>
<video id="zjj55"></video>

<menuitem id="zjj55"></menuitem>

    <video id="zjj55"><listing id="zjj55"></listing></video>

    <menuitem id="zjj55"></menuitem>
    <output id="zjj55"><delect id="zjj55"><pre id="zjj55"></pre></delect></output>

    <menuitem id="zjj55"></menuitem>
    <menuitem id="zjj55"></menuitem>

        <big id="zjj55"></big>
          1. 移動端
            訪問手機端
            官微
            訪問官微

            搜索
            取消
            溫馨提示:
            敬愛的用戶,您的瀏覽器版本過低,會導致頁面瀏覽異常,建議您升級瀏覽器版本或更換其他瀏覽器打開。

            OpenAI官宣開放多模態ChatGPT 能看、能聽、還會說

            史正丞 來源:財聯社 2023-09-26 09:23:27 OpenAI ChatGPT 金融AI
            史正丞     來源:財聯社     2023-09-26 09:23:27

            核心提示人工智能領域的知名創業公司OpenAI發布題為《ChatGPT現在能看、能聽、能說》的公告,宣布將在未來兩周時間里向付費用戶推送這項功能。

            財聯社9月26日訊(編輯 史正丞)北京時間周一晚間,人工智能領域的知名創業公司OpenAI發布題為《ChatGPT現在能看、能聽、能說》的公告,宣布將在未來兩周時間里向付費用戶推送這項功能。

            在今年3月GPT-4的發布會上,最令人感到震驚的一幕應該是,OpenAI總裁Greg Brockman拿著一張草稿紙畫了個草圖,隨手拍了張照就讓GPT-4在10秒鐘時間里生成了這個網站的代碼。

            image

            (來源:OpenAI)

            ChatGPT此前曾推出過能上傳圖片的“代碼解釋器“功能,具備了一些初步處理圖像和文本照片的能力。但毫無疑問,今天這個“隨手拍、隨心問”才更貼近大多數用戶的AI助手使用場景。

            拍張冰箱照片 告訴你今晚吃啥

            按照標題的順序,今天更新的功能主要有兩點:基于圖片的對話,以及實時語音對話。

            先說關注度非常高的圖片聊天功能。按照OpenAI的說法,用戶現在可以拍一張冰箱的照片,然后讓ChatGPT來推薦菜譜;在旅行時拍攝一張地標的照片,讓ChatGPT來講述這處景點的有趣之處。當然,也能拍一張數學題的照片,讓ChatGPT來解答。

            在官方給出的例子中,給到ChatGPT一張自行車的照片,問它如何把座椅調低。然后ChatGPT表示看你車的型號,有的車有快拆桿,有的是用螺栓固定,然后給出了詳細的步驟。

            image

            隨后官方裝作不懂,拍了一張螺栓的照片,并用官方畫圖工具圈出來以示強調,然后問ChatGPT這是不是快拆桿。ChatGPT表示你這個是螺栓,得去找一個內六角扳手。

            image

            隨后官方又拍了一張工具箱的照片,問ChatGPT到底是哪一個扳手。ChatGPT也順利地認出了扳手,并準確提示用戶到底要拿哪一個尺寸。

            image

            ChatGPT會說話啦!

            除此之外,OpenAI也將語音識別、轉錄和音頻生成功能打包,推出了AI語音聊天的功能,這項功能只適用于iOS和安卓客戶端。官方表示,用戶可以用這項功能為家里的小孩講睡前故事?;蛘呒依锍灾?,突然為某個問題吵起架來,這個時候就可以把ChatGPT拍在桌面上解決爭論。

            image

            OpenAI介紹稱,這項功能使用了Whisper開源語音識別系統,將用戶說的話轉錄成文本。同時還用上了一項新的文本轉語音模型,并與專業配音演員合作,提供5種可供用戶自行選擇的聲音。

            更先進的AI也有新的風險和局限性

            OpenAI表示,新的語音技術能夠僅通過幾秒鐘的真實語音創造出逼真的合成聲音。這種功能打開了創造力的大門,也帶來了新的風險——例如不法分子可能偽造公眾人物進行欺詐。所以OpenAI的決策是通過“語音聊天”這樣的特定用例來推出這項功能。

            同時OpenAI也在與更多的機構展開合作。例如流媒體公司Spotify就在試用這項功能來進行語音翻譯,通過使用播客主持人的聲音將播客音頻翻譯成其他語言,幫助播客主持人擴大他們的全球影響力。

            圖像也會帶來新的挑戰,例如幻覺問題,以及使用者在高風險領域卻依賴模型對圖像的解釋。因此在上線前,OpenAI也對極端主義和科學能力等領域進行了風險測試。

            另外對看到這篇文章的中文讀者來說,圖片對話的體驗大概率值得期待,但語音對話可能要打一些折扣。OpenAI表示,該模型擅長轉錄英文文本,但在一些其他語言,特別是那些使用非羅馬字母的語言中表現不佳,建議非英語用戶不要使用ChatGPT來進行此類用途。


            責任編輯:王超

            免責聲明:

            中國電子銀行網發布的專欄、投稿以及征文相關文章,其文字、圖片、視頻均來源于作者投稿或轉載自相關作品方;如涉及未經許可使用作品的問題,請您優先聯系我們(聯系郵箱:cebnet@cfca.com.cn,電話:400-880-9888),我們會第一時間核實,謝謝配合。

            為你推薦

            猜你喜歡

            收藏成功

            確定
            人妻精品一区二区三区_好紧好湿好硬国产在线视频_亚洲精品无码mv在线观看_国内激情精品久久久

            <video id="zjj55"><delect id="zjj55"></delect></video>

            <big id="zjj55"><listing id="zjj55"><del id="zjj55"></del></listing></big>

            <menuitem id="zjj55"><delect id="zjj55"><pre id="zjj55"></pre></delect></menuitem>

            <output id="zjj55"></output>
            <video id="zjj55"></video>

            <menuitem id="zjj55"></menuitem>

              <video id="zjj55"><listing id="zjj55"></listing></video>

              <menuitem id="zjj55"></menuitem>
              <output id="zjj55"><delect id="zjj55"><pre id="zjj55"></pre></delect></output>

              <menuitem id="zjj55"></menuitem>
              <menuitem id="zjj55"></menuitem>

                  <big id="zjj55"></big>