在發布“通義千問”不到兩個月后,阿里云基于大模型在AI音視頻賽道打出了一槍。
6月1日,阿里云宣布通義大模型進展,聚焦音視頻內容的AI新品“通義聽悟”正式上線,成為國內首個開放公測的大模型應用產品。
今年以來,國產AI大模型賽道熱鬧非凡,各家廠商、機構的大模型接踵而至,應接不暇。最新數據顯示,截至目前,我國10億級參數規模以上大模型已發布79個。
相比于集體宣布搶發AI大模型,未來,如何基于大模型研發針對行業細分領域的垂直的模型更加重要。各路人馬已有動向?!鞍倌4髴稹钡南乱粋€新擂臺,已然搭起。
國內首個開放公測大模型應用產品
開會AI幫忙記錄,還能幫忙總結、提取重點和整理待辦事項?
6月1日,阿里云宣布通義大模型進展,聚焦音視頻內容的AI新品“通義聽悟”正式上線,成為國內首個開放公測的大模型應用產品。
從現場演示可以看到,通義聽悟接入了通義千問大模型的理解與摘要能力,能夠完成對音視頻內容的轉寫、檢索、摘要和整理,比如用大模型自動做筆記、整理訪談、提取PPT等。聽悟還與阿里云盤打通,同時支持云盤導入和本地上傳。
阿里云CTO周靖人介紹,聽悟集成了阿里最先進的語音和語言技術。其內置阿里新一代工業級語音識別模型,識別準確率極高;融合自研語音語義多模態說話人算法,能對10人以上說話場景進行角色區分;接入通義千問大模型后,能夠對上萬字的音視頻內容進行摘要總結,支持跨多音視頻內容的精準問答理解。
聽悟技術負責人鄢志杰向21世紀經濟報道記者表示,通義聽悟的前身是阿里云內部一個名為“聽悟”的產品,主要為投資部、HR等部門做項目會議的音頻轉寫功能,在2022年,這款產品的潛力逐步被挖掘,內部開始思考其工具屬性是不是要發生變化。
“工具是什么呢?人還是支配他的,基本上它不會比你更聰明,也不會比你懂得更多。但是,大模型能力跟工具應用相結合變成助手以后,它甚至能給到建議啟發你,知曉你不知道的知識,留意到你之前沒有留意的細節?!臂持窘苷f。
繼此前阿里云降價之后,此次聽悟同樣推出免費使用體驗,聽悟用戶可通過每日登陸等多種任務領取免費轉寫時長。公測期間,阿里云官方微博、微信及各大平臺社區還會發放大量20小時轉寫口令碼,用戶獲得的福利權益可累加,一年內有效,免費時長可高達100小時以上。
周靖人表示,聽悟發布公測版后,希望更多人能夠體驗到該產品,真正把大模型的能力變成工作學習的AI助手。在接下來的階段,聽悟也將陸續推出增強版,到時候會有一些商業化的安排。
“百?!蓖瞥鲋?/span>
ChatGPT帶火了國內AI大模型市場,5月28日發布的《中國人工智能大模型地圖研究報告》顯示,截至目前,我國10億級參數規模以上大模型已發布79個。距離實現真正的“百?!?,已然不遠。
此前,中國工程院院士、清華大學計算機科學與技術系教授鄭緯民接受21世紀經濟報道記者采訪時,ChatGPT的爆紅源于其能流暢地與人對話、寫詩,甚至作畫,但未來AI大模型所帶來的貢獻應不止于此,如何基于大模型研發針對行業細分領域的垂直的模型更加重要。
各家企業、機構也在緊鑼密鼓地發展大模型、打磨基于大模型的應用。
阿里云推出通義聽悟時,距離“通義千問”的發布還不到兩個月的時間。周靖人對21世紀經濟報道記者表示,目前外界對大模型要求很高,從通義千問發布以來,阿里云也陸陸續續做了大量工作,并在全國開始部署AI的模型。同時,在云的底層通過一系列模型優化不斷降低模型使用的成本,降低模型所使用的資源,只有這樣能夠讓模型真正意義大規模去服務社會。
對比阿里云發布國內首個開放公測的大模型應用產品,百度則帶著國內首個大模型基金而來。
5月31日,百度正式宣布設立規模為10億元的“百度文心投資基金”,重點投資孵化大模型領域的優質創業企業,為其提供包括資金、技術、人才在內的一站式資源。另外,創始人李彥宏正式宣布啟動百度“文心杯”創業大賽,致力于尋找大模型時代的“game-changing founder”,參賽創業者將有機會獲得來自百度集團的1000萬元投資。
在最近的財報電話會議上,騰訊方面也表示AI基礎模型“混元”取得良好進展,模型構建進展順利。其業務部門稱,目前正積極對訓練部門及生產線擴容,相信未來人工智能將在不同領域有所應用。
據悉,騰訊已成立類ChatGPT對話式產品項目組“混元助手”。該項目組將聯合騰訊內部多方團隊構建大參數語言模型,目標是通過性能穩定的強化學習算法訓練,完善騰訊智能助手工具,打造騰訊智能大助手,并能成為國內的業界標桿。
責任編輯:王超
免責聲明:
中國電子銀行網發布的專欄、投稿以及征文相關文章,其文字、圖片、視頻均來源于作者投稿或轉載自相關作品方;如涉及未經許可使用作品的問題,請您優先聯系我們(聯系郵箱:cebnet@cfca.com.cn,電話:400-880-9888),我們會第一時間核實,謝謝配合。