在各家大廠競逐大模型的步伐中,近日才發布相關產品的螞蟻集團無疑趕了個“晚集”。
9月8日,在上海舉辦的外灘大會上,螞蟻集團正式發布金融大模型以及基于金融大模型能力的兩款產品:C端智能金融助理“支小寶2.0”與B端智能業務助手“支小助”,從基礎大模型走向產業大模型與產業應用。
而此時全國已有超過130家公司發布自己的大模型,百度“文心一言”、商湯科技“商量SenseChat”、騰訊“混元大模型”、華為“盤古大模型”等等都已通過國家網信辦深度合成服務算法備案。
一直以來,擁有雄厚資金投入與數據基礎的金融行業,被公認為大模型落地應用的前沿領域。然而,通用大模型的泛化能力似乎又與金融場景對“絕對精準”與“絕對安全”的要求背道而馳。
對于螞蟻而言,AI大模型意味著什么?當螞蟻集團參戰開“卷”,為何選擇垂直大模型產品?大模型在金融行業的產業化落地應用還有多遠?
“AI是一個科技戰略問題”
“無論對金融行業,還是對螞蟻自身,AI都是一個科技戰略問題?!?/p>
螞蟻集團副總裁王曉航告訴21世紀經濟報道記者,今天的產業技術變革不是一蹴而就的,如果沒有長期以來AI全棧布局與積累,很難把握住這一輪技術變革的先機,而螞蟻很早就做好了準備。
2021年8月,斯坦福教授李飛飛與上百位AI科學家聯名發表《基礎模型的風險與機遇》(《On the Opportunities and Risk of Foundation Models》),掀開學界對大模型的研究,而螞蟻也由此開啟了對大模型的內部實踐研究,從支付寶開始探索百億規模的AI模型。
“在這之后,我們慢慢探索出了大模型新的技術范式,即在預訓練的基礎上進行精調,當服務發生變化,基礎模型不再需要重新訓練,這大幅提高了我們工程的生產能力?!蔽浵伡瘓FCTO何征宇提到,在2022年1月的一次公開演講中,他就分享過大模型范式的探索。
21世紀經濟報道記者了解到,2022年9月,螞蟻集團內部開了一次戰略性的會議,確立了集團整體AI的工程體系,必須圍繞大模型來做整體的升級,
“今年3、4月份,相信所有中國科技企業都曾經過了一段焦慮期,最害怕睡覺,害怕剛一起床就發現有一個新的論文和產品要研究?!蓖鯐院教寡?,盡管大模型的涌現帶來了各種各樣的可能性,但這還是一個需要知識積累的技術,在扎實的AI全棧布局與巨大的資金投入下,大模型不會一夜之間顛覆某個行業,“這是一個持續、長期的過程?!彼硎?。
算力、數據、算法是推動大模型成長的“三駕馬車”,螞蟻的基礎大模型在這三個層面都投入巨大。
算力層面,螞蟻基礎大模型平臺具備萬卡異構集群,其中千卡規模訓練MFU可達到40%,集群有效訓練時長占比達到90%以上;數據層面,除了全網通用語料與金融領域的優質語料,螞蟻還注入了優質的研判分析數據,以及大規模知識工程所帶來的超過270億Token的知識量;模型層面,螞蟻認為金融專屬指令更能夠代表大模型,解決特定金融任務的能力,其從真實場景中萃取了超過60萬條以上的專屬指令。
“大模型、生成式人工智能,是非常深刻的基礎技術,就像電力在發明之初被運用于電燈與照明,但逐漸它會深入到人們生活的方方面面?!焙握饔钊缡钦f。
金融全場景落地道阻且長
在“百模大戰”下,每家公司都面臨著不同的商業路徑選擇。
一方面,通用大模型與垂直領域大模型的發展能力截然相反,前者強調通用的泛化能力,而后者強調精準與精確專業。另一方面,“百模大戰”背后是大模型全產業鏈的發展,云平臺、計算機硬件、底層基礎大模型、大模型落地解決方案、大模型應用程序與服務都是這個賽道上的重要一環。
對此,螞蟻集團選擇的路徑是“卷”專業不“卷”云廠商。
“我們不做裸模型的開放,不卷云廠商?!蓖鯐院礁嬖V記者,螞蟻希望通過平臺和產品來幫助金融機構解決關鍵問題。
何征宇向記者表示,如果要為金融機構提供精調的落地解決方案,首先需要大量算力的投入,其次需要大量清洗好的數據與大量專業技術人才,而如今市場上這些資源都非常緊缺。
“我認為這些技術紅利不應該只壟斷在大公司,或者大平臺手中,應該盡快降低門檻,讓大模型技術得到快速普及?!焙握饔钪赋?,螞蟻希望提供端到端的產品,讓不了解大模型技術的員工與普通人也可以享受到技術紅利,實現技術普惠。
螞蟻集團這次發布的產品有兩款,分別是針對C端用戶的智能金融助理“支小寶2.0”,以及服務B端金融機構的智能業務助手“支小助”。值得一提的是,螞蟻的這個大模型有點“卷”,8月底,它已通過證券從業資格、保險從業資格、執業醫師資格、執業藥師資格等專業試題測試。
“在大模型時代,想象力非常重要,但我們認為更重要的是把技術轉化為規?;a業價值的能力,這需要解決產業的真命題?!蓖鯐院皆谘葜v中說道。
如此看來,螞蟻的大模型產品如果要覆蓋金融產業鏈條各個復雜環節,道阻且長。
復旦大學計算機科學技術學院教授肖仰華指出,從根本上來說,金融領域是復雜且嚴肅的應用場景?!皣烂C”意味著準確性要求極高,合規性要求極高,而生成式AI天生具備“幻覺”,其“一本正經胡說八道”的能力與嚴肅的應用要求存在天然矛盾,這一矛盾需要技術的調和。而復雜的金融場景是系統性的,例如從源頭來看,在數據合規、數據隔離、知識私有化等等問題都會限制大模型的效果發揮。
在金融系統的安全方面,浙江大學計算機學院教授、浙江大學人工智能研究所副所長鄭小林也表示,模型訓練過程中,許多非線性預算是需要進行警示的,如果誤差經過一層層累計,可能會成為比較大的金融安全隱患,這一安全問題需要個人、平臺、監管的全面關注。
“現在大模型技術在通用領域的門檻正在降低,但真正深入到專業領域,牽涉風險管理、決策研判等領域,還是停留在想象階段?!蓖鯐院奖硎?,如今大模型在金融行業的應用還沒有成熟,需要金融機構、金融科技公司共同將大模型的技術能力轉化成產品,實現產業落地的能力還需要1-2年。
責任編輯:王超
免責聲明:
中國電子銀行網發布的專欄、投稿以及征文相關文章,其文字、圖片、視頻均來源于作者投稿或轉載自相關作品方;如涉及未經許可使用作品的問題,請您優先聯系我們(聯系郵箱:cebnet@cfca.com.cn,電話:400-880-9888),我們會第一時間核實,謝謝配合。