2023年12月17日,工商銀行首席技術官呂仲濤在第二屆明珠灣金融論壇上發布了《明珠灣智能金融發展報告(2022)應用篇》(以下簡稱“應用篇”),并接受了經濟觀察網記者的提問。
呂仲濤介紹,金融行業智能應用2022年以來主要呈現了三個特征:應用規模穩步增長、應用質效不斷提升、應用成效顯著增強?!皯闷比脒x典型案例共33個,按照銀行、保險、證券三個主要的行業板塊組織,每個板塊大致細分為產品創新、客服營銷、運營管理、風控合規四個應用大類。其中,銀行業對智能新技術先行先試,持續提升業務水平,在智慧鄉村、智能錄審、數智交易等各類場景推出一大批典型應用。
呂仲濤表示:“大型銀行的數字化轉型和智能化應用發展較早,往往基于全技術棧面向全業務場景打造企業級平臺化能力,水平在同業中較為領先。中小銀行受制于資本、規模、人才等因素,其智能應用水平較大型機構總體上還有一定的差距,適合根據自己的戰略定位和特色業務領域,通過專項技術產品引進和持續打磨的方式賦能業務?!?/p>
對于記者提出的AI大模型需要大量的業務數據反哺來訓練學習,大型金融機構怎樣做好數據治理,安全合規地發展金融大模型的問題,呂仲濤表示:“高質量的數據是企業大模型應用成功的基石。但是訓練所需的數量巨大且多樣性要求高,對大模型所需的數據采、洗、管、用的數據工程平臺能力提出新挑戰?!?/p>
呂仲濤介紹,工商銀行已在同業率先完成千億金融大模型構建和應用。在這過程中,工商銀行依托企業級數據中臺,已從金融數據集的建設出發,圍繞數據采集、清洗、標注、管理、使用等全生命周期管理,初步形成一整套大模型數據工程平臺能力并積累TB(萬億字節)級金融數據集并不斷完善。
一是夯實標準化、流水線的數據采集之“基”,打破數據孤島。呂仲濤表示,對內,通過建立企業級數據中臺方式,集中手段打通數據孤島,將不同業務線、不同部門、不同系統的分散、冗雜的數據(包括結構化數據和文檔、語音、圖像等非結構化數據)整合在一起,形成統一集中納管的數據資產。對外,通過開源加聯創、專項采購等方式,持續豐富通用的互聯網新聞、書籍等外部數據。內外結合,建立數據的全面采集機制,為金融大模型的構建引來源頭活水。
二是持續提升數據處理、知識沉淀、數據治理之“器”,降低數據處理門檻。呂仲濤表示介紹,工商銀行已圍繞大模型初步建立數據工程和知識工程的體系化工具,具備對相關數據資產進行整理、清洗、去重、標注、治理的數據工程化能力,有效消除數據冗余、清除數據偏見,確保數據的質量和準確性,并通過工具支撐,持續擴充金融專屬數據集,以便完成企業專有模型訓練。
三是加強訓練數據安全管理之“術”,守牢大模型數據安全質量。通過構建專項機制和專項團隊,重點加強大模型數據安全管控,在數據安全管控過程中,優先保障社會主義核心價值觀、工行企業文化及金融從業要求,通過敏感詞檢測、非法數據過濾、安全測評、人工審核等處理安全手段,提升數據質量和安全可控能力。同時,工商銀行已隨大模型應用深入及實踐總結,逐步在推進體系化的安全測評、管控辦法和技術框架等能力建設。
四是建立大模型應用的數據運營之“道”,實現大模型的數據閉環。呂仲濤透露,一方面在業務系統中,以智能場景為單位,大模型迭代為目標,通過規范運營埋點數據、埋點數據全入湖等方式,確保大模型應用數據閉環,進而推動大模型持續迭代和優化。另一方面,加強金融大模型運營數據監控分析,按照不同業務領域預置運營指標模板,實現技術指標、業務指標的統一監控,并基于BI(Business Intelligence商務智能)能力,生成各類運營評價報告,給數據科學家提供大模型優化指導,保障大模型數據驅動的持續保鮮。
責任編輯:韓希宇
免責聲明:
中國電子銀行網發布的專欄、投稿以及征文相關文章,其文字、圖片、視頻均來源于作者投稿或轉載自相關作品方;如涉及未經許可使用作品的問題,請您優先聯系我們(聯系郵箱:cebnet@cfca.com.cn,電話:400-880-9888),我們會第一時間核實,謝謝配合。