案例名稱
太平金科AI全棧信創平臺
案例簡介
AI已成為推動創新進步的核心力量。太平集團已在關鍵業務中廣泛運用AI,日均處理請求超40萬次,主要依托NVIDIA芯片。然而,全球技術競爭加劇,高端AI芯片制裁日益嚴苛,對國內AI產業構成巨大挑戰。為強化供應鏈安全,探索AI信創化道路,解決技術瓶頸,太平集團實施了AI全棧信創平臺建設項目。項目致力于打造AI全棧信創平臺,提供從模型訓練到推理部署的一站式服務。目前,已成功實現人臉識別與OCR模型的信創化改造,并支持包括PaddlePaddle在內的多主流框架,同時完成了ChatGLM、百川等大模型的推理部署,通過了監管單位的信創驗收。
創新技術/模式應用
本項目從GPU硬件架構入手,基于信創GPU技術路線和ARM服務器架構,重構基于信創計算環境的AI模型,并在此基礎上,對應用服務、數據庫、中間件等常規軟件組件進行了信創化,自底向上構建了全棧AI信創平臺?;谠撈脚_,完成了OCR、人臉識別和大模型的等AI推理場景部署。該平臺同時支持PaddlePaddle等國產AI訓練框架。實現從AI芯片、服務器硬件、操作系統、數據庫、中間件、應用等全棧技術自主可控目標。
在項目實施過程中,項目組主要對信創AI性能和適配性問題進行攻關。原有的OCR與人臉識別的深度學習模型均是在x86和Nvidia硬件生態體系下訓練和推理運行的,在遷移到新的ARM+國產GPU的過程中,涉及諸多基于原有x86加速計算的指令集和Nvidia Cuda專用算子等,遷移難度較大。項目組協調上下游廠商、骨干技術內勤,協同攻關,從最底層入手,逐個解決不兼容的算子,如將x86上的SIMD指令遷移到ARM架構的NEON指令,將基于NVIDIA CUDA生態的特定算子也需要逐個遷移到國產GPU芯片的等效算子上,保證兼容性問題。
在性能實測階段,發現人臉識別應用在ARM架構體系下的整體性能較差,未達到預期。項目組對相應代碼進行行級性能跟蹤檢測,發現性能瓶頸主要在處理圖像的像素操作上,存在層級較多的循環操作,性能損耗嚴重。經調研后,將原循環操作轉換為矩陣操作,并從原來的Python代碼改用C++實現,且將圖像的前后處理部分,從原來流程的CPU處理,遷移到信創GPU處理,獲得10倍以上加速,解決性能了問題。
同時,平臺基于K8S構建了用于信創模型部署和訓練的資源池,彈性管理GPU計算資源,為集團內其他項目組的AI應用配給算力,為信創化改造提供沙箱環境,協同加速推進AI信創化進程。
項目效果評估
本項目是保險行業在AI領域的首個全棧信創項目,也是ARM架構+信創GPU的技術路線在金融行業的首次落地,項目成效主要體現在如下幾方面:
一是開展國產GPU設備選型,充分調研論證信創可行性。開展國產GPU設備選型,全面POC測試海光、華為、寒武紀、燧原、天數智芯以及百度昆侖芯共6家國內領先廠商AI芯片,深入了解國產AI芯片全貌,獲得各廠商的產品兼容性、性能以及價位等關鍵要素,為后續的選型和應用提供了重要參考依據。
二是制定高性價比信創選型方案,啟動重要場景試點。制定高性價比國產AI芯片信創選型方案,在同等性能配置下,整機采購價格約為非信創產品的25%,節約成本超200萬全部用于算力提升,實現應用性能最大化配置。選取“OCR三證一卡”和“人臉識別推理”兩個重要場景,完成AI模型信創遷移及Java應用、中間件、TDSQL數據庫等關聯組件全面信創化改造。
三是探索實踐AI全棧信創,為大模型落地奠定基礎。在大模型全面爆發引起的算力短缺和國外高端AI芯片制裁雙重挑戰下,“AI全棧信創平臺”是太平集團首個全棧信創化的AI項目,對保險及金融同業突破國外AI芯片制裁困境、推動自主創新發展具有重要借鑒意義,為集團同類系統信創化改造提供了可行參考路徑和重要實踐經驗,為未來大模型等AI算力密集型應用在太平集團落地奠定了基礎。
項目牽頭人
涂閃 應用開發崗
項目團隊成員
陳沫、葉俊鋒、宋明久、時愛民、涂閃、任偉、張小成、楊正超
責任編輯:陳愛
免責聲明:
中國電子銀行網發布的專欄、投稿以及征文相關文章,其文字、圖片、視頻均來源于作者投稿或轉載自相關作品方;如涉及未經許可使用作品的問題,請您優先聯系我們(聯系郵箱:cebnet@cfca.com.cn,電話:400-880-9888),我們會第一時間核實,謝謝配合。