作者:寧波銀行科技部 沈棟 王巧燕 陳波
近年來,傳統銀行業經營模式受到巨大沖擊,銀行數字化轉型壓力日益凸顯。隨著金融科技創新發展日新月異,人工智能技術的商業化應用逐漸成熟,這為銀行業尤其是中小銀行提供了彎道超車的機遇。在人工智能領域,除了機器學習、深度學習等眾所周知的技術外,還有知識圖譜這項重要的分支技術。當下,隨著人工智能技術對“讓機器形成認知能力”的不懈追求和知識工程相關技術的日趨完善,知識圖譜正逐漸成為人工智能的關鍵技術之一,在學術界與工業界掀起了研究與應用的熱潮。
金融知識圖譜技術帶來的新價值
1.客戶畫像勾勒更加精準。知識圖譜將多源異構數據進行有機而便捷地融合,不僅能真實而整體地刻畫出人、事、物的屬性和聯系,還可以通過圖分析將潛藏的關聯性特征提取到每個相關實體,將了無生機的字節數據還原成事物在現實世界的本來面貌。
2.關系層次挖掘更為深遠。在“六度鄰接空間”理論中,每個人都可通過一個六度的關系進行連接。但在傳統應用中,沒有有效技術支撐高深度的關系分析,導致企業實際控制人挖掘等場景無法實現,知識圖譜的圖存儲具有高效的關系推演性能,使得深度關系挖掘成為可能。
3.決策依據支持更科學、前瞻。知識圖譜可應用于營銷獲客、風險管理等場景。以風險管理為例,通過知識圖譜風險傳導預測,可確保在眾多小事件發生的初期,及早介入風險管控,防止“蝴蝶效應”。
金融知識圖譜技術的行業應用探索
1.銀行數字化營銷。寧波銀行依托“海王星”平臺建設,為大數據技術在客戶精準營銷、客戶關系管理等各領域的成功應用奠定了扎實基礎。未來,知識圖譜將在以下幾方面助推銀行營銷數字化轉型圖 知識圖譜核心技術能力升級。
一是智能產品推薦。知識圖譜構建過程可有效整合各類數據,通過關聯關系分析,實現千人千面式精準推薦。此外,知識圖譜的高性能運算能力可為客戶提供實時推薦決策判斷,提升客戶體驗。
二是潛在客戶挖掘。知識圖譜關系梳理可以識別同一類客戶或關聯類客戶,通過聚類分析算法,挖掘出人工難以發現的潛在用戶,實現存量“活”客與智能“獲”客兩手抓。
三是客戶關系梳理。知識圖譜多維度關系視角拓寬了分析問題、挖掘知識的能力,可幫助銀行感知更深入、更廣泛和更完整的客戶關系管理方法和知識體系,實現全面了解客戶(KYC)。
2.銀行風險控制管理。風險控制是銀行的重中之重,但是長期以來,在很多風控領域,一直沒有找到效果好、效率高的風控手段。隨著金融科技的發展,知識圖譜技術的進步,我們看到這些問題有望得到解決。
一是反欺詐識別。知識圖譜對客戶身份和行為的關聯分析,可有效識別虛假申請、惡意申請、套現、詐騙等各項犯罪行為,為貸前決策、貸后風控提供有效數據依據,降低金融風險。
二是反洗錢。知識圖譜對資金交易過程實時決策分析判斷,不僅能提供事后批量分析和報告,還能實現事中的交易分析和阻斷,有效提升反洗錢能效。
三是資金中介識別。知識圖譜對資金匯劃的數據分析,可有效識別人工難以識別的資金中介,幫助業務部門做好排查,防范資金中介風險。
3.銀行數據資產管理。銀行數據之間的關聯性非常緊密,通過知識圖譜,我們梳理數據間的關聯關系,厘清統計口徑的計算方法,讓數據“看得清來龍去脈、算的明統計口徑、查的到底層數據”。因此,知識圖譜應用在數據資產管理上必將發揮作用,促進數據價值有效提升。
一是數據關系梳理。知識圖譜可應用于數據血緣分析,挖掘歷史數據存儲結構、表關系及數據與業務關系,智能化業務及數據梳理工作。
二是多源數據融合。知識圖譜可應用于數據標準遷移分析,根據業務關系,對多源異構數據有效融合,全面貫通企業級數據。三是統計數據分析。知識圖譜可應用于統計指標口徑溯源分析,排查特定口徑應用的統計指標項,根據數據統計的傳導路徑反溯源頭(底層)數據。四是科技 CMDB 管理。知識圖譜可應用于 IT 資產數據分析,為故障定位、資產變更決策等提供有效分析支撐。
三是統計數據分析。知識圖譜可應用 于統計指標口徑溯源分析,排查特定口徑 應用的統計指標項,根據數據統計的傳導 路徑反溯源頭(底層)數據。
四是科技 CMDB 管理。知識圖譜可 應用于 IT 資產數據分析,為故障定位、 資產變更決策等提供有效分析支撐。
圖 知識圖譜核心技術能力
金融知識圖譜應用難點與要點
1.金融知識圖譜的認知。首先,知識圖譜在金融行業的應用仍處于初級階段。金融知識圖譜雖然已廣泛應用于風控、營銷、IT 資產管理和數據管理等領域,但大部分是應用于簡單數據查詢和邏輯規則方式。在應用初級階段,金融知識圖譜發力的核心內容 :一是將多源異構數據有機融合為一張關聯圖譜,二是將反映整體的網絡特征提煉到單個實體信息中,實現關系特征從無到有的跨越。
第二,知識圖譜是一個可以廣泛應用的輔助工具。知識圖譜應用的廣泛性在于拓撲連接的廣泛性,任何事物都可以在賦范空間建立連接。同時,由于關聯分析在整個數據分析方案中的有限性,金融知識圖譜在應用過程中,往往作為一個輔助工具和其他技術結合使用,作為數據挖掘在關系維度的一個補充完善,對既有業務模型進行升級完善。
2.金融知識圖譜的應用挑戰。首先,數據完整性面臨挑戰。知識圖譜面向關系密集型數據,相較于其他數據挖掘技術更要求數據的完整性。若關聯關系數據不全或圖數據量過小,圖將無法連通而形成一個個孤立的子圖孤島,會導致信息無法傳播,基于此的關聯分析可能退化成雞肋般的應用。上述問題在業務數據體量較小的中小銀行中尤為凸顯。針對此,不僅要考慮數據的積累,也要優化分析模型,減少數據完整性對分析結果的影響。
第二,模型精準性需要關注。知識圖譜建模的精準性同時依賴于對模型的業務特征和技術方法的深刻理解和實踐經驗,一是知識圖譜數據建模的模型,即如何定義知識本體,例如,在異構圖和同構圖的選擇上,是選擇構建全量數據的異構圖,還是針對特殊場景對實體和屬性進行簡化、對關系進行折疊的同構圖 ;在關系定義尤其是抽象關系定義上,如何在無限制的關系定義中概括出對應用有價值的關系,包括實體間的共同愛好、共同購買關系、在特殊時段的聯系、處理后獲得的某種特征上的相似性等 ;二是數據分析的模型,如何對業務邏輯進行概括并映射成圖能理解處理的模式,如擔保風險中的擔保鏈、擔保圈、平臺擔保,映射到圖分析中環形路徑查找、擔保社區發現和高維度節點算法等。
第三,互聯性與權限最小化設計的矛盾值得探討。知識圖譜提出的本意在于世界萬物的互聯,打通字節世界與真實世界。而銀行業對數據安全的權限設計較為嚴格,一方面是要將所有數據都連通以最大化關聯性分析價值的技術要求,一方面是各個業務部門各個應用場景各個角色之間安全隔離的管理要求。如何做好知識圖譜平臺的多租戶管理,結合知識圖譜核心技術框架的四個層級,從存儲到可視化如何分層設置權限,需要我們在前期做好建設規劃。
結語
可以預見在未來很長一段時間內,知識圖譜將成為大數據智能的前沿研究問題。學術界在持續地推進技術的研究與創新,工業界在積極地探索業務落地的場景。金融業要做好基礎平臺建設,把握技術發展動態,從實際業務發展痛點出發,用好知識圖譜這把利器。
責任編輯:韓希宇
免責聲明:
中國電子銀行網發布的專欄、投稿以及征文相關文章,其文字、圖片、視頻均來源于作者投稿或轉載自相關作品方;如涉及未經許可使用作品的問題,請您優先聯系我們(聯系郵箱:cebnet@cfca.com.cn,電話:400-880-9888),我們會第一時間核實,謝謝配合。