2021年12月、2022年1月,人民銀行、銀保監會相繼發布《金融科技發展規劃(2022-2025年)》《關于銀行業保險業數字化轉型的指導意見》,指出穩妥發展金融科技,加快金融機構數字化轉型,明確了“十四五”期間金融數字化、智能化的發力方向。
近年來,在監管部門的指導下,江蘇銀行以數字化轉型為契機,堅持問題導向,依托企業級數據治理平臺,統一數據標準、打破業務板塊壁壘,提高數據使用率,為精準營銷、智能風控和智慧經營提供有力支撐。
數據治理有兩大驅動力
數據的科學有效治理是構建完善、共享、統一管理數據環境的基本保障和重要組成部分,是把數據作為資產來管理的有效手段,更是數字化轉型發展的前提與數據釋放出價值的關鍵。
企業進行數據治理有兩大驅動力:一是通過提高數據質量實現更多的業務價值。二是將實現業務目標作為數據管理和服務的核心驅動力,優化數據架構,提升數據倉庫和信息化系統建設,支持管理能力的提高和精細化,以及決策的科學性。
之所以長期存在各類數據質量問題,是因為全行數據散落在各個業務系統中,沒有進行有效整合,形成豎井式架構,造成多個信息孤島,且整體架構缺少一個穩定的、抗源變化的保存最細粒度歷史數據的數據層,無法支撐未來共享性應用。同時,缺少統一的基礎數據標準和應用分析標準,而且針對數據質量問題沒有歸納總結,缺少反饋機制。
針對以上情況,江蘇銀行按照數據治理框架、明確目標、完善設計,健全法規,搭建企業級數據治理平臺,實現跨部門的數據匯聚,奠定數據應用基礎,并采用基于元數據的數據血緣關系分析方法及大數據挖掘技術進行挖掘分析,逐步優化行內數據架構,建立全行數據質量治理和管理體系。
數據治理平臺的三個應用方向
江蘇銀行企業級數據治理平臺有以下幾個應用方向。
第一,監管數據質量問題。通過分析源系統表數據,從及時性、完整性、準確性、有效性、一致性方面對源系統數據進行數據校驗,發現并記錄數據質量問題,生成數據質量問題報告。
數據質量監管主要分三步實施:一是在源系統分析階段,全面分析主要相關的源業務系統。二是在數據質量問題檢查階段,根據制定的檢查規則編寫程序,對源系統數據進行檢查。三是在數據質量問題分析階段,分析有質量問題數據對現有應用的影響并提出解決措施。
第二,數據標準統一口徑。針對基礎數據和指標數據制定全行統一的標準,實現業務數據信息統一定義、統一命名、統一來源。
基礎數據標準。參考人民銀行標準規范文檔定義的基礎數據標準框架,從業務屬性、技術屬性、管理屬性三個方面對我行日常業務開展過程中所產生的基礎性數據,對數據的業務表達、數據格式、數據關系等方面進行一致約定,從而規范數據在全行內外共享和使用中的一致性和準確性。實現對數據、應用過程的統一管理和規范,并明確數據的定義、格式、規則以及數據與數據間的關系,為系統開發實施提供全行統一的規范準則,為數據加工和應用提供統一來源和依據。
指標數據標準。通過對我行經營管理資料的分析,并參考同業的類似成果以及監管部門要求,梳理和篩選出直接反映我行業務經營管理狀態的重要指標,并對指標的業務含義、業務規則、統計口徑等內容進行標準化定義,形成全行一致的指標數據標準。從而統一全行對各項經營指標的理解和認識,促進各項經營指標在經營管理決策中的運用,解決我行取數口徑不一致、業務含義不清晰、指標分類不清晰的情況,促進部門間的數據共享。
第三,數據架構優化搭建?;跀祿膶傩?、實體、視圖、主題的層次架構優化我行數據架構,建立貼源層、整合層、匯總層、應用層的數據倉庫模型框架,建設穩定、可擴展的數據倉庫。
整合層,即數據明細層,基于貼源層的原始數據,在數據最細粒度的基礎上保證數據質量,該層采用一些維度退化手法,減少事實表和維度表的關聯,從而提高數據的易用性。
整合層主要實現了以下五個功能:1.明確業務含義和數據來源,確保字段業務定義的唯一性,形成全行統一的業務視圖。2.保留了業務系統中最細粒度的業務數據,保證可以支持明細級的數據查詢和分析應用。3.保證模型對未來業務進行業務支持的快速響應,不需要隨業務的變化而頻繁調整整合層模型。4.涵蓋我行主要源業務系統的業務信息,提供全面的業務數據,可以為客戶、風險、績效等各類分析應用。5.可以完整保留業務系統的歷史數據,保證了對歷史類查詢分析的支特。
匯總層作為整合層和應用層的銜接,從業務的視角出發,提煉出對數據倉庫具有共性的數據訪問需求,抽取出公共指標,形成由維度和指標組成的維度模型,對符合要求的數據進行預匯總和預加工。為應用層統一提供規范的、準確的數據,完成整個匯總層的邏輯模型、物理模型的設計并全部實現物理化,并根據業務性質將業務數據劃分為主題分類存放和管理。
數據治理平臺的兩大核心功能模塊
為有效整合全行數據,防止豎井式架構和信息孤島問題,江蘇銀行企業級數據治理平臺建設了兩大核心功能模塊——基于數據血緣關系分析的元數據管理系統及數據質量檢核系統,打造了大數據平臺框架和數據治理生態。
元數據管理系統具備多種數據分析功能:
一是差異分析。通過對元數據對象關聯的其他對象或參與加工過程的不同元數據對象之間進行分析,檢測對象之間的差異和關聯情況,對相似的指標從業務定義、數據生成等多個方向進行對比分析。
二是問題定位分析。直觀地展示以某個元數據為起始節點,其后與其有關系的所有元數據,反映數據的流向與加工過程,分析數據流向和定位數據轉換過程中出現的質量問題。
三是指標波動分析。當某個指標(如1104報表中的“個人經營性貸款”)出現較大的波動時,可進行溯源分析,判斷是由哪條數據發生變化所導致的。
四是數據整體分析。判定系統和數據的健康情況,是否存在大量的冗余數據、無效數據、無來源數據、重復計算、系統資源浪費等問題。通過分析數據的血緣關系,能在每個環節注意到數據質量的檢測結果和處理方式,更高效、直接地提高企業數據質量。
數據質量檢核系統利用預定義的可靈活定制的質量檢核規則對源系統基礎業務數據進行全面的數據質量檢查,并實現重要業務數據質量的周期性動態檢查,對發現的數據質量問題生成數據質量報告,以便準確掌握業務系統各種數據質量問題,促進基礎業務數據質量的提高。
打造數據治理生態,釋放數字建設能力
在打造數據治理生態方面,江蘇銀行數據治理堅持“治用并舉、以用促治”原則,從數據標準和數據質量入手,構建企業級數據質量治理和管理體系,推進數據資產化運營,形成從數據資產供給端到數據資產消費端的供求關系閉環管理,為精準營銷、智能風控、智慧經營和監管合規賦能,實現高水平、高效率、高質量的數據質量支撐。
依托企業級數據治理平臺,江蘇銀行統一數據標準、打破業務板塊壁壘:
一是實現了數據治理過程中數據質量問題的發現、定位、下發、跟蹤、解決的全流程閉環管理。
二是增強數據管理能力,加強數據質量控制,健全數據治理體系,為數據綜合應用奠定堅實基礎。
三是利于數據挖掘,支持各業務部門進行客戶價值分析、客戶行為分析、貨款償還預測分析、客戶信用政策分析、業務關聯分析等數據挖掘應用。
四是支撐數據應用,可提供全行級的最細粒度數據,滿足未來建設決策支持系統如:客戶關系管理、資產負債管理、管理會計、信用風險管理、管理駕駛艙等業務數據模型。
五是統一數據架構,對各類數據進行整合,統一數據標準,統一數據校驗規則,發布標準數據目錄,盡可能實現業務數據的全覆蓋,保證數據架構的穩定性等。
在持續釋放數字建設能力上,江蘇銀行緊跟監管動態,在強化數據治理能力的同時,樹立以數據為核心資產的經營理念,解決“數據在哪里、數據有哪些、數據怎么用、數據怎么樣”的難題。
一是梳理內部數據資產共十大主題目錄,數據項近20萬個;外部數據資產百余類,包括企業信息類,個人信息類,風險信息類、資源信息類、數據服務類、金融市場類,合計數據項超1萬。
二是按照數據使用場景,從數據安全角度出發,制定數據分類分級保護措施,并結合隱私計算技術,形成全行數據安全體系。
三是以數據的最終價值驅動數據全鏈路運營過程,從價值倒推數據資產建設需要,通過數據紅利推動業務部門數據治理和優化。
數據有效治理和數據質量提升是數字化轉型發展的前提。以江蘇銀行為代表的區域性銀行當前在數據治理與應用方面,仍存在源頭治理不完善、業務口徑不準確、存量數據待治理等問題亟待解決。
下一步,江蘇銀行將以實現數據價值為目標,驅動數據全鏈路運營過程,通過數據紅利反向推動業務部門注重數據治理和整合,組織建立全行數據質量治理和管理體系,為精準營銷、智能風控、智慧經營和監管合規賦能,推進金融創新與科技、數據的深度融合,為全行數字化轉型做好數據支撐。
責任編輯:陳愛
免責聲明:
中國電子銀行網發布的專欄、投稿以及征文相關文章,其文字、圖片、視頻均來源于作者投稿或轉載自相關作品方;如涉及未經許可使用作品的問題,請您優先聯系我們(聯系郵箱:cebnet@cfca.com.cn,電話:400-880-9888),我們會第一時間核實,謝謝配合。