“與黑產團伙的斗爭,永遠是道高一尺,魔高一丈的博弈?!币晃还煞葜沏y行風控部門人士趙強(化名)感慨說。
近日,他發現貸款欺詐行為正變得更加“隱蔽”——比如一家企業因資金周轉困難,竟慫恿員工向銀行申請個人消費貸款“紓困”。隨著這些員工未能按時償還貸款,銀行方才發現這家企業早已因經營不善而倒閉,員工拿不到企業還款,也就無力償還貸款。
“這讓我們意識到,原先的大數據反欺詐風控模型或許已過時?!壁w強表示。一直以來,銀行通過跟蹤信貸資金流向以防范欺詐風險的各項數據,主要通過表格方式存儲呈現。但隨著銀行每日交易流水量達到百萬級,傳統的表格查詢方式不但跟不上業務發展速度,極其“抽象”的呈現方式也令銀行風控部門難以在海量數據里,精準捕捉貸款欺詐行為的蛛絲馬跡。
記者多方了解到,隨著貸款欺詐方式日益多元化與隱蔽化,越來越多銀行機構也意識到傳統大數據反欺詐技術的局限性,紛紛探索基于知識圖譜(關系網絡)的新型反欺詐技術。
“所以越來越多金融機構選擇圖數據庫技術作為反欺詐模型的底層技術?!盩igerGraph(維加星信息科技(上海)有限公司)解決方案顧問李憓松向記者透露。某種程度而言,圖數據庫技術好不好用,呈現的用戶賬戶關系網絡全不全,數據處理分析速度能否起到實時預警欺詐風險的效果,對銀行持續升級反欺詐風控模型有著至關重要的作用。
所謂圖數據庫技術,主要是通過點和邊的形式呈現人、地點、事物等數據是如何相互關聯的,進而協助銀行風控部門通過圖分析技術,借助用戶社會關系、交易模式關聯、互聯網行為、移動設備等數據特征,對客戶行為模式進行匹配分析,精準判斷客戶是否存在貸款欺詐(或遭遇欺詐而申請貸款)的可能性。
“目前,不少銀行基于圖數據庫技術,一面構建基于知識圖譜(關系網絡)的反欺詐風控模型,一方面則挖掘出新的反欺詐風控規則,在大幅提升欺詐行為預判精準性同時,有效抵御黑產團伙的頻繁大規模攻擊?!币晃怀巧绦酗L控部門主管向記者直言。比如在信用卡套現欺詐行為的偵測過程,他所在的銀行采取多部圖及高密子圖偵測等方法,將代碼運行時間從2-3周縮短為1小時,輸出結果覆蓋的黑樣本(與黑產團伙相關的賬戶號碼等)從總量的58%提高到77%,既提升了對欺詐行為的實時監測預警效率,也令更多欺詐行為變得無所遁形。
李憓松透露,當前圖數據庫技術還能有效搜索資金交易鏈路、回路等結構,在發現洗錢鏈路、套現團伙、反貸款欺詐等業務應用場景具有天然的優勢。
銀行與黑產團隊的“斗智斗勇”再升級
記者多方了解到,隨著科技發展,貸款欺詐方式也變得多元化——尤其是越來越多黑產團伙從原先的盜號,演變成使用大規模攻擊、通過IP池等技術繞過風控規則實施貸款欺詐,導致金融機構遭遇的欺詐狀況日益復雜,傳統的大數據反欺詐模型變得“力不從心”。
“目前,黑產團伙還呈現專業化、產業化、隱蔽化、突發化的新特征?!壁w強向記者指出。
所謂專業化,即黑產團隊招募大量風控人員,專業黑客、AI專家等,通過大規模攻擊等方式“反復測試”金融機構的反欺詐風控規則,一旦他們掌握這些風控規則且找出相應的漏洞,就會迅速制定針對性欺詐手段騙取巨額貸款資金。
產業化,則是貸款欺詐行為已從單個作案發展成團伙作案,即黑產團隊通過獲取大量賬號進行大規模攻擊,以實現欺詐收益最大化。
隱蔽化,即黑產團隊跨境作案日益普遍,往往會利用IP池對身份進行洗牌,將交易鏈路變得更加復雜,從而令金融機構難以開展深層次數據挖掘以識別其中的欺詐風險。
突發化,是黑產團隊賬戶號碼一旦進入征信系統就迅速“作廢”,迫使黑產團伙采取兩種方式對這些賬戶號碼進行最大化利用,一是用一個號碼向多家銀行等金融機構進行騙貸,二是使用很多賬戶在同一時間內,對銀行等金融機構反欺詐規則漏洞進行大規模突擊性攻擊,若銀行等金融機構不具備高實時性的反欺詐監測能力,就容易被“攻破”。
“這無形間對銀行持續升級反欺詐風控模型提出更大的考驗?!壁w強強調說。目前他所說的銀行反欺詐風控模型已出現某些技術性短板,一是對欺詐行為的數據監測分析存在“滯后性”——當銀行發現欺詐行為蹤跡時,有些欺詐行為已發生;二是反欺詐風控規則迭代更新速度偏慢,容易被黑產團隊利用大規模攻擊方式“洞察”其中秘密。
記者獲悉,這驅動越來越多銀行等金融機構開始嘗試使用圖數據庫技術工具,構建反欺詐風控新模型。
李憓松告訴記者,已有多家銀行使用TigerGraph圖分析技術構建基于知識圖譜的反欺詐模型。究其原因,一是TigerGraph實時圖數據庫能將不同數據源的萬億級數據進行集中處理,并提供實時查詢能力,從而在貸款發放前識別欺詐行為;二是TigerGraph可以為機器學習提供圖特征,對某些隱蔽性高的欺詐行為進行快速識別,比如通過對借款人的各類關系特征進行建模,對潛在的欺詐行為進行毫秒級實時甄別;三是圖特征結合邏輯回歸、決策樹等機器學習算法所得到的預測分析結果比較容易理解,有助于銀行風控人員加快反欺詐風控模型迭代升級進程。
“目前,圖數據庫技術已在某些金融反欺詐領域得到廣泛應用?!彼赋?。比如根據業務人員以往經驗,不少銀行認為公司在獲得貸款后的短時間內(比如3天內)將大部分貸款資金(貸款金額80%以上)轉出,可能存在違規使用企業信貸資金購買房產的行為。于是這些銀行采取圖數據庫技術,在全圖上設置查詢條件——(1)發放貸款與轉出交易的時間差在3天內、(2)轉出的總金額不小于貸款發放金額的80%,就能迅速得到符合上述條件的所有資金交易賬戶關聯網絡圖,再快速識別資金是否流向存在買房行為的關聯賬戶,及時阻止信貸資金違規流入樓市的行為。
“相比基于關系型數據庫的查詢,TigerGraph圖查詢的條件設置直觀且簡便,無論從分析結果呈現還是業務邏輯關聯,都具有較強的可解釋性?!?李憓松表示。
圖數據庫技術的“新挑戰”
盡管越來越多銀行開始將圖數據庫技術作為構建知識圖譜反欺詐模型的重要抓手,但在實際操作環節,他們仍遇到不少操作痛點——比如某些金融科技公司提供的圖數據庫+大數據平臺技術,難以擴展到多臺機器、難以深度鏈接分析、不支持實時反欺詐預警等問題。
“因此,我們一直致力于創建操作簡單且技術成熟的解決方案,徹底解決上述三大痛點?!崩顟}松向記者直言。在可擴展性和高性能方面,TigerGraph已能夠支持萬億級別的關系網絡處理和亞秒級查詢;在易用性方面,TigerGraph則采用類SQL高級SDK,擁有圖靈計算完備的表達力,支持以天計算的PoC(項目驗證)能力;此外,TigerGraph還開發了基于瀏覽器的GraphStudio可視化開發工具,令銀行等金融機構更容易使用圖數據庫技術清晰全面地呈現各類賬戶的關聯網絡,洞察其中的欺詐行為蛛絲馬跡。
在業內人士看來,圖數據庫技術能否最大限度提升基于知識圖譜的反欺詐模型運營效果,還取決于用戶數據全面性。
“畢竟,用戶數據是圖分析的基礎。若銀行在遵循相關法律法規和監管要求的情況下,通過用戶授權收集到更全面的個人數據,風控人員就能構建更完整的用戶社會關系、交易模式關聯、互聯網行為、移動設備等圖數據庫,從而對用戶行為模式開展更精準的匹配分析,對用戶是否存在貸款欺詐(或遭遇欺詐而申請貸款)的判斷會變得更準確?!鄙鲜龀巧绦酗L控部門主管指出。然而,數據安全保護相關法規日益嚴格導致個人數據獲取難度日益增加,對銀行完善知識圖譜反欺詐模型的數據積累構成相當大的挑戰。
記者獲悉,部分銀行決定另辟蹊徑——在數據量不足的情況下,利用圖數據庫技術將業務人員以往的反欺詐經驗總結成眾多風控規則,編寫相應圖數據庫查詢代碼,令圖數據庫查詢結果具有更大的覆蓋度,從而協助風控部門提升資金流向追蹤監控能力,在更大范疇與維度洞察各類潛在的貸款欺詐行為。
“目前,我們迫切需要構建大量全新的反欺詐風控規則,以確保我們的反欺詐風控模型始終領先黑產團伙,才能有效抵御他們大規模攻擊行為?!壁w強指出。
責任編輯:王超
免責聲明:
中國電子銀行網發布的專欄、投稿以及征文相關文章,其文字、圖片、視頻均來源于作者投稿或轉載自相關作品方;如涉及未經許可使用作品的問題,請您優先聯系我們(聯系郵箱:cebnet@cfca.com.cn,電話:400-880-9888),我們會第一時間核實,謝謝配合。