<video id="zjj55"><delect id="zjj55"></delect></video>

<big id="zjj55"><listing id="zjj55"><del id="zjj55"></del></listing></big>

<menuitem id="zjj55"><delect id="zjj55"><pre id="zjj55"></pre></delect></menuitem>

<output id="zjj55"></output>
<video id="zjj55"></video>

<menuitem id="zjj55"></menuitem>

    <video id="zjj55"><listing id="zjj55"></listing></video>

    <menuitem id="zjj55"></menuitem>
    <output id="zjj55"><delect id="zjj55"><pre id="zjj55"></pre></delect></output>

    <menuitem id="zjj55"></menuitem>
    <menuitem id="zjj55"></menuitem>

        <big id="zjj55"></big>
          1. 移動端
            訪問手機端
            官微
            訪問官微

            搜索
            取消
            溫馨提示:
            敬愛的用戶,您的瀏覽器版本過低,會導致頁面瀏覽異常,建議您升級瀏覽器版本或更換其他瀏覽器打開。

            大模型重塑金融業態報告③丨金融大模型重塑數據開放生態

            李覽青 楊夢雪 來源:21世紀經濟報道 2024-02-20 08:53:01 大模型 金融AI
            李覽青 楊夢雪     來源:21世紀經濟報道     2024-02-20 08:53:01

            核心提示在金融數智化轉型存在的固有問題以外,出于對數據安全、用戶隱私、機構競爭等各方面考慮,金融機構之間的數據流通共享,成為限制行業大模型發展的最大因素。

            摘要:“大模型”無疑是2023年最熱的關鍵詞之一,隨著大模型概念的崛起和廣泛傳播,金融行業因被視作最優落地場景也同步掀起了一輪熱潮。大模型究竟會給金融行業帶來什么?它會在何種程度上重塑技術和業務,會衍生出怎樣的商業價值?21世紀資管研究院調研了三十多家金融機構和科技公司相關負責人,形成了這份《大模型重塑金融業態報告》,通過梳理機構布局情況以及這些領軍者們的觀點,描繪行業發展趨勢。

            21世紀資管研究院研究員李覽青、楊夢雪

            談及大模型與小模型的差別,基于巨量參數規模的“暴力美學”屢屢被提及。然而,在強依賴數據的大模型時代,數據積累最為豐富的金融行業卻面臨著優質語料規模不足的痛點。

            數據的質量與應用效率直接關系著數智化轉型的成敗。當數據成為第五大生產要素,數據要素的開放共享與數據資產價值的挖掘,正在將金融機構的數智化轉型推向新的階段。

            為了實現大模型能力應用,金融機構開始重新梳理自己的企業級知識庫,主動提高數據質量,加強內部生態協同。同時,大模型帶來的“后NLP(自然語言處理)時代”進一步提高了金融機構數據應用的能力。

            在相關監管部門、行業組織的引導下,合規背景下公共數據開放生態與金融行業數據共享生態正在建立。

            三大問題推進金融行業進入數據治理新階段

            與傳統基于小參數、大數據標注、模型配置的AI不同,基于Transformer架構的大模型浪潮的一大特征能力是“涌現”。當高質量語料庫訓練至少達到百億級參數時,大模型的語言能力將會涌現,而意圖理解、文本語言生成等方面的能力也將隨著參數增加達到頂峰。

            但在金融機構實際探索應用的過程中,訓練語料的規模與質量成為一大難題。有基金科技部門負責人指出,在代碼自動生成場景下,基于現有模型,僅僅是讓代碼生成可用就需要提供20-30個非常好的項目代碼,更別提讓代碼實現能力涌現。一位銀行科技部門人士也表示,基于通用大模型的微調,需要基礎大模型數據量的20%,才能使得智能涌現,以1000億token參數規模的大模型微調為例,需要1000萬篇專業性萬字長文。

            在金融領域實現大量優質數據語料的匯集,顯然不是某一家機構或廠商可以完成的。

            在21世紀資管研究院的調研中,“割裂”是出現最多的一個關鍵詞。一方面,在金融機構內部,大量的非結構化數據囤積于垂直業務部門,難以打通利用;另一方面,在不同機構、廠商、平臺之間,數據生態的割裂導致用于訓練的語料不足,特別是在專業知識領域的生態體系尚未建立。

            傳統人工智能的數據賦能,被業內戲稱為“有多少人工才能有多少智能”,依托于人工標注、清洗數據,通過“打點”、“畫框”輔助機器學習,使得金融機構在結構化數據分析、挖掘方面遙遙領先于非結構化數據。

            然而,大模型最擅長處理的數據是文本、圖像、音視頻等非結構化數據,這也是金融機構在業務場景下積累最為豐富卻較難利用的數據。

            21世紀資管研究院梳理非結構化數據治理的難點發現,在金融機構的數智化轉型過程中存在三個問題在大模型時代被進一步放大:

            第一,未能形成業務與技術一體化協同的組織機制,業務部門未能充分認知非結構化數據的價值,而科技部門對部分業務信息難以理解或充分解讀,導致數據難以歸集梳理;

            第二,部分機構在基礎設施架構中未能形成統一的平臺架構,來支持業務部門非結構化數據的留存與進一步分析;

            第三,金融機構在數智化轉型成效評估方面存在難點的情況下,缺乏相應的激勵機制,導致業務部門配合度不高。此外,由于金融行業是高度精準的行業,而大模型的“黑盒”問題導致其可解釋性較差,需要大量專家對相關知識進行對齊。

            大模型快速檢索、自監督學習等能力,降低了金融機構挖掘非結構化數據價值的門檻。在大模型加持下,NLP(自然語言處理)的封裝門檻大幅降低,通過大規模的預訓練與自監督學習,來提高模型的語言理解與生成能力,在文本分類、情感分析、問答系統、機器翻譯、文本生成等場景下實現非結構化數據挖掘效率的提高。

            不過金融機構已經意識到,數據治理層面的種種痛點,并非大模型時代特有的問題,而是自機構數智化轉型伊始就存在的系統性問題,相比于新興技術帶來的焦慮,更重要的是在組織、戰略、架構以及成本方面的挑戰。

            基于上述問題,新型數據治理階段已開啟。一方面,在數據資產梳理的基礎上,金融機構加速建立企業級知識庫,幫助各部門解決場景應用的難題,以提高業務應用的精準性。另一方面,金融機構應當更加重視數據資產的可持續運營,組織架構與數字化轉型戰略也需要相應的調整,來保障多方協同下的數據治理。

            數據開放生態亟待形成

            在金融數智化轉型存在的固有問題以外,出于對數據安全、用戶隱私、機構競爭等各方面考慮,金融機構之間的數據流通共享,成為限制行業大模型發展的最大因素。

            “我們國家的數據生產量全球排名在第二名,但是分散在各個行業、各個組織中,整體的數據是分開的。但大模型所需要是將數據進行物理歸集,在短時間內基于一定的算力與算法進行預訓練?!蹦硵祿灰姿耸空劦?,金融機構一直是數據交易兩端的需方角色,基于公共數據的場景應用較為豐富,但在安全考量下的主動開放還較為困難。

            從金融機構的角度,多位受訪人士提到,首先從成本角度考量,只有大型商業銀行有足夠的數據與資金實力運用新興技術嘗試各類應用落地;同時在信貸風控等領域,金融數據的規模與質量,直接關系著機構的盈利能力與競爭力。

            從政策端,公共數據授權運營彌補了一部分金融行業數據供給不足的情況;同時在激勵上,數據資源得以納入資產負債表,為金融機構數據治理與行業內數據流動提供動力。

            2023年,四川省金融科技學會與原中國人民銀行成都分行營業管理部聯合發布了《2023公共數據金融應用白皮書》,在國內首次聚焦公共數據面向金融領域的開放和應用問題。作為《白皮書》起草專家之一,四川省政協常委、西南財經大學金融學院教授、博導張曉玫告訴21世紀資管研究院,公共數據是一類特殊的數據要素,本身具有高權威性、高準確性、高價值性和高應用性特征,充分挖掘公共數據的金融應用價值已經成為金融行業的普遍訴求。因此,公共數據的開放對于推動大模型發展,尤其是金融大模型的發展具有非常重要的意義,公共數據金融領域的垂直模型也具有非常廣闊的發展前景。

            但值得注意的是,囿于數據安全和隱私保護等因素,目前開放給金融行業應用的公共數據多限于企業維度的數據,個人維度的數據較少,且我國推動公共數據金融應用工作的時間不算長,因而數據量嚴重不足。同時,目前已開放的公共數據遠不能滿足金融場景對于數據的精度要求和更新頻率要求。而數據的量和質對于大模型訓練的重要性不言而喻。

            因此,在張曉玫看來,公共數據金融領域垂直模型的發展還非常初級,首先需要解決的就是數據端的問題。如何在公共數據開放和應用過程中充分保障數據安全和個人隱私,如何建立一套方便有效的公共數據質量管理體系,如何完善已有的公共數據配置機制,這些都是實踐中需要優先考慮,并且亟待解決的問題。

            目前在金融公共數據應用方面的公開探索,是北京金融控股獲授權運營的北京金融公共數據應用專區,截至2023年11月匯聚公共數據超過50億條,涵蓋300多萬個市場主體。數據要素開放共享方面,上海數交所金融板塊也已初步建成,涵蓋銀行、保險、證券等業務場景。

            另據了解,在監管指導下國有大行金融科技子公司有望承擔起在可信可控框架內,整合銀行業相關數據,為行業提供數據服務的工作,已有隱私計算服務商參與其中,實現數據的可用不可見。

            在依法安全合規前提下,推動數據開放生態的形成,不僅為金融行業以數據驅動智能化服務提供土壤,更是推動數據要素在社會層面的優化配置。特別是在“數據要素x”行動下,發揮數據要素乘數效應實現金融行業的智能化躍升,將直接關系到金融服務實體經濟的質量。

            在這一命題下,金融行業呼吁進一步細分的數據收益分配機制、安全隱私保護規范,同時,有關部門需要加強基礎設施建設,來保障數據資源的流通交易,從而實現整個價值鏈條的可信,推動形成更為開放的數據生態。


            責任編輯:王超

            免責聲明:

            中國電子銀行網發布的專欄、投稿以及征文相關文章,其文字、圖片、視頻均來源于作者投稿或轉載自相關作品方;如涉及未經許可使用作品的問題,請您優先聯系我們(聯系郵箱:cebnet@cfca.com.cn,電話:400-880-9888),我們會第一時間核實,謝謝配合。

            為你推薦

            猜你喜歡

            收藏成功

            確定
            人妻精品一区二区三区_好紧好湿好硬国产在线视频_亚洲精品无码mv在线观看_国内激情精品久久久

            <video id="zjj55"><delect id="zjj55"></delect></video>

            <big id="zjj55"><listing id="zjj55"><del id="zjj55"></del></listing></big>

            <menuitem id="zjj55"><delect id="zjj55"><pre id="zjj55"></pre></delect></menuitem>

            <output id="zjj55"></output>
            <video id="zjj55"></video>

            <menuitem id="zjj55"></menuitem>

              <video id="zjj55"><listing id="zjj55"></listing></video>

              <menuitem id="zjj55"></menuitem>
              <output id="zjj55"><delect id="zjj55"><pre id="zjj55"></pre></delect></output>

              <menuitem id="zjj55"></menuitem>
              <menuitem id="zjj55"></menuitem>

                  <big id="zjj55"></big>