7月5日,上海銀行申請的一項名為“大模型驅動的智能知識平臺”的專利公布。其申請于2024年4月30日,屬于人工智能和大數據技術領域。
據悉,該平臺包括數據收集模塊、數據處理模塊、大模型訓練模塊、知識圖譜生成模塊、知識檢索模塊、用戶界面模塊、問答處理模塊和結果優化模塊。
數據收集模塊用于從各種來源收集知識數據,包括但不限于書籍、網頁、論壇、社交媒體,該模塊能夠提取大量的知識數據;數據處理模塊用于對收集到的知識數據進行清洗、整理和標注,以便于后續的處理和分析;大模型訓練模塊用于訓練大模型,該模型能夠理解和處理知識數據,生成知識圖譜;知識圖譜生成模塊用于根據訓練好的大模型生成知識圖譜,該圖譜能夠清晰地展示知識的結構和關系;知識檢索模塊用于根據用戶的需求,從知識圖譜中檢索相關的知識;用戶界面模塊用于展示知識圖譜和檢索結果,提供用戶友好的操作界面;問答處理模塊用于接收用戶的問題,通過大模型生成答案,并將答案返回給用戶;結果優化模塊用于對生成的答案進行優化,包括答案的準確性、完整性、可讀性等方面的優化。
更具體的,數據收集模塊包括數據來源、數據清洗和數據預處理。數據來源為網絡爬蟲、API接口、文件導入等,數據清洗步驟為去重、去除噪聲、填充缺失值等,數據預處理為數據歸一化、特征提取、文本轉詞等。
數據處理模塊包括數據整合、數據挖掘和知識表示。數據整合為將不同來源的數據進行融合,形成統一的知識庫,數據挖掘通過自然語言處理技術,提取關鍵信息和知識點,知識表示將數據轉換為機器可理解的向量表示,便于后續處理。
大模型訓練模塊包括模型選擇、模型訓練和模型評估。模型選擇根據任務需求選擇合適的深度學習模型,如Transformer、BERT等,模型訓練使用大量標注數據進行模型訓練,優化模型參數,模型評估通過交叉驗證、準確率、召回率等指標評估模型性能。
知識圖譜生成模塊包括實體識別、關系抽取和知識圖譜構建。實體識別為從文本中提取實體,如人名、地名、機構名等,關系抽取為從文本中抽取實體之間的關系,如作者與作品的關系、地點與事件的關系等,知識圖譜構建為將實體和關系組織成知識圖譜結構,便于檢索和推理。
知識檢索模塊包括文本檢索、結果排序和可視化展示。文本檢索根據用戶輸入的關鍵詞,在知識圖譜中進行匹配和搜索,結果排序根據相關性、熱度等因素對搜索結果進行排序,可視化展示將搜索結果以圖表、列表等形式展示給用戶。
用戶界面模塊包括交互設計、功能實現和個性化定制。交互設計為設計簡潔易用的界面,提供友好的操作體驗,功能實現為實現各種功能模塊,如搜索、推薦、問答等,個性化定制為根據用戶喜好和需求進行個性化定制設置。
問答處理模塊包括問題解析、知識檢索和結果生成。問題解析對用戶輸入的問題進行分析和理解,提取關鍵信息,知識檢索在知識圖譜中查找相關信息,回答用戶問題,結果生成將答案以自然語言的形式輸出給用戶。
優化模塊包括結果篩選和結果摘要。結果篩選對搜索結果進行篩選,去除不相關或低質量的內容,結果摘要對搜索結果進行摘要,提煉關鍵信息。
說明書提到該發明的背景為,隨著互聯網的飛速發展,大量的信息被不斷地產生和傳播。在這個信息爆炸的時代,人們對于知識的獲取需求也日益增長。然而,傳統的知識獲取方式存在效率低下、信息不對稱等痛點。
在當前的對公客戶服務中,知識庫面臨著一些挑戰和問題。首先,信息傳遞的速度相對較慢,這可能會導致客戶在尋求幫助或解決問題時遭遇延誤。其次,由于知識庫的更新不及時,重復的客戶投訴情況頻繁出現,這不僅增加了客戶的不滿,也給服務團隊帶來了額外的壓力。此外,現有的問答系統數量有限,無法滿足所有客戶的需求。這些問題的存在,使得銀行服務質量受到了一定的影響。
再者,知識庫中的知識質量參差不齊,有些信息可能已經過時或者不準確,這對于尋求幫助的客戶來說無疑是一種困擾。更為嚴重的是,目前的知識庫主要依賴于人工進行整理和維護,這種方式效率低下,且容易出錯。大量的人力和時間被投入到了重復性的工作上,而無法將更多的精力投入到提高服務質量和滿足客戶需求上。因此,需要尋找更有效的方法來改進知識庫管理方式,以提高銀行的服務質量和客戶滿意度。
在該發明中,用戶能快速獲取到所需的知識內容;可以讓大模型具有強大的語義理解能力。當用戶提出問題時,模型可以通過分析問題的語義,理解用戶的意圖并給出相應的答案或解決方案。如此,大模型能夠更好地滿足用戶的需求,提供更加準確和個性化的服務。
責任編輯:陳愛
免責聲明:
中國電子銀行網發布的專欄、投稿以及征文相關文章,其文字、圖片、視頻均來源于作者投稿或轉載自相關作品方;如涉及未經許可使用作品的問題,請您優先聯系我們(聯系郵箱:cebnet@cfca.com.cn,電話:400-880-9888),我們會第一時間核實,謝謝配合。