ChatGPT迅速崛起,正讓私募基金看到投研能力的新提升空間。
“對量化私募基金而言,其投研能力的高低,很大程度取決于三大因素,一是數據能力,如今越來越多行業頭部量化私募基金擁有數百TB的數據,二是算法能力,包括深度學習、文本挖掘等算法能力的持續升級;三是交易能力,比如通過低延遲技術研發,將交易時間從20微秒縮短至2微秒?!?寬邦科技創始人CEO梁舉向記者表示。ChatGPT的興起,恰恰給量化私募基金數據挖掘與算法升級帶來新的想象空間。
以往,量化私募基金往往獲取的是預先寫好的結構化數據信息,但在ChatGPT可以用自然語言與私募基金量化投資建模人員溝通交流,以通俗易懂的語言解釋那些結構化信息數據,一方面幫助私募基金量化投資建模人員更精準地尋找交易投資機會,另一方面能根據這些建模人員需要,將投研報告里的相關信息數據呈現出來,大幅提升投研效率。
梁舉向記者透露,目前他們正在嘗試將ChatGPT與量化投研能力輸出工作相結合,比如使用ChatGPT輔助寫代碼,在某些簡單的代碼撰寫方面,ChatGPT的工作成效甚至超過不少工程師。
“未來,我們希望能將各類投研報告放入統一的預訓練模型,讓私募基金直接詢問,通過自然語言的交互溝通,獲取他們想要的分析師觀點與投研報告作者對某些調研上市公司的情緒,甚至是每天金融市場不同交易時段的市場分析報告要點等?!彼赋?。
在上海蒙璽投資管理有限公司總經理李驤看來,ChatGPT的興起,也預示著AI技術在量化私募基金領域的應用日益廣泛。
“今年我比較看好中證500與中證1000指數增強策略,但就超額回報獲取角度而言,中證1000指數增強策略更適合擅長量價相關研究、且AI運用能力比較突出的私募機構。因為它需要更強的數據處理維度能力,以及它的預測性相對線性模型的提升能力要求更高。所以我們的量化模型要與量化因子強相關,若AI深度學習能力做得更好,超額回報獲取能力會高于中證500指數增強策略?!彼赋?。
朝陽永續首席金融工程師陳實向記者指出,目前ChatGPT對量化私募基金投研能力提升的最直接表現,就是幫助后者更精準地把握投研報告作者對所調研上市公司的情緒。
“這也是文本挖掘技術急需提升的一個突破口。以往量化私募基金在提取投研報告要點時,往往只能看到純粹的結構性信息數據,無法全面了解報告作者對上市公司的情緒,可能對報告所呈現的投資價值研判缺乏更敏銳的洞察。但chatGPT通過自然語言交互,有效解決這個問題?!彼毖?。未來基于ChatGPT的更廣泛應用,第三方數據研發機構可以提供個股研報情感評分,個股專家的情感評分一致預期,行業股票的分析師情緒指數變化等,幫助量化私募基金更全面地了解市場對相關股票的投資偏好細微變化。
ChatGPT如何強化量化私募投研能力
在陳實看來,ChatGPT興起,讓不少量化私募紛紛“腦洞大開”。比如有些私募機構給ChatGPT一篇投研報告,要求它按照自己的需求,將相關報告摘要找出來;還有私募機構正打算用ChatGPT寫投研報告或投資策略。
在他看來,這都得益于自然語言模型技術的蓬勃發展。
記者獲悉,自然語言模型的發展,主要經歷三個階段。
第一階段以語言統計模型為主,它的做法相對簡單——即給它一句話,讓它將這句話切成詞,并根據上下文關系預測其中一個字的出現概率。但這個模型的兩大痛點,一是文本語義識別能力不強,比如對語言統計模型而言,“你喜歡我”與“我喜歡你”是同一個意思;二是當文本內容較多時,語句統計模型的某個文字權重矩陣會出現偏差,不利于算法模型運算。
到了第二階段詞向量模型的誕生,有效解決上述兩大痛點時也解決了切詞后的文本信息丟失問題。但詞向量模型也有某些缺陷,一是單詞的向量是唯一的,無法區分某些多義詞的多重含義,二是模型訓練時容易出現維度“爆炸”,且訓練過程是串行的,導致算力資源耗費巨大且訓練時間漫長。
記者獲悉,這導致前兩個階段的自然語言模型只能處理相對簡單的工作,比如簡單的文本解析、情緒分析與主題模型搭建,但無法處理復雜任務。而Transformer技術的興起,徹底改變了這種狀況。
究其原因,Transformer解決了自然語言模型的注意力機制問題,即通過詞與詞的關聯性訓練,它會給每個詞之間設立單獨的權重曲線,且通過并行訓練模式大幅提升訓練速度。正是Transformer技術的興起,它將自然語言模型引入第三發展階段——預訓練語言模型,即它能通過訓練,將文章主題與相關邏輯、內容資料“提取”出來,整合成新的文本提供給讀者。
記者了解到,如今的預訓練語言模型有兩大代表技術,一是GPT,二是BERT,前者將自己生成的結果通過再訓練并輸入到模型,適合文本生成類工作;后者則通過上下游訓練,比較合適語言理解工作,可以作為文本生成、更深層次的語義情感分析與閱讀理解,信息檢索與問答對話。
梁舉告訴記者,若將AI模型分成兩類,一是分析型AI,二是生成型AI,前者主要類似搜索引擎,提供一個分析結果與預算,后者則是生成用戶所需的信息文本。
“ChatGPT屬于后者,且它已經歷多個發展階段。如今ChatGPT3.5版本擁有逾1700億參數,預計4.0版本的數據參數可能會再擴大100倍,預計未來3-5年,ChatGPT可能會自己寫代碼與文本,到時量化私募基金只需提一些投資策略文本需求,它就能直接寫出來,包括圖表與視頻的生成?!彼J為。
記者多方了解到,目前個別大型量化私募基金已開始嘗試使用ChatGPT撰寫投資策略代碼,因為金融投資的文本信息需求,主要涵蓋投資者與媒體的關注度;管理層、投資者與媒體的情緒;財務報告文本可讀性;新聞的隱含波動率指數;投資者分歧;行業分類等六類,數據來源來自搜索指數、股吧數據、上市公司報告、上市公司電話會議等,若能將這些數據收集起來與詞向量模型匹配,再通過ChatGPT按照自身要求生成更通俗易懂的自然語言文本,就能對行業相關上市公司各類信息的了解更加全面精準,從而促進投資策略的迭代升級與精準投資決策。
陳實告訴記者,目前量化私募基金提升數據與算法能力的迫切需求,主要表現在兩方面,一是從分析師報告提取分析師的情緒,再做預測。二是對分析師報告股價同比性做研究,甚至建立分析師文本因子以預測未來個股投資的超額收益率。但這都需要 ChatGPT的自然語言交互功能,以便私募基金更好地理解分析師在報告里的“情緒”與對上市公司投資價值的“預判”。
在李驤看來,包括chatGPT等AI能力的持續發展,對量化私募基金提前洞察投資風險也有著較大的促進作用。比如隨著量化私募行業規模增長,高頻策略的集中度日益提高,令機構獲取高頻策略超額回報的難度增加,驅動高頻策略私募紛紛拓展中低頻策略,但這需要私募機構需不斷優化風控能力,包括設定其他人尚未發現的風險點并進行求解。各類AI能力的持續發展,將有助量化私募基金風控能力的不斷優化。
產品路演與投資者交互的新應用
記者獲悉,隨著 ChatGPT興起,越來越多私募基金開始嘗試用它做更多工作。
梁舉向記者透露,在ChatGPT剛面世時,他們將它應用在私募策略能力開發環境里,一是私募機構可以用ChatGPT糾正他們所寫的代碼;二是根據私募基金投資者對產品的詢問,ChatGPT可以自動分析詢問內容并生成文本,有效解決投資者與私募基金的某些投資糾紛。
一位主觀策略私募基金負責人告訴記者,近期他們發現不少投資者都會詢問為何去年產品凈值回撤幅度較大,目前他們正在嘗試通過ChatGPT生成文本解答。
“我們也不善于與投資者溝通,以往解釋凈值回撤的話術比較生硬,容易引發更強烈的投資者矛盾,如今ChatGPT可以用更柔和的話術向投資者解釋凈值回撤較大的原因,反而更能贏得他們的理解?!彼毖?。比如他們的某些投資策略需要2-3年才能收獲理想回報,但期間可能因市場環境變化出現不小的凈值回撤幅度,以往他們都是站在機構角度回復,導致語句比較生硬,讓投資者感到不適,但ChatGPT更容易站在投資者立場做回復,更能贏得投資者認可。
但他表示,隨著ChatGPT發展,它未必能徹底能替代基金經理與投資者的溝通,因為涉及到未來投資策略的優化,他們仍需“面對面”與投資者溝通,爭取投資者同意修改基金的某些投資條款。
記者獲悉,目前不少私募基金還在嘗試將ChatGPT作為產品募資路演的“新工具”。以往,他們在產品募資路演期間介紹投資策略時,總是會搬出一大堆專業術語,但很多高凈值投資者對此未必理解,導致彼此在投資策略與投資理念方面出現某些偏差,令私募錯失不少客戶。
如今,他們會將某些專業術語通過ChatGPT轉化成通俗易懂的自然語言文本展現給潛在投資者,爭取他們對投資策略的更精準理解,從而提升募資效率。
“未來,ChatGPT在私募領域會有多大的應用,仍是未知數。但可以預見的是,AI不會取代人,但會用AI的人會取代不會用 AI的人?!绷号e直言。
責任編輯:王超
免責聲明:
中國電子銀行網發布的專欄、投稿以及征文相關文章,其文字、圖片、視頻均來源于作者投稿或轉載自相關作品方;如涉及未經許可使用作品的問題,請您優先聯系我們(聯系郵箱:cebnet@cfca.com.cn,電話:400-880-9888),我們會第一時間核實,謝謝配合。