在上周O'Reilly和英特爾聯合主辦的AI Conference 2018北京站大會上,京東集團副總裁、AI平臺與研究部負責人周伯文發表了演講,分享了AI市場的發展和AI所面臨的技術挑戰。
周伯文認為,通用人工智能的到來并沒有時間表,但是從ANI(狹義AI)到ABI(廣義AI)有七個主要的技術難題需要克服。第一需要系統地解決遺忘問題,需要做持續學習;第二AI需要具備嚴密的推理和邏輯的能力;第三是AI系統需要能在沒有任何輸入的情況下自我學習;第四是架構需要更新;第五是AI需要變成一個自己能夠組合,完成一個更復雜的系統;第六是打破黑盒;第七是去掉偶然的成份。(小羿)
以下為周伯文博士演講實錄:
周伯文:我今天想跟大家探討一個話題,大家都知道AI是一個方興未艾的市場,我想告訴大家,其實這個市場可以比這個大100倍。當然,我們要達到這個目標,我們需要更多的努力。今天我想跟大家分享一下這些思考,關于這些技術挑戰的思考。
就像我說的一樣,AI是今天所有人都在討論的話題。當我們在談AI的時候一般會談什么?我們會談很多非常出色的AI的系統,在各種比賽中,從最近的AphaGo到AlphaZero等等,再到更早1950年我們就做過一個用AI來下棋的一個Game。除了這種非常有明確規則和邊界的下棋之外,其實AI還能用這種天生帶有模糊性的自然語言理解和問題回答的競賽。在危險邊緣的百科知識競賽中,IBM的Watson擊敗了人類的冠軍。當然遠遠不僅僅是棋類比賽,AI還可以創作性的協作。這是我們2016年做的一個工作,讓AI讀新聞,一個字一個字的像人類一樣寫一個新聞的標題,第一段是一個新聞,第二段是我們人類記者寫的標題,第三段是我們的AI寫出來的標題。能夠發現有幾個非常值得注意的是,這個動詞是AI自己想出來的,原文里面沒有,上下文里面也沒有。對比的人類用的對此就不一樣,AI用的是一個更書面化的動詞。同時對于這個里面的主語,是馬來西亞的Mahathir,相對應的人類記者寫的是Mahathir的Leader。從這里可以看到,AI做了一個創造性的改變,他知道什么時候忠實于原文,什么可以創造。
人工智能還可以做更多的推理,這樣的工作就是用人工智能回答專業領域的問題,關于一個保險的問題??蛻魡柕饺绻屹I一棟帶游泳池的房子,那我的保費會上升多少。這一類的專業問題,人工智能也回答的非常好。下面的答案是人工智能從很多文檔里面找出來的一個答案,但是這個答案的神奇在于,不但告訴你這是一個好的答案,而且幫你標出了為什么這個答案是好的,這個推理遠遠超越我們的想像。這里提到的,最后面這個角落提到把近鄰找出來,告訴這個用戶的鄰居是誰。這里面有一個專業的知識在里面,保費取決于你的風險,風險取決于你有沒有鄰居。如果你的鄰居在你的游泳池里面出事了,保險公司要承擔很大的責任,如果沒有鄰居,這個保費就不會很大,所以人工智能做了這么一個好的推理,告訴你這是一個好的答案。人工智能還能做很多機器閱讀、問題回答的例子。所有這一切,我想告訴大家,這一切都是我所說的狹義的人工智能的例子。今天我們仍然是從狹義的人工智能往廣義的人工智能在轉變,我到底狹義和廣義是指什么?我給大家花一點時間介紹一下。
大家可能聽過人工智能,聽到AGI,即通用人工智能。有些公司在研究。我們定義一下,to AGI,我們并不知道什么時候會到來。AI我們知道的比較多,今天的AI需要大量的數據,需要人工智能算法專家去設計架構,優化規則,設計程序去學習,每個任務都是分離和獨立的。通用的人工智能是我們做人工智能所有的研究者夢寐以求的東西,我們希望這個人工智能系統有更多的廣義的自主性。我們希望它能夠無時不在的都在學習,它能夠從閱讀中學習,從討論中學習,從觀察中學習,從做實驗中學習。我們希望這個人工智能系統的架構,它的特征表達、學習算法和優化算法是相互影響、相互一起來協作往前進,而不是說人設計一個再去設計另外一個,這是我們希望做的廣義的人工智能,或者說通用的人工智能。
就像我說的一樣,通用人工智能并沒有一個明確的時間表,我們看到這個定義也不是特別的清楚。我想廣義的人工智能是我們下一個里程碑。我把廣義的人工智能定義為有下面幾個特點:
第一,人工智能系統能夠自己去補充知識,能夠選擇性的補充知識,在離線的時候,會從不同的資源當中學習知識;
第二,它能夠保留和適應原有的這些人工智能模型,在新的任務里面,它能夠很快的適應,但是同時,它不會忘記已有的一些技能;
第三,因為它的學習方式,它的技能會越來越好,同時不會忘記原來的技能。
從ANI(狹義AI)到ABI(廣義AI)有七個主要的技術方向,需要我們的研究人員和技術工作者克服,跟大家簡單分享一下:
第一,ANI現在做的是狹隘的,一個個獨立的AI問題,ABI是要做廣義的、打通的終身學習。需要做到這個目的,就需要我們去系統的解決這個遺忘問題,做更好的Learning to Learning,需要做持續學習。
第二,我們現在的系統,大部分的神經網絡深度學習系統需要取得選擇性的彈性,為什么讓AI從頭到尾寫一本嚴密的推理小說是不可能的,因為他不可能做到這么嚴密的推理和邏輯。他們不能夠在很長的時間上去理解,這是一個很重要的能力。
第三,我們現在看到的人工智能雖然非常成功,大部分是來自于大數據。我們下面就需要從新的方向,我們需要不僅僅是標注的、監督的學習,也不僅僅是我們最近看到非常成功的這種,還有一種更極端的情況,就是連輸入都沒有,這個系統能夠自己自我學習,這個聽起來好像很神奇,但是我們人類就是這么做的。有一個生理現象,就是你每天晚上回到家的時候,你睡著了以后,你的大腦里面會重演一遍你今天做的事情,你在想什么做的不對,什么做的好,到第二天早晨起來的時候你還記得。這種情況下AI系統也會有,就是在沒有任何輸入的情況下自我學習。
第四是架構要變。我們現在是AI專家在設計,大家一起來學習,到將來AI一定是自己學習去更新。
第五,我們需要變成一個自己能夠組合,完成一個更復雜的系統,怎么組合,怎么完成更復雜的系統,這是AI需要自己去掌握的。
第六,今天的AI更多的情況下是黑盒,我們需要AI的公司讓用戶、專家能夠理解為什么要做這個決定。就像我剛才講的例子一樣,為什么說那個答案提到了回答保險公司的情況是一個好的答案,因為他提到了你的近鄰,給你解釋為什么是一個好的回答。
第七是關于優化,優化這一塊,我們今天人工智能的成功有點偶然的成份,我們做了一個神經網絡,理論上大家都知道它是非最優的。但是我們發現,好像在使用的系統當中也可以,這就導致今天AI大量的成功。但是如果達到了前面的那些目的,就是你在不停的演進,你的表征在演進。在這種新的框架下面,我們很難有運氣把這個問題解決。所以我認為,更有效的方式是一定需要的。
下面給大家舉兩個具體的例子,挑兩個方向給大家講一下近期的研究成果,讓大家看到一些ABI出現的一些前景。首先我想給大家講一下從所有可能的輸入中去學習,這個方向的研究領域很多,我給大家挑一個最近的工作,很有意思,就是機器閱讀、理解和問題回答。大家都知道,機器閱讀理解現在能夠非常好的回答百科全書的工作。一個原因就是能夠很好的標注這些數據,產生問題再產生答案去訓練。所以訓練數據里面,監督學習需要文檔,機器閱讀文檔,機器看這個問題,再看答案,再一起來做這個學習,幾十萬數量級的大數據做學習。如果我變成ABI,如果真的能夠閱讀理解跟人類一樣,那為什么你讀一個新的領域的文章還需要我給你標注數據呢?能不能自己讀完這個文章,就把這個文章看懂?所以我們現在做的一個研究就是,怎么能夠把一個系統回答問題,挪到一個新的領域。這個新的領域里面,不給他任何問題,他自己要學會,我們只測試數據和訓練數據。人是怎么讀的?我們想人讀新的文章,會自問自答,他講的是什么事情,什么問題。這是關于印度尼西亞的一個籃球員的新聞,來自CNN。有多少英國人被救了,答案是3個,文章里面提到過。從這個過程當中,就會產生新的領域的閱讀能力。我們做ABI的學習方式,跟人類的學習是非常像的。
我們把這個新的領域的閱讀理解問題回答變成兩個任務。一個就是我們去訓練一個教師系統,就是自問自答,我讀了這個文章產生哪些問題,讓用戶自己找到答案,通過這個過程,對這個過程加深了深刻的理解。我們把自己產生的問題和回答放到一起去訓練一個模型,去做新的領域的閱讀理解。所以可以看到這些結果,如果你不用原來百科全書的去做的話,如果完全給你一個標注的話,準確度高很多。但是如果我們用這種方法,完全沒有數據怎么去學?在很大程度上接近了后者,比前者好很多。
再講下一個話題,我們看到一些類腦(Brain-Inspired)的算法,很多人工智能做這些簡單的工作,跟人的大腦相比,這個差距是非常明顯的,我們的大腦是一個非均衡的動態系統。絕不僅僅是一個簡單的預測系統。將來的ABI和AGI,一定會結合這種彈性,包含什么時候該選擇記住,什么時候該選擇遺忘。你的記憶等等,所有的這些要融合在一起,就像我們坐的飛機跟鳥一樣去飛,現在缺乏這樣一個機制。我們現在做了一個終身學習,覺得更有彈性,更可靠。這其中一個問題就是,我怎么讓這個大腦,讓這個AI系統有可變化性,跟人類大腦一樣。為什么會這么講?因為大家可能不知道,在我們大腦中有一個現象,我們每天都有新的腦細胞在產生,也有腦細胞在死亡。所以你會在中國聽到一句話說,這個問題太難了,會死很多的腦細胞。但是即使是一個成年人,也會有很多新的腦細胞產生。
這種現象在我們AI里面的下一個工作,我們在做動態重構的一個工作。下面這個圖,中間那一層是一些個藍色的節點,可以想像成一個隱性的神經元。我們做的你可以想成是一個稀疏的,中間藍色的點代表了中間一層神經元。我們做的工作就是,我能不能在學習的過程當中動態的看一下這一層有多少神經元,可以加上這個神經元,也可以選擇性的模擬腦細胞的產生和死亡。這個產生的過程中,因為我在AI系統面臨不同的挑戰,就是我以前學的很好的東西,我現在做一個新的東西,我發現不適應了,所以腦細胞要死亡。人類說學這個東西死了很多腦細胞,我可能文科很好,做數學死了很多腦細胞,就說明有些腦細胞可能不適合學數學,所以會自然而然的死亡,但是有新的腦細胞產生,所以就會產生新的腦細胞,這是這張圖的意義。
我們看一下這個結果。通過這種做法,可以看到,我們現在做的是試圖重構不同的圖,不斷的改變系統測試的環境。這個系統本來的訓練是重構這個城市風光,城堡、別墅,我們動態產生一些讓它去重構這種植物、自然風光,包括花、草這些東西。這種環境不斷的變化,我們發現在學習過程當中,這個系統不斷的產生新的細胞和老的細胞。到最后動態產生的系統遠遠好于一個靜態的人工專家設計的系統。我們發現,這個結構更壓縮,更有效率,數據的規模更小,模型規模更小,這是一個非常有意思的視角。
如果我的整個演講,大家能夠記住一句話的話就是這句話:ABI意味著有更好的需求和標識數據,我們對專家人工系統,算法專家的依賴性會減少,我們會有更多可解釋的人工智能解決給大家分享。更重要的在于,你去設計和研發的一個AI系統,可以來做更多不同的任務。所有這一切合在一起,就會形成我們說的ABI。但是如果ABI能夠達到,對任何AI的應用企業,對AI的使用者來說,這意味著一個比今天大100倍的人工智能市場,謝謝大家!
人妻精品一区二区三区_好紧好湿好硬国产在线视频_亚洲精品无码mv在线观看_国内激情精品久久久責任編輯:韓希宇
免責聲明:
中國電子銀行網發布的專欄、投稿以及征文相關文章,其文字、圖片、視頻均來源于作者投稿或轉載自相關作品方;如涉及未經許可使用作品的問題,請您優先聯系我們(聯系郵箱:cebnet@cfca.com.cn,電話:400-880-9888),我們會第一時間核實,謝謝配合。