0
本文作者: 彭鵬 | 編輯:郭奕欣 | 2017-04-25 18:20 | 專題:ICLR 2017 |
雷鋒網(wǎng)按:在 ICLR 2017 舉辦之際,F(xiàn)AIR實驗室撰文展示了團隊在理解對話所做的研究和貢獻,雷鋒網(wǎng)進行編譯,未經(jīng)許可不得轉(zhuǎn)載。
在 Facebook 的人工智能研究中心(FAIR),理解對話一直被認為是一個宏大和長期的 AI 研究目標(biāo)。
一個真正有效的對話系統(tǒng)應(yīng)該是一項輔助性的技術(shù),這個系統(tǒng)很可能包括一個可以用自然語言與人類交流的與聊天機器人類似的系統(tǒng)。它可以幫助人們更好地理解周圍的世界,更有效地和周圍的人進行交流,消除溝通上的障礙。隨著數(shù)字化內(nèi)容的不斷增多,研發(fā)此類技術(shù)將會變得越來越重要。
嘗試著去理解和解釋對話并不是一個新奇的想法。早在 20 年前,就有人嘗試著去建造一臺人類可以與之交流并且可以教它學(xué)習(xí)如何去對話的機器。它們結(jié)合了技術(shù)和工程,但是使用預(yù)編程的腳本響應(yīng)就顯得視野十分狹窄了。
多虧了近年來機器學(xué)習(xí)技術(shù)的發(fā)展,機器學(xué)習(xí)技術(shù)讓 AI 智能體與人類用自然語言交流成為了一個更加現(xiàn)實的想法,得到了學(xué)術(shù)界和工業(yè)界的廣泛關(guān)注。
然而,現(xiàn)在的大多數(shù)對話系統(tǒng)仍然是腳本化的:它們的自然語言理解的模塊可能是基于機器學(xué)習(xí)的,但是它們的應(yīng)答內(nèi)容通常是由 if/then 語句或規(guī)則引擎來決定的。盡管相對于數(shù)十年前已經(jīng)取得了進步,但是在很大程度上還是依據(jù)其巨大的文本數(shù)據(jù)庫來創(chuàng)建它們的回答。
與聊天機器人進行自然語言的對話仍然是一個挑戰(zhàn),這將需要一系列研究上的突破。 FAIR 選擇從兩個方向來解決這個問題:一般的 AI 和機器通過交流進行推理以及在當(dāng)前的對話系統(tǒng)中進行研究。并從實際使用的聊天機器人中吸取經(jīng)驗。 FAIR 的優(yōu)勢在于跨越兩種方法的所遇到的多樣性。從長期的類似于 CommAI intiative 的基礎(chǔ)性研究,到短期的類似于 FastText 和 Facebook M 的應(yīng)用型嘗試。通過這些努力,再加上團隊在 AI 頻譜、從深度學(xué)習(xí) NLP 到增強學(xué)習(xí)、計算機視覺和工程方面的專業(yè)知識, FAIR 希望能夠取得有意義的自然語言對話進展。
FAIR 在對話方面工作的重要一點是, 團隊如何將它置于一個明確的基礎(chǔ)之中:
強大的基礎(chǔ): 針對于 NLP 問題的高級學(xué)習(xí)系統(tǒng)應(yīng)該展現(xiàn)出比傳統(tǒng)方法更好地性能。為了達到這個目的, FAIR 構(gòu)建了 FastText, 用相對簡單和容易理解的技巧來提供可達到的最佳效果。
清晰的評估:評價一個對話系統(tǒng)是一個很困難的問題。FAIR 提出了一個更好的工具來做到這一點。在 ICLR 2017,F(xiàn)acebook 與學(xué)術(shù)界分享了它們的發(fā)現(xiàn)和工具。其中包括訓(xùn)練和評估推理模型的 CommAI environment,以及可用于測試端對端對話模型的 bAbI. 由于 FAIR 與 Facebook M 的合作,這些工具已經(jīng)在實際生產(chǎn)條件下進行了測試。
開放的研究:FAIR 通過會議或者預(yù)印的方式公開了其幾乎所有的研究工作。同樣地,代碼和數(shù)據(jù),包括上面提到的兩個評估舉措也作為開放源碼發(fā)布了。正如在 FAIR 有多種多樣的工作一樣,AI 社區(qū)也有著極大的多樣性。 FAIR 相信通過開放式的對話、共享工具和研究將會帶來更大的進步。
在 ICLR, FAIR 提供了 7 篇論文來說明 FAIR 對話研究的質(zhì)量、創(chuàng)新和廣度。Lazaridou 等人 [6] 和 CommAI 團隊 [1] 提出了使系統(tǒng)能夠發(fā)現(xiàn)和使用基本溝通技巧的方向,是邁向強人工智能的第一步。Li 等人提出了 2 篇關(guān)于端對端對話系統(tǒng)如何使用現(xiàn)場對話來提升自身性能的論文 [2,5]。Bordes 等人將 bAbI 引入到面向目標(biāo)場景中的端對端對話系統(tǒng)的測試。 FAIR 也展示了 Grave 等人和 Henaff 等人關(guān)于機器閱讀的兩篇論文,他們的研究實現(xiàn)了通過機器推動文本閱讀的界限。
[1] CommAI: Evaluating the First Steps Towards a Useful General AI, M Baroni, A Joulin, A Jabri, G Kruszewski, A Lazaridou, K Simonic, T Mikolov
[2] Dialogue Learning With Human-In-The-Loop, J Li, AH Miller, S Chopra, MA Ranzato, J Weston
[3] Improving Neural Language Models with a Continuous Cache, E Grave, A Joulin, N Usunier
[4] Learning End-to-end Goal-oriented Dialog, A Bordes, YL Boureau, J Weston
[5] Learning Through Dialogue Interactions, J Li, AH Miller, S Chopra, MA Ranzato, J Weston
[6] Multi-Agent Cooperation and the Emergence of (Natural) Language, A Lazaridou, A Peysakhovich, M Baroni
[7]「Tracking the World State with Recurrent Entity Networks,」M Henaff, J Weston, A Szlam, A Bordes, Y LeCun
via research.fb,雷鋒網(wǎng)編譯
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。
本專題其他文章