來源:新浪VR
語言是人類最基本的交際工具,人類社會的運行和發(fā)展離不開語言。我們通過語言來進行的人際互動、交換信息。說話者發(fā)出“語言信息”,受話者接受信息并在大腦中經(jīng)過處理,最后“反饋信息”。那么,這種能力是否能運用于人工智能呢?是否可以讓機器人也學會根據(jù)自己的需要發(fā)出命令指導對方實踐?
研究員們通過實踐,在一個基于文本的冒險游戲中結(jié)合自然語言處理和強化學習技術(shù),向機器展示如何使用語言作為工具。一個通過與角色對話完成文本冒險游戲任務(wù)的人工智能不僅學會了如何做事,還學會了如何讓別人做事。該系統(tǒng)向機器使用語言實現(xiàn)目標邁出了一步。
為了構(gòu)建一個有目的言語的人工智能,來自亞特蘭大佐治亞理工學院(Georgia Institute of Technology)和Facebook人工智能研究中心(Facebook AI Research)的研究人員結(jié)合了來自自然語言處理(natural-language processing)和強化學習(reinforcement learning)的技術(shù)。
為了測試他們的方法,研究人員在一款名為LIGHT的基于文本的多人游戲中訓練他們的系統(tǒng)。LIGHT是Facebook去年開發(fā)的,用于研究人類和人工智能玩家之間的交流。游戲設(shè)定在一個幻想主題的世界里,有成千上萬的眾包對象、角色和地點,通過屏幕上的文字進行描述和交互。玩家(人或電腦)通過輸入諸如“擁抱向?qū)?rdquo;、“打龍”或“摘掉帽子”等命令來行動。他們還可以和聊天機器人控制的角色交談。
為了給出人工智能做事情的理由,研究人員增加了大約7500個眾包任務(wù),這并不包括在最初版本的《光》中。最后,他們還創(chuàng)建了一個知識圖(一個主題-動詞-對象關(guān)系的數(shù)據(jù)庫),為AI提供關(guān)于游戲世界和游戲角色之間聯(lián)系的常識信息,比如商家只有在警衛(wèi)是朋友的情況下才會信任他們。游戲現(xiàn)在有動作(比如“上山”和“吃掉騎士”)來完成任務(wù)(比如“建立龍所能獲得的最大的寶藏”)。
將所有這些結(jié)合在一起,他們訓練人工智能僅僅通過語言來完成任務(wù)。要執(zhí)行動作,它可以為該動作鍵入命令,也可以通過與其他字符對話來達到相同的目的。例如,如果人工智能需要一把劍,它可以選擇偷一把或說服另一個角色交出一把。
目前,這個系統(tǒng)還只是個玩具。它的態(tài)度可能很直率,但將自然語言處理與強化學習相結(jié)合是一個令人興奮的操作,它不僅可以使聊天機器人更智能地對話,而且可以幫助我們對“充滿語言的世界是如何運作的”這一思考進行更豐富且深入地理解。