2018 年 11 月 13-17 日,AAAI 人工智能與交互式數(shù)字娛樂大會 (AI for Interactive Digital Entertainment) 在阿爾伯塔大學舉辦。會上宣布了一年一度的星際爭霸 AI 挑戰(zhàn)賽結果;這也是即時戰(zhàn)略(RTS)游戲 AI 比賽中最重要的比賽之一。
第八屆(2018 年) AIIDE StarCraft AI Competition 星際爭霸 AI 挑戰(zhàn)賽共有 27 支團隊參賽,包括知名機構如三星、中科院自動化所、Facebook 等,知名高校如 Stanford University,以及許多獨立參賽隊伍。挑戰(zhàn)賽使用 12 臺計算機進行了大約 2 星期的比賽。經過每個 bot 平均大約 2600 局、每組對手平均大約 100 局,共 34694 局車輪戰(zhàn) 1v1 比賽之后,三星、Facebook 以及中科院自動化研究所分別以 95.91%、90.86%、87.11% 的勝率榮獲前三名 。
AIIDE StarCraft AI 挑戰(zhàn)賽自 2011 年起已連續(xù)舉辦八屆,該競賽以星際爭霸 1 為載體,以促進和評估用于實時戰(zhàn)略游戲(RTS)的人工智能水平為目的。近年來,它更是成為博弈對抗、強化學習、模仿學習、多任務學習等乃至通用人工智能算法研究的主要平臺和工具。由于包括對手不確定在內的信息不完全以及狀態(tài)動作空間巨大等問題,使得星際爭霸AI較圍棋AI更極具挑戰(zhàn)性,因此也吸引了包括DeepMind、Facebook、三星、斯坦福大學、中國科學院自動化研究所在內的國內外頂尖研究機構投入研究,相關核心技術可以廣泛應用在金融學、經濟學、生物學、政治學和軍事等領域。
前三名方案介紹
第三名 中科院自動化所,神族 bot “CSE”
在 2017 年的星際爭霸 AI 挑戰(zhàn)賽中,來自中科院自動化所的 AI“CPAC”就以 71% 的勝率獲得了第四名的成績。
今年的比賽中,由中科院自動化所智能系統(tǒng)與工程研究中心(C RISE )開發(fā)的神族 bot“CSE”以 87.11% 的勝率獲得季軍。據(jù)了解,該中心為自動化所獨立建制的科研部門,致力于研究博弈對抗與自主進化智能研究,包括感知智能與認知決策智能。“CSE”的作者包括:張俊格、郭瑋、尹奇躍、詹東、王琦瑋、胡益琿、申生奇和黃凱奇。2017年的CPAC也是由該團隊主要人員開發(fā)。
“CSE”使用的種族是神族(Protoss),采用的是規(guī)則和學習聯(lián)合驅動的方式。比如何時采用隱刀偷襲吸納了人類玩家的經驗知識;在建造隊列為空的時候,“CSE”使用深度學習來預測待構建單位,等等。
第二名 Facebook,蟲族 bot“CherryPi”
相比去年比賽中的 69% 勝率、第六名成績,來自 Facebook 的“CherryPi”今年有了大幅改進,取得了 90.86% 的勝率。“CherryPi”首先對于每個種族的對手有 8~13 種預先準備的不同的策略,利用比賽是多場 1v1 比賽的特點,它會根據(jù)與對手的過往比賽的勝率選擇最優(yōu)的策略。除此之外,它還使用了一個預訓練的機器模型,根據(jù)當前比賽狀態(tài)估算不同可用策略的勝率,然后在某些狀況下切換為勝率最高的策略。這種切換的設計也產生了“混合策略”的效果 。“CherryPi”中使用的機器學習技術還包括用于繞開障礙物、避戰(zhàn)與放風箏的尋路搜索算法、根據(jù)人類數(shù)據(jù)學習建筑布置、離線強化學習與在線學習等。“CherryPi”也是今年唯一一個使用了 GPU 計算能力的 bot。
第一名 三星,人族 bot “SAIDA”
我們都知道星際爭霸在韓國尤為盛行,自 2002 年來,韓國職業(yè)星際選手陸續(xù)加入了職業(yè)戰(zhàn)隊,并由包括三星、SK Telecom 等知名公司贊助。“SAIDA”的成功很有可能來自其職業(yè)星際選手的助力。
根據(jù)介紹,“SAIDA”bot 的核心是使用了一個穩(wěn)定的游戲策略,它會首先考慮防守,然后在游戲中期伺機一波帶走對方 。他們認為這種策略能應對絕大多數(shù)對手的策略,弱點也最少。
“SAIDA”也應用了一些 AI 技術。在 UAlbertaBot 的技術基礎上(下文還會提到),他們使用了一個有限狀態(tài)機來控制單位和建筑。每個單位和建筑在每種戰(zhàn)局下都有一個特定的狀態(tài)。并且使用了多個搜索算法來尋找敵方基地或者可以建造建筑的區(qū)域。
在開發(fā)過程中“SAIDA”還探索了使用 CNN 和編解碼器結構向人類選手學習進攻時機、在局部游戲中用多智能體強化學習方法學習單位微操,不過這些技術并沒有添加到此次參加比賽的版本中。
詳細排名
包含了所有團隊的成績以及詳細比賽數(shù)據(jù)的官方成績表單如下圖。
比賽中其它有趣事項
作為比賽中勝率最高的 bot,“SAIDA”面對人類選手的表現(xiàn)如何呢?三星團隊找業(yè)余選手和職業(yè)選手進行了測試,“SAIDA”可以擊敗業(yè)余選手,輸給了職業(yè)選手。不過他們認為差距并不大,擊敗職業(yè)選手的曙光就在前方。
主辦方補刀:既然已經出現(xiàn)了能擊敗人類的 bot 了,那么未來業(yè)余選手也許再也沒有獲勝的機會了也說不定呢……
絕大多數(shù)參賽團隊都使用固定的種族,2016、2017、2018 三年中都僅僅有一支團隊可以“隨機種族”。顯然單一種族意味著放棄了廣度,可以把已經發(fā)現(xiàn)的有效的策略挖得更深,也就更容易取得好成績。2017、2018 年的隨機種族方案都來自加拿大紐芬蘭紀念大學的 UAlbertaBot,今年他們僅以 34.71% 的勝率位列 19 位?;?UAlbertaBot 然后獲得冠軍的三星“SAIDA”顯然只是借用了技術,用以實現(xiàn)自己的策略。
“SAIDA”使用的策略顯然有極大的優(yōu)勢。根據(jù)挑戰(zhàn)賽主辦方提供的勝率波動圖表,在一開始的比賽中“SAIDA”就取得了最高勝率的位置,并一直穩(wěn)定保持到了最后。Facebook 的亞軍“CherryPi”與中科院自動化所的季軍“CSE”在剛開始時有交替波動,然后也很快穩(wěn)定了下來。
【來源:雷鋒網】