談談《星際爭霸2》電競人工智能AlphaStar
農步祥 于 2019.01.27 21:14:41 | 源自:www.soomal.com | 版權:原創 | 平均/總評分:09.83/59

人工智能一直是人類從進入資訊時代后最熱門的討論題,兩年前在谷歌旗下人工智能研究企業Deepmind研發的圍棋AI,在陸續戰勝李世石和柯潔兩位頂級職業圍棋選手后,帶起了一輪圍棋AI的研究熱潮,騰訊等科技企業也陸續折騰了不少人機或機器對戰賽事,那么象棋之類的AI出現只是時間問題了。

1月24日,Deepmind在官網了Youtube發表了旗下最新科技AlphaStar,并且在知名電競游戲《星際爭霸2》中以兩個5:0戰勝了兩位世界排名前50的職業選手——液體[Team Liquid]的MaNa和TLO,但在隨后的網上直播中人類扳回一城,而AlphaStar將在2月15日挑戰WSC去年的總冠軍Serral。

對于人類來說,是游戲復雜還是下棋復雜?這兩者看起來完全不是一個時代的休閑娛樂競技項目。眾所周知星際玩家不需要視力,由于游戲存在戰爭迷霧,無法完全看到對方的爆兵和行動,而且存在多變的規則、地形等因素,還需要實時操作和隨機應變,而棋盤戰局則是透明公開的回合制,允許思考。主要挑戰有博弈、不完整資訊、長期規劃、實時和巨大的行動空間,如果比類為棋盤,那么《星際爭霸2》的可行動數為10的26次方級別。

對于打電動的AI,不少院校已經在雅達利、超級馬里奧、雷神之錘3、Dota2等游戲上有研究成果,但多數還處于bot級別,和普通玩家斗智斗勇的階段。AlphaStar建立的目標就和AlphaGo類似,采用神經網路和深度學習技術使AI最終能挑戰職業選手,其深度學習模式采用原始游戲數據輸入,采用監督學習和強化學習模式。

另一方面要解決的是命令輸入,畢竟游戲的實時性無法像圍棋那樣通過下命令進行行動,而在機器觀察和行動上,Deepmind采用的是和暴雪聯合開發的開源機器操作接口PySC2,而觀察、思考和行動被分為多個助手[Agent]模塊。通過初步的監督學習,AlphaStar就戰勝了游戲中的精英AI,達到玩家天梯中的黃金級別。

而在往后的深度學習中,Deepmind采用了谷歌最新的人工智能處理器TPU v3,每個Agent單元配備了16個TPU單元,在14天的深度學習中,每個Agent都灌輸了200年時長的游戲回放進行訓練。而最終會把有效的策略通過Nash分配技術集中在一臺電腦上,也就意味著最終一個桌面PC級別的GPU就能和人類進行對抗。

當然,從競技角度來看,這次人機對戰AI贏下的10局也并不是完全公平,因為AI獲得的“圖像”是整個游戲界面的原始輸入[Raw Input]而不是顯示器輸出,AlphaStar不需要自己切換小地圖進行戰術分析和行動。雖然公平平等之類不是AI要解決的課題,不過AlphaStar相應也進行了圖像識別的深度學習訓練,其被稱為Camera Agent,而直播的那一局正是因為AI第一次使用圖像識別的原始版本而且未經過詳細測試,因為視力不佳輸給了職業選手,當然即使使用原始輸入,也比星際2自帶的開圖AI公平不少,而且經過訓練后,圖像識別和原始界面兩種方式的競技強度相差不大。

由于電競在傳統媒體上不一定會有圍棋的熱度,但作為Deepmind的技術成果展示,AlphaStar確實相較于AlphaGo又有了進步,無論是TPU硬體、深度學習時間等方面,它使用的硬體更少,學習速度也有了很大提升,對于推進人工智能技術和產業的進步也提供了指引。Deepmind團隊同期還有兩個大項目:AlphaZero[國際象棋和日本將棋AI]以及通過基因序列預測蛋白質3D結構的人工智能AlphaFold。

當然,這些東西或許離多數人的現實生活還比較遙遠。在去年的12月5日,谷歌旗下的WayMo無人駕駛計程車開始在美國的鳳凰城投入運營,給無人駕駛的商用和民用領域開啟了新的篇章,對于某些不想買車的居民來說毫無疑問是非常期待的。

那是不是時候研討AI取代人類這種杞人憂天了呢?從Deepmind的發展路線規劃圖來看,AlphaGo能像人類一樣讀懂棋譜至少也要10年以后,而有能力勝任人類所有機械智力工作的AI,至少也要40年后才能出現,而完全勝任人類工作的AI則是一個世紀之后,那么取代的問題就不用現在活著的人擔心了,而如果有幸活到那個時候,還能有球型關節女仆給養老伺候,豈不美哉。

請評分
1
2
3
4
5
6
7
8
9
10
03
這樣的機器出現之后,人類是不是可以準備不上班了
發表于2019.02.11 15:01:23
42
123.151.076.***
123.151.076.***
發表于2019.02.11 04:37:27
41
03
dnn——深度神經網路。

“1981年諾貝爾醫學獎獲得者 David Hubel 和 Torsten Wiesel 發現人的視覺系統的資訊處理是分級的:從視網膜(Retina)出發,經過低級的V1區提取邊緣特征,到V2區的基本形狀或目標的局部,再到高層的整個目標(如判定為一張人臉),以及到更高層的PFC(前額葉皮層)進行分類判斷等。高層的特征是低層特征的組合,從低層到高層的特征表達越來越抽象和概念化,也即越來越能表現語義或者意圖。

現在的深度神經網路,就是受此啟發。”

也就是說,深度神經網路算法真的是在模擬動物神經處理訊號的方式,而并非只是一個噱頭式命名。而這幾年以此發展起來的ai,也確實表現出了一些動物思考的特征,盡管還很原始,但已經不是空泛的概念了。
此帖使用Win10提交
——詳細閱讀
發表于2019.02.06 00:56:33
40
03
對運算力要求太高。這次alphastar是專門用了一塊GPU來跑的。而且放到人機對戰實際意義為0。因為alphastar就是靠學習人類對戰來進化的,進化到極致時的對戰感覺也就是碰到人類超高手。那直接上戰網找高手不久行了?
此帖使用Win10提交
發表于2019.02.06 00:48:06
39
03
感覺如果不加限制的開發人工智能,到最后會很恐怖!
發表于2019.02.01 12:46:55
38
118.116.***.***
118.116.***.***
有道理。其實我當然是支援AI植入手機電視等諸多娛樂裝置,不管現階段的AI是智能還是“智障”,對提高效率,滿足個性化需求總是有好處的。實際上,我之前說的重點在于1000多元的三流電視是否是真AI值得懷疑,感覺現在造一個產品不提AI或智能都不好意思拿出去賣,但有些產品真的算AI嗎?或者說有些產品真的有智能或互聯的必要嗎?我親眼見過一些被“強行智能”的產品,反而讓原本簡單的操作變復雜,這是否違背了智能化的初衷?所以我才說現在的AI已爛大街,并處于瘋狂炒概念的階段。當然,這并不絕對,只是對一些社會怪象的諷刺罷了。希望中國的AI+之路少一些噱頭,多一份務實。
此帖使用iPhone提交
發表于2019.01.31 10:26:47
37
042.236.***.***
042.236.***.***
是啊是啊
此帖使用Win10提交
發表于2019.01.30 12:43:19
36
03

此帖使用ZUK Z2131提交
發表于2019.01.30 10:42:16
35
10
比如,十年前,Google Picasa分析1GB的圖片內容,類區分照片的內容,例如花卉、禮堂、人臉,云端運算也得跑個半小時以上。而推理核心的AI處理器在手機上,處理效率比當年估計高成千上百倍。AI電視分析語音,分析電視節目喜好,也是同理。只需要很少的資源就可以做到豐富的內容。雖然和理想還有距離,但這條路不是老路,效率的增速目前還會處于飛快增長階段。


此帖使用MAC提交
發表于2019.01.29 20:05:15
34
10

此帖使用MAC提交
發表于2019.01.29 19:58:22
32
157.255.242.***
157.255.242.***
發表于2019.01.29 09:36:27
31
147.158.012.***
147.158.012.***
發表于2019.01.29 09:09:40
30
118.116.***.***
118.116.***.***
現在國內隨便一臺1000多塊錢的電視機都叫“人工智能電視”,樂了,要說目前AI處于什么階段,那明顯是瘋狂炒概念的階段,當然,只是在國內
此帖使用iPhone提交
發表于2019.01.29 08:27:16
29

此帖使用Win10提交
發表于2019.01.29 08:24:54
28
163.177.***.***
163.177.***.***
催更一下 HomePod 評測,期待 HomePod 評測在年前發出,么么噠
此帖使用MAC提交
發表于2019.01.28 18:51:37
26
03
發表于2019.01.28 18:16:21
25
萬一暴雪和Google合作推出新人機難度“AlphaStar”難度呢?
此帖使用Win10提交
發表于2019.01.28 16:12:58
24
萬一暴雪和Google合作推出新人機難度“AlphaStar”難度呢?
此帖使用Win10提交
發表于2019.01.28 16:12:57
23
提示
本貼不可匿名回復,回復等級為:1 ,您現在正處在潛水狀態
回復
驗證碼
7522 為防止廣告機貼垃圾,不得已而為之
表情
正文
京ICP備11010137號 京ICP證110276號 京公網安備110114000469號