谈谈《星际争霸2》电竞人工智能AlphaStar
农步祥 于 2019.01.27 21:14:41 | 源自:www.soomal.com | 版权:原创 | 平均/总评分:09.80/49

人工智能一直是人类从进入信息时代后最热门的讨论题,两年前在谷歌旗下人工智能研究企业Deepmind研发的围棋AI,在陆续战胜李世石和柯洁两位顶级职业围棋选手后,带起了一轮围棋AI的研究热潮,腾讯等科技企业也陆续折腾了不少人机或机器对战赛事,那么象棋之类的AI出现只是时间问题了。

1月24日,Deepmind在官网了Youtube发表了旗下最新科技AlphaStar,并且在知名电竞游戏《星际争霸2》中以两个5:0战胜了两位世界排名前50的职业选手——液体[Team Liquid]的MaNa和TLO,但在随后的网上直播中人类扳回一城,而AlphaStar将在2月15日挑战WSC去年的总冠军Serral。

对于人类来说,是游戏复杂还是下棋复杂?这两者看起来完全不是一个时代的休闲娱乐竞技项目。众所周知星际玩家不需要视力,由于游戏存在战争迷雾,无法完全看到对方的爆兵和行动,而且存在多变的规则、地形等因素,还需要实时操作和随机应变,而棋盘战局则是透明公开的回合制,允许思考。主要挑战有博弈、不完整信息、长期规划、实时和巨大的行动空间,如果比类为棋盘,那么《星际争霸2》的可行动数为10的26次方级别。

对于打电动的AI,不少院校已经在雅达利、超级马里奥、雷神之锤3、Dota2等游戏上有研究成果,但多数还处于bot级别,和普通玩家斗智斗勇的阶段。AlphaStar建立的目标就和AlphaGo类似,采用神经网络和深度学习技术使AI最终能挑战职业选手,其深度学习模式采用原始游戏数据输入,采用监督学习和强化学习模式。

另一方面要解决的是命令输入,毕竟游戏的实时性无法像围棋那样通过下命令进行行动,而在机器观察和行动上,Deepmind采用的是和暴雪联合开发的开源机器操作接口PySC2,而观察、思考和行动被分为多个助手[Agent]模块。通过初步的监督学习,AlphaStar就战胜了游戏中的精英AI,达到玩家天梯中的黄金级别。

而在往后的深度学习中,Deepmind采用了谷歌最新的人工智能处理器TPU v3,每个Agent单元配备了16个TPU单元,在14天的深度学习中,每个Agent都灌输了200年时长的游戏回放进行训练。而最终会把有效的策略通过Nash分配技术集中在一台电脑上,也就意味着最终一个桌面PC级别的GPU就能和人类进行对抗。

当然,从竞技角度来看,这次人机对战AI赢下的10局也并不是完全公平,因为AI获得的“图像”是整个游戏界面的原始输入[Raw Input]而不是显示器输出,AlphaStar不需要自己切换小地图进行战术分析和行动。虽然公平平等之类不是AI要解决的课题,不过AlphaStar相应也进行了图像识别的深度学习训练,其被称为Camera Agent,而直播的那一局正是因为AI第一次使用图像识别的原始版本而且未经过详细测试,因为视力不佳输给了职业选手,当然即使使用原始输入,也比星际2自带的开图AI公平不少,而且经过训练后,图像识别和原始界面两种方式的竞技强度相差不大。

由于电竞在传统媒体上不一定会有围棋的热度,但作为Deepmind的技术成果展示,AlphaStar确实相较于AlphaGo又有了进步,无论是TPU硬件、深度学习时间等方面,它使用的硬件更少,学习速度也有了很大提升,对于推进人工智能技术和产业的进步也提供了指引。Deepmind团队同期还有两个大项目:AlphaZero[国际象棋和日本将棋AI]以及通过基因序列预测蛋白质3D结构的人工智能AlphaFold。

当然,这些东西或许离多数人的现实生活还比较遥远。在去年的12月5日,谷歌旗下的WayMo无人驾驶计程车开始在美国的凤凰城投入运营,给无人驾驶的商用和民用领域开启了新的篇章,对于某些不想买车的居民来说毫无疑问是非常期待的。

那是不是时候研讨AI取代人类这种杞人忧天了呢?从Deepmind的发展路线规划图来看,AlphaGo能像人类一样读懂棋谱至少也要10年以后,而有能力胜任人类所有机械智力工作的AI,至少也要40年后才能出现,而完全胜任人类工作的AI则是一个世纪之后,那么取代的问题就不用现在活着的人担心了,而如果有幸活到那个时候,还能有球型关节女仆给养老伺候,岂不美哉。

请评分
1
2
3
4
5
6
7
8
9
10
03
这样的机器出现之后,人类是不是可以准备不上班了
发表于2019.02.11 15:01:23
42
123.151.076.***
123.151.076.***
发表于2019.02.11 04:37:27
41
03
dnn——深度神经网络。

“1981年诺贝尔医学奖获得者 David Hubel 和 Torsten Wiesel 发现人的视觉系统的信息处理是分级的:从视网膜(Retina)出发,经过低级的V1区提取边缘特征,到V2区的基本形状或目标的局部,再到高层的整个目标(如判定为一张人脸),以及到更高层的PFC(前额叶皮层)进行分类判断等。高层的特征是低层特征的组合,从低层到高层的特征表达越来越抽象和概念化,也即越来越能表现语义或者意图。

现在的深度神经网络,就是受此启发。”

也就是说,深度神经网络算法真的是在模拟动物神经处理信号的方式,而并非只是一个噱头式命名。而这几年以此发展起来的ai,也确实表现出了一些动物思考的特征,尽管还很原始,但已经不是空泛的概念了。
此帖使用Win10提交
——详细阅读
发表于2019.02.06 00:56:33
40
03
对运算力要求太高。这次alphastar是专门用了一块GPU来跑的。而且放到人机对战实际意义为0。因为alphastar就是靠学习人类对战来进化的,进化到极致时的对战感觉也就是碰到人类超高手。那直接上战网找高手不久行了?
此帖使用Win10提交
发表于2019.02.06 00:48:06
39
03
感觉如果不加限制的开发人工智能,到最后会很恐怖!
发表于2019.02.01 12:46:55
38
118.116.***.***
118.116.***.***
有道理。其实我当然是支持AI植入手机电视等诸多娱乐设备,不管现阶段的AI是智能还是“智障”,对提高效率,满足个性化需求总是有好处的。实际上,我之前说的重点在于1000多元的三流电视是否是真AI值得怀疑,感觉现在造一个产品不提AI或智能都不好意思拿出去卖,但有些产品真的算AI吗?或者说有些产品真的有智能或互联的必要吗?我亲眼见过一些被“强行智能”的产品,反而让原本简单的操作变复杂,这是否违背了智能化的初衷?所以我才说现在的AI已烂大街,并处于疯狂炒概念的阶段。当然,这并不绝对,只是对一些社会怪象的讽刺罢了。希望中国的AI+之路少一些噱头,多一份务实。
此帖使用iPhone提交
发表于2019.01.31 10:26:47
37
042.236.***.***
042.236.***.***
是啊是啊
此帖使用Win10提交
发表于2019.01.30 12:43:19
36
03

此帖使用ZUK Z2131提交
发表于2019.01.30 10:42:16
35
10
比如,十年前,Google Picasa分析1GB的图片内容,类区分照片的内容,例如花卉、礼堂、人脸,云端运算也得跑个半小时以上。而推理核心的AI处理器在手机上,处理效率比当年估计高成千上百倍。AI电视分析语音,分析电视节目喜好,也是同理。只需要很少的资源就可以做到丰富的内容。虽然和理想还有距离,但这条路不是老路,效率的增速目前还会处于飞快增长阶段。


此帖使用MAC提交
发表于2019.01.29 20:05:15
34
10

此帖使用MAC提交
发表于2019.01.29 19:58:22
32
157.255.242.***
157.255.242.***
发表于2019.01.29 09:36:27
31
147.158.012.***
147.158.012.***
发表于2019.01.29 09:09:40
30
118.116.***.***
118.116.***.***
现在国内随便一台1000多块钱的电视机都叫“人工智能电视”,乐了,要说目前AI处于什么阶段,那明显是疯狂炒概念的阶段,当然,只是在国内
此帖使用iPhone提交
发表于2019.01.29 08:27:16
29

此帖使用Win10提交
发表于2019.01.29 08:24:54
28
163.177.***.***
163.177.***.***
催更一下 HomePod 评测,期待 HomePod 评测在年前发出,么么哒
此帖使用MAC提交
发表于2019.01.28 18:51:37
26
03
发表于2019.01.28 18:16:21
25
万一暴雪和Google合作推出新人机难度“AlphaStar”难度呢?
此帖使用Win10提交
发表于2019.01.28 16:12:58
24
万一暴雪和Google合作推出新人机难度“AlphaStar”难度呢?
此帖使用Win10提交
发表于2019.01.28 16:12:57
23
提示
本贴可以匿名回复 ,您现在正处在潜水状态
回复
验证码
1056 为防止广告机贴垃圾,不得已而为之
表情
正文
京ICP备11010137号 京ICP证110276号 京公网安备110114000469号