科技之全球垄断_第229章【一夜爆红的神秘高手（二合一）】

　　二次错误。

　　换个说法就是，娜芙的学习进步速度太恐怖了，每一次对抗对“她”来说都是学习。

　　罗晟通过这五场与人类玩家对抗的比赛中也看到了娜芙暴露出来的一个缺陷，就是除了特定的分兵战术，“她”并不能形成灵活的兵力分配。

　　在输掉的第四局对抗中，一名高水平的人类玩家对娜芙的基地不停的多线骚扰，而“她”一旦回防对方就立刻跑路，等“她”的兵出门展开进攻的时候又转回来继续骚扰。

　　这场对抗，面对人类玩家的灵活出兵策略，娜芙只能被动应战，无法形成对人类玩家的有效进攻，也导致了最后滚雪球效应起来了。

　　最终落败。

　　第五局对抗结束之后，罗晟让娜芙停止了匹配对手，然后对其重新进行了一次大幅的升级优化。

　　他觉得这样的学习效率仍然显得太慢。

　　娜芙的智能体采用的是深度学习算法，罗晟对其进行了一次精心升级之后，包括了神经网络、通过强化学习的自我对弈，多智能体学习、模仿学习等算法或技术。

　　其中所谓的自我对弈，简单说就是自我学习，通过不断的试错找到让自己胜率最大的游戏方式。

　　而通过自我对弈和强化学习，构成了开放端学习算法的基本范式，学习人的策略，并确保娜芙的智能体在整个游戏过程中不断探索这些策略，从而让“她”获得更大的升级与进步。

　　此外，由于星际争霸这款游戏具有巨大的动作空间，会让许多先前强化学习方法变得无效。

　　罗晟因此还为娜芙开发了一种全新的算法进行非策略强化学习，使得“她”能从旧有的历史决策的游戏中有效的更新决策。

　　而罗晟的终极目的可不是让娜芙成为一个“IMBA”的星际争霸AI玩家，而是以此为起点，让“她”能够胜任复杂多变的其它应用场景。

　　如果“她”只是在星际争霸的比赛中成为超级高手，换个场景，例如在围棋、语言或其它领域就不行了，那依然是个纯粹的人工智障，和真正的人工智能有着巨大的差距。

　　……

　　时间一分一秒的流逝，罗晟猫在他的办公室不知不觉就耗费了三个多小时，为娜芙完成了第二次的优化升级才下班，时间已经不早了。

　　罗晟在离开办公室之前，又把娜芙放进了暴雪星际战网的天梯中，让“她”与人类玩家不停的对抗。

　　搞定这一切就没有在管了，下午还要去蔚蓝海岸公司处理一些工作，还有一场会议什么。

　　而被放养的娜芙就在做一件事情，不断与人类玩家对战。

　　娜芙的背后支撑“她”的几乎是整个苏城数据中心，消耗的是算力资源，是电费。

　　事实上如果没有钱，是不可能养得起一个人工智能的，就更别说是开发阶段了。

　　如果是像IBM公司这样的人工

　　请收藏：https://m.touna.cc