纳什均衡的可能

2 min readJun 30, 2018

在 Alpha Go 战胜柯洁之后，人类突然意识到很多我们过去的经典棋法，理解是有问题的，Alpha Go 的很多招式，是前无古人的，从理论上说，人类的围棋的理解，陷入在了「纳什均衡」之中

「纳什均衡」的定义：

最近看到 Dota2 的 AI 通过每天相当于人类180年的强化学习，已经可以战胜普通的战队，使出了很多超越人类过往认知的玩法，让人大开眼界，今天看到 Google 新发布的论文，机械手臂通过强化学习，将抓取成功率从 78% 提升到了 96%，可以想象，人类过去的认知，有多么的「纳什均衡」

人类作为地球历史上第一个达到如此智能水平的物种，大概率是处于「纳什均衡」中的，所以无论是我们现在生活中的吃喝住行，还是我们赖以生存的生理构造，亦或是更底层的DNA结构和碳基，都有可能是处于「纳什均衡」之中的，而要想走出这种「纳什均衡」，强化学习是目前比较合适的方法，但是要在更复杂的条件下运用强化学习，人类是有非常漫长的路要走的

另一方面，强化学习可以把所有的平行文明，引向共同的方向，到时候，我们兴许就能放弃各自徒劳的寻觅，与别的文明共同遇到彼此了

纳什均衡的可能

Written by Marvin

No responses yet