在 Alpha Go 战胜柯洁之后,人类突然意识到很多我们过去的经典棋法,理解是有问题的,Alpha Go 的很多招式,是前无古人的,从理论上说,人类的围棋的理解,陷入在了「纳什均衡」之中
「纳什均衡」的定义:
最近看到 Dota2 的 AI 通过每天相当于人类180年的强化学习,已经可以战胜普通的战队,使出了很多超越人类过往认知的玩法,让人大开眼界,今天看到 Google 新发布的论文,机械手臂通过强化学习,将抓取成功率从 78% 提升到了 96%,可以想象,人类过去的认知,有多么的「纳什均衡」
人类作为地球历史上第一个达到如此智能水平的物种,大概率是处于「纳什均衡」中的,所以无论是我们现在生活中的吃喝住行,还是我们赖以生存的生理构造,亦或是更底层的DNA结构和碳基,都有可能是处于「纳什均衡」之中的,而要想走出这种「纳什均衡」,强化学习是目前比较合适的方法,但是要在更复杂的条件下运用强化学习,人类是有非常漫长的路要走的
另一方面,强化学习可以把所有的平行文明,引向共同的方向,到时候,我们兴许就能放弃各自徒劳的寻觅,与别的文明共同遇到彼此了