本科技报于4月8日凌晨宣布,“冷扑大师”vs中国龙的团队德克萨斯扑克人机大战表演赛在海南生态软件园传奇智力体育馆结束了第二天的比赛。 全天8400手,龙队一共输了347565分。 与冷扑的积分差相当明显。
4月7日下午,创新工厂创始人、理事长李开复、中国第一位德州扑克女子亚洲冠军李思晓、追梦者基金创始人朱波本直播间讲述了现在的比赛和各自眼睛的人工智能。
李开复表示,“冷扑大师”的机器学习能力非常强,而且不断学习,不断调整的能力非常可怕。 机器的一切决定是比较人类的一切可能性做出对他自己最有利的评价,而且根据德扑的规则,“冷扑”可以囊括一切可能性。
对此,李思晓说:“我觉得很害怕。 我看了以前的一点介绍。 包括他在内,不仅仅是来自大数据的总结,而是尽快调整人的决定。 他在德扑克专业方面的学习能力非常强,对人的尽快调整很快,包容性也很强”。
鉴于“冷扑高手”的表现,引起了他对超高学习能力的担忧。 关于人工智能是否向人类隐瞒消息,李开复说没有必要太担心。 “现在的人工智能工具都是人写的代码,本质上是人操作的工具。 所以他受人类管理,他没有自我意识到隐藏消息,所以不用担心我们的机器人以后会欺骗我们。 ”。
节目中,李思晓在日后的比赛中询问是否考虑“冷扑”的打法时,李思晓参考说:“我刚去比赛,现在世界上最顶尖的玩家也在模仿机器人下注,所以他(冷扑)。 (徐利)
以下本技术根据李开复博士陈述的复印件进行整理。
我们可能在今年1月看到了美国cmu卡内基梅隆大学的教授开发了德国机器人,在美国打败了顶尖的美国高手。 我自己也毕业于卡内基梅隆,所以我向他发出了邀请。 看到他不想和中国牌手对抗,阿尔法狗想打败世界冠军,cmu的这个“冷大师”系统在美国打败了顶尖高手。
那么这次来中国,我们怀着希望,能让大家看到德扑也很有趣的比赛,而且比围棋有不同的意义。 那么我很高兴托马斯教授也带来了“冷扑大师”,我们这次组织的中国龙队和杜悦老师在中国唯一在vsop上获得金手链的是拥有中国龙队的六名选手冷扑之马 这是大致的背景。
人类第一次输了1万分以上,第二次输了5万分以上,第三次输了12万分以上。 我们第一次在几乎相同的情况下,可以看出代表中国派遣的选手真的很强。 但是,“冷扑”在结束所有的比赛后,他进行机器学习,比较所有手的弱点调整自己的参数。 所以在第一天下午的比赛中,他化身为六个“冷门大师”,比较所有牌手的弱点调整参数,从而把差距拉至5万。 第三场比赛学习以来已经12万了。
所以,你会发现机器的自我调整很厉害,很可怕。
“冷扑”怎么学好德扑?
其实“冷扑”和alphago的区别还是很大的。
“冷扑”没有学过人类的牌谱,alphago先从人类的牌谱开始学习,然后自我提高。 “冷扑”根据博弈论的理论和德州扑克的规则,自己推进算法,所以他每次下注,或者所有的决定都比较人类的一切可能性,最有利于他自己的评价。 这个评价出来后,不管人类怎么反应,对“冷大师”来说都是最好的。 而且“冷扑”不断优化自己的做法,使对方无法推测,但他可以推测人类的应对方法。
打开“冷扑”盖子,你会发现里面有一个特别巨大的数据库,里面保存着所有卡片的排列和组合。 另外,在即时排列和组合下如何平衡,使对方无法推测自己有什么样的卡。
所以毕竟还是巨大的统计系统。
人工智能对人类隐瞒消息吗?
从“冷扑”的表现看起来似乎隐瞒了消息,其实这是人类告诉他的。 现在的人工智能工具无论是机器人、无人驾驶、alphago还是“冷扑大师”,本质上都是人写的代码,人操作工具。 所以他们受人类管理。 他没有意识到操纵自己隐藏消息。 隐藏消息其实是他的程序员让他这么说的。 所以我不太担心未来的机器人会欺骗我们。
和棋打一针,你就会发现棋的黑白在棋盘上,完全没有隐藏。 真正的应用在哪里? 确实,人的真正应用几乎不会暴露。 德国的扑克可能适合你买房子。 标价是900万。 在你心里预计是850万。 我应该拿出700万美元吗? 还是直接出840万拒绝涨价?
说到这个,我们发现商务谈判其实和德扑特很相似。 这也意味着德国将来可以克服商务谈判,甚至政治外交,解决国际关系上的问题,帮助人类做出决定。
“冷扑”囊括了所有的可能性
“冷主人”不断地判断自己的全部可能性和对方回应的全部可能性,以及接下来出示的卡的全部可能性,这样往返,不断地按下去。
另一方面,德克萨斯扑克本身的搜索区间比较小。 因为这个“冷扑”可以全面探索一切可能性。 他应该做的事件是自己如何选择人类不同的打法和让人类陷入困境的打法。 最后的目的是优化对方犯错误的可能性和自己获得越来越多的积分代码的可能性。 比如,两个人用石头剪刀布,任何策略掉落的概率都不到三分之一,对方就能找到你的弱点。
事实上,除了阿尔法go和冷扁,我们现在被人工智能技术包围了。 百度、淘宝、滴滴、今天的标题、知乎等企业在为各自的顾客服务的过程中,应用了人工智能技术。
除此之外,人工智能的应用场景包括金融行业、医疗行业、语音识别、面部识别等。 我预计在十年内,人类从事的50%的员工将被机器取代。
我希望人类选手获胜
现在,在2日4场比赛的15600手之后,龙队一共落后412702分,平均每100手失去了26.2个大盲注。 龙队和“冷扑”之间的积分差异很明显。
机器在不断地学习,当然,人类也在不断地学习,所以形势越来越差。 但是,显然机器学习的速度更快。 这是因为我预测的差距越来越大。
在alphago与李世石对战的比赛中,人类选手最后赢了一局。 这也恢复了人类的尊严。 我希望在未来的七场比赛中,我们的中国德扁平选手也能获得冠军。
原文1标题:“李开复点评德扑机战: ai向人隐瞒消息吗? 别担心"
责任:张海磊
标题:【时讯】李开复评德扑人机战:希望人类选手能赢一场
地址:http://www.jsswcm.com/jnjy/15931.html