打了一辈子德州,居然输给了新手AI!(上篇)
来呀!来呀!收藏我吧!!
前段时间,受周围朋友都在玩德扑游戏的影响,喜欢上了口袋德州(德州扑克),享受和牌友心理博弈的过程,也享受“赌博”带来的快感。一直觉得德州最大的魅力就在于它不完全是理性的判断,更多的是感性、勇气和理智之间的较量,不确定性太多,所以它区别于其他的棋牌类游戏,没有办法通过学习一些套路和技巧就能完胜对手。
最近回了学校,又开启了每天和AI“博弈”的磕盐生活。今天惊奇的发现,AI打德州扑克居然也完胜人类了!此次比赛共持续 20 天,由 4 名人类职业玩家 Jason Les、Dong Kim、Daniel McAulay 和 Jimmy Chou 对战人工智能程序 Libratus,在为期 20 天的赛程里面对玩 12 万手,争夺 20 万美元的奖金。最终的结果是「比赛过程中,人类选手整体上从未领先过」。
随着天数的增加,AI和人类选手的差距愈发明显
近几年,随着科技的不断发展,计算机打败人类的案例屡见不鲜。作为一只“程序媛”,我也算是半个“局内人”,本科参与过一些计算机博弈和机器人相关的比赛,硕士期间对AI也有一些浅显的了解。
今天就从理性的角度讲讲,AI是如何打败人类的。
几年前也是辉煌过的~~~
1
德州扑克怎么玩?(会玩请忽略)
德州扑克是目前世界上最流行的扑克游戏,
总结来说,如果想要赢牌,第一种可能就是你的牌比其他人的牌都大,第二种可能就是通过押注的技巧把牌没有你大的对手都吓跑。可能性就是口袋德州最有趣的地方。
2
完美信息博弈和不完美信息博弈
为什么AI不容易在德州扑克上打败人类呢?德扑游戏和围棋对AI来讲到底有什么区别?
首先,要理解完美信息博弈(棋牌类游戏)和不完美信息博弈(扑克类游戏)的区别。
完美信息博弈是指后行动的参与者可以观测到先行动的参与者的行动信息。像棋牌类游戏,双方的信息都是共享的,比如围棋,双方都能够看到场上已经下过的旗子以及双方的优势和劣势。
而扑克、谈判、商业决策等问题,双方的信息都是不公开给对方的,也即是说但参与者做选择的时候不知道其他参与者的选择,这就被称谓不完美信息博弈。简单来说,如果把其他参与者的行动理解为一个参与者做决策时所面对的环境,信息不完美就是决策者不知道自己所处的决策环境。对德州游戏规则,即使对手all in了所有的筹码,那么我们也不清楚他手里到底有什么底牌,信息的不对称,就迫使大家必须有“赌一把”的精神。这也是为什么金融人士和投资大佬们都喜欢玩口袋德州。
3我们用理工的思维讲讲AI是怎么赢了人类的
打了一辈子,居然输给了新手AI!(中篇):https://www.moshike.com/a/353.html
FAQ
WPT Global 有移动应用程序吗?
WPT Global 移动应用程序:功能、可用性以及如何下载 WPT Global 是增长最快的在线扑克平台之一,为 iOS 和 Android 设备提供方便且用户友好的移动应用程序。本文将指导您了解该
當沖手續費比較貴嗎?
當沖手續費和一般賣賣股票相同,皆為0.1425%;如買賣股票一般,手續費在買進、賣出股票時,都會被收取手續費,因此總共會收取2 次的手續費費用
當沖一定要當天賣嗎?
關注標的不宜過度分散:在進行當沖交易時,應該選擇自己較熟悉的股票,並且不宜同時關注過多標的,由於當沖者必須時常注意價格的波動,因此在交易時應
1股多少錢?
股票的價值:一股多少錢? 一張股票幾股? 在台灣,金管會規定股票的面額為一股10 元,一張股票等於1000 股。 所以「小學堂股份有限公司」,一共有1
日本錢 撲克牌怎麼玩?
德克萨斯扑克全称Texas Hold’em poker,中文简称德州扑克。 它是一种玩家对玩家的公共牌类游戏。 一张台面至少2人,最多22人,一般是由2-10人