打了一辈子德州,居然输给了新手AI!(上篇)

来呀!来呀!收藏我吧!!
前段时间,受周围朋友都在玩德扑游戏的影响,喜欢上了口袋德州(德州扑克),享受和牌友心理博弈的过程,也享受“赌博”带来的快感。一直觉得德州最大的魅力就在于它不完全是理性的判断,更多的是感性、勇气和理智之间的较量,不确定性太多,所以它区别于其他的棋牌类游戏,没有办法通过学习一些套路和技巧就能完胜对手。
最近回了学校,又开启了每天和AI“博弈”的磕盐生活。今天惊奇的发现,AI打德州扑克居然也完胜人类了!此次比赛共持续 20 天,由 4 名人类职业玩家 Jason Les、Dong Kim、Daniel McAulay 和 Jimmy Chou 对战人工智能程序 Libratus,在为期 20 天的赛程里面对玩 12 万手,争夺 20 万美元的奖金。最终的结果是「比赛过程中,人类选手整体上从未领先过」。
随着天数的增加,AI和人类选手的差距愈发明显
近几年,随着科技的不断发展,计算机打败人类的案例屡见不鲜。作为一只“程序媛”,我也算是半个“局内人”,本科参与过一些计算机博弈和机器人相关的比赛,硕士期间对AI也有一些浅显的了解。
今天就从理性的角度讲讲,AI是如何打败人类的。
几年前也是辉煌过的~~~
1
德州扑克怎么玩?(会玩请忽略)
德州扑克是目前世界上最流行的扑克游戏,
总结来说,如果想要赢牌,第一种可能就是你的牌比其他人的牌都大,第二种可能就是通过押注的技巧把牌没有你大的对手都吓跑。可能性就是口袋德州最有趣的地方。
2
完美信息博弈和不完美信息博弈
为什么AI不容易在德州扑克上打败人类呢?德扑游戏和围棋对AI来讲到底有什么区别?
首先,要理解完美信息博弈(棋牌类游戏)和不完美信息博弈(扑克类游戏)的区别。
完美信息博弈是指后行动的参与者可以观测到先行动的参与者的行动信息。像棋牌类游戏,双方的信息都是共享的,比如围棋,双方都能够看到场上已经下过的旗子以及双方的优势和劣势。
而扑克、谈判、商业决策等问题,双方的信息都是不公开给对方的,也即是说但参与者做选择的时候不知道其他参与者的选择,这就被称谓不完美信息博弈。简单来说,如果把其他参与者的行动理解为一个参与者做决策时所面对的环境,信息不完美就是决策者不知道自己所处的决策环境。对德州游戏规则,即使对手all in了所有的筹码,那么我们也不清楚他手里到底有什么底牌,信息的不对称,就迫使大家必须有“赌一把”的精神。这也是为什么金融人士和投资大佬们都喜欢玩口袋德州。
3我们用理工的思维讲讲AI是怎么赢了人类的
打了一辈子,居然输给了新手AI!(中篇):https://www.moshike.com/a/353.html
FAQ
轮盘赌在电影和文学等流行文化中扮演什么角色?
轮盘赌在电影和文学等流行文化中扮演什么角色? 轮盘赌在流行文化中发挥着重要作用,出现在许多电影、书籍和其他形式的媒体中。在电影中,轮盘赌经常被
當沖真的不好嗎?
當沖的三個缺點 1.需要高超的技術看這裡一堆賠爆的人就知道了 短期的股價很難預測 2.身體長期處於興奮狀態很傷身會有各種疾病找上你 3.需要花大量時
在线赌场的引入如何影响轮盘赌游戏?
在线赌场的引入如何影响轮盘赌游戏? 在线赌场的引入对轮盘赌游戏产生了重大影响。在线赌场使任何有互联网连接的人都可以轻松访问轮盘赌和其他赌场游戏
當沖一定要當天賣嗎?
關注標的不宜過度分散:在進行當沖交易時,應該選擇自己較熟悉的股票,並且不宜同時關注過多標的,由於當沖者必須時常注意價格的波動,因此在交易時應
WPT扑克中的TP是什么?
WPT扑克中的TP是什么? 锦标赛积分(TP) 用于购买 ClubWPT 上的 VIP 锦标赛的门票。所有玩家在开设 VIP 账户时都会获得固定数量的 TP(500)。它们无法重