立即玩

Play Poker Online and Win Real Money.

打了一辈子德州,居然输给了新手AI!(中篇) 打了一辈子德州,居然输给了新手AI!(上篇):https://www.moshike.com/a/347.html 完美信息博弈类游戏 对于围棋

打了一辈子德州,居然输给了新手AI!(上篇):https://www.moshike.com/a/347.html

完美信息博弈类游戏

对于围棋游戏来说,是一场零和完美信息博弈,这是指在任何时刻,双方玩家都知道前面游戏的全部状态(完美信息),并且在有限步数之后游戏的结果非胜即负(零和)。

知道了游戏的有限状态,计算机就可以通过暴力枚举的方法来计算后面所有可能的下法,形成一颗巨大的搜索树,这颗搜索树可以列举出在当前状态下所有可能的下法,每个子搜索树都能独立求解,计算机就可以根据计算的结果安排对应的策略,从而达到最终的胜利。

举个栗子,比如,小明是一个普通中国家庭长大的小孩,在他的一生中,面临着很多个选择,如何才能在未来走向人生巅峰呢?如果可以列举出他未来所有的可能性,把每一步的选择拆解成“子未来”,那么就可以计算出成功胜算最大的选择了。(例子可能不够恰当,理解意思就好,嘻嘻)

小明同学的人生探险

所以,假设我们有无限大的计算资源,就可以将一局游戏的博弈拆解成一个一个的子博弈(列举出所有的可能性),从而计算出胜算最大的打法,就可以打赢比赛了。但是,以棋类游戏中比较简单的西洋棋来说,它的分支因子大概是40左右,这表示预测之后20步的动作需要计算40的20次方(这是多大,就算是1GHz的处理器,也要计算3486528500050735年),请注意,这还是比较简单的西洋棋。

所以,科学家们利用一些剪枝、搜索等算法以缩减计算范围,从而在有限的游戏时间内找出最佳策略。

不完美信息博弈类游戏

终于讲到了今天的主角,口袋德州。口袋德州(德州扑克)就是很典型的不完美信息博弈类游戏,它的策略设置中存在隐藏的信息。这类模型也有大量的应用场景,比如谈判、拍卖等等。不完美信息博弈不能如完美信息博弈那样通过分解而进行求解,因为一个子博弈的最佳策略可能依赖于其它尚未得到的子博弈的策略和输出。换句话说,我们无法通过预测到对方下注的多少从而猜测到对方手里的牌是什么,因为也许对方的牌并不好,但他通过下注欺骗你,让你选择弃牌。

所以,这件事对于没心机的计算机是相当困难的,对手第一手就all in了,但是他的牌到底好不好呢?

因此,当我看到AI在德州上也打败了人类,还些许有些小激动,maybe未来,机器人也可以具有女人的第六感了。那AI到底是如何打败人类的呢?论文中提及和很多很难理解(其实自己也看不太懂,逃)的算法,为了方便理解德州怎么玩,我们以一个简单的博弈模型来举例,试图理解聪明的AI。

我们来设计一个简单的游戏。

游戏玩家有A和B两人。A可以抛一次硬币,正反面都只有自己才可以看到,抛完后他有两个选择:①sell,卖掉硬币;②play,和B玩游戏。

if : A选择了sell:

if : 硬币落在正面,A卖掉后得到五毛钱;

else:硬币落在反面,A卖掉后输掉五毛钱。

if : A选择了play:

游戏继续,接下来由B来猜硬币是落在正面还是反面:

if : B猜对了,A赔一元,B赚一元;

else:B猜错了,A赚一元,B赔一元。

打了一辈子,居然输给了新手AI!(下篇):https://www.moshike.com/a/354.html

FAQ

WPT Globalで出金ができないのはなぜですか?

入金した額をプレイしないと出金できない WPT Global(WPT グローバル)には入金額の1倍プレイするという出金条件があります。 $20をWPT Globalに入金した方は$20以上プレイしないと出金できません。 ポーカー以外のカジノをプレイしても出金できます。2023/10/13

app是什麼東西?

應用程式(英語:application program),簡稱應用(application或app),是軟體的主要分類,指為針對使用者的某種特殊應用目的所撰寫的程式,例如文字處理器、表格、會計應用、瀏覽器、媒體播放器、航空飛行模擬器、命令列遊戲、圖像編輯器等。 與之相對應的是主要功能為驅動電腦執行的系統軟體。

德州撲克1bb是多少錢?

左邊第二位玩家叫做大盲(Big Blind),簡稱【BB】。 在還沒發牌前,小盲位要先支付0.5個大盲注,大盲位要先支付1個大盲注。 起始盲注大小沒有特別規定,不過基本上,每位玩家一開始都會有100個大盲注的籌碼。

德州撲克為什麼不是賭博?

同樣是打德州撲克,如果直接以財物下注、憑藉機率分輸贏就會是賭博,但像此案的方式則塑造成類似競技的性質,便與「賭博財物」的作法有所區隔,而不屬於《刑法》所稱之賭博行為了。 本次法院的見解可能會顛覆過往大眾對於賭博行為的理解,既然需要運用技術與策略就不算是賭博,那像最常牽涉到賭博罪的「麻將」不也是很需要技術嗎?Jan 2, 2023

台灣可以玩德州撲克嗎?

以往德州撲克在台灣許多人眼裡就是賭博,甚至有許多不好的刻板印象。 但經過多位前輩的努力爭取下,如今德州撲克不僅在台灣是合法的競技比賽,更是國際性的競技運動站點之一喔!May 11, 2024

😈 最新文章 🎬🎶 熱門文章 🎬
🎢 推薦文章 🎈

你有这几个德州扑克坏习惯吗? 所有德州扑克牌手都或多或少有些坏习惯。有些坏习惯是轻微的,对他们在牌桌上的表现只有小小影响,而有些坏习惯可能导致玩家的扑克成绩显著波动。 下面

职业牌手的翻前策略 职业牌手的翻前策略 如需系统地学习德州扑克翻前策略,请点击查看视频课程:https://www.moshike.com/a/4691.html

丹牛给扑克新手的建议 丹牛给扑克新手的建议 你我都听说过针对扑克新手的基本扑克策略,对于刚开始德州扑克之旅的新手来说,扑克论坛上满是各种各样的最好建议。 无论你是常规

在低级别常规桌怎么对付打得松和打得紧的对手 在低级别常规桌怎么对付打得松和打得紧的对手 这些年我出过的书,都是主讲1/2刀、2/5刀的打法,看完这些书,大家大致会对这个游戏的基本知识有个

AQo的翻前打法和翻后打法 AQo的翻前打法和翻后打法 有人爱它,有人讨厌它。 AQo,德州扑克游戏里,名声最两极化的手牌之一。 尽管它也算翻前最强起手牌之一,可相较于其他优

【新手必看】5分钟快速入门德州扑克 【新手必看】5分钟快速入门德州扑克 德州扑克英文全称Texas Hold’em poker,它是一种玩家对玩家的公共牌类游戏。一张台面至少2人,最

德州扑克大底池的打法技巧 德州扑克大底池的打法技巧 河牌圈是扑克玩家做多数艰难决定的牌局环节,英雄式跟注、三街诈唬、无奈弃牌等等都会在这个环节发生。随着河牌圈底池额度的

拿到大牌应该快玩还是慢玩 拿到大牌应该快玩还是慢玩 在我看来,牌手们往往武断地决定是快玩还是慢玩一手大牌,我觉得这是个代价昂贵的错误。 在德州扑克中,你的大牌占据你成本底

在前面位置时小对子怎么打 在前面位置时小对子怎么打 在牌桌的任何位置游戏小口袋对子都不容易,但当你在前面位置时,这可能是种特别的挑战。 在前面位置游戏小口袋对子有许多不同

德州扑克二次连续下注 德州扑克二次连续下注 什么时候我应该在转牌圈做二次连续下注? 定义:二次连续下注(double barrel)是指在对手跟注翻牌圈持续下注后,在转

Can I play WPT Global in the UK? Because some European countries have decided to restrict gambling, WPT Global cannot operate in some countries. These include the Czech Republic, Germany, Italy, Switzerland, and the UK. However, poker-friendly European countries like Finland, Ireland, Slovakia, and Slovenia are welcome to play.21 Aug 2023

怎么成为德扑牌桌赢家? 1第一原则:了解你的对手 所有德州扑克牌手都不得不承认的一个事实,打好德州扑克的最后关键还是在于了解对手。不同的玩家有不同的游戏风格,多了解对

你有这几个德州扑克坏习惯吗? 你有这几个德州扑克坏习惯吗?所有德州扑克牌手都或多或少有些坏习惯。有些坏习惯是轻微的,对他们在牌桌上的表现只有小小影响,而有些坏习惯可能导致玩家的扑克成绩显著波动。

所有德州扑克牌手都或多或少有些坏习惯。有些坏习惯是轻微的,对他们在牌桌上的表现只有小小影响,而有些坏习惯可能导致玩家的扑克成绩显著波动。 下面