立即玩

Play Poker Online and Win Real Money.

打了一辈子德州,居然输给了新手AI!(中篇) 打了一辈子德州,居然输给了新手AI!(上篇):https://www.moshike.com/a/347.html 完美信息博弈类游戏 对于围棋

打了一辈子德州,居然输给了新手AI!(上篇):https://www.moshike.com/a/347.html

完美信息博弈类游戏

对于围棋游戏来说,是一场零和完美信息博弈,这是指在任何时刻,双方玩家都知道前面游戏的全部状态(完美信息),并且在有限步数之后游戏的结果非胜即负(零和)。

知道了游戏的有限状态,计算机就可以通过暴力枚举的方法来计算后面所有可能的下法,形成一颗巨大的搜索树,这颗搜索树可以列举出在当前状态下所有可能的下法,每个子搜索树都能独立求解,计算机就可以根据计算的结果安排对应的策略,从而达到最终的胜利。

举个栗子,比如,小明是一个普通中国家庭长大的小孩,在他的一生中,面临着很多个选择,如何才能在未来走向人生巅峰呢?如果可以列举出他未来所有的可能性,把每一步的选择拆解成“子未来”,那么就可以计算出成功胜算最大的选择了。(例子可能不够恰当,理解意思就好,嘻嘻)

小明同学的人生探险

所以,假设我们有无限大的计算资源,就可以将一局游戏的博弈拆解成一个一个的子博弈(列举出所有的可能性),从而计算出胜算最大的打法,就可以打赢比赛了。但是,以棋类游戏中比较简单的西洋棋来说,它的分支因子大概是40左右,这表示预测之后20步的动作需要计算40的20次方(这是多大,就算是1GHz的处理器,也要计算3486528500050735年),请注意,这还是比较简单的西洋棋。

所以,科学家们利用一些剪枝、搜索等算法以缩减计算范围,从而在有限的游戏时间内找出最佳策略。

不完美信息博弈类游戏

终于讲到了今天的主角,口袋德州。口袋德州(德州扑克)就是很典型的不完美信息博弈类游戏,它的策略设置中存在隐藏的信息。这类模型也有大量的应用场景,比如谈判、拍卖等等。不完美信息博弈不能如完美信息博弈那样通过分解而进行求解,因为一个子博弈的最佳策略可能依赖于其它尚未得到的子博弈的策略和输出。换句话说,我们无法通过预测到对方下注的多少从而猜测到对方手里的牌是什么,因为也许对方的牌并不好,但他通过下注欺骗你,让你选择弃牌。

所以,这件事对于没心机的计算机是相当困难的,对手第一手就all in了,但是他的牌到底好不好呢?

因此,当我看到AI在德州上也打败了人类,还些许有些小激动,maybe未来,机器人也可以具有女人的第六感了。那AI到底是如何打败人类的呢?论文中提及和很多很难理解(其实自己也看不太懂,逃)的算法,为了方便理解德州怎么玩,我们以一个简单的博弈模型来举例,试图理解聪明的AI。

我们来设计一个简单的游戏。

游戏玩家有A和B两人。A可以抛一次硬币,正反面都只有自己才可以看到,抛完后他有两个选择:①sell,卖掉硬币;②play,和B玩游戏。

if : A选择了sell:

if : 硬币落在正面,A卖掉后得到五毛钱;

else:硬币落在反面,A卖掉后输掉五毛钱。

if : A选择了play:

游戏继续,接下来由B来猜硬币是落在正面还是反面:

if : B猜对了,A赔一元,B赚一元;

else:B猜错了,A赚一元,B赔一元。

打了一辈子,居然输给了新手AI!(下篇):https://www.moshike.com/a/354.html

FAQ

德州撲克1bb是多少錢?

左邊第二位玩家叫做大盲(Big Blind),簡稱【BB】。 在還沒發牌前,小盲位要先支付0.5個大盲注,大盲位要先支付1個大盲注。 起始盲注大小沒有特別規定,不過基本上,每位玩家一開始都會有100個大盲注的籌碼。

德州撲克 home game違法嗎?

在家中,不特定人無法進出,所以不符合公開或公眾可以進出的場所,因此,不成立刑法賭博罪,但如家裡作為職業賭博場所,仍違反社會秩序維護法第84條。 1 刑法第266條規定。 2 司法院院字第1458號(一):「在自己住宅或家室內賭博財物。 非公共場所或公眾得出入之場所。

德州鋪克 那個位置最好?

在許多的遊戲中,後行動的玩家較先行動的玩家來得有優勢;在撲克中,這點體現在每一局的位置上。 單看翻牌後的三個回合,都是由SB 開始行動,一路輪到最後行動的BTN。 因此,一般而言,會認為BTN 是最好的位置,其次是CO;依此類推,最差的位置是SB,其次是BB。Mar 11, 2023

Can you play WPT Global on computer?

At WPT Global, we bring our wealth of experience running the best poker games in the world to online poker, offering the opportunity to take on the challenge of real money poker games on safe, secure tables designed for all players from beginner to expert.

當沖一定要當天賣嗎?

關注標的不宜過度分散:在進行當沖交易時,應該選擇自己較熟悉的股票,並且不宜同時關注過多標的,由於當沖者必須時常注意價格的波動,因此在交易時應專注於幾檔股票即可,避免產生顧此失彼的狀況。 注意當沖的交易時間:當沖必須在當日沖銷買進的股票,投資人應特別注意交易時間,避免在收盤前來不及賣出股票,而需支付交割股票的本金。Aug 8, 2024

🎢 最新文章 🎨🎧 熱門文章 🎪
😈 推薦文章 👀

UTG是什么意思?枪口位在什么位置? UTG是什么意思?枪口位在什么位置? Under the Gun简称UTG,中文指的是“枪口位”。 UTG(枪口位)位于大盲位之后,是翻牌之前第一个行动的位置,

德州撲克 為什麼不算賭博? 德州撲克與賭博的差異 主要是德州撲克這項牌桌遊戲除了單靠運氣成分來贏得勝利外,還需要靠著玩家自身的判斷力、反應力、觀察力、心理素質與組牌技巧來

德州扑克多人底池的战术 德州扑克多人底池的战术 如果你想要提升自己在 3 人或更多人底池的战绩,继续往下读吧! 这篇文章会对你非常有帮助,尤其是线下游戏! BB 位防守 vs 1 raise + (

我靠这19条终于度过了超长的德扑下风期 我靠这19条终于度过了超长的德扑下风期 下风期,一个让无数牌手痛不欲生的名词,其中的苦痛只有深处其中的人才能体会,而那种痛苦又只可意会不可言传

德州扑克诱捕对手的方法 德州扑克诱捕对手的方法 提到诱捕,一些无限德州扑克牌手马上会想到“慢玩”(slow play)。事实上,有些人错误地认为,翻后诱捕对手的唯一方式

真人德扑圈有没有挂?有真人德扑圈作弊吗? 真人德扑圈有没有挂?有真人德扑圈作弊吗? 真人德扑圈有没有挂?到底有没有真人德扑圈作弊?其实这样的问题严格来讲并不能一概而论,不能以偏概全,就

德州扑克伙牌 德州扑克伙牌 一、什么是伙牌 同一个对手拥有多个账号在同一桌游戏,或者多个对手在同一桌互通信息进行游戏的行为,我们称为伙牌。 二、伙牌的优势 信息不

app是什麼東西? 應用程式(英語:application program),簡稱應用(application或app),是軟體的主要分類,指為針對使用者的某種特

德州扑克中针对超级松浪局的五个建议 德州扑克中针对超级松浪局的五个建议 你在德州扑克生涯中有时会碰到存在很多松浪玩家的牌局。我所说的松浪玩家不是指松凶玩家,而是指玩得很疯狂,又几

翻牌圈的过牌加注如何应对 翻牌圈的过牌加注如何应对 被对手过牌加注(check-raise)通常很棘手,特别是不确定该如何反应的时候。 若你的对手是一名很少诈唬的紧手,你

德州扑克锦标赛打法策略 德州扑克锦标赛打法策略 扑克锦标赛与常规桌最大的不同点在于,随着比赛的进行,不断上升的盲注级别。 几乎所有的锦标赛策略都是基于锦标赛每一个阶段的

如何打好起手对子JJ? 如何打好起手对子JJ? 口袋对子JJ是无限德州扑克中最难玩好的一手牌之一。 JJ是一手虽然不错,但不是特别好的成手牌。对于翻前一直没发到好牌的人