打了一辈子德州,居然输给了新手AI!(下篇)

打了一辈子德州,居然输给了新手AI!(上篇):https://www.moshike.com/a/347.html

此时,对B而言,就是一个不完美博弈,他无法从A选择play从而判断A手中的硬币是正面还是反面。

这时有两个极限情况,如果B总是猜正面,那么聪明的A就会变化策略,当他抛到正面时就卖掉硬币,如果抛到反面才玩游戏,这样B必然会输。此时,A的期望分数为

0.5(抛到正面的概率)*0.5(选择sell的得分)+0.5(抛到反面的概率)*1(选择play的得分)=0.75

如果B总是猜反面,那么A抛到正面时就会选择play,得一元;抛到反面就会选择sell卖掉硬币,这样只赔五毛钱。所以A的期望是

0.5(抛到正面的概率)*1(选择play的得分)+0.5(抛到反面的概率)*(-0.5)(选择sell的得分)=0.25

此时,出现一个知识点,叫纳什均衡,也就是B为了有效的降低损失,他最有效的策略就是以0.25的概率猜正面,以0.75的概率猜反面,这样可以确保他的胜算最大。

而博弈永远是一个动态的过程,如果B持续按照固有的策略做决策,那么A也会根据B的决策结果调整自己的策略。所以,对B最安全的方法,就是不断更新A卖掉硬币会得到的回报,持续寻找最优解。

我们聪明的计算机就是通过这样的方法动态的计算牌友们押注所带来的回报期望,进而“持续更新对手的套路”,最终获得了「比赛过程中,人类选手整体上从未领先过」的效果。

看来,想要和AI斗智,人类的小脑筋maybe还需要转的更快才行嘞,也许没有套路才是最大的套路哦。

都说金融大佬都爱玩德州,看完这篇文章,金融大佬们是否有些启发呢?

FAQ

如何在电脑上玩 WPT Global 2024

如何在计算机上玩 WPT Global 下载软件 1。访问官方网站:访问 WPT Global 网站或使用扑克新闻网站提供的联属链接。 2。开始下载:单击特定于您的操作系统的“下载”按

當沖一定要當天賣嗎?

關注標的不宜過度分散:在進行當沖交易時,應該選擇自己較熟悉的股票,並且不宜同時關注過多標的,由於當沖者必須時常注意價格的波動,因此在交易時應

WPT扑克中的TP是什么?

WPT扑克中的TP是什么? 锦标赛积分(TP) 用于购买 ClubWPT 上的 VIP 锦标赛的门票。所有玩家在开设 VIP 账户时都会获得固定数量的 TP(500)。它们无法重

轮盘赌游戏的未来是什么?

轮盘游戏的未来是什么? 轮盘赌的潜在未来之一是虚拟和增强现实技术的集成。这将使玩家沉浸在虚拟赌场环境中,享受更真实、更吸引人的游戏体验。 轮盘赌

當沖一定要當天賣嗎?

關注標的不宜過度分散:在進行當沖交易時,應該選擇自己較熟悉的股票,並且不宜同時關注過多標的,由於當沖者必須時常注意價格的波動,因此在交易時應

本網站僅收集相關文章。如需查看原文,請複製並打開以下連結:打了一辈子德州,居然输给了新手AI!(下篇)

🔥 😚 WPT Global Taiwan 玩撲克贏真錢 🎵
😘 最新文章 🎤 🎉 熱門文章 🎮
🎊 推薦文章 🎪
# 文章標題 關鍵詞 文章連結 文章詳情