N1H111SM's Miniverse

AONLH(2) - Preflop Play (part 1)

字数统计: 4.8k阅读时长: 19 min
2019/06/05 Share

Introduction


首先德扑游戏具有两个特性:对于人类玩家的记忆来说的较大的策略空间和非完美信息博弈,这使得我们没有办法使用特定的策略解决所有的情况。关于如何解决这种情况,书中一个观察让我印象很深刻:

Second, we should note that the best way to approach a problem may often seem backwards or cause us to pause for a while and come back later when we have more information. For instance, suppose on the flop we want to figure out what our bluffing to value raising ratio should be. To accomplish this, we must first know how often we’re going to bet the river with a balanced range, what bet sizing should be used on the turn and river, and how position effects our range.

其次,我们应该注意解决这个问题的最好方法往往是从后向前的,或者让我们先暂停一下等有了更多的信息再去解决它。比方说,如果我们想要找到最好的bluff和value raising的比例,那么我们必须首先知道该如何在river上进行平衡的bet,在turn上和在river上bet的sizing,以及位置是如何影响我们的range的。

我对这段话的理解是,从一个玩家的角度出发,每一次翻牌的结果和玩家的决策的结果都是策略空间中的一部分。那么每一个最终被选择的策略(翻出什么牌、下了多少注),都会构成这棵决策树上的一条路径。要理解前期的策略应该被如何执行,就要知道前期策略会导致怎么样的后果,也就是要对未来决策树路径的选择非常清楚。也就是说在执行当前决定之前,牌手必须对下来的情况都有应当对策略。

另外,虽然有的时候我们不能够找到最优的策略,但是我们能够通过分析就判断出一个行为是不是坏的。这里作者举了一个例子:在任何位置上都用自己的QQ+/AK去3-bet对抗UTG位置的open raise是一个不好的选择。因为如果每个玩家都用这样的牌去进行3-bet,那么UTG的玩家就会马上意识到自己被别人3-bet的频率太高了。于是为了对抗这种高频的3-bet,UTG玩家就会降低自己open raise的频率,拿更加强的牌进行open raise。

Preflop (3,4,5)-betting Frequencies


在网络德州中,通常情况下每个玩家的stack size是100BB,常见的open size是3.5BB,3-bet size为10BB~12BB。接下来让我们先考虑防守(通常“防守”指的是call对方的raise)对方3-bet的频率。为了让对方在3-bet bluff的EV为0(书中的描述为Indifferent to bluffing),我们假设自己防守的概率为$x$,则有

其中5表示的大小盲的盲注大小1.5BB加上open raise的3.5BB,同时上面这条式子做了一个简化,那就是假定如果我们进行了防守,对手的bluff一定会输。而此时这个频率构成了双方玩家的一个均衡:也就是说如果想要让对方bluff的EV为0,我们需要防守$x$的频率;而对方如果要平衡自己bluff的频率,则他必须要在$1-x$的频率下进行value bet。由此解得作为open raiser我们需要对抗对手3-bet的频率为33.3%。而如果对手的3-bet的size为12BB,则有:

相应的防守频率为29.4%。这里注意到3-bet进攻的玩家多投入20%的筹码也只会降低open raise玩家4%的防守频率。同时我们还需要注意的是open raise的玩家并不是场上唯一一个防守者,其他后置位的玩家也有可能进行防守。假设CO做了3.5BB的open raise,BTN做了10BB的3-bet,考虑进其他玩家(此时只剩下了SBBB)的防守并假设他们4-bet的频率为3%,我们可以计算出CO要进行的防守频率为29.1%:

但是德州扑克并没有这么简单。通常来讲处于有利位置的玩家倾向于做一个小的3-bet来鼓励他的对手入池并看到河牌,这种时候其他玩家帮助我们进行防守的概率会变高;处于不利位置的玩家则通常把3-bet的size做的更大一些来获取我们更高的弃牌率。总的来说,我们防守3-bet的频率应该在27%到31%之间。

当对手做了3-bet时,底池已经有15BB-16BB大小。4-bet raise的size通常是22BB-24BB,如果是原本open raise的玩家进行4-bet raise,那么他的成本就是18.5BB-20.5BB,因为之前的3.5BB已经成为了构成底池的死钱。这也就意味着cold 4-bet需要至少需要60%的成功率,而后者只需要55%的成功率。

在一个stack只有100BB的牌局中,5-bet bluff通常都会使用all-in进行。这样也就导致了5-bet bluff的玩家通常会使用一个weak pocket pair或者一个weak Ace suited来做5-bet bluff,这是因为这两种牌型在被跟注时具有最高的equity。 但是具体的equity对抗对手不同的calling range是不同的,例如:在对抗JJ+/AK时,33oA5s分别具有32.2%和30.7%的equity;而在对抗KK+的范围时,他们两者就分别只有18.4%和26.7%的equity。

需要注意到绝大多数情况下进行5-bet bluff的玩家和3-bet的玩家是同一个,这样对于这名玩家来说他在3-bet时投入的11BB(10BB和12BB的中间值)就是底池中的死钱,他在进行5-bet时就只有额外的89BB的风险。假设该名玩家的equity为31%,那么他5-bet bluff被跟注的EV为:

而他的对手如果放弃,则他5-bet bluff获利的EV为:

需要注意的是,这里我们讨论的都是heads-up的对局,因此1.5为盲注大小,11为3-bet大小,24则包括了open raise的3.5BB。为了让bluff保持在一个0EV的状态,则我们可以计算出我们的5-bet bluff必须要在42%的情况下奏效,也就是指对手应当有42%的弃牌率:

总的来讲,为了要能够有收益,5-bet bluff应当要在40-50%之间奏效才行,而具体的EV值则需要根据具体的5-bet跟注范围、其他bet的sizing进行计算。综上的分析,我们得出了以下频率:

  • 3-bet bluff通常需要在67-70%的情况下奏效才能盈利。
  • 4-bet bluff通常需要在54-60%的情况下奏效才能盈利。
  • 5-bet bluff通常需要在40-50%的情况下奏效才能盈利。

这是一个非常有趣的观察,那就是虽然3-bet到5-bet的下注大小在不断增大,他们需要成功的条件却是不断宽松,需要成功的频率要求是在不断降低的。如果我们的对手更倾向于call而不是raise,那么3-bet和4-bet的条件又可以放宽一些,因为这又增加了我们在后面几条街上击中并实现equity的概率,而这也常常发生。类似地,我们也可以做这样的说明:

  • 如果一个玩家从来不flat call对手的3-bet,那么他需要在15-20%的频率下对自己的open raise进行防守。这个频率还可以适当降低因为还有其他的玩家会帮助防守。
  • 3-bet的玩家如果也不flat call对手的4-bet,那么他需要在40-46%的频率下对自己的3-bet进行防守。
  • 4-bet的玩家需要在50-60%的频率下call对手的5-bet all-in。

这些基于频率的观察帮助我们在3-bet、4-bet和5-bet的情况下平衡自己的value raises和bluff raises,虽然它不能够告诉我们具体该怎么做,但是却能够帮助我们判断自己的策略是否严重地倾斜并及时作出修正。

Preflop Raise, First in Ranges


在我们讨论该用怎样的range去对抗对手的open之前,我们应当首先了解我们该使用怎样的手牌去open。注意到在flop前的fold具有的EV为0,所以我们应当拿大于0EV的手牌进行open raise。这样就说明了我们open range中的最差手牌的EV应当接近于0,因此我们对一名GTO玩家的open raise range中的最差牌力有以下四项观察:

  • 这手牌的EV如果不是恰好等于0,那么它必须接近于0。一手牌只以一定频率被用来open raise的时候它可能就会达到0EV;而它如果总是被拿来open raise,则它的EV会更倾向于变成负。例如UTG拿着56s以75%的频率做open raise是一个接近于0EV的行动,但是如果100%频率则非常容易被剥削从而变成-EV的策略。

  • 这手牌在面对对手的3-bet是需要经常fold的。因为拿最弱的牌去call对手的3-bet不是一件很好的事。

  • 这手牌在面对对手的call时的EV会大于-3.5BB,这是因为即便是一手非常弱的手牌也有可能在后面几条街上实现它的equity。
  • 这手牌在看见flop时的EV不会大于+1.5BB。因为德扑是一个0和游戏,如果在open raise range中最差的手牌也能够有大于盲注大小的EV,这就说明cold caller没有使用optimal的策略,他的冷跟策略是-EV的。

open raiser利用自己range中最弱的牌将自己的3.5BB投入风险以赢得底池中的1.5BB,结合上文中提到的最弱的牌在遭遇cold call和reraise时都是-EV的,那么它需要在至少70%的情况下能够吓走对手才能够获得收益。这样就意味着如果其余的玩家如果构成了超过30%的3-bet频率,那么对于open raiser来说,他再使用这种在遭遇3-bet时fold的牌进行open raise就不再是一件有利可图的事了。

Maximum 3-bet Range


为了方便起见,我们假设每一个玩家在不同位置采取的3-bet频率都相同。同样的假设UTG进行了open raise,剩下5名玩家需要行动。5名玩家构成了30%的3-bet防守频率,假设每名玩家的3-bet频率为$x$,则有下式:

从而我们得出,剩下的每名玩家3-bet的最大range是6.9%。同时我们注意到在前面章节中的结论,一名3-bet玩家在面对对手4-bet时不应当在超过40-46%的频率上fold,这也就意味着40-46%的3-bet range要准备好对抗对手的4-bet,我们将这种3-bet的range称为“Value 3-bet”。下表显示了使用上面这种方法计算出的不同位置的3-bet频率。这里尤其需要注意,举第一行为例,6.9%的频率指的是当UTG玩家open时,你作为后置位玩家应该3-bet的频率,而不是当你在UTG位置上的3-bet频率。

Opening Range Maximum 3-Betting Percentage Value 3-Betting Percentage Value Component of 3-Betting Range
UTG 6.9 2.76 AA-QQ, AK
MP 8.5 3.4 AA-JJ, AK, AQs
CO 11.2 4.6 JJ+, AJs+, AQo
BTN 16.3 6.52 TT+, ATs+, KQs+, AJo+

以上的频率和范围并不是理论正确的策略:我们可以3-bet一些并不是最强牌力的牌并且在遭遇4-bet时进行5-bet bluff。我们也可以通过冷跟preflop来慢玩一些超强牌。但是上面的表可以帮助我们判断别的玩家是否在3-bet上做得过于激进了。也就是说,如果他们在接近于以上的频率进行3-bet,那么preflop raiser如果继续采用自己range中最差牌open就会开始输钱了。同时,preflop raising range中最弱的牌一旦get called,就倾向于输钱,理由如下:

  • It is weaker than the average hand in a preflop cold calling range. 它比冷跟preflop raise的范围的平均牌力要弱。
  • On the flop, the preflop raiser will often be out of position unless he opened on the button or is just called by a blind. 在flop上,preflop raiser通常都处于不利位置,除非他在BTN位open并且仅有盲注跟注。
  • If one of the blinds does call (thus letting the preflop raiser see a flop in position), the pot will be smaller since there is less extra dead money from the blinds. 如果大小盲中的一个玩家确实跟注了,虽然这会让open raiser在后面几条街上处于有利位置,但这也导致底池比其他玩家跟注的情况要小一些,因为底池中失去了原来盲注位的死钱。

接着来到了本文中我个人认为是最重要的一处论述,为了强调它的重要性并且保持原文的忠诚度,我在这里贴上原文。

It’s important to design ranges where all of our theory and beliefs make sense and must not allow ourselves to have a contradicting thought process. We now are equipped with a great set of restrictions, or parameters, which will tell us what we can and cannot do when designing opening ranges and defending ranges from all the positions.

In order to quickly illustrate this concept, let’s imagine we are playing at an aggressive table and open the worst hand in our theoretically correct UTG opening range for 3.5 big blinds. We are 3-bet 30 percent of the time total and are cold called another 25 percent of the time. Furthermore, let’s be generous and assume our expected value when our open is called is on average 0 EV. We can now plug in these variables to figure out that the expected value of opening the worst hand in an UTG opening range at this table is -0.375 big blinds.

That is the UTG player expects to on average lose -0.375 big blinds when he opens the worst hand in his theoretically correct UTG opening range.

Notice we are not breaking even at this table by opening the worst hand in our theoretically correct raise first in range. Our opponents are playing too aggressively and our weak hand does poorly against opponents who 3-bet 30 percent total. The fact that theoretically correct raises can have a negative expected value against certain opponents shouldn’t surprise anyone. For instance, a theoretically correct bluff on the flop will lose money against opponents who refuse to fold.

While we would break even if our opponents always 3-bet or folded and they 3-bet 30 percent total, we must not forget to take into account our open will sometimes be called. This is something which can easily be forgotten when performing calculations. It’s easy to think “since I break even when my opponent calls, it doesn’t change anything,” but this is not true. When our opponents fold we win 1.5 big blinds, yet when one of them calls, we win 0 big blinds.

This showcases the fact that as long as our opponents have any sort of reasonable cold calling ranges, they must be 3-betting significantly less than 30 percent of the time combined. If instead they always reraise with all these hands, we have no incentive to open with the weak hands in our theoretically correct opening range.

About Noob Poker


因为在前文中我们假设对于自己的3-bet其余玩家不会采用跟注的方式防守,而总是采取弃牌或是4-bet,所以在一个稍微平衡一些的牌局中,我们马上就能够通过我们设定好的参数计算发现自己的3-bet频率在导致我们输钱。所以对于牌局的考量:对手应对raise的方式是加注还是跟注,他们下注的sizing等等都应该成为我们平衡自己range的参数,基于这种参数的计算应当在进入牌局之前进行。上面这段文字让我特别有感触的点在于,之前自己对于德扑理论了解得不深,看了一些高额德州stack在200-250BB的牌局,在不理解高手下注的尺度和频率的情况下,就盲目地学习他们的玩法,往往在都是新手的牌局中占不到便宜。因为新手的策略往往都是严重偏离GTO的,所以采用GTO的打法(虽然自己只是拙劣地模仿)会导致盈利不足甚至经常在multi-way中被Bad Beat。现在让我们自己来对这种新手局的preflop场景进行一些分析,而不考虑后面几条街的变数。

刚接触德扑的新手玩家倾向于跟注入池,而不考虑自己和对手的范围或者相对的位置关系。而在进行一些游戏之后会有少量新手玩家学会在preflop弃掉特别差的牌,例如27o等等。同时新手玩家对于raise和raise的尺度并不敏感,他们很少自己进行raise,即便他们手中有超强牌力的手牌。于是我们假设在一个标准六人牌桌上,其余5名玩家的在preflop轮的动作频率分布为:

call raise fold
90% 0 10%

首先我们假设自己的bluff在被跟注之后能够实现的平均equity为10%(事实上这已经将这个情景乐观化了很多),因为对手行动空间上的概率分布已经固定,我们就可以计算出bluff的EV:

其中,$1.5\times0.1^5​$代表剩余5名玩家全部fold并直接获利的期望;$10\%\times5\times0.9​$表示二项分布的独立同分布实验的期望盈利;而$99\%.​$则表示在get called之后输掉的y用于open raise的下注大小。可以非常清楚的发现由于对手的range为固定值,我们的bluff永远都是一个负EV的操作。

接着我们来计算在这样的牌桌中最大的open range是多少,假设自己的open raise中最差手牌需要具有的平均equity为$x$,则根据前文的假设最差手牌的EV应当接近于0,故而有:

解得$x=18.2\%$,而我们知道这里的$x$为平均需要具有的equity,而不是range本身。也就是说当equity近似于pot odds时我们就应该open raise,甚至条件还更加宽松。这一点其实和我们在牌桌上的体验是相同的:首先因为新手对于范围不敏感,所以当你open raise时,其余玩家的跟注等效于盲注大小变大,并没有将其余玩家排除在游戏之外。而且由于对手总体的弃牌率低,使得自己拿到池内盲注的immediate reward的EV降低,也就是说在这种情况下open的size并没有那么关键,所以作任何size的open都是一个0EV的选择。因此从数学上来说,是否做open是一件无关紧要的事,如何在flop轮之后榨取更多的价值,才是一件需要我们更多思考的事。

CATALOG
  1. 1. Introduction
  2. 2. Preflop (3,4,5)-betting Frequencies
  3. 3. Preflop Raise, First in Ranges
  4. 4. Maximum 3-bet Range
  5. 5. About Noob Poker