Two-person zero-sum game
Juego bipersonal de suma cero
A two-person zero-sum game is a game with two players (Player A and Player B) such that:
|
&2:
Rock, paper, scissors
Piedra, papel, tijeras
Each player has the same three moves: rock, paper, and scissors. Rock beats (crushes) scissors; scissors beat (cut) paper, and paper beats (wraps) rock.
Each +1 entry indicates a win for the row player, −1 indicates a loss, and 0 indicates a tie. Do you want to play? You are Player A and I am Player B. Click on a row move...
Cada jugador tiene las mismas tres acciones: piedra, papel, y tijeras. Piedra vence a las tijeras rompiéndolas, las tijeras vencen al papel cortándolo, y el papel vence a la piedra envolviéndola.
Cada entrada +1 indica una ganancia para el jugador renglón, −1 indica una pérdida, y 0 indica un empate. ¿Quieres jugar? Tú eres Jugador A y yo soy Jugador B. Clic en una acción renglón... |
More terms
Más términos
In each round of the game, the way a player chooses a move is called a strategy. A player using a pure strategy makes the same move each round of the game. For example, if a player in the above game chooses to play scissors (s) at each turn, then that player is using the pure strategy s. A player using a mixed strategy randomly chooses each move a certain percentage of the time; for instance, Player A might choose to play &4 50% of the time, and each of &5 and &6 25% of the time.
We represent the strategy of the row player by a row matrix and the strategy of the column player by a column matrix. In each case, the ith entry is the percentage of time the player uses move i.
A cada turno del juego, la manera en la que escoge un jugador su acción se llama una estrategia. Un jugador usa una estrategia pura si usa la misma acción a cada turno del juego. El jugador usa una estrategia mixta si a cada turno escoge al azar una acción para que cada acción se está usado una fracción determinada del tiempo; por ejemplo, puede escoger jugar &4 50% del tiempo, y cada una de &5 y &6 25% del tiempo.
Representamos a estrategia del judagor renglón por una matriz renglón, y la estrategia del jugador columna por una matriz columna. En cada caso, la i-ésima entrada es el porcentaje del tiempo el jugador usa acción i.
|
&2s
If, in the above game, the row player (Player A) uses &4 50% of the time, and each of &5 and &6 25% of the time, then the row player (mixed) strategy is written as
Si, durante el juego más arriba, el jugador renglón (Jugador A) usa &4 50% del tiempo, y cada una de &5 y &6 25% del tiempo, entonces la estrategia (mixta) renglón se representa por
|
&8 That depends on what specific defense or offense each coach selects for that specific play. (Remember that they are playing mixed strategies.) A better question to ask is: On average, how many yards will be gained by the Alpha team each play? This quantity—the average number of points gained by the row player—is called the expected payoff and the method of calculation is shown below: Esto depende de cual defensa y ataque escoge cada entrenador durante aquella jugada específica. (Acuérdate que están jugando estrategias mixtas.) Una pregunta mejor sería: ¿Cuántas yardas, por promedio, ganará el equipo Alpha cada jugada? Esta cantidad—el número promefio de puntos ganado por el jugador renglón—se llama el pago esperado y lo calculamos como sigue:
Expected payoff
Pago esperado
If a game has payoff matrix $P$, and if the row player uses the mixed strategy $R$ and the column player uses the mixed strategy $C$, then the associated expected payoff $e$ is the average payoff taken over a large number of such games, and is given by the product
|
||||||||||
&2
Suppose that a game has payoff matrix
Supongamos que un juego tiene matriz de pagos
$P = \mat[4]{\[2 , -2\]!0 , -1}. $
and that the players use the strategies
y que los jugadores usan las estrategias
$R = \mat[4]{\[.5 , .5\]}, C = \mat[4]{\[.20\]!.80}, $
then the expected payoff is
entonces el pago esperado es
|
Here again is the payoff matrix for rock, paper, scissors:
Aquí está de nuevo la matriz de pagos para piedra, papel, tijeras:
$P = $ | ||||||
Your name is Bob Stone, and you are playing rock, paper, scissors against Melanie Sharpe. You have a strong preference for playing rock, and play it &11% of the time. You are less fond of paper, which you play &12% of the time. Melanie Sharpe tends to favor scissors, which she plays &16% of the time, whereas she plays rock only &14% of the time. You are the row player. The row and column mixed strategies are:
Tu nombre es Juan dePiedra, y estás jugando piedra, papel, tijeras contra Lupita Filosa. Prefieres jugar piedra, que juegas &11% del tiempo. Nop te gusta papel, y lo juegas solo &12% del tiempo. Lupita suele favorecer tijeras, y las juega &16% del tiempo, mientras que juega piedra solo &14% del tiempo. Tú eres el jugador renglón. Las estrategias mixtas renglón y columna son:
$R$ = |
Let us go back to the Alphas and the Betas: Recall that you (the Alpha coach) have decided to try a mixed strategy that uses offenses #1 and #3 each of the time and offense #2 the rest of the time, and that the Betas coach has decided to use defenses #1 and #2 each of the time. The payoff matrix is as follows:
Regresemos a los Alphas y los Betas: Acuérdate que tú (eres el entrenador de los Alphas) has decidido probar una estrategia mixta que usa las jugadas ofensiva #1 y #3 cada una del tiempo, y jugada #2 el resto del tiempo, y que el entrenador de los Betas ha decidido usar las jugadas defensivas #1 y #2 cada una del tiempo. La matriz de pagos es como sigue:
-
[Suggestion: Use the Matrix algebra tool to do the calculation.]
[Sugerencia: Usa la Herramienta álgebra matricial para hacer la calculación.]
Optimal counterstrategy Contraestrategia óptima
In the discussion up to this point, we have assumed that the strategies of both players are known. What if only one of the strategies is known? To illustrate this situation, let us go back to the football scenario. Here is the payoff matrix: En el discurso hasta este punto, hemos supuesto que las estrategias mixtas de ambos jugadores están conocidas. ¿Qué tal si está conocida solo una de aquellas? Para ilustrar tal situación, regresamos de nuevo al escenario sobre futbol americano. Aquí es la matriz de pagos:&8 This time, all we know is the mixed column strategy: Esta vez, todo que sabemos es la estrategia mixta columna:
-
$C = \mat[4]{\[.20\]!.20!.60}$.
-
$R = \mat[4]{\[x , y , z , u , v\]}$.
$e = RPC$ | = | $\mat[4]{\[x , y , z , u , v\]}$ $\mat[4]{\[.20\]!.20!.60}$ | |
= | $\mat[4]{\[x , y , z , u , v\]}$ | It is easiest to first multiply the pure numerical matrices $P$ and $C$. That is, think of the product as $R(PC)$: Es más fácil multiplicar primero las matrices puras numéricas $P$ y $C$. Es decir, piensa en el producto como $R(PC)$: | |
= |
-
$x = 0, y = 1, z = 0, u = 0, v = 0$
-
$e = 2(0) + 8.4(1) - 0 + 7(0) + 3(0) = 8.4$
-
$R = \mat[4]{\[x , y , z , u , v\]} = \mat[4]{\[0 , 1 , 0 , 0 , 0\]}$
Now here is one for you to do, where this time you must calculate the best pure strategy from the column player's point of view, given a knowledge of the row strategy: que significa que los Alphas siempre deben jugar el ataque #2, con el que pueden esperar a ganar un promedio de 8.4 yardas por jugada.
A continuación, aquí está uno par ti, donde debes calcular la estrategia mejor desde el punto de vista del jugador columna, dado un conocimiento de la estrategia renglón:
Here again is the payoff matrix for rock, paper, scissors:
Aquí está de nuevo la matriz de pagos para piedra, papel, tijeras:
$P = $ | ||||||
You (the row player as usual) are playing rock, paper, scissors against a very observant opponent. Although you think you are playing purely at random, your opponent has noticed that you tend to play rock &20% of the time, paper &21% of the time, and scissors &22% of the time.
In order to compute the best counterstrategy for the column player, we should set up $R$ and $C$ as follows [Use $x, y, z$ for entries of any strategy that is currently unknown]:
Tú (eres el jugador renglón como de costumbre) estás jugando piedra, papel papel, tijeras contra un contrincante muy observador. Aunque piensas que estas jugando puramente al azar, tu contrincante se ha dado cuenta de que sueles jugar piedra &20% del tiempo, papel &21% del tiempo, y tijeras &22% del tiempo.
Para calcular el mejor contraestrategia para el jugador columna, debemos configurar $R$ y $C$ como sigue [Usa $x, y, z$ para las entradas de cualquiera estrategia corrientemente desconocida]:
$R$ = |
&7
Duh! If my opponent knows I am playing rock most of the time, then obviously she should play paper to beat me. Who needs all this nonsense about matrices to figure that out, especially when it gives the wrong answer?
¡Qué estupidez! Si me contrincante sabe que estoy jugando piedra la mayoría del tiempo, entonces es obvio que ella debe jugar papel para ganarme. ¿Quién necesita todas esas tonterías acerca de matrices para entender eso, especialmente cuando nos da la respuesta incorrecta?
&8 Yes, most of the time you are playing rock, and so you would lose to paper. However, you are playing scissors almost as often as rock, so a decision by your opponent to play paper would carry some risk, as paper would only earn her an average of 40 − 35 = 5 points for every hundred plays. A better bet is for your opponent to play rock, which ties every time you play rock and beats your scissors, meaning that your opponent would win an average of 35 − 25 = 10 points for every hundred plays. Sí, estás jugando piedra la mayoría del tiempo, y así perdería a papel. Sin embargo, estas también jugando tijeras casi tan seguido como piedra, así que una decisión por tu contrincante jugar papel llevaría bastante riesgo, ya que papel le ganaría un promedio de 40 − 35 = 5 puntos por cada cien jugadas. Una opción mejor para ella es jugar piedra, que te empata cada vez que juegas piedra y gana tus tijeras, resultando en un promedio de 35 − 25 = 10 puntos para tu contrincante por cada cien jugadas.
Now go on to Part B of this tutorial by pressing "Next topic" on the side. Alternatively, you can now try some of the exercises in Section 3.4 of
or
, or try the topic true false quiz.
Ahora va a Parte B de este tutorial por pulsar el vinculo "Tutorial siguiente" al lado. En cambio, puedes probar algunos ejercicios en la sección 3.4 de
o
, o bien el concurso verdadero falso de este tema.
&8 Yes, most of the time you are playing rock, and so you would lose to paper. However, you are playing scissors almost as often as rock, so a decision by your opponent to play paper would carry some risk, as paper would only earn her an average of 40 − 35 = 5 points for every hundred plays. A better bet is for your opponent to play rock, which ties every time you play rock and beats your scissors, meaning that your opponent would win an average of 35 − 25 = 10 points for every hundred plays. Sí, estás jugando piedra la mayoría del tiempo, y así perdería a papel. Sin embargo, estas también jugando tijeras casi tan seguido como piedra, así que una decisión por tu contrincante jugar papel llevaría bastante riesgo, ya que papel le ganaría un promedio de 40 − 35 = 5 puntos por cada cien jugadas. Una opción mejor para ella es jugar piedra, que te empata cada vez que juegas piedra y gana tus tijeras, resultando en un promedio de 35 − 25 = 10 puntos para tu contrincante por cada cien jugadas.