Algojáték 4. gyakorlat megoldókulcs

Javaslat

A megoldásokat ne nézd meg rögtön, előbb szánj egy kis időt az önálló gondolkodásra és az ötletelésre! A problémamegoldás képessége olyan mint egy izom: mindenkiben fejleszthető. Ezek a feladatok pontosan ebben segítenek. Ha teljesen elakadnál, ott a hint.

1. feladat

A két Algojáték gyakorlat fogolydilemmát játszik egymás ellen. A 8 órakor kezdődő gyakorlaton 15 hallgató vallana és 10 hallgatna, a 14 órakor kezdődőn 16 hallgató vallana és 13 hallgatna. A két gyakorlatról véletlenszerűen egy-egy hallgatót kiválasztva határozzuk meg az egyes gyakorlatok várható nyereségeit.

vall hallgat
vall (-6, -6) (0, -10)
hallgat (-10, 0) (-0.5, -0.5)

Hint

A véletlenszerű hallgatóválasztás azt jelenti, hogy a két gyakorlat egy-egy konkrét kevert stratégiát játszik. Az egyes stratégiák valószínűségei az olyan szavazatú hallgató választásának valószínűségei lesznek.

Megoldás

A 8 órakor kezdődő gyakorlat a $$\sigma_{8} = \frac{15}{25} \chi_{\text{vall}} + \frac{10}{25} \chi_{\text{hallgat}}$$ kevert stratégiát játssza, a 14 órakor kezdődő pedig a $$\sigma_{14} = \frac{16}{29} \chi_{\text{vall}} + \frac{13}{29} \chi_{\text{hallgat}}$$ kevert stratégiát.

A 8 órakor kezdődő gyakorlat várható nyeresége tehát $$ \begin{align*} u_{8}(\sigma_{8}, \sigma_{14}) &= \frac{15}{25} \cdot \frac{16}{29} \cdot (-6) \\ &+ \frac{15}{25} \cdot \frac{13}{29} \cdot (0) \\ &+ \frac{10}{25} \cdot \frac{16}{29} \cdot (-10) \\ &+ \frac{10}{25} \cdot \frac{13}{29} \cdot (-0.5) \approx −4,2828 \end{align*} $$ a 14 órakor kezdődő gyakorlaté pedig $$ \begin{align*} u_{14}(\sigma_{8}, \sigma_{14}) &= \frac{15}{25} \cdot \frac{16}{29} \cdot (-6) \\ &+ \frac{15}{25} \cdot \frac{13}{29} \cdot (-10) \\ &+ \frac{10}{25} \cdot \frac{16}{29} \cdot (0) \\ &+ \frac{10}{25} \cdot \frac{13}{29} \cdot (-0.5) \approx −4,7656 \end{align*} $$

2. feladat

Határozzuk meg az alábbi stratégiai játékokban az összes tiszta és kevert Nash-egyensúlyt.

a) Minecraft: két játékos eldöntheti, hogy közösen épít egy erődöt vagy egy barlangot rendez be a hegy oldalában. Az erőd csak akkor tud megépülni, ha mindketten részt vesznek benne, a barlangot egyedül is be tudják rendezni.

erőd barlang
erőd (4, 4) (0, 2)
barlang (2, 0) (1, 1)
Hint

Geometriai módszer

A sorjátékos kevert stratégiáját egyetlen $p$ paraméter írja le. Legyen ennyi a valószínűsége az erőd választásának, ekkor $(1-p)$ a valószínűsége a barlang választásának. Hasonlóan az oszlopjátékosra, ahol legyen $q$ a paraméter neve.

A várható nyereségfüggvény ekkor ennek a két paraméternek a függvényében megadható:

$$u_{\text{sor}}(p, q) = \dots$$ A négy választható cellában lévő kifizetésértéket kell súlyozni a cella választásának valószínűségével és összeadni.

Ezután az a kérdés, hogy fix $q$-ra milyen $p$-vel kell válaszolnia a sorjátékosnak. Ehhez emeljük ki a $p$-t a függvényben és nézzük meg hogy a szorzójának mi az előjele! Ha a szorzó pozitív, akkor a legjobb válasz a $p=1$, ha negatív, akkor a legjobb válasz a $p=0$, ha pedig a szorzó nulla, akkor minden $p \in [0,1]$ legjobb válasz.

Hasonló módon járjunk el az oszlopjátékosra is. Azok a $(p,q)$ párok, melyek mindkét játékosnak legjobb válaszai, lesznek a kevert Nash-egyensúlyok. Ezeket a legjobb válaszolkat ábrázoljuk egy-egy vonalként egy $p$ - $q$ diagrammon. A vonalak metszéspontjai lesznek mindkét játékos számára legjobb válaszok, ezek alkotják a kevert Nash-egyensúlyokat.

Megoldás

Interaktív widget

A piros, illetve kék vonalakkal jelölt legjobb válaszok metszéspontjai alkotják a kevert Nash-egyensúlyokat. Ezek a $(p,q)=(0,0), (\frac{1}{3}, \frac{1}{3}), (1,1)$ kevert stratégiaválasztásokhoz tartoznak, ahol a $(0,0)$ a (barlang, barlang), az $(1,1)$ pedig az (erőd, erőd) tiszta stratégiaválasztásnak felel meg.

b) Háború és béke: két ország egymástól függetlenül eldönti, hogy háborúba kezd-e a másik ellen.

háború béke
háború (-1, -1) (0, -2)
béke (-2, 0) (2, 2)
Megoldás

Interaktív widget

A piros, illetve kék vonalakkal jelölt legjobb válaszok metszéspontjai alkotják a kevert Nash-egyensúlyokat. Ezek a $(p,q)=(0,0), (\frac{2}{3}, \frac{2}{3}), (1,1)$ kevert stratégiaválasztásokhoz tartoznak, ahol a $(0,0)$ a (béke, béke), az $(1,1)$ pedig a (háború, háború) tiszta stratégiaválasztásnak felel meg.

c) Nemek harca: egy házaspár két tagja egymástól függetlenül dönt arról, hogy balett előadásra vagy focimeccsre menjenek-e.

balett meccs
balett (3, 2) (1, 1)
meccs (0, 0) (2, 3)
Megoldás

Interaktív widget

A piros, illetve kék vonalakkal jelölt legjobb válaszok metszéspontjai alkotják a kevert Nash-egyensúlyokat. Ezek a $(p,q)=(0,0), (\frac{3}{4}, \frac{1}{4}), (1,1)$ kevert stratégiaválasztásokhoz tartoznak, ahol a $(0,0)$ a (meccs, meccs), az $(1,1)$ pedig a (balett, balett) tiszta stratégiaválasztásnak felel meg.

3. feladat

Vegyünk egy $(2 \times 2)$-es nyereségmátrixú stratégiai játékot. Nevezzük valóban kevert Nash-egyensúlynak az olyan kevert Nash-egyensúlyt, melyben mindkét játékos pozitív valószínűséggel játssza mindkét stratégiáját. A játékosok kifizetéseinek függvényében mikor lesz $0$, $1$, illetve legalább $2$ különböző valóban kevert Nash-egyensúly a játékban?

Hint

Alkalmazzuk a geometriai módszert paraméteresen! A valóban kevert Nash-egyensúlyok a $(p,q) \in [0,1] \times [0,1]$ egységnégyzet belső pontjai, gondoljuk végig mikor van metszéspont a négyzet belsejében.

Megoldás

Alkalmazzuk a geometriai módszert paraméteresen!

A kérdés az, hogy mikor lesz a legjobb válaszokat reprezentáló ponthalmazoknak $0$, $1$, illetve legalább $2$ közös pontja a $(p,q) \in [0,1] \times [0,1]$ egységnégyzet belsejében. (Hiszen a négyzet oldalán legalább az egyik játékos tiszta stratégiát játszik.)

Általános alakban a sorjátékos nyereségmátrixa

a b
c d
ebből a nyereségfüggvényére $$u_{\text{sor}}(p, q) = a \cdot pq + b \cdot p(1-q) + c \cdot (1-p)q + d \cdot (1-p)(1-q)$$ adódik, amit átrendezve az $$u_{\text{sor}}(p, q) = (a-b-c+d) \cdot pq + (b-d) \cdot p + (c-d) \cdot q + d$$ $$u_{\text{sor}}(p, q) = [(a-b-c+d) \cdot q + (b-d)] \cdot p + [(c-d) \cdot q + d]$$ alakot kapjuk, ahol a $$(a-b-c+d) \cdot q + (b-d)$$ kifejezés előjele határozza meg $p$-t.

Az egységnégyzet belsejében csak akkor választunk ki legjobb választ reprezentáló pontot, ha valamilyen $0 \lt q \lt 1$ esetén $$(a-b-c+d) \cdot q + (b-d) = 0$$, hiszen ekkor lesz $p \in [0,1]$ tetszőleges.

Ez kétféleképpen lehetséges:

1. eset: Ha $(a-b-c+d) \neq 0$, akkor $q = \frac{d-b}{a-b-c+d}$.
Ez egy, a $p$ tengellyel párhuzamos, a $q$ tengelyt a $\frac{d-b}{a-b-c+d}$ pontban metsző szakaszt határoz meg.
Ez akkor van a négyzet belsejében, ha $$0 \lt \frac{d-b}{a-b-c+d} \lt 1$$

2. eset: Ha $(a-b-c+d) = 0$ és $(b-d)=0$, azaz ha $b=d$ és $a=c$ teljesül.
Ebben az esetben az egységnégyzet minden pontját kiválasztjuk.

Minden más esetben nincs belső pontja az egységnégyzetnek, ami legjobb válasz lehetne, legyen ez a 3. eset.

Az oszlopjátékos saját nyereségmátrixára hasonlóképpen eljárva a következőt kaptuk:

4. feladat

Határozzuk meg az alábbi stratégiai játékokban az összes tiszta és kevert Nash-egyensúlyt. A megoldás során érdemes az iterált szigorú eliminálást is felhasználni.

X Y Z
A (3, 4) (5, 3) (2, 3)
B (2, 5) (3, 9) (4, 6)
C (3, 1) (2, 5) (7, 4)

Hint

Először a $B$ stratégiát lehet az $A$-ból és a $C$-ből kevert stratégiával szigorúan eliminálni. Ezután pedig a $Z$-t lehet az $X$-ből és az $Y$-ból kevert stratégiával szigorúan eliminálni. A megmaradt $(2 \times 2)$-es játékban már alkalmazható a geometriai módszer.

Megoldás

Az $\frac{1}{2} \chi_{A} + \frac{1}{2} \chi_{C}$ stratégia erősen dominálja a $B$ stratégiát. A $B$ stratégia eliminálása után az $\frac{1}{5} \chi_{X} + \frac{4}{5} \chi_{Y}$ erősen dominálja a $Z$-t. Az eliminálások után az alábbi $(2 \times 2)$-es mátrix maradt.

X Y
A (3, 4) (5, 3)
C (3, 1) (2, 5)

Interaktív widget

Vagyis kevert Nash-egyensúly minden $(p,1)$, ahol $p \in (\frac{4}{5}, 1)$. Ezen belül az egyetlen tiszta Nash-egyensúly az $(1,1)$, ami az $(A, X)$ tiszta stratégiaválasztásnak felel meg.


X Y Z
A (5, 3) (4, 3) (1, 1)
B (2, 4) (3, 4) (6, 2)
C (2, 5) (3, 5) (4, 7)
Hint

Először a $C$ stratégiát lehet az $A$-ból és a $B$-ből kevert stratégiával szigorúan eliminálni. Ezután tiszta stratégiákkal történő szigorú eliminálásokkal elérhető egy $(1 \times 2)$-es mátrix, amiben az oszlopjátékosnak mindegy, hogy melyik oszlopot választja.

Megoldás

Az $\frac{1}{3} \chi_{A} + \frac{2}{3} \chi_{B}$ kevert stratégia erősen dominálja a $C$ stratégiát. A $C$ stratégia eliminálása után az $X$ erősen dominálja a $Z$-t. A $Z$ eliminálása után $A$ erősen dominálja a $B$-t. A $B$ eliminálása után megmarad két stratégiaválasztás, $(A, X)$ és $(A, Y)$.

X Y
A (5, 3) (4, 3)

A sorjátékos mindenképpen az egyetlen lehetséges stratégiáját választja. Az oszlopjátékos indifferens a két tiszta stratégiájára, ezért kevert Nash-egyensúly lesz az oszlopjátékos minden lehetséges kevert stratégiája, tiszta Nash-egyensúlyok ezen belül az $(A, X)$ és $(A, Y)$ tiszta stratégiaválasztások.

5. feladat

Egy számítógépes hálózat csúcspontjai és a közöttük lévő irányítatlan összeköttetések az alábbi ábrán láthatóak. Két szolgáltató van jelen, az egyikőjük az $a$ és a $c$, a másikójuk pedig a $b$ és a $d$ csúcsok között szolgáltat. Az élekre ráírtuk azok üzemeltetési költségeit. A szolgáltatók választanak egy utat a saját csúcsaik között és az ahhoz tartozó élek üzemeltetéséért fizetnek. Ha egy élet mindkét szolgáltató kiválasztotta, akkor a költségeket elfelezik egymás között. Az élek megfelelően nagy kapacitással rendelkeznek a két szolgáltató együttes kiszolgálásához. Írjuk fel a feladathoz tartozó nyereségmátrixot és határozzuk meg a tiszta és kevert Nash-egyensúlyokat a játékban!

Hint

A $b$-ből a $d$-be négy lehetséges útvonal van, ez az egyik játékos négy lehetséges stratégiája. Az $a$-ból a $c$-be három lehetséges útvonal van, ez a másik játékos három lehetséges stratégiája. A kifizetéseket a választott élek függvényében felírva kapunk egy $(4 \times 3)$-mas mátrixot. Ebből csak tiszta stratégiákkal történő szigorú eliminálásokkal egy $(2 \times 2)$-es mátrix kapható.

Megoldás

Legyen az $a$ és $c$ közötti szolgáltató az oszlopjátékos, a $b$ és $d$ közötti pedig a sorjátékos! A lehetséges stratégiáik az egyes választható útvonalak, melyeket $o1, o2, o3$, illetve $s1, s2, s3, s4$ címkézünk és a költségeik az alábbiak szerint alakulnak.

o1: ac o2: ab, bc o3: ad, cd
s1: bc, cd (-10, -4) (-6, -8) (-9, -5)
s2: ab, ad (-8, -4) (-6, -10) (-6, -4)
s3: ac, ad, bc (-14, -2) (-12, -8) (-14, -4)
s4: ab, ac, cd (-8, -2) (-8, -10) (-9, -5)
Szigorú eliminálunk a következőképpen:
  1. $s2$ erősen dominálja $s3$-mat
  2. A maradék játékban $o1$ erősen dominálja $o2$-t.
  3. A maradék játékban $s2$ erősen dominálja $s1$-et.

o1: ac o3: ad, cd
s2: ab, ad (-8, -4) (-6, -4)
s4: ab, ac, cd (-8, -2) (-9, -5)

Interaktív widget

Tehát kevert Nash-egyensúly lesz minden $(p,q)$, ahol vagy $p=1$ és $q \in [0,1]$ vagy $p \in [0,1]$ és $q=1$. Ezen belül tiszta Nash-egyensúlyok az $(1,1)$, $(0,1)$, $(1,0)$, amik az (s2, o1), (s4, o1) és (s2, o3) tiszta stratégiaválasztásokhoz tartoznak.

6. feladat

Szarvas-liba vadászat: Egy vadászklubban $n$ vadász egymástól függetlenül dönt, hogy szarvasra vagy libára megy vadászni. A szarvasvadászat csak akkor sikeres, ha mindannyian ezt az opciót választják, ekkor fejenként $100$ Ft-ot kapnak. Ha ennél kevesebben választják ezt az opciót, akkor ők $0$ Ft-ot kapnak érte. A libavadászat legalább egy résztvevő esetében már sikeres és fejenként $2$ Ft-ot ér a résztvevőknek. Keressük meg a szimmetrikus kevert Nash-egyensúlyokat, vagyis azokat a kevert Nash-egyensúlyokat, ahol minden játékos ugyanazt a kevert stratégiát alkalmazza.

Hint

Ha mindenki $p$ valószínűséggel választ szarvast, akkor mennyi egy játékos várható nyeresége? A kevert Nash-egyensúlyokban lévő kevert stratégiák a többiek kevert stratégiaválsztására nézve legjobb tiszta válaszokból vannak kikeverve. A legjobb tiszta válaszok várható nyeresége egyenlő.

Megoldás

Legyen $p$ a szarvas stratégia valószínűsége a keresett kevert stratégiaválasztásban! A játékosok várható nyeresége két részből áll:

$$[100 \cdot p^{n-1}] \cdot p + [2] \cdot (1-p)$$ A kevert Nash-egyensúlyban lévő kevert stratégiák a többiek kevert stratégiaválasztására nézve legjobb tiszta válaszokból tevődnek össze. Ezeknek a várható nyeresége azonos kell hogy legyen, azaz $$100 p^{n-1} = 2$$ teljesül. Ebből következik, hogy $p=\frac{1}{\sqrt{50}}$.


7. feladat

Előadáson láttuk, hogy az alábbi nyereségmátrixszal adott kő-papír-olló játékban az a kevert stratégiaválasztás, melyben mindkét játékos az $\frac{1}{3} \chi_{\text{kő}} + \frac{1}{3} \chi_{\text{papír}} + \frac{1}{3} \chi_{\text{olló}}$ kevert stratégia szerint játszik, kevert Nash-egyensúly. Lássuk be, hogy ettől különböző kevert Nash-egyensúly nincs a játékban.

papír olló
(0, 0) (-1, 1) (1, -1)
papír (1, -1) (0, 0) (-1, 1)
olló (-1, 1) (1, -1) (0, 0)
Hint

Tegyük fel, hogy van ettől különböző kevert Nash-egyensúly! Legyen a sorjátékos kevert stratégiája ebben $$\sigma_s = p_k \chi_{\text{kő}} + p_p\chi_{\text{papír}} + p_o\chi_{\text{olló}}$$. Mivel a három valószínűség nem lehet egyenlő, van kettő akik között szigorú egyenlőtlenség teljesül. Az oszlopjátékos szemszögéből ez azt eredményezi, hogy valamelyik tiszta stratégia várható nyeresége túl kicsi, az nem lehet legjobb válasz.

Megoldás

Tegyük fel, hogy van ettől különböző kevert Nash-egyensúly! Legyen a sorjátékos ehhez tartozó kevert stratégiaválasztása $$\sigma_s = p_k \chi_{\text{kő}} + p_p\chi_{\text{papír}} + p_o\chi_{\text{olló}}$$

Szimmetriaokokból feltehetjük, hogy $p_o = \max(p_o, p_k, p_p)$. Ezután három eset van:

1. eset: $p_{k}, p_{p} \lt p_{o}$

Az oszlopjátékos várható nyeresége negatív, ha papírt játszik, hiszen $$u_o(\sigma_s, \text{papír}) = p_k - p_o < 0$$ illetve pozitív, ha követ, hiszen $$u_o(\sigma_s, \text{kő}) = p_o - p_p > 0$$ tehát ebben az esetben nem legjobb válasz a papír, az oszlopjátékos kevert stratégiaválasztásában ez nem szerepelhet.

2. eset: $p_{k} < p_{p} = p_{o}$

Hasonlóan, annyi különbséggel, hogy most $$u_o(\sigma_s, \text{kő}) = p_o - p_p = 0$$ tehát ebben az esetben sem legjobb válasz a papír, az oszlopjátékos kevert stratégiaválasztásában ez nem szerepelhet.

3. eset: $p_{p} < p_{k} = p_{o}$

Hasonlóan, annyi különbséggel, hogy most $$u_o(\sigma_s, \text{papír}) = p_k - p_o = 0$$ tehát ebben az esetben sem legjobb válasz a papír, az oszlopjátékos kevert stratégiaválasztásában ez nem szerepelhet.

Beláttuk, hogy az oszlopjátékos kevert stratégiaválasztásában nincs papír. Ebből következik, hogy $p_k=1$, amire az egyetlen legjobb válasz a sorjátékos részéről a papír, ez pedig nem Nash-egyensúly, ellentmondásra jutottunk.

8. feladat

Árazási játék: Tegyük fel, hogy egy piacon két eladó, $A$ és $B$, illetve három vevő, $X$, $Y$ és $Z$ vannak jelen. Mindegyik vevő fejenként pontosan egy darab terméket szeretne venni. Az $X$ kizárólag az $A$-tól, a $Z$ pedig kizárólag a $B$-től hajlandó megvenni a terméket. Az $Y$ attól függően választ, hogy az $A$ vagy a $B$ árulja olcsóbban, egyenlőség esetén az $A$-tól fog vásárolni. Az eladók egymástól függetlenül döntenek, hogy a saját terméküket milyen $p_A, p_B \in [0,1]$ áron adják, ezután ilyen áron kell azt kínálniuk az összes vevőjüknek. Az eladóknak van elegendő mennyiségű termékük raktáron, hogy minden vevői igényt ki tudjanak szolgálni. Az eladók nyeresége az általuk eladott termékek vételárainak az összege (a termékek gyártási költsége $0$). Igazoljuk, hogy a játékban nincs tiszta Nash-egyensúly, illetve nincs véges sok tiszta stratégiából képzett kevert Nash-egyensúly!

(Pöttyös feladat.)

9. feladat

Két játékos választ egy-egy számot az $\{ 1, \ldots, n \}$ halmazból, ahol $n \ge 2$ egy tetszőleges egész szám. Ha a két szám megegyezik, akkor a sorjátékos 1 pontot, az oszlopjátékos $-1$ pontot kap; minden más esetben pedig senki sem kap pontot. Határozzuk meg a tiszta és kevert Nash-egyensúlyokat.

(Pöttyös feladat.)