Nashi tasakaal

Allikas: Vikipeedia
Jump to navigation Jump to search

Nashi tasakaal on mänguteoorias kasutatav lahenduse leidmise kontseptsioon, mis on oma nime saanud USA matemaatiku John Forbes Nash Juniori järgi. Mittekooperatiivses mängus, kus osaleb vähemalt kaks mängijat ning iga mängija teab teiste mängijate strateegiaid, esineb Nashi tasakaal juhul, kui ükski mängija ei soovi muuta oma strateegiat, arvestades teiste osalejate strateegiavalikuid.[1]

Juhul kui kõik mängijad on valinud strateegia ja keegi neist ei saaks mõne muu strateegia kasutamisel paremat tulemust, eeldusel et teised mängijad oma strateegiat ei muuda, moodustavadki selline strateegiate hulk ning neile vastavad tasud Nashi tasakaalu.

Kahe mängija kohta lihtsustatult väljendudes on Mari ja Jüri saavutanud Nashi tasakaalu siis, kui Mari teeb enda jaoks parima võimaliku otsuse, võttes arvesse ka Jüri otsust ja eeldades, et see parajasti ei muutu, ning kui Jüri teeb endale parima võimaliku otsuse, võttes arvesse Mari otsust ja eeldades, et see parajasti ei muutu.

Rakendusi[muuda | muuda lähteteksti]

Mänguteoreetikud kasutavad Nashi tasakaalu mõistet, et ennustada tulemust olukorras, kus mitu inimest või institutsiooni teevad samal ajal strateegilisi valikuid ning iga osaleja tulemus sõltub nii tema enda kui ka teiste valikutest. John Nashi idee seisneb lihtsas põhimõttes, et mitme otsustaja valikute tulemust ei saa ennustada, kui võimalikke otsuseid analüüsitakse isoleeritult.

Nashi tasakaalu on kasutatud vaenulike situatsioonide analüüsiks, nt sõda ja võidurelvastumine.[2] Samuti on seda kasutatud eesmärgiga uurida eri eelistustega inimeste koostöövalmidust, valuutakriise, mitme osalise hariduslike püüdluste tulemusi,[3] õigusakte, nt keskkonnamäärusi,[4] loodusressursside haldamist,[5] turundusstrateegiaid[6] ja isegi penaltite löömist jalgpallis[7].

Ajalugu[muuda | muuda lähteteksti]

Nashi tasakaal on oma nime saanud USA matemaatiku John Forbes Nash Juniori järgi. Nashi tasakaalu erijuhtumit on teadaolevalt esimesena käsitlenud 1838. aastal Antoine Augustin Cournot, kes rakendas seda oligopolide puhul.[8] Cournot' teoorias valivad ettevõtted oma tootmismahu kasumi maksimeerimise järgi. Samal ajal sõltub optimaalne tootmismaht ka sellest, kui palju teised turuosalised toodavad. Cournot' tasakaal ilmneb juhul, kui iga ettevõte maksimeerib oma kasumi, arvestades ka teiste ettevõtete tootmismahtusid. Sel juhul on tegemist Nashi tasakaalu puhta strateegiaga. Seevastu Nashi tasakaal on laiem mõiste kui Cournot' tasakaal või Pareto-efektiivne tasakaal, sest Nashi definitsioon ei sisalda hinnangut tekkinud tasakaalu optimaalsusele.

Tänapäevases mänguteoorias kasutatav Nashi tasakaalu kontseptsioon on defineeritud segastrateegiate kaudu, kus mängijad valivad tõenäosusjaotuse, arvestades võimalikke valikuid. Segastrateegilise Nashi tasakaalu ideed tutvustasid John von Neumann ja Oskar Morgenstern oma 1944. aastal ilmunud raamatus "Mänguteooria ja majanduslik käitumine" ("The Theory of Games and Economic Behavior"). Siiski oli nende analüüs piiratud nullsummamängudega. Nad näitasid, et igas lõpliku valikute hulgaga nullsummamängus on segastrateegiaga Nashi tasakaal.[9]

Nashi 1951. aastal avaldatud artikli "Mittekooperatiivsed mängud" ("Non-Cooperative Games") tähtsus seisnes selles, et segastrateegiaga Nashi tasakaal defineeriti iga mängu jaoks, milles on lõplik arv valikuid, ning tõestati, et sellises mängus peab olema vähemalt üks (segastrateegiaga) Nashi tasakaal. Von Neumanniga võrreldes esitab Nash oluliselt üldisema tõestuse tasakaalu olemasolu kohta. Nashi definitsiooni kohaselt on "tasakaalupunkt n osalejaga mängus n elementi nii, et iga mängija segastrateegia maksimeerib tema tasu, kui teiste strateegiad hoida püsivana. Seega on iga mängija strateegia teiste suhtes optimaalne". Sellise raamistiku andmine probleemile võimaldas Nashil oma 1950. aasta artiklis kasutada Kakutani püsipunkti teoreemi. 1951. aastal avaldatud lisaartiklis tõestas Nash Brouweri püsipunkti teoreemi abil väite, et igas lõpliku mängijate arvuga mängus (mitte üksnes nullsummamängus) peab olema vähemalt üks segastrateegiaprofiil, mis seab mängija vastavusse iseendaga, st strateegiaprofiil, mis ei tingi strateegia muutmist suurema tasu nimel.[10]

Alates Nashi tasakaalu kontseptsiooni kasutuselevõtust on mänguteoreetikud tuvastanud mõningaid tingimusi, mille korral viib Nashi tasakaal valede ennustusteni. Selliste tingimuste kõrvaldamiseks on välja pakutud mitmeid lahenduste kontseptsioone või täiendusi. Näiteks võib Nashi tasakaal tekkida olukorras, kus strateegia põhineb ebausutaval ähvardusel. 1965. aastal pakkus Reinhard Selten välja tasakaalu alamhulga, mille ta nimetas ideaalseks tasakaaluks. Tema täiendus seisneski ebausutavatel ähvardustel põhinevate strateegiate välistamises. Teised Nashi tasakaalu täiendused on seotud olukordadega, kus mängu korratakse või kus kõigil mängijatel ei ole kogu asjakohast informatsiooni teiste osalejate kohta. Mistahes täiendusi ja laiendusi iseloomustab aga lähtumine Nashi tasakaalu aluspõhimõttest, et kõik tasakaalukontseptsioonid analüüsivad, mis valikuid tehakse, kui võetakse arvesse teiste mängijate valikuid.

Definitsioonid[muuda | muuda lähteteksti]

Mitteametlik definitsioon[muuda | muuda lähteteksti]

Mittematemaatiliselt väljendudes on strateegiaprofiil Nashi tasakaal, kui ükski mängija ei saa oma strateegiat muutes suuremat tasu. Et mõista, mida see tähendab, tuleb kujutleda olukorda, kus igale mängijale tehakse teatavaks teiste strateegia. Järgmiseks küsib iga mängija endalt: "Teades teiste mängijate strateegiaid ja oletades, et need ei muutu, kas ma saaksin enda strateegia muutmisest kasu?" Kui vähemalt üks mängija saab vastata sellele küsimusele jaatavalt, siis selline strateegiate hulk ei ole Nashi tasakaal. Kui iga mängija eelistab jätta oma strateegia samaks või ei huvitu strateegia muutmisest, sest tema tasu jääks strateegia muutmisel samaks, siis selline strateegiaprofiil on Nashi tasakaal. Seega, iga strateegia Nashi tasakaalus on parimal viisil vastavuses kõigi teiste mängijate strateegiatega.[11]

Nashi tasakaal võib vahel paista ebaratsionaalne, kui jälgida süsteemi väljastpoolt, sest Nashi tasakaal ei pruugi olla Pareto-efektiivne. Samuti võib Nashi tasakaal tekitada mitteratsionaalseid tulemusi järjestikustes mängudes, sest mängijad võivad teineteist n-ö ähvardada ebaratsionaalsete otsustega. Selliste mängude analüüsimiseks võib sobida paremini ideaalne Nashi tasakaal kui Nashi tasakaalu alamhulk.

Ametlik definitsioon[muuda | muuda lähteteksti]

Olgu mäng, milles on mängijat, ning on strateegiate hulk mängija jaoks. on kogu strateegiaprofiilide hulk ja on selle tasufunktsioon punktis . Olgu mängija strateegiaprofiil ning olgu kõigi teiste mängijate strateegiaprofiil, välja arvatud oma. Kui iga mängija valib strateegia ning tulemuseks on strateegiaprofiil , siis mängija tasu on . Tasu sõltub valitud strateegiaprofiilist, st mängija valitud strateegiast ning ka kõigi teiste valitud strateegiatest. Strateegiaprofiil on Nashi tasakaal, kui ükskõik mis mängija ükski ühepoolne strateegiamuudatus ei ole sellele mängijale kasumlik, st

Kui ülemine võrratus kehtib rangelt (≥ asemel on >) kõigi mängijate jaoks ning kõigi võimalike alternatiivsete strateegiate jaoks, siis nimetatakse tasakaalu rangeks Nashi tasakaaluks. Kui mõne mängija jaoks kehtib täpne võrdus ja mõne muu strateegia vahel hulgas , siis nimetatakse tasakaalu nõrgaks Nashi tasakaaluks.

Mängul võib olla puhta strateegia või segastrateegiaga Nashi tasakaal. Viimases valitakse puhas strateegia juhuslikult kindla tõenäosusega.

Nashi olemasoluteoreem[muuda | muuda lähteteksti]

Nash tõestab, et kui lubada segastrateegiaid, siis igal lõpliku mängijate arvuga mängul, kus valida on lõpliku arvu puhaste strateegiate vahel, on olemas vähemalt üks Nashi tasakaal.

Nashi tasakaalu ei pruugi olemas olla, kui valikute hulk on lõpmatu ja mittekompaktne. Siia alla kuulub olukord, kus kaks mängijat nimetavad samal ajal naturaalarvu ning suurema arvu nimetaja võidab. Nashi tasakaal on aga olemas siis, kui valikute hulk on kompaktne ning pideva tasufunktsiooniga.[12] See esineb olukorras, kus tasakaal on pidev segu puhastest strateegiatest, ehk mängus, kus kaks mängijat valivad reaalarvude 0 ja 1 vahel ning ühe mängija tasu (mille maksab teine mängija) võrdub ruutjuurega kahe valitud arvu vahest.

Näiteid[muuda | muuda lähteteksti]

Koordinatsioonimäng[muuda | muuda lähteteksti]

Koordinatsioonimängu näide on sõitmine teel vastutuleva auto suunas ning kohustus valida, kas sõita tee parem- või vasakpoolses servas. Esitatud näites on tasu 10 olukord, kus kokkupõrget autode vahel ei toimu, ning tasu 0 olukord, kus kokkupõrge toimub. Sel juhul saame mängu kirjeldada järgmise tasumaatriksiga.

Sõitmismäng
Autojuht 1; autojuht 2 Sõitmine vasakul Sõitmine paremal
Sõitmine vasakul 10, 10 0, 0
Sõitmine paremal 0, 0 10, 10

Praegusel juhul eksisteerib kaks puhta strateegiaga Nashi tasakaalu: mõlemad valivad sõitmiseks enda poolt vaadatuna vasaku või parema poole. Kui lubada ka segastrateegiaid (kus puhas strateegia valitakse juhuslikult, kuid mingi kindla tõenäosusega), siis eksisteerib sama juhtumi korral kolm Nashi tasakaalu: esimesed kaks on eeltoodud puhtad strateegiad, kus tõenäosused on esimese mängija jaoks 0% ja 100% ning teise jaoks 0% ja 100% ning vastupidi; kolmas on lisanduv segastrateegia, kus tõenäosused kummalegi mängijale on 50% ja 50%.

Vangi dilemma[muuda | muuda lähteteksti]

Next.svg Pikemalt artiklis Vangi dilemma.
Vangi dilemma tasumaatriksi näide
Vang 1; vang 2 Koostöö (vaikimine) Reetmine (rääkimine)
Koostöö (vaikimine) 2, 2 0, 3
Reetmine (rääkimine) 3, 0 1, 1

Kujutlege kahte vangi, keda hoitakse eraldi kongides ning keda kuulatakse samal ajal üle. Mõlemale pakutakse võimalust saada kaaskurjategija reetmise korral lühem vanglakaristus. Vang võib teise vangiga teha koostööd, st mitte midagi välja rääkida, või reeta kaaskurjategija, rääkides teise sisse. Juhul kui mõlemad annavad teineteise kohta infot, saavad nad suurema karistuse kui vaikimise korral. Tasumaatriksis kujutatud arvud on seda suuremad, mida lühem on karistus, st suurem arv tähendab suuremat tasu (väiksemat karistust).

Vangi dilemma korral sarnaneb maatriks koordinatsioonimänguga, kuid mõlemad mängijad saavad maksimaalse tasu (vt näide 3) vaid juhul, kui nende otsused on erinevad. Mõlemal mängijal on võimalik oma olukorda parandada, kui ta vahetab koostöö reetmise vastu, teades, et teise vangi parim otsus on reeta. Vangi dilemmal on seega üks Nashi tasakaal – mõlema vangi otsus teine reeta. Arutelu, mis näitab, et reetmine on parim valik, võiks olla näiteks järgmine: "Kui teine vang mu reedab, peaksin ka mina tema reetma (tasu = 1), sest tema reetmise ja minu vaikimise korral on minu karistus karmim (tasu = 0). Kui teine vang vaikib, siis peaksin ta ikkagi reetma, sest sel juhul on minu tasu maksimaalne (tasu = 3). Kui mõlemad vaikiksime, oleks minu tasu vaid 2."

Selle juhtumi on teinud läbi aegade üheks huvitavaimaks õppenäiteks asjaolu, et Nashi tasakaalu saavutamine on vangidele vähem kasulik kui koostöö tegemine, st vaikimine. Mõlemad saaksid kergema karistuse, kui kumbki ei räägiks midagi. Siiski saab vang parandada oma olukorda, murdes vastastikuse koostöö lepet. Sõltumata teise mängija valikust, on vangil alati kasulikum reeta.

Kirjeldatud juhtum on põhjustanud ka vääritimõistmist, sest Nashi tasakaalu puhul rõhutatakse sageli vajadust arvestada teiste mängijate strateegiatega ning seda tõlgendatakse sageli kui koostööd, kuid siin toodud näites ei ole koostöö Nashi tasakaal. Lisaks põhjustab eksiarvamusi asjaolu, et Nashi tasakaal ei ole mõlemale vangile kõige kasulikum olukord. Näiteks on Marek Strandberg 2012. aastal avaldanud Sirbis artikli, kus ta kirjeldab, et vangi dilemma juures on Nashi tasakaaluks mõlema vaikimine, mis ei ole õige[13]. Teine võimalus tõlgendada ja õigustada Strandbergi arutluskäiku oleks see, kui reetmine tooks kaasa kõige kehvema tulemuse (isegi kehvema kui vaikimine, eeldusel et teine räägib). See aga ei ole mäng "Vangi dilemma", mis on defineeritud ülaltoodud viisil.

Stabiilsus[muuda | muuda lähteteksti]

Stabiilsuse kontseptsiooni, mis on kasulik mitut tüüpi tasakaalu analüüsimisel, saab rakendada ka Nashi tasakaalu korral. Nashi tasakaal segastrateegiatega mängus on stabiilne, kui väike tõenäosuste muutus ühe mängija jaoks viib situatsioonini, kus on täidetud järgmised tingimused:

  1. mängija, kelle jaoks midagi ei muutunud, ei saavutanud uues situatsioonis paremat strateegiat;
  2. mängija, kelle jaoks toimus muutus, mängib nüüd varasemast kehvema strateegiaga.

Kui mõlemad tingimused on täidetud, siis mängija, kelle segastrateegias toimus väike muutus, naaseb kohe Nashi tasakaalu. Sel juhul nimetatakse tasakaalu stabiilseks. Kui esimene tingimus ei pea paika, on tasakaal ebastabiilne. Kui aga ainult esimene tingimus peab paika, siis on tõenäoliselt selle mängija jaoks, kellel toimus muutus, kasutada lõpmatu hulk optimaalseid strateegiaid.

Eespool toodud "Sõitmismängu" näites esinevad nii stabiilne kui ka ebastabiilne tasakaal. Stabiilne on selline tasakaal, mis põhineb segastrateegiatel, mille valikud toimuvad 100% tõenäosusega. Kui emb-kumb mängija muudab seda tõenäosust veidi, on mõlemad seejärel kehvemas olukorras ning vastasel ei ole selle peale põhjust enda strateegiat muuta. Seevastu 50% ja 50% tasakaal on ebastabiilne. Kui emb-kumb mängija muudab valiku tõenäosust, siis on teisel mängijal mõttekam liikuda kohe 0% ja 100% strateegia või 100% ja 0% strateegia juurde.

Stabiilsus on Nashi tasakaalu rakendamisel oluline, sest mängijate segastrateegiad ei ole üldjuhul detailselt teada, vaid neid tuleb tuletada mängus tehtud valikute statistilisest jaotusfunktsioonist. Sel juhul on väga ebatõenäoline, et praktikas esineb ebastabiilne tasakaal, sest iga vähimgi muutus kellegi strateegias viib tasakaalu kaotamiseni.

Esinemine[muuda | muuda lähteteksti]

Kui mängus on olemas unikaalne Nashi tasakaal ning mäng vastab teatud tingimustele, siis jõutakse Nashi tasakaaluks vajalike strateegiate hulgani. Nashi tasakaalu tekkeks peavad olema täidetud järgmised tingimused.

  1. Mängijad annavad endast parima, et maksimeerida enda oodatavat tasu.
  2. Mängijad on oma tegevuste täideviimises veatud.
  3. Mängijatel on piisavad teadmised mängu lahenduse tuletamiseks.
  4. Mängijad teavad kõigi teiste mängijate planeeritud tasakaalustrateegiat.
  5. Mängijad usuvad, et kui nad kalduvad oma strateegiast kõrvale, ei mõjuta see teiste mängijate valikut.
  6. Valitseb üldine teadlikkus selle kohta, et kõik mängijad vastavad eeltoodud tingimustele: peale selle, et iga mängija peab teadma, et teised vastavad konkreetsele tingimusele, peab ta ka teadma, et kõik teised seda teavad jne.

Tingimused ei ole täidetud[muuda | muuda lähteteksti]

Näiteid mänguteooria probleemide kohta, kus eeltoodud tingimused ei ole kas osaliselt või täielikult täidetud

  1. Esimene tingimus ei ole täidetud, kui mängust ei ilmne piisavalt selgelt, mis suurust soovib mängija maksimeerida. Sel juhul ei ole mängijal otsest põhjust valida tasakaaluni viivat strateegiat. Näiteks vangi dilemma ei ole dilemma, kui vähemalt üks mängijatest on rahul määramata ajaks vangi minemisega.
  2. Paljudel juhtudel ei ole kolmas tingimus täidetud, sest kuigi tasakaalupunkt peab mängus eksisteerima, ei ole see mängu keerukuse tõttu teada, nt Hiina male korral.[14] Sama kehtib ka siis, kui tasakaalupunkt on teada, kuid mitte kõigile mängijatele, nt väikese lapsega trips-traps-trulli mängides.
  3. Üldise teadlikkuse kriteerium ei pruugi olla täidetud isegi siis, kui kõik mängijad vastavad kõigile ülejäänud tingimustele. Mängijad, kes seavad kahtluse alla teineteise ratsionaalsuse, võivad teiste irratsionaalse käitumise tarbeks võtta kasutusele hoopis vastustrateegiad. Seda tuleb kindlasti arvestada näiteks võidurelvastumist analüüsides.

Tingimused on täidetud[muuda | muuda lähteteksti]

Doktoriväitekirjas pakkus John Nash välja kaks tõlgendust oma tasakaalukontseptsioonile, et näidata, kuidas saab tema tasakaalupunktid viia vaadeldavate nähtustega vastavusse. Üks tõlgendus on ratsionalistlik: "Kui eeldada, et mängijad on ratsionaalsed, teavad mängu struktuuri, mängitakse vaid ühe korra ning mängus on vaid üks Nashi tasakaal, siis mängijad mängivad sellesse tasakaalupunkti jõudmiseni." Selle idee formaliseerisid 1995. aastal R. Aumann ja A. Brandenburger artiklis "Epistemic conditions for Nash equilibrium" (Econometrica, 63, 1161–1180). Nad tõlgendasid iga mängija segastrateegiat kui hüpoteesi teiste mängijate käitumise kohta ning näitasid, et kui mäng ja mängijate ratsionaalsus on vastastikku teada, siis selline hüpotees peab olema Nashi tasakaal.

Teine tõlgendus on mängijate jaoks väiksemate piirangutega: "Ei ole tarvilik eeldada, et mängijatel on täielik teadmine mängu struktuuri kohta ning mängijatel ei pea olema võimekust ja vajadust läbida keerulist loogilist arutlusprotsessi. Eeldatakse, et on olemas mängijate kogum igale positsioonile mängus, mida mängivad kogumist juhuslikult valitud mängijad ajas pidevalt. Kui on olemas stabiilne keskmine sagedus, millega kogumi "keskmine mängija" kasutab mõnda puhast strateegiat, siis see stabiilne keskmine sagedus ongi segastrateegia Nashi tasakaal." (Vt H. Kuhn jt 1996, "The work of John Nash in game theory", Journal of Economic Theory, 69, 153–185.)

Kuivõrd tingimused, millal saab Nashi tasakaalu reaalselt mingis olukorras jälgida, on võrdlemisi piiratud, on see kontseptsioon üsna harva teejuhiks igapäevaste olukordade lahendamisel. Siiski on Nashi tasakaalul kui majandusteaduse ja evolutsioonibioloogia teoreetilisel kontseptsioonil selgitav jõud. Majandusteaduses on mängu tasuks üldjuhul varad (raha) vm, evolutsioonibioloogias geenide edasikandumine – mõlemad on tarvilikud tingimused elamiseks ja elu edasikandumiseks vastavates distsipliinides. Uurijad, kes neis valdkondades mänguteooriat rakendavad, väidavad, et strateegiad, mis ei tule toime eeltoodud hüvede maksimeerimisega mistahes põhjustel, surutakse turult või keskkonnast välja. Sellistes situatsioonides kasvab eeldus, et jälgitav strateegia on Nashi tasakaal, enamasti välja uurimusest.[15]

Olemasolu tõestus[muuda | muuda lähteteksti]

Tõestus Kakutani püsipunktiteoreemi abil[muuda | muuda lähteteksti]

Nashi algses, väitekirjas esitatud tõestuses kasutati Brouweri püsipunktiteoreemi. Lihtsam on näidata tõestust Kakutani püsipunktiteoreemi kaudu, nagu ta ise tegi seda oma 1950. aasta artiklis.

Et tõestada Nashi tasakaalu olemasolu, olgu mängija i parim vastus kõigi teiste mängijate strateegiatele.

Siin , kus on segastrateegia profiil kõigi segastrateegiate hulgas ja on mängija i tasufunktsioon. Vastavuse defineerimisel . Nashi tasakaalu olemasolu on ekvivalentne sellega, kui -il on püsipunkt.

Kakutani püsipunktiteoreem tagab püsipunkti olemasolu, kui järgmised neli nõuet on rahuldatud.

  1. on kompaktne, kumer ja mittetühi.
  2. on mittetühi.
  3. on kumer.
  4. on ülespoole poolpidev.

Tingimus 1 on rahuldatud sellega, et on simpleksne ja seega kompaktne. Kumerus tuleneb mängijate võimalusest strateegiaid segada. on mittetühi, kui mängijatel on strateegiaid.

Tingimus 2 on rahuldatud, sest mängijad proovivad maksimeerida oma tasu, mis on pidev funktsioon üle kompaktse hulga. Weierstrassi ekstreemumite teoreem tagab, et maksimum on alati olemas.

Tingimus 3 on rahuldatud tänu segastrateegiatele. Kui , siis . Seega, kui kaks strateegiat maksimeerivad tasu, siis nende kahe strateegia kombinatsioon tagab sama tasu.

Tingimus 4 on rahuldatud Berge maksimumi teoreemi kaudu. Kuna on pidev ja kompaktne, siis on ülespoole poolpidev.

Seega eksisteerib püsipunkt ja Nashi tasakaal.[16]

Kui Nash tegi eelneva teatavaks John von Neumannile, siis von Neumann vastas: "See on ju triviaalne. See on lihtsalt püsipunktiteoreem." (Vt Nasar, 1998, p. 94.)

Nashi tasakaalu arvutamine[muuda | muuda lähteteksti]

Kui mängijal A on domineeriv strateegia , siis eksisteerib Nashi tasakaal, milles A mängib välja . Mängijate A ja B puhul eksisteerib Nashi tasakaal, kus A mängib välja ja B mängib parima vastuse -le. Kui on rangelt domineeriv strateegia, siis A mängib kõigis võimalikes Nashi tasakaalu punktides. Kui nii A-l kui ka B-l on rangelt domineerivad strateegiad, siis eksisteerib unikaalne Nashi tasakaal, milles mõlemad mängivad oma rangelt domineerivat strateegiat.

Segastrateegia Nashi tasakaalu punktidega mängus arvutatakse konkreetse strateegia valik nii, et iga strateegiaga viiakse vastavusse muutuja, mis kirjeldab selle strateegia valimise fikseeritud tõenäosust. Et mängija nõustuks juhuvalikuga, peaks eeldatav tasu iga strateegia jaoks olema sama. Lisaks peab kõigi strateegiate valikute tõenäosuste summa olema 1. See tekitab võrrandisüsteemi, millest saab tuletada iga strateegia valimise tõenäosuse.[11]

Näited[muuda | muuda lähteteksti]

Sendimäng
Mängija A; mängija B Mängija B mängib kulli Mängija B mängib kirja
Mängija A mängib kulli −1, +1 +1, −1
Mängija A mängib kirja +1, −1 −1, +1

Kulli ja kirja mängus kaotab mängija A punkti B-le, kui A ja B mängivad sama strateegiaga, ning võidab punkti B-lt, kui nad mängivad eri strateegiatega. Segastrateegia Nashi tasakaalu arvutamiseks tähistagu p seda, et A mängib kulli, ning (1-p) seda, et ta mängib kirja. q olla tõenäosus, et B mängib kulli, ja (1−q) tõenäosus, et ta mängib kirja.

E[Tasu, et A mängib kulli] = (−1)q + (+1)(1−q) = 1−2q
E[Tasu, et A mängib kirja] = (+1)q + (−1)(1−q) = 2q−1
E[Tasu, et A mängib kulli] = E[Tasu, et A mängib kirja] ⇒ 1−2q = 2q−1 ⇒ q = 1/2
E[Tasu, et B mängib kulli] = (+1)p + (−1)(1−p) = 2p−1
E[Tasu, et B mängib kirja] = (−1)p + (+1)(1−p) = 1−2p
E[Tasu, et B mängib kulli] = E[Tasu, et B mängib kirja] ⇒ 2p−1 = 1−2pp = 1/2

Seega, segastrateegiaga Nashi tasakaal oleks selles mängus see, et kumbki mängija valib juhuslikult kulli või kirja tõenäosustega p = 1/2 ja q = 1/2.

Vaata ka[muuda | muuda lähteteksti]

Viited[muuda | muuda lähteteksti]

  1. Osborne, M. J.; Rubinstein, A. (1994). A Course in Game Theory. Cambridge: MIT.
  2. Schelling, T. (1960, 1980). The Strategy of Conflict. Harvard University Press.
  3. De Fraja, G.; Oliveira, T.; Zanchi, L. (2010). "Must Try Harder: Evaluating the Role of Effort in Educational Attainment". Review of Economics and Statistics, 92 (3): 577. doi:10.1162/REST_a_00013. 
  4. Ward, H. (1996). "Game Theory and the Politics of Global Warming: The State of Play and Beyond". Political Studies, 44 (5): 850. doi:10.1111/j.1467-9248.1996.tb00338.x. ,
  5. "Risks and benefits of catching pretty good yield in multispecies mixed fisheries". ICES Journal of Marine Science. 2017. doi:10.1093/icesjms/fsx062. 
  6. "Marketing Lessons from Dr. Nash – Andrew Frank". Vaadatud 30.08.2015. 
  7. Chiappori, P.-A.; Levitt, S.; Groseclose, T. (2002). "Testing Mixed-Strategy Equilibria when Players Are Heterogeneous: The Case of Penalty Kicks in Soccer". American Economic Review, 92 (4): 1138. doi:10.1257/00028280260344678. 
  8. Cournot, A. (1838). Researches on the Mathematical Principles of the Theory of Wealth.
  9. Von Neumann, J.; Morgenstern, O. (1944, 1953). Theory of Games and Economic Behavior. Princeton University Press.
  10. Carmona, G.; Podczeck, K. (2009). "On the Existence of Pure Strategy Nash Equilibria in Large Games". Journal of Economic Theory 144 (3): 1300–1319. SSRN 882466. doi:10.1016/j.jet.2008.11.009. 
  11. 11,0 11,1 von Ahn, L. "Preliminaries of Game Theory". Vaadatud 2008-11-07. 
  12. MIT OpenCourseWare. 6.254: Game Theory with Engineering Applications, Spring 2010. Lecture 6: Continuous and Discontinuous Games.
  13. Strandberg, M. (2012). Vangide dilemma lahendus Eesti moodi, Sirp.
  14. Turocy, T. L.; von Stengel, B. (2001). Game Theory. Texas A&M University, London School of Economics, pages 141–144.
  15. Cox, J. C.; Walker, M. (1997). Learning to Play Cournot Duoploy Strategies. Texas A&M University, University of Arizona.
  16. Fudenburg, D.; Tirole, J. (1991). Game Theory. MIT Press. ISBN 0-262-06141-4. 

Kirjandus[muuda | muuda lähteteksti]

Mänguteooria õpikuid[muuda | muuda lähteteksti]

Algsed Nashi artiklid[muuda | muuda lähteteksti]

Muud viited[muuda | muuda lähteteksti]

Välislingid[muuda | muuda lähteteksti]