Nashi tasakaal

Allikas: Vikipeedia

Nashi tasakaal on lahenduse leidmise kontseptsioon mänguteoorias, mis on saanud oma nime USA matemaatiku John Forbes Nash Jr. järgi. Mitte-kooperatiivses mängus, kus osaleb vähemalt kaks mängijat ning iga mängija teab teiste mängijate strateegiaid, esineb Nashi tasakaal juhul, kui ükski mängija ei soovi muuta oma strateegiavalikut, arvestades teiste osalejate valikuid strateegiate vahel.[1]

Juhul, kui iga mängija on valinud strateegia ning ükski mängija ei saaks paremat tulemust mõne muu strateegia kasutamisel, eeldusel, et teised mängijad oma strateegiat ei muuda, ongi selline strateegiate hulk ning neile vastavad tasud Nashi tasakaaluks.

Kahe mängija kohta lihtsustatult väljendudes on Mari ja Jüri Nashi tasakaalus siis, kui Mari teeb enda jaoks parima võimaliku otsuse, võttes arvesse ka Jüri otsust, eeldades, et see parajasti ei muutu. Jüri teeb endale parima võimaliku otsuse, võttes arvesse Mari otsust ning eeldades, et see parajasti ei muutu.

Rakendusi[muuda | muuda lähteteksti]

Mänguteoreetikud kasutavad Nashi tasakaalu mõistet, et ennustada olukorra tulemust, kus mitu inimest või institutsiooni teevad samaaegselt strateegilisi valikuid ning iga osaleja tulemus sõltub nii tema enda kui ka teiste valikutest. John Nashi idee lihtne põhimõte seisneb selles, et ei ole võimalik mitme otsustaja valikute tulemust ennustada, kui võimalikke otsuseid analüüsida isoleeritult.

Nashi tasakaalu on kasutatud vaenulike situatsioonide analüüsiks, nt sõda ja võidurelvastumine [2]. Veel on seda kasutatud, et uurida erinevate eelistustega inimeste koostöövalmidust, valuutakriise, mitme osapoole tehtud püüdluste tulemusi haridusprotsessis,[3] reguleerivat seadusandlust, nt keskkonnaregulatsioone,[4] loodusressursside haldamist,[5] turundusstrateegiaid,[6] ja isegi penaltite löömist jalgpallimängus.[7]

Ajalugu[muuda | muuda lähteteksti]

Nashi tasakaal on oma nime saanud USA matemaatiku John Forbes Nash Jr. järgi. Teatud Nashi tasakaalu erijuhtumit on teadaolevalt esimesena käsitletud oligopolide puhul 1838. aastal Antoine Augustin Cournot[8]. Cournot' teoorias valivad ettevõtted oma tootmismahu nii, et maksimeerida kasumit. Samas optimaalne tootmismaht sõltub ka sellest, kui palju teised turuosalised toodavad. Cournot tasakaal ilmneb juhul, kui iga ettevõte maksimeerib oma kasumi, arvestades ka teiste ettevõtete tootmismahtusid, mille näol on tegemist Nashi tasakaalu puhta strateegiaga. Nashi defineeritud tasakaal on laiem mõiste, kui Cournot' oma ning ka laiem, kui Pareto-efektiivne tasakaal, sest Nashi definitsioon ei anna hinnangut tekkinud tasakaalu optimaalsusele.

Kaasaegse mänguteooria Nashi tasakaalu kontseptsioon on defineeritud segastrateegiate kaudu, kus mängijad valivad tõenäosusjaotuse üle võimalike valikute. Segastrateegilise Nashi tasakaalu ideed tutvustasid John von Neumann ja Oskar Morgenstern oma 1944. aastal ilmunud raamatus "Mänguteooria ja majanduslik käitumine" ("The Theory of Games and Economic Behavior"). Siiski oli nende analüüs piiratud nullsummamängudega. Nad näitasid, et igas lõpliku valikute hulgaga nullsummamängus eksisteerib segastrateegiaga Nashi tasakaal.[9] Nashi 1951. aastal avaldatud artikli "Mittekooperatiivsed mängud" ("Non-Cooperative Games") panus seisnes selles, et defineeriti segastrateegiaga Nashi tasakaal iga mängu jaoks, milles on lõplik arv valikuid ning tõestati, et vähemalt üks (segastrateegiaga) Nashi tasakaal peab sellises mängus eksisteerima. Nashi võti andmaks von Neumannist oluliselt üldisemat tasakaalu olemasolu tõestust peitub Nashi viisis tasakaalu defineerida. Nashi kohaselt on "tasakaalupunkt n osalejaga mängus n elementi nii, et iga mängija segastrateegia maksimeerib tema tasu, kui teiste strateegiad hoida püsivana. Seega on iga mängija strateegia optimaalne teiste suhtes." Probleemile sellise raamistiku andmine võimaldas Nashil kasutada Kakutani püsipunkti teoreemi oma 1950. aasta artiklis ning täiendavas artiklis, mille Nash avaldas 1951. aastal, tõestas ta Brouweri püsipunkti teoreemi abil väite, et igas lõpliku mängijate arvuga (mitte üksnes nullsumma-) mängus peab eksisteerima vähemalt üks segastrateegiaprofiil, mis seab enesele vastavusse iseenda, st strateegiaprofiil, mis ei tingi strateegia muutmist suurema tasu nimel.[10]

Alates Nashi tasakaalu kontseptsiooni tekkimisest on mänguteoreetikud avastanud teatud tingimusi, mille korral Nashi tasakaal viib valede ennustusteni. On pakutud välja mitmeid lahenduste kontseptsioone või täiendusi Nashi tasakaalule, et vastavaid olukordi lahendada. Üks konkreetne näide seisneb selles, et vahel võib Nashi tasakaal tekkida olukorras, kus strateegia baseerub ebausutaval ähvardusel. 1965. aastal pakkus Reinhard Selten välja tasakaalu alamhulga, mille ta nimetaks ideaalseks tasakaaluks ning täiendus seisneski asjaolus, et välistatakse ebausutavatel ähvardustel baseeruvad strateegiad. Teised Nashi tasakaalu täiendused on võtnud teemaks olukorrad, kus mängu korratakse või mis juhtub, kui kõigil mängijatel ei ole kogu asjakohast informatsiooni teiste osalejate kohta. Sellegipoolest kõik täiendused ja laiendused jagavad Nashi tasakaalu mõiste peamist tuuma: kõik tasakaalukontseptsioonid analüüsivad, milliseid valikuid tehakse, kui võetakse arvesse teiste mängijate valikuid.

Definitsioonid[muuda | muuda lähteteksti]

Mitteformaalne definitsioon[muuda | muuda lähteteksti]

Mittematemaatiliselt väljendudes on strateegiaprofiil Nashi tasakaal, kui ükski mängija ei saa oma strateegiat muutes suuremat tasu. Et mõista, mida see tähendab, kujutlege, et igale mängijale öeldakse teiste strateegia. Järgmiseks iga mängija küsib eneselt: "Teades teiste mängijate strateegiaid ja oletades, et need ei muutu, kas ma saaksin enda strateegia muutmisest kasu?" Kui vähemalt üks mängija saab vastata sellele küsimusele jaatavalt, siis selline strateegiate hulk ei ole Nashi tasakaal. Kui iga mängija eelistab jätta oma strateegia samaks, (või ei huvitu strateegia muutmisest, sest tema tasu ei muutuks strateegia muutmisega) siis selline strateegiaprofiil on Nashi tasakaal. Seega, iga strateegia Nashi tasakaalus on parim vastus kõigi teiste mängijate strateegiatele selles tasakaalus.[11]

Nashi tasakaal võib vahel paista ebaratsionaalne süsteemi väljastpoolt vaadeldes. See võib aset leida, kuna Nashi tasakaal ei pruugi olla Pareto-efektiivne. Nashi tasakaal võib tekitada mitteratsionaalseid tulemusi ka järjestikustes mängudes, sest mängijad võivad teineteist "ähvardada" ebaratsionaalsete otsustega. Selliste mängude analüüsimiseks võib tähenduslikum vahend olla ideaalne Nashi tasakaal, kui Nashi tasakaalu alamhulk.

Formaalne definitsioon[muuda | muuda lähteteksti]

Olgu mäng, milles on mängijat ning on strateegiate hulk mängija jaoks, on kogu strateegiaprofiilide hulk ja on selle (strateegiaprofiilide hulga) tasufunktsioon punktis . Olgu mängija strateegiaprofiil ning olgu kõigi teiste mängijate strateegiaprofiil, välja arvatud . Kui iga mängija valib strateegia ning tulemuseks on strateegiaprofiil , siis mängija tasu on . Märgime, et tasu sõltub valitud strateegiaprofiilist, st mängija valitud strateegiast ning ka kõigi teiste valitud strateegiatest. Strateegiaprofiil on Nashi tasakaal, kui ükski ühepoolne strateegiamuutus mistahes ühe mängija poolt ei ole antud mängijale kasumlik, st

Kui ülemine võrratus kehtib rangelt (≥ asemel on >) kõigi mängijate jaoks ning kõigi võimalike alternatiivsete strateegiate jaoks, siis nimetatakse tasakaalu rangeks Nashi tasakaaluks. Kui mõne mängija jaoks kehtib täpne võrdus ja mõne muu strateegia vahel hulgas , siis nimetatakse tasakaalu nõrgaks Nashi tasakaaluks.

Mängul võib olla puhta strateegia või segastrateegia Nashi tasakaal. Viimases valitakse puhas strateegia juhuslikult kindla tõenäosusega.

Nashi olemasoluteoreem[muuda | muuda lähteteksti]

Nash tõestab, et kui lubada segastrateegiaid, siis igal lõpliku mängijate arvuga mängul, kus valida on lõpliku arvu puhaste strateegiate vahel, on olemas vähemalt üks Nashi tasakaal.

Nashi tasakaalu ei pruugi eksisteerida, kui valikute hulk on lõpmatu ja mittekompaktne. Näiteks juhtum, kus kaks mängijat nimetavad samaaegselt naturaalarvu ning suurema arvu nimetaja võidab. Nashi tasakaal on samas olemas, kui valikute hulk on kompaktne ning pideva tasufunktsiooniga.[12] Näide, kus tasakaal on pidev segu puhastest strateegiatest, oleks mäng, kus kaks mängijat valivad reaalarvu 0 ja 1 vahel ning ühe mängija tasu (mille maksab teine mängija) võrdub ruutjuurega kahe valitud arvu vahest.

Näiteid[muuda | muuda lähteteksti]

Koordinatsioonimäng[muuda | muuda lähteteksti]

Näide koordinatsioonimängust on sõitmine teel vastutuleva auto suunas ning kohustus valida, kas sõita tee parem- või vasakpoolses servas. Olgu näites tasuks 10 olukord, kus kokkupõrget autode vahel ei toimu ning tasuks 0, kui kokkupõrge toimub. Sel juhul saame mängu kirjeldada sellise tasumaatriksiga:

Sõitmismäng
Autojuht 1; Autojuht 2 Sõitmine vasakul Sõitmine paremal
Sõitmine vasakul 10, 10 0, 0
Sõitmine paremal 0, 0 10, 10

Käesoleval juhul eksisteerib kaks puhta strateegia Nashi tasakaalu – kas mõlemad valivad sõitmiseks enda poolt vaadatuna vasaku poole või mõlemad valivad parema poole. Kui lubada ka segastrateegiaid (kus puhas strateegia valitakse juhuslikult, kuid mingi kindla tõenäosusega), siis eksisteerib kolm Nashi tasakaalu sama juhtumi jaoks: kaks tükki neist on eeltoodud puhtad strateegiad, kus tõenäosused on 1. mängija jaoks (0%, 100%) ja teise jaoks (0%, 100%) ning vastupidi – esimese jaoks (100%, 0%) ning teisele (100%, 0%). Segastrateegiana lisandub veel selline Nashi tasakaal, kus tõenäosused kummalegi mängijale on (50%, 50%).

Vangi dilemma[muuda | muuda lähteteksti]

Next.svg Peamine artikkel Vangi dilemma
Vangi dilemma tasumaatriksi näide
Vang 1 ; Vang 2 Koostöö (vaikimine) Reetmine (rääkimine)
Koostöö (vaikimine) 2, 2 0, 3
Reetmine (rääkimine) 3, 0 1, 1

Kujutlege kahte vangi, keda hoitakse eraldi kongides ning neid kuulatakse samaaegselt üle ja pakutakse neile tehingut (saada lühem vanglakaristus) kaaskurjategija reetmise korral. Vang võib teise vangiga teha "koostööd", st mitte midagi välja rääkida või "reeta" kaaskurjategija, rääkides teise sisse. Kusjuures kui mõlemad teineteise kohta info välja räägivad, siis saavad mõlemad suurema karistuse, kui olnuks juhul, kus mõlemad vaikivad. Tasumaatriksis kujutatud arvud on kõrgemad, mida lühem on karistus, st suurem arv tähendab suuremat tasu (väiksemat karistust).

Vangi dilemma puhul sarnaneb maatriks koordinatsioonimänguga, kuid maksimaalne tasu kummagi mängija jaoks (käesolevas näites 3) saavutatakse vaid juhul, kui mängijate otsused on erinevad. Kumbki mängija saab oma situatsiooni parandada, kui vahetab "koostöö" "reetmise" vastu, teades, et teise vangi parim otsus on "reeta". Vangi dilemmal on seega üks Nashi tasakaal, milleks on mõlema vangi otsus teine reeta. Arutelu, mis näitab, et "reetmine" on parim valik, võiks olla näiteks järgmine: "Kui teine vang mind reedab, peaksin ka mina teda reetma (minu tasu = 1), sest tema reetmise ja minu vaikimise korral on minu karistus karmim (tasu 0). Kui teine vang vaikib, siis peaksin ma ta ikkagi reetma, sest sel juhul on minu tasu maksimaalne (3). Kui mõlemad vaikiksime, oleks minu tasu vaid 2."

Selle juhtumi on teinud läbi aegade üheks huvitavamaks õppenäiteks asjaolu, et Nashi tasakaal on vangidele vähem kasulik, kui mõlema vangi "koostöö", st vaikimine. Mõlemad saaksid kergema karistuse, kui kumbki vang ei räägiks midagi. Siiski, kumbki vang saab parandada oma situatsiooni, murdes vastastikuse koostöö lepet. Sõltumata teise mängija valikust, on vangil antud mängus alati kasulikum "reeta".

Kirjeldatud juhtum on tekitanud ka palju vääritimõistmist, sest Nashi tasakaalu puhul räägitakse teiste mängijate strateegiatega arvestamisest ning seda tõlgendatakse sageli kui koostööd, kuid antud näites koostöö ei ole Nashi tasakaal. Lisaks põhjustab eksiarvamusi muidugi asjaolu, et Nashi tasakaaluolukord ei ole mõlemale vangile kõige kasulikum olukord. Näiteks Marek Strandberg on 2012. aastal avaldanud Sirbis artikli, kus kirjeldab, et vangi dilemma juures on Nashi tasakaaluks mõlema vaikimine, mis ei ole õige[13]. Teine võimalus tõlgendada ja õigustada viimati viidatud artikli autori arutluskäiku oleks see, kui reetmine tooks kaasa kõige kehvema tulemuse (isegi kehvema, kui vaikimine juhul, kui teine räägib). See aga ei ole mäng nimega "vangi dilemma", mis on defineeritud ülaltoodud viisil.

Stabiilsus[muuda | muuda lähteteksti]

Stabiilsuse kontseptsioon, mis on kasulik mõiste paljude tasakaalude analüüsiks, on rakendatav ka Nashi tasakaalule. Nashi tasakaal segastrateegiatega mängus on stabiilne, kui väike tõenäosuste muutus ühe mängija jaoks viib situatsioonini, kus on täidetud järgmised tingimused:

  1. mängija, kelle jaoks midagi ei muutunud, ei oma uues situatsioonis paremat strateegiat
  2. mängija, kelle jaoks toimus muutus, mängib nüüd eelnevast kehvema strateegiaga

Kui mõlemad tingimused on täidetud, siis mängija, kellel toimus väike muutus tema segastrateegias, naaseb kohe Nashi tasakaalu. Tasakaalu nimetatakse siis stabiilseks. Kui esimene tingimus ei pea paika, on tasakaal ebastabiilne. Kui ainult esimene tingimus peab paika, siis on tõenäoliselt selle mängija jaoks, kellel toimus muutus, lõpmatu hulk optimaalseid strateegiaid.

Eespool toodud "Sõitmismängu" näites esinevad nii stabiilsed kui ka ebastabiilsed tasakaalud. Tasakaal, kus on tegu 100%-lise tõenäosusega toimuvate valikutega segastrateegiaga, on stabiilne. Kui kumbki mängija muudab seda tõenäosust veidi, on nad seejärel kehvemas olukorras ning nende vastasel ei ole selle peale põhjust enda strateegiat muuta. (50%, 50%) tasakaal on ebastabiilne. Kui kumbki mängija muudab valiku tõenäosust, siis on teisel mängijal mõttekam liikuda kohe strateegia (0%, 100%) või (100%, 0%) juurde.

Stabiilsus on oluline mõiste Nashi tasakaalu praktiliseks rakendamiseks, sest mängijate segastrateegiad ei ole üldjuhul detailselt teada, vaid neid tuleb järeldada nende mängus tehtud valikute statistilisest jaotusfunktsioonist. Sel juhul on väga ebatõenäoline, et praktikas esineb ebastabiilne tasakaal, sest iga vähimgi muutus kellegi strateegias viib tasakaalu kaotamiseni.

Esinemine[muuda | muuda lähteteksti]

Kui mängus on olemas unikaalne Nashi tasakaal ning mängijad mängivad teatud tingimustele vastavalt, siis jõutakse Nashi tasakaalule vastava strateegiate hulgani. Piisavad tingimused selleks, et jõuda Nashi tasakaaluni, on järgmised:

  1. Mängijad annavad endast parima, et maksimeerida enda oodatud tasu.
  2. Mängijad on oma tegevuste täideviimises veatud.
  3. Mängijatel on piisavad teadmised ja arusaam, et tuletada mängu lahendus.
  4. Mängijad teavad kõigi teiste mängijate planeeritud tasakaalustrateegiat.
  5. Mängijad usuvad, et kui nad kalduvad oma strateegiast kõrvale, ei mõjuta see teiste mängijate valikut.
  6. Valitseb üldine teadlikkus selle kohta, et kõik mängijad vastavad eeltoodud tingimustele. St lisaks sellele, et iga mängija peab teadma, et teised vastavad toodud tingimusele, ta peab ka teadma, et kõik teised seda teavad jne.

Millal ei ole tingimused täidetud[muuda | muuda lähteteksti]

Näiteid mänguteooria probleemidest, kus (osad) eeltoodud tingimused ei ole täidetud:

  1. Esimene tingimus ei ole täidetud, kui mäng ei defineeri piisava selgusega, millist suurust soovib mängija maksimeerida. Sel juhul ei ole mängijal otsest põhjust valida tasakaaluni viivat strateegiat. Näiteks vangi dilemma ei ole dilemma, kui vähemalt üks mängijatest on rahul määramata ajaks vangi minemisega.
  2. Paljudel juhtudel ei ole kolmas tingimus täidetud, sest kuigi tasakaalupunkt peab eksisteerima, ei ole see mängu keerukuse tõttu teada, näiteks Hiina male korral.[14] Või kui tasakaalupunkt on teada, ei pruugi see olla teada kõigile mängijatele, näiteks võib selline olukord esineda väikese lapsega trips-traps-trulli mängides.
  3. Üldise teadlikkuse kriteerium ei pruugi olla täidetud isegi siis, kui kõik mängijad vastavad kõigile ülejäänud tingimustele. Mängijad, kes seavad kahtluse alla teineteise ratsionaalsust, võivad võtta kasutusele hoopis vastustrateegiad teiste irratsionaalse käitumise tarbeks. Seda tuleb kindlasti arvestada näiteks võidurelvastumist analüüsides.

Millal on tingimused täidetud[muuda | muuda lähteteksti]

Enda doktoriväitekirjas pakkus John Nash välja kaks tõlgendust enda tasakaalukontseptsioonile, mille eesmärk oli näidata, kuidas tema tasakaalupunktid on võimalik vastavusse viia vaadeldavate nähtustega. Üks tõlgendus on ratsionalistlik: "kui eeldada, et mängijad on ratsionaalsed, teavad mängu struktuuri, mängitakse vaid ühe korra ning mängus on vaid üks Nashi tasakaal, siis mängijad mängivad sellesse tasakaalupunkti jõudmiseni". Selle idee formaliseerisid 1995. aastal R. Aumann ja A. Brandenburger ("Epistemic Conditions for Nash Equilibrium", Econometrica, 63, 1161–1180), kes tõlgendasid iga mängija segastrateegiat kui hüpoteesi teiste mängijate käitumise kohta ning näitasid, et kui mäng ja mängijate ratsionaalsus on vastastikku teada, siis selline hüpotees peab olema Nashi tasakaal.

Teine tõlgendus on mängijatele väiksemate piirangutega: "ei ole tarvilik eeldada, et mängijatel on täielik teadmine mängu struktuuri kohta ning ei pea olema võimekust ja vajadust läbida keerulist loogilist arutlusprotsessi. Eeldatakse, et on olemas mängijate kogum igale positsioonile mängus, mida mängitakse ajas pidevalt mängijate poolt, kes satuvad mängima kogumist juhuslikult valituna. Kui on olemas stabiilne keskmine sagedus, millega mõnda puhast strateegiat kasutatakse "keskmise mängija" poolt vastavast kogumist, siis see stabiilne keskmine sagedus ongi segastrateegia Nashi tasakaal." Nende ridade formaalse kirjelduse kohta vt Kuhn, H. and et al., 1996, The Work of John Nash in Game Theory, Journal of Economic Theory, 69, 153–185.

Kuivõrd tingimused, millal Nashi tasakaalu saab reaalselt mingis olukorras jälgida, on võrdlemisi piiratud, on see kontseptsioon üsna harva teejuhiks igapäevaste olukordade lahendamisel. Siiski, teoreetilise kontseptsioonina majandusteaduses ja evolutsioonibioloogias on Nashi tasakaalul selgitav jõud. Majandusteaduses on mängu tasuks üldjuhul varad (raha) vm, evolutsioonibioloogias geenide edasikandumine; mõlemad on tarvilikud tingimused elamiseks ja elu edasikandumiseks vastavates distsipliinides. Uurijad, kes neis valdkondades mänguteooriat rakendavad, väidavad, et strateegiad, mis ei tule toime eeltoodud hüvede maksimeerimisega mistahes põhjustel, surutakse turult või keskkonnast välja. Sellistes situatsioonides kasvab eeldus, et jälgitava strateegia näol on tegu Nashi tasakaaluga, enamasti välja uurimusest.[15]

Olemasolu tõestus[muuda | muuda lähteteksti]

Tõestus Kakutani püsipunkti teoreemi abil[muuda | muuda lähteteksti]

Nashi algne tõestus (oma väitekirjas) kasutas Brouweri püsipunkti teoreemi. Lihtsam on näidata tõestust Kakutani püsipunkti teoreemi kaudu, nagu ta ise seda näitas oma 1950. aasta artiklis.

Tõestamaks Nashi tasakaalu olemasolu, olgu mängija i parim vastus kõigi teiste mängijate strateegiatele.

Siin, , kus on segastrateegia profiil kõigi segastrateegiate hulgas ja on mängija i tasufunktsioon. Defineerige vastavus nii, et . Nashi tasakaalu olemasolu on ekvivalentne sellega, kui -il on püsipunkt.

Kakutani püsipunkti teoreem garanteerib püsipunkti olemasolu, kui järgnevad neli nõuet on rahuldatud:

  1. on kompaktne, kumer ja mittetühi.
  2. on mittetühi.
  3. on kumer.
  4. on ülespoole poolpidev.

Tingimus 1 on rahuldatud sellest, et on simpleksne ja seega kompaktne. Kumerus tuleneb mängijate võimalusest strateegiaid segada. on mittetühi, kui mängijatel on strateegiaid.

Tingimus 2 on rahuldatud, sest mängijad proovivad maksimeerida oma tasu, mis on pidev funktsioon üle kompaktse hulga. Weierstrassi ekstreemumite teoreem garanteerib, et maksimum alati eksisteerib.

Tingimus 3 on rahuldatud tänu segastrateegiatele. Olgu , siis . s. o. kui kaks strateegiat maksimeerivad tasu, siis nende kahe strateegia segu väljastab sama tasu.

Tingimus 4 on rahuldatud Berge maksimumi teoreemi kaudu. Kuna on pidev ja kompaktne, siis on ülespoole poolpidev.

Seega eksisteerib püsipunkt ja Nashi tasakaal.[16]

Kui Nash tegi eelneva teatavaks John von Neumann'ile, siis von Neumann vastas "See on ju triviaalne. See on lihtsalt püsipunkti teoreem." (vt Nasar, 1998, p. 94.)

Nashi tasakaalu arvutamine[muuda | muuda lähteteksti]

Kui mängijal A on domineeriv strateegia , siis eksisteerib Nashi tasakaal, milles A mängib välja . Kahe mängija A ja B juhul eksisteerib Nashi tasakaal, kus A mängib välja ja B mängib parima vastuse -le. Kui on rangelt domineeriv strateegia, siis A mängib kõigis võimalikes Nashi tasakaalupunktides. Kui nii A-l kui ka B-l on rangelt domineerivad strateegiad, siis eksisteerib unikaalne Nashi tasakaal, milles mõlemad mängivad oma rangelt domineerivat strateegiat.

Segastrateegiatega Nashi tasakaalupunktidega mängudes arvutatakse konkreetse strateegia valik nii, et iga strateegiaga vastavusse muutuja, mis kirjeldab selle strateegia valimise fikseeritud tõenäosust. Et mängija nõustuks juhuvalikuga, peaks eeldatav tasu iga strateegia jaoks olema sama. Lisaks peab kõigi strateegiate valikute tõenäosuste summa olema 1. See tekitab võrrandisüsteemi, millest iga strateegia valimise tõenäosuse saab tuletada.[11]

Näited[muuda | muuda lähteteksti]

Sendimäng
Mängija A; mängija B Mängija B mängib H Mängija B mängib T
Mängija A mängib H −1, +1 +1, −1
Mängija A mängib T +1, −1 −1, +1

Sendimängus kaotab mängija A punkti B-le, kui A ja B mängivad sama strateegia ning võidab punkti B-lt, kui nad mängivad erinevad strateegiad. Segastrateegia Nashi tasakaalu arvutamiseks tähistagu p sellele, et A mängib H ning (1-p) sellele, et ta mängib T. Las q olla tõenäosus, et B mängib H ja (1−q), et ta mängib T.

E[Tasu, et A mängib H] = (−1)q + (+1)(1−q) = 1−2q
E[Tasu, et A mängib T] = (+1)q + (−1)(1−q) = 2q−1
E[Tasu, et A mängib H] = E[Tasu, et A mängib T] ⇒ 1−2q = 2q−1 ⇒ q = 1/2
E[Tasu, et B mängib H] = (+1)p + (−1)(1−p) = 2p−1
E[Tasu, et B mängib T] = (−1)p + (+1)(1−p) = 1−2p
E[Tasu, et B mängib H] = E[Tasu, et B mängib T] ⇒ 2p−1 = 1−2pp = 1/2

Seega segastrateegiaga Nashi tasakaal oleks antud mängus see, et kumbki mängija valib juhuslikult H või T tõenäosustega p = 1/2 ja q = 1/2.

Vaata ka[muuda | muuda lähteteksti]

Viited[muuda | muuda lähteteksti]

  1. Osborne, Martin J., and Ariel Rubinstein. A Course in Game Theory. Cambridge, MA: MIT, 1994. Print.
  2. Schelling, Thomas, The Strategy of Conflict, copyright 1960, 1980, Harvard University Press, ISBN 0-674-84031-3
  3. De Fraja, G.; Oliveira, T.; Zanchi, L. (2010). "Must Try Harder: Evaluating the Role of Effort in Educational Attainment". Review of Economics and Statistics 92 (3): 577. doi:10.1162/REST_a_00013. 
  4. Ward, H. (1996). "Game Theory and the Politics of Global Warming: The State of Play and Beyond". Political Studies 44 (5): 850. doi:10.1111/j.1467-9248.1996.tb00338.x. ,
  5. "Risks and benefits of catching pretty good yield in multispecies mixed fisheries". ICES Journal of Marine Science. 2017. doi:10.1093/icesjms/fsx062. ,
  6. "Marketing Lessons from Dr. Nash – Andrew Frank". Vaadatud 2015-08-30. 
  7. Chiappori, P. -A.; Levitt, S.; Groseclose, T. (2002). "Testing Mixed-Strategy Equilibria when Players Are Heterogeneous: The Case of Penalty Kicks in Soccer". American Economic Review 92 (4): 1138. doi:10.1257/00028280260344678. 
  8. Cournot A. (1838) Researches on the Mathematical Principles of the Theory of Wealth
  9. J. Von Neumann, O. Morgenstern, Theory of Games and Economic Behavior, copyright 1944, 1953, Princeton University Press
  10. Carmona, Guilherme; Podczeck, Konrad (2009). "On the Existence of Pure Strategy Nash Equilibria in Large Games". Journal of Economic Theory 144 (3): 1300–1319. SSRN 882466. doi:10.1016/j.jet.2008.11.009. 
  11. 11,0 11,1 von Ahn, Luis. "Preliminaries of Game Theory". Vaadatud 2008-11-07. 
  12. MIT OpenCourseWare. 6.254: Game Theory with Engineering Applications, Spring 2010. Lecture 6: Continuous and Discontinuous Games.
  13. Marek Strandberg, Vangide dilemma lahendus Eesti moodi, 2012, Sirp.
  14. T. L. Turocy, B. Von Stengel, Game Theory, copyright 2001, Texas A&M University, London School of Economics, pages 141–144.
  15. J. C. Cox, M. Walker, Learning to Play Cournot Duoploy Strategies, copyright 1997, Texas A&M University, University of Arizona, pages 141–144
  16. Fudenburg, Drew; Tirole, Jean (1991). Game Theory. MIT Press. ISBN 0-262-06141-4. 

Kirjandus[muuda | muuda lähteteksti]

Mänguteooria õpikuid[muuda | muuda lähteteksti]

Algsed Nashi artiklid[muuda | muuda lähteteksti]

Muud viited[muuda | muuda lähteteksti]

Välislingid[muuda | muuda lähteteksti]