Teoria jocurilor

Teoria jocurilor reprezinta o abordare distincta si interdisciplinara a studiului comportamentului uman. Cele mai implicate discipline, in teoria jocurilor, sunt matematica si economia, dar si alte stiinte sociale si comportamentale. Teoria jocurilor a fost creata de matematicianul John von Neumann. Prima sa lucrare importanta a fost “The Theory of Games and Economic Behavior”, lucrare scrisa in colaborare cu un economist celebru, Oskar Morgenstern. Odata cu lucrarea lui Neumann, “jocurile” au devenit o metafora stiintifica ce reprezenta o gama larga de interactiuni umane ale caror finalitate depinde de strategiile interactive a doua sau mai multe persoane, ale caror interese sunt in cel mai rau caz opuse sau in cel mai bun caz, partial comune.

Teoria jocurilor apartine unei familii de teorii ce sunt insumate sub termenul general de Teoria Alegerilor Rationale. Toate aceste teorii (teoriile deciziei, a jocurilor si a alegerilor sociale) pun in discutie conditiile in care se poate spune despre actiunile agentilor implicati ca ar fi rationale. In functie de felul in care aceste conditii sunt interpretate, Teoria Alegerilor Rationale poate avea o functie pozitiva sau normativa: poate sa contrubuie la anticiparea si explicarea comportamentului agentului sau poate contribui la sfatuirea agentilor in privinta a ceea ce trebuie sa faca. Multe din presupusele functii ale teoriei Alegerilor Rationale sunt controversate. Fiind parte din ea Teoria Jocurilor e afectata de aceste controverse, in special cand e aplicata in domenii sociale.

Teoria jocurilor incerca sa raspunda la o serie de intrebari esentiale, printre ele se numara:

Ce inseamna sa alegi strategii “rationale” atunci cand finalitatea lor depinde de strategiile alese de altii, iar informatiile sunt incomplete?

In “jocurile” ce permit pierderi si castiguri comune, este rationala cooperarea  pentru  a realiza un castig comun (sau a se evita o pierdere comuna) sau este “rationala” abordarea agresiva in cautarea castigului individual, indiferent de castigurile sau pierderile comune?

Daca raspunsul la a doua intrebare e “uneori”, atunci in ce circumstante este agresivitatea rationala si in ce circumstante este cooperarea rationala?

In acest context, exista diferente intre relatiile de durata fata de cele trecatoare?

Interactiunea unor egoisti rationali poate duce la crearea spontana a unor reguli morale de cooperare?

In ce fel corespunde comportamentul uman real cu comportamentul “rational” din aceste cazuri?

Si daca difera, prin ce difera? Sunt oamenii mai cooperativi decat sunt “rationali”? Mai agresivi? Ambele?

Rationalitatea

Veriga lipsa dintre economia neoclasica si teoria jocurilor este rationalitatea. Economia neoclasica este bazata pe presupunerea ca fiintele umane sunt 100% rationale in alegerile economice. Fiecare persoana isi maximizeaza propriile recompense (profit, venit sau beneficii subiective), in functie de circumstantele alese de ea sau care ii sunt impuse. Aceasta ipoteza serveste unui scop dublu in studierea alocarii resurselor. In primul rand restrange gama de posibilitati. Comportamentul rational absolut este mai usor de anticipat decat cel irational. Si in al doilea rand ofera un criteriu de evaluare a eficientei unui sistem economic. Daca sistemul se indreapta spre o reducere a recompenselor fata de unele persoane, fara sa produca mai mult decat recompensele celorlalti “jucatori” (costurile sunt mai mari decat beneficiile) atunci e clar ca exista o problema.

In economia neoclasica, individul rational e expus unui anumit sistem de institutii ce include dreptul de proprietate, bani si piete cu nivel mare de competitie. Acestea sunt unele dintre “circumstantele” ce trebuiesc luate in considerare de o persoana ce doreste sa isi maximizeze recompensa. Implicatiile dreptului proprietatii, a unei economii monetare si a unei piete competitive ideale il fac pe individ sa nu ia in considerare interactiunea sa cu alti indivizi. Acel individ ia in considerare doar situatia sa si “conditiile pietei”.

Acest lucru duce la doua probleme. Prima din ele limiteaza aplicatiile teoriei. Acolo unde competitia e restrictionata (dar nu exista monopol) sau acolo unde drepturile de proprietate nu sunt definite complet, teoria economiei neoclasice nu poate fi aplicata. Iar economia neoclasica nu a realizat nici o extensie recunoscuta a acestei teorii care sa cuprinda aceste cazuri. Deciziile luate in afara economiei monetare erau si ele problematice.

Teoria jocurilor era destinata acestei probleme: sa asigure o teorie a comportamentului economic si strategic atunci cand oamenii interactioneaza mai degraba direct, decat prin “intermediul pietii”. Prin urmare, teoria jocurilor se adreseaza  interactiunilor serioase. In cadrul acestor interactiuni serioase, ca si in cadrul unui joc, alegerile individului sunt in esenta alegeri strategice, iar finalitatea lor depinde de strategiile alese de fiecare participant in parte.

In teoria economiei neoclasice, a alege rational inseamna maximizarea recompensei proprii. Dintr-un anumit punct de vedere seamana cu o problema de matematica: alegerea activitatii care maximizeaza recompensa intr-o anumita situatie. Dar in cazul teoriei jocurilor, problema este mult mai complexa, deoarece rezultatul final nu depinde doar de strategiile proprii si de “conditiile pietei”, rezultatul final depinde in mod direct si de alegerile facute de ceilalti.

Introducere in Teoria Jocurilor

Imaginati-va ca sunteti un soldat postat pe front. Maine va avea loc o mare batalie. Batalia poate sa aiba doar 2 finalitati (victorie sau infrangere). Situatia in care se afla soldatul are si ea doar 2 finalitati (supravietuieste sau moare). Este evident ca tu ai prefera sa supravietuiesti. Daca linia defensiva este strapunsa, vei muri. Daca linia defensiva rezista, e posibil sa mori oricum. Se pare ca cea mai buna optiune e fuga. Daca faci asta, cei care raman in urma si lupta vor muri. Iti dai seama ca fiecare soldat din transee se gandeste la acelasi lucru. Deci daca tu te hotarasti sa ramai dar ceilalti fug, atunci in mod sigur mori. Problema aceasta a preocupat strategii militari de multa vreme. De aceea este adaugata o conditie noua in ecuatie – daca fugi sau daca dezertezi, esti impuscat pentru tradare. De aceea cea mai buna sansa de supravietuire o ai in transee luptand pentru victorie.

Teoria jocurilor nu este studiul modalitatilor prin care poti castiga un joc de sah. Uneori, teoria jocurilor nu are nici o legatura cu ceea ce se intelege in mod normal prin joc. La nivelul de baza, teoria jocurilor studiaza felul in care oamenii, companiile sau natiunile (agenti sau jucatori) determina strategii in diverse situatii atunci cand sunt confruntati cu strategiile competitive ale altor jucatori. Teoria jocurilor se bazeaza pe ideea ca jucatorii iau numai decizii rationale. Dar exista o problema, ceea ce poate fi numit comportament irational de majoritatea societatilor (acumularea unui stoc de arme nucleare urias), este considerat rational conform standardelor teoriei jocurilor.

Dar chiar si atunci cand analiza teoriei jocurilor produce rezultate contra-intuitive, tot reuseste sa ne prezinte fatete surprinzatoare ale naturii umane. De exemplu, membrii unei societati coopereaza unii cu altii doar de dragul castigului material, sau e mai mult decat atat? Ai ajuta pe cineva stiind ca acest lucru iti va dauna pe termen lung?

Dilema Prizonierilor

A.W. Tucker aduce o metafora proprie numita Dilema Prizonierilor. Aceasta dilema ce nu ocupa mai mult de o pagina, ar putea foarte bine sa fie cea mai influenta singura pagina a stiintelor sociale din cea de a doua jumatate a secolului al XX-lea. Aceasta inovatie remarcabila nu a aparut intr-o lucrare de doctorat sau de cercetare, ci intr-o sala de clasa. In anul 1950 in timp ce se adresa unei audiente de psihologi ai Universitatii Stanford, Tucker a creat acest exemplu in incercarea de a arata cat de dificila e analiza “unor anumite jocuri”.

Doi spargatori, Bob si Al, sunt prinsi de politie. Sunt separati si fiecaruia dintre ei ii sunt prezentate acelasi set de alegeri:

-daca nici unul dintre ei nu marturiseste fapta, atunci politistii ii vor acuza de port ilegal de arma si vor fi inchisi pentru un an.

-daca ambii marturisesc si se incrimineaza reciproc, amandoi vor fi condamnati la 10 ani de inchisoare.

-dar daca unul dintre ei marturiseste fapta si il incrimineaza pe celalalt, iar celalalt nu marturiseste; atunci cel care a colaborat va fi eliberat, iar celalalt va fi condamnat la 20 de ani de inchisoare.

Exista doar 2 strategii posibile: a marturisi sau a nu marturisi. Recompensele (in cazul de fata penalitati) vin sub forma sentinelor.

Cum putem rezolva acest joc? Care e strategia “rationala” daca ambii vor sa reduca la minim perioada petrecuta in inchisoare? Al ar putea privi asa: “Se pot intampla doua lucruri: Bob marturiseste sau Bob nu marturiseste. Sa presupunem ca Bob marturiseste. In cazul asta sunt condamnat la 20 de ani daca nu marturisesc si 10 ani daca marturisesc, deci e mai bine sa marturisesc. Pe de alta parte daca Bob nu marturiseste si nici eu nu marturisesc atunci suntem condamnati la 1 an. Dar daca eu marturisesc atunci sunt liber. Oricum ar fi e mai bine sa marturisesc.”

Dar Bob la randul sau poate gandi si el asa si e foarte probabil ca o face – deci amandoi marturisesc si sunt condamnati la 10 ani de inchisoare. Dar daca s-ar comporta “irational” si ar pastra tacerea, atunci ar putea scapa doar cu un an de inchisoare. Ceea ce s-a intamplat aici e caderea celor 2 prizonieri in ceea ce numim “echilibrul strategiei dominante”.

Definitia strategiei dominante

Lasati un jucator individual al unui joc sa evalueze separat fiecare dintre combinatiile strategice pe care e posibil sa le infrunte, iar pentru fiecare combinatie sa isi aleaga propria strategie ce ii ofera recompensa maxima. Daca aceeasi strategie este aleasa  pentru fiecare dintre combinatiile strategice diferite pe care le infrunta, atunci aceasta strategie este numita strategia dominanta a jucatorului.

Definitia echilibrului strategiei dominante

Daca intr-un joc, fiecare jucator are o strategie dominanta si o foloseste, atunci acea combinatie de strategii dominante si a recompenselor corespondente constituie echilibrul strategic dominant al jocului. In cadrul jocului Dilema Prizonierilor, a marturisi e strategia dominanta, iar cand ambii prizonieri marturisesc, acesta e echilibrul strategic dominant.

Problemele Dilemei Prizonierilor

Acest rezultat remarcabil – ca ratiunea individuala duce la inrautatirea situatiei ambilor indivizi – a avut un impact major asupra stiintelor sociale moderne. Exista multe interactiuni in lumea moderna care sunt asemanatoare, de la cursa inarmarilor, pana la ambuteiaje si poluare. Acestea sunt interactiuni diferite in detaliu, dar sunt interactiuni in cadrul carora actiunile individuale rationale duc la rezultate inferioare pentru indivizii implicati. Dilema Prizonierilor ne sugereaza felul in care e posibil sa decurga lucrurile.

Sa nu uitam totusi ca aceasta dilema reprezinta sub forma unui concept foarte simplificat si abstract multe dintre aceste interactiuni. Exista o serie de probleme ce pot fi ridicate:

Dilema Prizonierilor e un joc de doua persoane, dar multe din aplicatiile acestei idei implica interactiuni cu numere mari de persoane. Se presupune ca nu exista nicio forma de comunicatie intre prizonieri. Daca ar putea comunica, ar putea aplica o strategie comuna cu rezultate diferite. In Dilema Prizonierilor, cei doi prizonieri interactioneaza o singura data. Interactiunile repetate ar putea duce la un rezultat diferit. Desi rationamentul care indica echilibrul strategic dominant este atragator, nu e singura modalitate in care problema poate fi rezolvata. Poate ca nu e cel mai rational raspuns.

Atunci cand analizam Teoria Jocurilor, trebuie sa presupunem cateva lucruri:

-este considerat joc orice scenariu in care 2 jucatori sunt capabili sa concureze unul impotriva altuia, iar strategiile alese de un jucator il vor afecta strategiile celuilalt. Jocurile bazate pe sansa nu sunt luate in considerare, deoarece nu exista libertate de alegere, prin urmare nu exista nici o strategie implicata. Iar jocurile cu un singur jucator, cum ar fi solitaire, nu sunt considerate a fi jocuri, deoarece nu necesita interactiunea strategica a 2 jucatori.

-jucatorii trebuie sa cunoasca fiecare miscare posibila a adversarului, dar si toate finalitatile posibile. Toti jucatorii au preferinte legate de anumite finalitati si fiecare jucator cunoaste preferintele celorlalti.

-finalitatile sunt definite de gradul de utilitate sau de valoare, pe care un jucator poate sa le deriveze din ele. Daca preferi sa ajungi in punctul A in loc sa ajungi in punctul B, atunci punctul A are un grad de utilitate mai mare. Dar stiind ca tu pretuiesti punctul A in locul lui B, si B in locul lui C, un alt jucator poate anticipa actiunile tale si va planui strategii care sa tina cont de ele.

-toti jucatorii se comporta rational. Chiar si actiunile aparent irationale sunt rationale din anumite puncte de vedere. De exemplu, daca ar fi sa joci 2 partide de biliard, nu ai pierde intentionat banii din prima partida decat daca crezi ca asa il impulsionezi pe oponent sa parieze mai mult bani in a doua partida – un joc in care anticipezi victoria.

Exista diferente importante intre jocurile la care participi doar odata si cele la care participi de mai multe ori.

-daca nici un jucator nu reuseste sa ajunga la finalitatea dorita, atunci jocul ajunge intr-un impas numit Echilibrul Nash. Mai pe scurt, jucatorii isi pastreaza strategiile curente (chiar daca nu sunt cele dorite) deoarece schimbarea lor nu va realiza nimic.

In jocurile unice, cum e dilema prizonierilor, miza e ridicata dar nu exista si alte repercusiuni. Atunci cand jucam un joc cu mai multe ture, aplicarea unei strategii unice nu e cea mai buna idee. Ambii jucatori pot obtine rezultate mai bune daca in unele situatii colaboreaza, iar in altele nu. Acest lucru ajuta la aproximarea strategiilor celuilalt jucator si se numeste strategie mixta. Sa zicem ca dilema prizonierilor e doar un scenariu dintr-o serie de jocuri repetate ce vor urma. Un jucator alege sa nu marturiseasca, in loc sa profite de acest lucru, cel de al doilea jucator refuza si el sa marturiseasca, ducand la cea mai buna finalitate mutuala. Strategiile aplicate in jocurile repetate iau in considerare reputatia adversarului si cooperarile viitoare.

Teoria Jocurilor si Razboiul Rece

La inceputul Razboiului Rece, administratia Eisenhower considera armamentul nuclear ca fiind doar o alta arma din arsenal. Thomas Schelling i-a convins ca armele nucleare erau bune pentru descurajare. Si a mai propus ca America sa aiba o varietate de raspunsuri tactice cu care sa faca fata la orice situatie posibila.

Un echilibru a fost astfel creat, in cadrul caruia nici o natiune nu putea fi avantajata in cazul unui atac nuclear – represaliile urmau sa fie devastatoare. Acestea erau cunoscute sub numele de M.A.D. (Mutual Assured Destruction). Acest echilibru necesita cunoasterea punctelor forte si slabe a fiecarei natiuni. Ca si in cazul dilemei prizonierilor, ambii jucatori trebuie sa presupuna ca celalalt e preocupat doar de propriul sau interes, prin urmare trebuiau sa isi limiteze riscul adoptand o strategie dominanta.

Daca una dintre natiuni modifica echilibrul puterii (prin construirea unui scut anti-racheta, de exemplu), ar duce acest lucru la o gafa strategica si declansarea unui razboi nuclear? Incercand sa evite asemenea dezechilibre, guvernele au apelat la teoriticienii jocurilor. Atunci cand o natiune construia silozuri de rachete, cealalta le tintea. U.R.S.S.-ul si S.U.A. au construit silozuri de rachete in toata lumea, lucru care a dus la marirea numarului de rachete din primul atac pentru a reduce cat mai mult capacitatea de atac a celuilalt. In cele din urma armele nucleare au ajuns sa fie instalate pe avioane ce zburau non-stop si pe submarine, pentru a preveni situatia in care silozurile ar fi fost distruse.

Atmosfera era foarte incordata si exista o teama generala fata de orice neintelegere care ar duce la dezastru. In mijlocul acestei situatii, chiar si o miscare defensiva, cum ar fi construirea unui adapost anti-atomic, putea duce la declansarea razboiului. Deoare construirea lor insemna anticiparea unor probleme. De ce sa anticipezi probleme, daca nu cumva tu esti cel care le va cauza?

Nici un calcul rational sau matematic nu dadea sens lansarii armelor nucleare dupa ce o natiune a primit o lovitura semnificativa. Care ar mai fi rostul? Distrugerea lumii de dragul razbunarii? Iar daca razbunarea nu descurajeaza, ce impiedica atunci o natiune sa lanseze primul atac? Pentru a contracara amenintarea primul atac, liderii americani si sovietici foloseau uneori strategia nebunului sau imprastiau zvonuri cum ca ar fi instabili mental sau orbiti de ura pentru a forta adversarul sa tina garda sus. Controlul armamentului si negocierele de dezarmare erau doar jocuri repetate ce permiteau ambelor parti sa rasplateasca cooperarea si sa pedepseasca lipsa ei. Prin intermediul intalnirilor repetate si a cresterii comunicarii dintre ei, increderea si cooperarea au dus la relaxarea atmosferei. Un rol important l-au avut si resursele necesare mentinerii unei capacitati nucleare in continua crestere.

Din fericire, nici una dintre natiunile implicate nu au fost dispuse sa joace scenariul final in care finalitatea preferata implica o victorie ce era sarbatorita in subteran de cativa supravietuitori.

Jocul Ultimatumului

Teoria jocurilor e utila in studiile sociologice. Exista jocuri diferite in baza carora se pot analiza tiparele comportamentale.

Doi jucatori incep fara nimic. Jucatorul 1 primeste 10 dolari si i se spune ca ii poate pastra daca da o parte si Jucatorului 2, care poate accepta sau respinge oferta. Daca Jucatorul 2 accepta oferta Jucatorului 1, atunci ambii pot castiga ceva. Daca Jucatorul 2 respinge oferta, atunci Jucatorul 1 ramane fara bani.

Initial se credea ca Jucatorul 1 va oferi sume mici (1-2 dolari) si ca Jucatorul 2 va accepta, din moment ce e mai bine decat nimic. Dar studiile au aratat ca uneori Jucatorul 2 respinge oferta. S-ar putea crede ca acesta e insultat de valoarea ofertei. Atunci cand accepta cei 2 dolari, castigul poate fi privit ca fiind net sau relativ. Dintr-un anumit punct de vedere, 2 dolari sunt mai buni decat nimic. Dar daca castigul net este de 2 dolari, asta inseamna ca ai avansat de la punctul de a avea ceva de valoare egala cu Jucatorul 1 (adica nimic) la punctul in care esti clar dezavantajat si in care Jucatorul 1 are cu 6 dolari mai mult decat tine. In functie de situatie, poate fi avantajos sa refuzi oferta daca nu e impartita egal.

Prin studierea motivatiilor celor 2 jucatori putem afla ce ii motiveaza cu adevarat pe oameni. Teoria economica sustine ca detinerea unei sume cat mai mari de bani e cel mai important lucru. Banii sunt importanti pentru supravietuire, dar folosirea lor reflecta si alte valori.

Sursa: https://en.wikipedia.org/wiki/Game_theory

Bogdan

Per aspera ad astra