Geri susitarimai daro gerus draugus | mokslinės ataskaitos

Geri susitarimai daro gerus draugus | mokslinės ataskaitos

Anonim

Dalykai

  • Elgesio metodai
  • Biologinė fizika
  • Evoliucijos teorija
  • Socialinė evoliucija

Anotacija

Pradėjus naują bendradarbiavimą, iš anksto verta išsiaiškinti, kaip stipriai jūsų partneris įsipareigoja siekti bendro tikslo ir kokios kompensacijos galima tikėtis pažeidus bendradarbiavimą. Įvairūs biologinio ir socialinio konteksto pavyzdžiai parodė, kad yra sudėtinga iš anksto susitarti dėl užpakalinių kompensacijų. Tai rodo, kad tokį elgesį galėjo suformuoti natūrali atranka. Čia analizuojame tokios įsipareigojimo strategijos evoliucinę svarbą ir susiejame ją su brangia bausmių strategija, kai nėra sudaromi išankstiniai susitarimai. Mes parodome, kad kai įsipareigojimo susitarimo sudarymo išlaidos yra tam tikrose ribose, galima pasiekti reikšmingą bendradarbiavimo lygį. Be to, šie lygiai yra didesni nei tas, kuris gaunamas už paprastas brangias bausmes, ypač kai reikalaujama pasidalyti susitarimo išlaidas. Mes ne tik parodome, kad geri susitarimai padaro gerus draugus, o susitarimai, pagrįsti dalintosiomis išlaidomis, leidžia pasiekti dar geresnių rezultatų.

Įvadas

Įprasta išmintis rodo, kad bendradarbiavimo sąveika turi didesnę galimybę išgyventi, kai visi dalyviai supranta lūkesčius ir galimas savo veiksmų pasekmes. Tada visos šalys aiškiai žino, ko įsipareigoja, ir gali atsisakyti tokio įsipareigojimo, kai tik pateikiamas pasiūlymas. Klasikinis tokio susitarimo pavyzdys yra santuoka 1, 2 . Tokiu atveju abipusis įsipareigojimas užtikrina tam tikrą santykių stabilumą, sumažina išnaudojimo baimę ir užtikrina saugumą nuo galimų kataklizmų. Akivaizdu, kad tokie susitarimai gali būti naudingi daugelyje situacijų, kurios neapsiriboja oficialių ir aiškių sutarčių rūšimis, kaip yra santuokos atveju. Įsipareigojimai gali būti išdėstyti net labiau netiesiogiai, kaip tai daroma tos pačios religijos 3, 4 nariams, arba tam tikru įmanomu signalizacijos mechanizmu, kaip kad primatai naudoja signalizaciją, kad sinchronizuotų lūkesčius, ir įsipareigojimų nevykdymo pasekmes. įsipareigojimas skirtingose ​​įmonėse 5 .

Čia analitiškai ir skaitmeniškai tiriame, ar brangios įsipareigojimų strategijos, kuriose žaidėjai siūlo, inicijuoja ir pagerbia susitarimą, yra perspektyvi bendradarbiavimo elgesio evoliucijos strategija, modeliuojant simetrišką, porų ir nesikartojantį kalinio dilemos (PD) žaidimą. socialinė dilema. Be tradicinių bendradarbiavimo (C) ir trūkumų (D) variantų, žaidėjas gali pasiūlyti savo bendražygiui įsipareigoti bendradarbiauti prieš žaidžiant PD žaidimą, norėdamas sumokėti asmenines išlaidas

Image

kad būtų patikima. Jei žaidėjas priima susitarimą ir taip pat vaidina C, jie abu gauna atlygį už abipusį bendradarbiavimą. Tačiau jei vienas iš žaidėjų žaidžia D, tada jis arba ji pasiūlymo teikėjui turės kompensuoti asmenine kaina ( δ ). Galiausiai, kai vienas iš žaidėjų nepriima susitarimo, žaidimas nėra žaidžiamas, todėl abu negauna išmokų.

Nors su susitarimu siejamos tam tikros bausmės, kompensacijos partneriui sąvoka, kai nesilaikoma sudaryto susitarimo, nėra visiškai lygiavertė bendrajai bausmės sampratai, kuri buvo išnagrinėta Evoliucinio žaidimo teorijoje 6, 7, 8, 9, 10, 11, 12, 13 iki šiol. Dabartiniame darbe abi šalys žino prieštaravimus prieš pradėdamos sąveiką: asmuo, kuris sutinka įsipareigoti, iš anksto žino, ko tikėtis iš asmens, kuris siūlo įsipareigojimą, ir kas bus, jei jis netinkamai elgsis. Dar daugiau, bendras žaidėjas turi galimybę nepriimti tokio susitarimo ir toliau bendrauti be išankstinio įsipareigojimo su kitais žaidėjais ir be galimo įsipareigojimo pasiūlos dalyvių poveikio. Dabartinėje literatūroje bausmė (už kainą arba be jos) skiriama už „blogą“ elgesį, kurio galima išvengti tik nedalyvaujant žaidime iš viso 9, 12, 14 . Iš esmės šis darbas skiriasi nuo bausmių už bendraamžius ir baseinus 9, 12 tuo, kad pastarasis įsipareigoja kitiems žaidėjams, ty pažeidėjai visada bus baudžiami, net jei jie nenorėjo žaisti su baudėjais. Be to, į modelį neįtraukta kompensacija, kuri atlygina pasiūlymo teikėjui, kai pažeidžiamas jos priimtas susitarimas, priešingai nei mūsų pačių modelis. Be to, kadangi susitarimo sukūrimas aiškiai vyksta dabartiniame darbe, žaidėjai gali elgtis sąlygiškai (net negalvodami apie ankstesnę tiesioginę ar netiesioginę sąveiką), ir tai nėra svarstoma vykstančiuose evoliuciniuose kolegų ir baseinų bausmių modeliuose. Tačiau gana tikėtina bendradarbiauti tik tada, kai kažkas prašo įsipareigoti ir kitaip suklysti, kad būtų išvengta išnaudojimo, net ir vienkartine sąveika.

Nepaisant to, tiek bausmės, tiek įsipareigojimo strategijos kainuoja

Image
tai gali būti siejama su priemonėmis nubausti kitą žaidėją, kaip tai daroma dėl ankstesnės strategijos, arba su susitarimo sudarymu pastarosios strategijos atveju. Daugybė įrodymų rodo, kad žmonės nori sumokėti asmenines išlaidas, norėdami nubausti tuos, kurie laisvai pasirenka savo ar kitų elgesį. Keletas teorinių ir eksperimentinių tyrimų rodo, kad tokios brangios bausmės (CP) gali palaikyti bendradarbiavimą net žaidimuose be pakartotinių sąveikų 6, 7, 8, 9, 11, 12, 14, 15, 16, 17, 18, 19, 20 . Tačiau taip pat yra įrodymų, kad CP gali būti nenaudingas bendradarbiavimui arba jo negali išpopuliarėti populiacijose, žaidžiančiose vienkartinius PD žaidimus ar viešųjų gėrybių žaidimus, net kai (pvz.) Tiesioginis abipusiškumas 21, 22, 23, netiesioginis abipusiškumas 24, tinklinės populiacijos Svarstoma galimybė dalyvauti 25 arba pasirinktinai 26 . Iš esmės šis darbas pateikia svarbų naujovišką požiūrį į kooperatinio elgesio atsiradimą socialinėse dilemose, kuriame aiškiai (ir nepriklausomai) atsižvelgiama tiek į atsidavimo, tiek į bausmės strategijas.

Viena svarbi naujausių eksperimentų išvada yra ta, kad CP gali palaikyti bendradarbiavimą tik tuo atveju, jei elgesys yra rentabilus, ty mažos išlaidos

Image
už nubaustąjį ir pakankamai reikšmingą smūgį ( δ ) nubaustajam 16, 17, 27, 28 . Kaip vėliau parodysime analitiškai PD žaidimui, šis santykis gali tapti gana per didelis, jei norima (beveik) visapusiškai bendradarbiauti CP (taip pat žr. Papildomą informaciją). Taigi gali būti įdomu: ar išankstinis susitarimas dėl kompensacijos ir dėl šios kompensacijos poveikio žaidėjui, kuris neįvykdė įsipareigojimų, leistų pasiekti geresnę pusiausvyrą tarp susitarimo išlaidų ir kompensacijos? Gali būti, kad didelė kompensacija atbaidys nebendradarbiaujančius žaidėjus ir paskatins kooperatyvus suvienyti jėgas. Tačiau kadangi pats savaime jos organizavimas kainuoja brangiai, tie, kurie nesinaudoja kitų pastangomis sudaryti sutartį, gali būti geresni nei patys pasiūlymo teikėjai.

Apibendrinant, pagrindiniai mūsų uždaviniai yra šie klausimai: ar tokių įsipareigojimų siūlymas ir jų laikymasis yra perspektyvi bendradarbiavimo elgesio raidos strategija ir kaip toks įsipareigojimo susitarimas turėtų būti sudarytas siekiant aukšto bendradarbiavimo lygio. Tai yra, ar turint omenyje žaidimą ir galimas įsipareigojimo organizavimo išlaidas, ar apskritai verta jį organizuoti? Jei taip, kokia kompensacija turėtų būti susieta su pasiūlymu dėl įsipareigojimo? Kad pasiūlymo teikėjai galėtų dominuoti, jie turi pagrįsti įsipareigojimo organizavimo išlaidas, kad laimėtų prieš laisvus motociklininkus ir tradicinius brokerius, taip pat už tai, kad suklastojusiems asmenims užtraukia pakankamai griežtas baudas. Be to, mes nagrinėjame, kaip šis ankstesnio abipusio įsipareigojimo modelis skiriasi nuo CP.

Rezultatai

Įsipareigojimo strategijos ir nemokami motociklininkai

Mes manome, kad šalia tradicinių grynojo kooperatyvo (C) ir trūkumų šalinimo (D) strategijų, įsipareigojimą siūlanti (COMP) strategija, siūlanti įsipareigojimą kitiems, yra pasirengusi apmokėti išlaidas

Image

sudaryti sandorį (jei reikia) ir vaidina C, kai oponentas sutinka. Kai susitarimas nepriimamas, tokio tipo asmenys atsisako žaisti žaidimą. Tačiau kadangi toks įsipareigojimo pasiūlymas suteikia informacijos apie didelę žaidėjo paskatą bendradarbiauti, kiti žaidėjai gali naudoti šią informaciją norėdami įgyti pranašumą prieš jį ar ją. Mes apžvelgiame šias galimybes, atsižvelgdami į dvi papildomas strategijas, kurios gali būti laikomos dviejų rūšių antrosios eilės nemokamais motociklais:

  1. Suklastotieji (FAKE), kurie priima pasiūlymą dėl įsipareigojimo, tačiau žaisdami žaidimą turi trūkumų, darant prielaidą, kad jie gali išnaudoti COMP žaidėjus nepatirdami rimtų padarinių.

  2. Nemokami motociklininkai (NEMOKAMAI), kurie neklysta, nebent jiems būtų siūlomas įsipareigojimas, kuriuos jie vėliau priima ir bendradarbiauja po PD žaidimo. Kitaip tariant, šie žaidėjai nori bendradarbiauti, kai yra siūlomas įsipareigojimas, tačiau nėra pasirengę apmokėti jo įsteigimo išlaidų.

Kiekvienas populiacijos asmuo žaisdamas PD žaidimą laikysis vienos iš šių penkių strategijų, kai žaidimas tradiciškai apibūdinamas pagal šią parametrizuotą išmokėjimo matricą:

Image

Kai bendravimas užmegztas ir abu žaidėjai nusprendė žaisti C arba D (su arba be įsipareigojimų), abu žaidėjai gauna tą patį atlygį R (bausmė P ) už abipusį bendradarbiavimą (abipusis pralaimėjimas). Vienašalis bendradarbiavimas suteikia čiulptukui S išmoką kooperatyvo žaidėjui ir pagundą sutriuškinti T už pralaimėjusįjį. Apmokėjimo matrica atitinka nuostatas, susijusias su kalinio dilema, kai parametrai atitinka užsakymą, T > R > P > S 29 . Didelė literatūros dalis parodė, kad norint plėtoti bendradarbiavimą tokiose socialinėse dilemose, reikia įdiegti tam tikrus mechanizmus, tokius kaip sąveikos pasikartojimas, reputacijos poveikis, giminaičių ir grupių santykiai ar struktūruotos populiacijos. 30, 31 . Dabartiniame tyrime daugiausia dėmesio skiriama strateginiam elgesiui siūlant įsipareigojimus, kol kas ignoruojant visus kitus mechanizmus.

Kadangi gryniems bendradarbiams (C) visada geriau sekasi prisiimti įsipareigojimus, nei kitaip - kadangi bendradarbiavimas yra jų numatytasis pasirinkimas ir už panaudojimą garantuojama teigiama kompensacija - jie visada sutiks įsipareigoti, kai bus paprašyti. Kita vertus, grynieji defektai (D) niekada nepriims pasiūlymų dėl įsipareigojimų, nes priešingu atveju jie turėtų kompensuoti pasiūlymo teikėjui, todėl jie būtų lygiaverčiai FAKE žaidėjams. Kai du COMP žaidėjai bendraus, tik vienas iš jų turės sumokėti įsipareigojimo nustatymo išlaidas. Kadangi bet kuris iš jų gali atlikti šį veiksmą, jie moka tik pusę laiko. Taigi kiekvienam COMP žaidėjui priteista išmoka vidutiniškai yra

Image
. Galima tai suprasti kaip numanomą išlaidų pasidalijimo formą.

Kartu šios penkios strategijos apibrėžia šią išmokėjimo matricą, fiksuodamos vidutinius pelnus, kuriuos kiekviena strategija gaus, sąveikaudama su viena iš kitų keturių strategijų.

Image
Pirmasis greitas šios matricos tyrimas jau rodo, kad D, FAKE ir NEMOKAMAI žaidėjai tarpusavyje yra neutralūs, nes visi jie gauna P už porų tarpusavio sąveiką. Be to, C bus naudingas COMP žaidėjams, nes jie neprivalo mokėti įsipareigojimo išlaidų.

Atminkite, kad atsižvelgiant į dabartinę nuostatą, yra ir kitų galimų strategijų, pavyzdžiui, tokių, kurios siūlo įsipareigojimą, tačiau nebendradarbiauja ar nepriima kitų pasiūlytų įsipareigojimų. Šiuo metu šios strategijos yra praleistos siekiant paaiškinti jas, taip pat todėl, kad jos bus pašalintos, nes jose dominuoja bent viena iš dabartinio modelio strategijų (žr. Papildomą informaciją).

Įsipareigojimų teikėjų gyvybingumo apribojimai

Ar COMP yra perspektyvi strategija, priklauso nuo įsipareigojimo parametrų, ty nuo susitarimo sudarymo išlaidų

Image

ir kompensacijos kaina ( δ ). Šį gyvybingumą galima nustatyti analitiškai, išskaičiavus, kokiomis sąlygomis COMP dominuoja rizika D, FAKE ir NEMOKAMŲ žaidėjų atžvilgiu (žr. Metodus). Naudojant lygtį (5), šios sąlygos, susijusios su įsipareigojimo parametrais

Image
ir δ galima gauti dėl COMP dominavimo bet kurioje iš trijų strategijų D, FAKE ir NEMOKAMAI:
Image
Kad šios sąlygos būtų suprantamos, mes sumažiname parametrizuotą PD žaidimą į „Donorystės žaidimą“ 31, kur T = b , R = b - c , P = 0, S = - c ir b > c , o b ir c rodo naudą. ir atitinkamai bendradarbiavimo išlaidos. Todėl ankstesnės sąlygos yra supaprastintos iki:
Image
Taigi, kai abu
Image
ir δ atitinka sąlygas, išvardytas 3 lygtyje, tada COMP yra dominuojanti rizika D, FAKE ir NEMOKAMAI. Abi sąlygos gali būti suprantamos intuityviai: norint sėkmingai įsipareigoti, COMP žaidėjas nori užtikrinti pakankamą naudą sudarant sandorį (maždaug
Image
) ir kad kai žaidėja nevykdo savo įsipareigojimų, ji yra pakankamai kompensuota (maždaug
Image
) už tai, kad ji pagerbė savo sandorio pusę. Kai viena iš šių sąlygų nėra įvykdyta, COMP žaidėją gali išnaudoti (D ir NEMOKAMAI žaidėjai, jei yra pirmoji sąlyga, ir FAKE žaidėjai, jei yra antroji sąlyga), kuris lemia bendrą gyventojų elgesį didėjant defektų lygiui.

Susitarimas yra toks pat geras, kaip ir jo investicinės išlaidos

Šie pastebėjimai tampa dar aiškesni, kai atsižvelgiama į skirtingų strategijų fiksavimo tikimybes ir nejudamąjį paskirstymą (žr. Metodus), kaip parodyta 1 paveiksle. Kai įsipareigojimo organizavimo išlaidos

Image

yra pakankamai mažas, populiacija didžiąją laiko dalį praleidžia vienalytėje būsenoje su COMP žaidėjais (taip pat žr. 2a ir 2b paveikslus), nepaisant pradinės populiacijos sudėties. Vis dėlto, kaip galima suprasti iš 1 paveikslo, atsiranda ciklai nuo C iki defektų strategijų (NEMOKAMA, D ir FAKE) ir atgal į COMP strategus. Nepaisant to, anksčiau minėtomis sąlygomis COMP išlieka dominuojančia strategija ir taip užtikrina aukštą bendradarbiavimo lygį.

Image

Gyventojai didžiąją laiko dalį praleidžia vienalytėje COMP būsenoje. Juodos rodyklės nurodo naudingus perėjimus, o punktyrinės linijos reiškia neutralų perėjimą. Atkreipkite dėmesį į ciklinį modelį, pradedant kooperatyvu ir baigiant įsipareigojimų strategijomis ir atgal. Parametrai: T = 2, R = 1, P = 0, S = −1; δ = 4;

Image
; imitacijos stiprumas, β = 0, 1; populiacijos dydis, N = 100; ρ N = 1 / N žymi neutralios fiksacijos tikimybę.

Visas dydis

Image

a) Penkių strategijų dažnis kaip funkcijos

Image
. Gyventojai didžiąją laiko dalį praleidžia homogeniškoje COMP būsenoje, kad būtų pakankamai maži
Image
. Įsipareigojimų laisvieji automobiliai (NEMOKAMAI) dominuos vieną kartą
Image
peržengia ribą
Image
(žr. brūkšniuotą vertikalią mėlyną liniją), po kurio eina D žaidėjai. b) COMP dažnis kaip funkcija
Image
ir δ . COMP, C, D, FAKE ir NEMOKAMŲ asmenų populiacijoje plačiam diapazonui
Image
ir δ , populiacija didžiąją laiko dalį praleidžia vienalytėje COMP būsenoje. Apskritai, kuo mažesnės siūlomo įsipareigojimo išlaidos,
Image
, ir kuo didesnė kompensacija už pažeisto įsipareigojimo įvykdymą δ , tuo didesnis COMP dažnis. Tačiau už bet kurį duotą
Image
, yra δ slenkstis, kai padidinus jį, galima pastebėti tik labai nedidelį COMP frakcijos pagerėjimą. c) Tai gali būti pagerinta, jei įsipareigojimų teikėjai paprašo kitų dalyvių pasidalinti įsipareigojimų organizavimo išlaidas (COMS), nors visos pasiūlyti įsipareigojimų strategijos gali būti atleidžiamos nuo žaidimo, kai jos paprašomos pasidalyti tas išlaidas (taip pat žr. d). COMP yra šiek tiek geresnis nei COMS, jei įsipareigojimas yra beveik nemokamas.
Image
) (taip pat žr. S3c ir S3d paveikslus), nes kitos strategijos vengia papildomų išlaidų dalijimuisi. d) bendras įsipareigojimų strategijų dažnis, COMS ir COMP, kaip funkcija
Image
ir δ . Parametrai: T = 2, R = 1, P = 0, S = −1; β = 0, 1; N = 100; A ir c plokštėse δ = 4.

Visas dydis

Kaip

Image
artėja prie 3 lygtyje paminėtos ribos, žr. 2a paveikslą, NEMOKAMI žaidėjai, o po jų D žaidėjų pradeda augti. Kartą
Image
juda peržengus ribą, šie ydingi tipai pradeda dominuoti populiacijoje. NEMOKAMI žaidėjai gauna didesnę naudą nei D žaidėjai dėl padidėjusių įsipareigojimų išlaidų: jie ir toliau gauna atlygį už bendradarbiavimą su COMP žaidėjais ir nepatiria brangių išlaidų, susijusių su susitarimo sudarymu. Populiacija, kurioje yra tik FAKE ar C žaidėjai, atsiranda labai retai, nes C strategus visada išnaudoja trys trūkumų strategijos, o FAKE žaidėjai kenčia nuo kompensacijos, kurią jiems reikia mokėti COMP žaidėjams. Be to, žaidimo svarba, atsižvelgiant į naudą, gautą iš bendradarbiavimo ( b – c ), lems, kokia susitarimo kaina,
Image
, yra pateisinamas žaidimui (žr. Palaikomoji informacija, S3 pav.).

Kaip parodyta 2b paveiksle, žemai

Image
, beveik vienodos COMP populiacijos beveik visada pasiekiamos pakankamai dideliam δ . Dar įdomiau, kad šiam aukštam dažniui nepaveikiami kompensacijos δ pokyčiai, kai pasiekiama tam tikra riba. Atitinkamai, susitarimo išlaidos yra pagrindinis parametras abipusio bendradarbiavimo atsiradimui ir išlikimui dabartiniame PD žaidimo pratęsime. Kaip galima pastebėti papildomoje informacijoje, tokio poveikio nėra, jei bausmė būtų brangi (CP). Tokiu atveju efektyvi bausmė δ didėja kartu su bausmės kaštais (žr. S2 paveikslą). Be to, norint pasiekti tokį patį bendradarbiavimo lygį kaip ir įsipareigojimų modelyje, už tokią pat mažą kainą reikia žymiai griežtesnės bausmės ( δ ≈ 14) (
Image
). Taigi įsipareigojimas efektyviai sumažina sąnaudų ir poveikio santykį. Tačiau didesniems
Image
(ir taip pat didesnis δ ), CP yra veiksmingesnis nei COMP, nes pastaruoju metu dominuoja laisvo elgesio mėgėjai (NEMOKAMAI) (žr. 1 paveikslą), o šie žaidėjai yra veiksmingai nubausti CP. Vis dėlto, kaip bus parodyta kitame skyriuje, šią problemą galima žymiai išspręsti pasidalijant susitarimo sudarymo išlaidas.

Aiškiai pasidalijus išlaidas, gaunami palankesni rezultatai

Kaip minėta anksčiau, kai du COMP žaidėjai sąveikauja, kiekvienas iš jų gauna vidutiniškai

Image

, nes abu turi 50% galimybę sumokėti už susitarimo sudarymą. Netiesiogiai šis rezultatas reiškia išlaidų pasidalijimą tarp šių žaidėjų. Tačiau kiti žaidėjai (C, NEMOKAMAI ir FAKE) nėra tokie, kokie bus, todėl COMP strategui reikia surinkti visą sumą.

Image
. Tarkime, kad COMP asmuo gali pasiūlyti sandorį taip pat paprašyti savo bendro žaidėjo pasidalyti susitarimo kainą, kurią mes vadinsime įsipareigojimo pasidalijimu arba COMS strategu. Taigi dabar išlaidų pasidalinimas tampa aiškus. Susidūrusi su tokiu asmeniu, prieš žaidimą žaidėja turi du pasirinkimus: ji turi nuspręsti priimti ar atmesti pasiūlymą dėl įsipareigojimo, o sutikusi turi nuspręsti, ar ji nori pasidalyti išlaidas, ar ne.

Darant prielaidą, kad visos ankstesnės įsipareigojimų prisiėmimo strategijos, ty C, FAKE ir NEMOKAMOS, nesutinka pasidalyti išlaidų, reikia įdiegti tris papildomas strategijas, kurios yra pasirengusios pasidalyti išlaidas, kai tik tai bus pasiūlyta. Mes šias strategijas vadinsime atitinkamai CS, FAKS ir FRES (žr. Papildomą informaciją apie išmokėjimo matricą).

Kaip buvo daroma COMP asmenims anksčiau (žr. Įsipareigojimų teikėjų gyvybingumo apribojimus), gali būti nustatomos sąlygos, kurioms esant COMS strategai dominuoja rizikuodami visais defektais ir laisvaisiais automobiliais (ty D, FAKE, FAKS, FREE ir FRES). :

Image
Palyginus su 3 lygtimi, galima pastebėti, kad COMS gyvybingumo sąlygos yra mažiau ribojančios nei tos, kurios nustatytos COMP: Viena vertus, didesnės įrengimo išlaidos
Image
(iki 2 ( b – c ) vietoj 2 ( b – c ) / 3) leidžiama, kad įsipareigojimų teikėjai vis dar dominuotų rizika. Kita vertus, norint sulaukti asmenų, žaidžiančių FAKE ir FAKS strategijose, reikia mažesnės kompensacijos (
Image
palyginus su
Image
). Tiek 2C, tiek 2d paveikslas paaiškina šį pastebėjimą toliau, parodydami, kad COMS yra perspektyvi evoliucijos strategija platesniam diapazonui.
Image
. Net ir didesnėms sąnaudoms dabar dažnas įsipareigojimų teikėjų (tiek COMS, tiek COMP) pasiūla padidėja δ , tuo tarpu paprašydamas savo partnerių pasidalinti įsipareigojimų organizavimo išlaidas. Tokiu būdu nemokami motociklininkai gali pasidalyti išlaidas (FRES ir FAKS) arba pasirinkti nežaisti (NEMOKAMAI ir FAKE), taip išspręsdami nemokamo važiavimo įsipareigojimą problemą.

Brangių bausmių literatūroje baseino bausmės yra veiksmingas sprendimas, susijęs su antros eilės nemokamu jodinėjimu, kai bendradarbiavimas gali būti pakirstas, jei tie, kurie prisideda prie bendrų pastangų, bet nebaudžia skriaudėjų, nėra patys nubausti 12, 14 . Kadangi išlaidos pasidalijamos tarp baseinų baudėjų, jos gali padaryti didesnį poveikį nubaustiesiems nei tai, ką jie gali padaryti patys. Tačiau baseinų baudėjų populiacija turi mažesnį vidutinį atlyginimą nei kolegų baudėjų, nes baseinų baudėjai moka iš anksto, o pastarieji tai daro reaktyviai, tik tada, kai susiduria su netinkamu veiksmu. T. y., „Efektyvumu prekiaujama siekiant stabilumo“ 12 .

Kitaip tariant, mūsų įsipareigojimų modelyje išlaidų pasidalijimas nemažina efektyvumo. Tai prilygsta „ dosnumui, kuriuo prekiaujama siekiant stabilumo “, darant prielaidą, kad COMP laikomas dosnesniu nei COMS, nes jis savanoriškai apmoka visas susitarimo išlaidas, tikėdamasis pritraukti daugiau (neklastingų) dalyvių. Mes manome, kad COMP gali padaryti geriau, jei atsižvelgiama į reputacijos poveikį, priskirdama aukštesnę COMP reputaciją nei COMS. Priešingu atveju geriau siūlyti išlaidų pasidalijimo sandorius.

Diskusija

Šiame dokumente, kalbant apie vienkartinę kalinio dilemą, parodyta, kad net nesant pakartotinių sąveikų, reputacijos efektų, tinklo abipusiškumo, taip pat grupės ir giminaičių atrankos, prašome įsipareigoti ir išsiaiškinti pasekmes susitarimo nesilaikymas yra veiksmingas mechanizmas, skatinantis bendradarbiavimo atsiradimą. Jei įsipareigojimą galima susitarti taip, kad jo išlaidos būtų pagrįstos atsižvelgiant į bendradarbiavimo naudą (apytiksliai iki abipusio bendradarbiavimo išmokėjimo), skiriant pakankamą kompensaciją (apytiksliai lygioms šioms ir bendradarbiavimo sąnaudoms), įsipareigojimų teikėjai perpranta ir dominuoja tarp gyventojų. Viena vertus, tokie įsipareigojimų teikėjai gali atsikratyti asmenų, kurie sutinka bendradarbiauti, tačiau elgiasi skirtingai (netikri vykdytojai), taip pat gali vengti sąveikos su tradiciniais trūkumais (D), net neįsitikinę, kad nebus išnaudoti. Kita vertus, jie gali išlaikyti pakankamą pranašumą prieš tuos asmenis, kurie bendradarbiauja tik tada, kai yra paprašomi įsipareigoti, nes įsipareigojimo pasiūlymas bendradarbiaus su žaidėjais panašiais, o pastarieji turi trūkumų. Šie rezultatai rodo, kad mūsų specializuotus įsipareigojimų gebėjimus galėjo formuoti natūrali atranka 1, 32, 33, 34, 35 kartu su sudėtingų signalizacijos sistemų raida ir susijusiomis reikšmėmis 36, 37 .

Kai padidėja įsipareigojimų organizavimo išlaidos ir jos viršija abi anksčiau minėtas sąlygas, šis pranašumas išnyksta, o įsipareigojimų teikėjus išnaudoja laisvieji automobiliai, todėl bendradarbiavimas išnyksta. Mes parodėme, kad šią nemokamo pasivažinėjimo problemą galima išspręsti aiškiai reikalaujant pasidalyti susitarimo išlaidas. Net tada, kai laisvieji automobiliai vis dar gali atsisakyti dalintis, dosnumu prekiaujama siekiant stabilumo . Tiksliau tariant, kai yra galimybė pasidalyti išlaidas, palaikomas bendradarbiavimas kur kas platesniam parametrų diapazonui. Taigi mūsų modelis rodo, kad visuomenėse, turinčiose tinkamą paramą, kad būtų galima susitarti dėl brangių įsipareigojimų ir spręsti kompensacinius konfliktus, kylančius iš ankstesnių įsipareigojimų nesilaikymo, bendradarbiavimas tampa plačiai paplitęs.

Tačiau, kas nutinka, kai visuomenė nėra pajėgi išspręsti konflikto? Kitaip tariant, kas, jei FAKE žaidėjas kartais gali atsikratyti apgaudinėjimo? Tokiu atveju COMP (arba COMS) grotuvas gautų vidutinę kompensaciją, mažesnę už δ , pavyzdžiui, proporcingą kompensacijos gavimo tikimybei p , ty p × δ . Vėlgi atsižvelgiant į 3 (arba 4) lygtyje nurodytas sąlygas, COMP (arba COMS) išlieka gyvybinga tol, kol pakoreguota kompensacija atitinka šių lygčių numatytus apribojimus.

Mes taip pat išryškinome skirtumus tarp brangaus įsipareigojimo ir brangios bausmės sąvokų, kur pastaroji buvo gausiai aprašyta žaidimų teorinėje literatūroje 6, 8, 9, 10, 11, 12, 13 . Jei susitarimo išlaidos neperžengs ribų, strategijos, pagrįstos išankstiniu įsipareigojimu, paskatins daug aukštesnį bendradarbiavimo lygį nei tas, kuris gaunamas atliekant brangias bausmes. Be to, kadangi bausmė yra vienpusis sprendimas, gali išsivystyti antisocialinės bausmės, ty bausmės, paskirtos „geriems“ žaidėjams, įskaitant bendradarbius ir altruistinius bausmes, ir taip trukdyti bendradarbiauti 18, 26 . Įsipareigojimai nelemia tokio antisocialinio elgesio: tik už sutikimą įsipareigoti gali būti nubaustas už jų netinkamą elgesį. Aišku, net jei bendradarbiavimas, paremtas įsipareigojimais, daugeliu atvejų gali duoti žymiai geresnių rezultatų nei tas, kuris grindžiamas brangiomis bausmėmis, tai nereiškia, kad mūsų modelis pakeičia esamus. Jie labiau papildo vienas kitą, todėl reikia papildomų tyrimų, kuriuose būtų išnagrinėta pusiausvyra tarp abiejų mechanizmų, vykstančių bendradarbiaujant.

Čia mes išanalizavome įsipareigojimus vienkartiniame PD žaidime. Akivaizdu, kad, kaip galima spręsti iš kai kurių pavyzdžių, įsipareigojimai gali būti nustatyti ilgesniam laikotarpiui ir jiems gali turėti įtakos reputacija1. Pastarojo atveju gali nuspręsti nutraukti vykdomą įsipareigojimą, kai partneris turi blogą reputaciją. Nagrinėjant pirmąjį, taip pat reikia atsižvelgti į tai, kad įsipareigojimai dažnai vienas kitą paneigia. Taigi būsimas darbas mokantis įsipareigojimų turėtų būti nukreiptas į kartojamus žaidimus kartu su kitais aspektais, tokiais kaip tiesioginis ir netiesioginis abipusiškumas. Atsižvelgiant į šias išplėstines aplinkybes, galimybė atpažinti kitų ketinimus remiantis ankstesne jų sąveika 38, 39, 40, 41, 42 gali leisti asmenims išvengti įsipareigojimų organizavimo išlaidų (skaidriame pasaulyje, kur abipusiai ketinimai yra lengvai atpažįstami, organizuoti brangiai kainuoja). įsipareigojimai nebūtini), ypač kai išlaidos yra didelės 35, 43 . Kitas aktualus klausimas yra tas, ar bendradarbiavimas, kurį sukelia išankstinių įsipareigojimų sistema, gali būti stabilesnis triukšmo (ty klaidų) atveju, pavyzdžiui, gerai žinomoms strategijoms, tokioms kaip „Tit-for-Tat“ ar „Win-Stay-Loose-Shift“ 31 . Šiame kontekste, kaip neseniai parodėme, atsiprašymas vaidins esminį vaidmenį, kad strategija taptų tvirta kovojant su triukšmu 44 .

Trumpai tariant, mūsų darbas rodo, kad tradicinė išmintis ar bendros žinios, teigiančios, kad geri susitarimai daro gerus draugus, yra labai svarbi gairė, kuri, kaip mes parodėme čia, gali būti išplėsta į gerus išlaidų pasidalijimo susitarimus, todėl dar geresni draugai .

Metodai

Rizikoje dominuojančios strategijos

Svarbus analizės kriterijus nustatant tam tikros strategijos gyvybingumą yra tai, ar ji dominuoja rizikoje, palyginti su kitomis strategijomis 30 . Būtent, svarstoma, kuri selekcijos kryptis yra labiau tikėtina: A mutantas, fiksuojantis homogenišką asmenų, žaidžiančių B, populiaciją, arba B, mutantas, fiksuojantis homogeniškoje populiacijoje, žaidžiančioje A. Kai pirmasis yra labiau tikėtinas nei pastarasis, sakoma A. būti dominuojančia rizika prieš B 30, 45, 46, kuris galioja esant bet kokiam atrankos intensyvumui ir esant dideliam N ,

Image

kur π X, Y reiškia asmens išmokėjimą, naudojant strategiją X, gautą sąveikoje su kitu asmeniu, naudojant strategiją Y (kaip nurodyta išmokėjimo matricoje (1)).

Baigtinių populiacijų evoliucijos dinamika

Tiek čia pateiktuose analitiniuose, tiek skaitiniuose rezultatuose naudojami evoliucinių žaidimų teorijos metodai baigtinėms populiacijoms. 31, 47, 48 . Tokiu atveju asmenų atlyginimas parodo jų tinkamumą ar socialinę sėkmę , o evoliucijos dinamiką formuoja socialinis mokymasis 31, 49, 50, kai sėkmingiausius asmenis dažniausiai imituoja kiti. Dabartiniame darbe socialinis mokymasis modeliuojamas naudojant vadinamąją porinio palyginimo taisyklę 51, darant prielaidą, kad individas A, kurio tinkamumas f A , pasirenka kito asmens B, kurio tinkamumas f B, strategiją su tikimybe p , kurią nurodo Fermi funkcija,

Image

. Parametras β parodo „atrankos stiprumą“ arba „atrankos intensyvumą“, ty kaip stipriai individai grindžia savo sprendimą imituoti kūno rengybos palyginimą. Jei β = 0, gauname neutralaus dreifo ribą - imitacijos sprendimas yra atsitiktinis. Didelio β imitacija tampa vis labiau determinuota.

Nesant mutacijų ar tyrinėjimų, galutinės evoliucijos būsenos neišvengiamai yra monomorfinės: pasiekus tokią būseną, jos neįmanoma išvengti imitacijos. Taigi mes darome prielaidą, kad su tam tikra mutacijos tikimybe individas atsitiktinai pereina į kitokią strategiją, neimituodamas kito individo. Atsižvelgiant į mažus mutacijų dažnius, dinamika bus vykdoma daugiausia naudojant dvi populiacijos strategijas, kad elgesio dinamiką būtų galima lengvai apibūdinti Markovo grandine, kurioje kiekviena būsena atspindi monomorfinę populiaciją, o pereinamosios tikimybės yra pateiktas vieno mutanto fiksacijos tikimybe 47, 48, 52 . Gauta Markovo grandinė turi nekintamą pasiskirstymą, kuris apibūdina vidutinį laiką, kurį gyventojai praleidžia kiekvienoje iš šių monomorfinių galinių būsenų.

Tegul N yra populiacijos dydis. Tarkime, kad populiacijoje yra daugiausia dvi strategijos, tarkime, k asmenys, naudojantys strategiją A (0 ≤ k ≤ N ), ir ( N - k ) asmenys, naudojantys strategijas B. Taigi (vidutinis) A, kuris naudojasi A, strategija, ir B gali būti parašyta atitinkamai,

Image
Dabar tikimybė pakeisti asmenų skaičių k naudojant strategiją A ± 1 kiekvienu laiko žingsniu gali būti parašyta kaip 51
Image
Vieno mutanto su strategija A fiksacijos tikimybė ( N - 1) asmenų, vartojusių B, populiacijoje yra 47, 51, 53
Image
Neutralios atrankos riboje (ty β = 0) ρ B, A yra lygus atvirkštiniam gyventojų skaičiaus dydžiui, 1 / N.

Atsižvelgiant į aibę {1,

.

, q } skirtingų strategijų, šios fiksacijos tikimybės lemia pereinamąją matricą

Image
, su T ij, j ≠ i = ρ ji / ( q - 1) ir
Image
, iš Markovo grandinės. Normalizuotas savivektorius, susietas su perkeltos M savitąja verte 1, pateikia stacionarųjį paskirstymą, aprašytą aukščiau 48, 52, 53, apibūdinantį santykinį laiką, kurį gyventojai praleidžia priimdami kiekvieną iš strategijų.

Papildoma informacija

PDF failai

  1. 1.

    Papildoma informacija

    Papildoma informacija

Komentarai

Pateikdami komentarą jūs sutinkate laikytis mūsų taisyklių ir bendruomenės gairių. Jei pastebite ką nors įžeidžiančio ar neatitinkančio mūsų taisyklių ar gairių, pažymėkite, kad tai netinkama.