Mažos grupės ir ilgi prisiminimai skatina bendradarbiavimą mokslinės ataskaitos

Mažos grupės ir ilgi prisiminimai skatina bendradarbiavimą mokslinės ataskaitos

Anonim

Dalykai

  • Evoliucinė ekologija
  • Evoliucijos teorija

Anotacija

Sudėtingas socialinis elgesys yra daugelio iššūkių, su kuriais susiduria evoliucinė biologija, sociologija, ekonomika ir už jos ribų, pagrindas. Evoliucijos biologams dažnai kyla klausimas, kaip besivystančioje sistemoje gali atsirasti ir išlikti grupinis elgesys, pavyzdžiui, kolektyviniai veiksmai ar sprendimų priėmimas, atspindintys praeities patirtį. Evoliucinė žaidimų teorija suteikia pagrindą šiems klausimams įforminti ir leisti juos griežtai studijuoti. Čia mes sukuriame tokią sistemą, skirtą ištirti ilgalaikio kolektyvinio veiksmo, vykstančio daugelio žaidėjų viešųjų gėrybių žaidimuose, raidą, kurioje žaidėjai savavališkai turi ilgus prisiminimus apie ankstesnius žaidimo raundus ir gali savavališkai reaguoti į savo patirtį. Sukuriame atminties strategijų koordinacinę sistemą kartojamuose n- žaidėjų žaidimuose, leidžiančioje apibūdinti visas bendradarbiavimo strategijas, kurios priešinasi bet kokių mutantų strategijų invazijai, ir stabilizuoti kooperatinį elgesį. Mes parodome, kad, ypač kai grupės yra mažos, ilgesnės atminties strategijos palengvina bendradarbiavimą, padidindamos bendradarbiavimo stabilizavimo būdų skaičių. Taip pat tiriame elgesio ir atminties raidą. Mes pastebime, kad net ir tada, kai atmintis kainuoja, dažnai vystosi ilgesnės atminties strategijos, o tai savo ruožtu skatina bendradarbiavimą, net kai bendradarbiavimo nauda yra menka.

Įvadas

Elgesio sudėtingumas yra visa apimantis organizmų, kurie užsiima socialine sąveika, ypatybė. Organizmai, veikdami visada tą patį pasirinkimą - visada bendradarbiaudami arba niekada nebendradarbiaudami, elgiasi skirtingai, priklausomai nuo jų socialinės aplinkos ar ankstesnės patirties. Poreikis suprasti elgesio sudėtingumą yra daugelio svarbių iššūkių, su kuriais susiduria evoliucinė biologija ir socialiniai mokslai, ar bet kurios problemos, kuriai svarbi socialinė sąveika, pagrindas. Bendradarbiavimas socialinėje sąveikoje visų pirma vaidina pagrindinį vaidmenį daugelyje pagrindinių evoliucijos perėjimų, pradedant daugialąstelinio gyvenimo atsiradimu ir baigiant žmonių kalbos raida 1 .

Evoliucijos biologams pavyko tiksliai nustatyti biologinius ir aplinkos veiksnius, kurie daro įtaką bendradarbiavimo atsiradimui populiacijoje. Visų pirma, demografinė ir erdvinė populiacijų struktūra pasirodė kaip esminiai veiksniai 2, 3, 4, 5, 6, 7, 8 . Kitame skalės gale pagrindiniai bendradarbiavimo mechanizmai, tokie kaip genetinius principus koduojančios genetinės architektūros ar viešųjų gėrybių pasklidimo aplinkoje galimybės, taip pat riboja, kaip ir kokiu mastu vystysis bendradarbiavimas 9, 10, 11, 12, 13 .

Nepaisant didžiulės pažangos kuriant paprastas sąveikas, supratimas apie bendradarbiavimo raidą, kai socialinės sąveikos kartojasi pakartotinai - kad individai galėtų atnaujinti savo elgesį atsižvelgdami į ankstesnę patirtį - ir įtraukti kelis dalyvius vienu metu, išlieka sunkiai suprantamas. Kai kurie perspektyviausi šios problemos sprendimo būdai yra pasikartojančių žaidimų tyrimas 14, 15, 16, 17, 18, 19, 20, 21, 22, 23 . Žaidimo teorijos kalba elgesio atnaujinimai atsižvelgiant į ankstesnę patirtį modeliuojami kaip strategija pasikartojančiame kelių žaidėjų žaidime heterogeninių asmenų tarpe. Net kai apsiribojame nedideliu santykinai paprastų tokių žaidimų strategijų rinkiniu, evoliucijos dinamika dažnai stebina ir prieštarauja intuicijai. Kai pradedame leisti įvairesnį, vis sudėtingesnį elgesį, bendradarbiavimo atsiradimo rezultatus atitinkamai sunkiau nustatyti.

Niekur sudėtingesnis problemos pobūdis nėra akivaizdesnis nei diskusijoje apie atminties vaidmenį kartojamuose žaidimuose ir bendradarbiavimo raidą 22, 23, 24, 25 . Viena vertus, atmintis, be abejo, gali būti galinga bendradarbiavimo skatinimo jėga, jei ji leidžia žaidėjams atpažinti artimuosius ar kitaip pažymėti skirtingus priešininkus 26, 27 . Vis dėlto toks pripažinimas gali būti brangus ir sudėtingas, norint sukurti 23, 28, 29 . Kita vertus, paprastesnę atminties formą, apsiribojančią praeities sąveikomis per tą patį pakartotą žaidimą, kad žaidėjo strategijoje būtų galima atsižvelgti į kelis ankstesnio žaidimo raundus, gali būti gana lengva vystyti ir patirti mažiau išlaidų. 24, 25, 29 . Nepaisant to, tokios atminties naudingumas kartojant žaidimą buvo suabejotas „Press“ ir „Dyson 18“ rezultatais ir jų apibendrinimu žaidžiant daugelio žaidėjų žaidimus 30, kurie rodo, kad žaidėjas, turintis atmintį-1, gali gydyti visus jos oponentai tarsi naudoja atminties-1 strategiją, neatsižvelgdami į tikrąją varžovės atminties talpą. Taigi atmintis-1 strategija, stabilizuojanti bendradarbiavimą su bet kokiais atminimo įsibrovėliais, taip pat skelbia bendradarbiavimą prieš bet kokį savavališką įsibrovėlį 19, 31, 32, 33, 34 .

Vis dėlto, jei mus domina bendradarbiavimo raida, kai kurių atminties 1 strategijų stabilumas visų formų įsibrovėlių atžvilgiu savaime nėra informatyvus. Kaip mes ir kiti parodėme, kad išlaikant bendradarbiavimą evoliucijos metu svarbiausia yra tai, kaip lengvai gali vystytis sėkmingos bendradarbiavimo strategijos 31, 34, 35 . Jei galimybė prisiminti ankstesnę sąveiką palengvina arba sunkiau vystosi bendradarbiavimo strategijas, tada atmintis gali palengvinti arba apsunkinti bendradarbiavimo vystymąsi. Tuomet pagrindinis šio dokumento klausimas yra toks: kokią įtaką gebėjimas prisiminti ankstesnius žaidimo etapus turi sėkmingų bendradarbiavimo strategijų, vykstančių pakartotiniuose žaidimuose, vystymuisi?

Mes tiriame besivystančias populiacijas, sudarytas iš asmenų, žaidžiančių savavališkomis strategijomis be galo pasikartojančiuose, kelių žaidimų žaidimuose. Mes sutelkiame dėmesį į bendradarbiavimo su viešosiomis gėrybėmis žaidimų perspektyvas ir tiriame, kaip šios perspektyvos priklauso nuo žaidėjų, tuo pačiu metu dalyvaujančių žaidime, skaičiaus, nuo žaidėjų atminties ir nuo bendro gyventojų skaičiaus. Tada mes tiriame žaidėjų strategijų raidą kartu su jų gebėjimu atsiminti ankstesnę sąveiką, įskaitant atvejus, kai tokia atminties talpa kainuoja. Pateikiame paprastą įžvalgą: kai žaidimuose dalyvauja nedaug žaidėjų, o grupės yra mažos, linkusios vystytis ilgesnės atminties strategijos, o tai savo ruožtu padidina galimą bendradarbiavimo mastą. Taigi populiacija linkusi pereiti nuo trumpų prisiminimų ir savanaudiško elgesio iki ilgų prisiminimų ir bendradarbiavimo.

Metodai

Mes nagrinėjame bendradarbiavimo evoliuciją pasikartojančiuose viešųjų prekių žaidimuose, kuriuose n žaidėjai pakartotinai pasirenka, ar bendradarbiauti, įnešdami C kainą į viešą fondą, sukurdami visuomenės naudos B > C. Kiekviename pakartoto žaidimo etape bendra nauda, ​​gauta dėl visų žaidėjų įnašų, yra paskirstoma vienodai visiems žaidėjams. Taigi, jei k žaidėjai nusprendžia bendradarbiauti tam tikrame ture, kiekvienas žaidėjas gauna išmoką Bk / n . Mes tiriame baigtines N žaidėjų, įsitraukusių į be galo pasikartojančius n žaidėjų viešųjų gėrybių žaidimus, populiacijas, naudodamiesi strategijomis, kurių ilgis m , ty žaidėjas gali prisiminti, kiek kartų ji ir jos priešininkai bendradarbiavo ankstesniuose m raunduose (1 pav.).

Image

Mes tiriame elgesio pokyčius pasikartojančiuose n- žaidėjų viešųjų gėrybių žaidimuose, kuriuose žaidėjai naudoja strategijas su atminties talpa m . Mes manome, kad atkartojama N individų populiacija, kuri gauna pelną iš įsitraukimo į be galo pasikartojantį žaidimą su visais įmanomais populiacijos ( n - 1) priešininkų pogrupiais. Tada žaidėjai dauginasi pagal „kopijavimo procesą“, kurio metu žaidėjas X su tikimybe nukopijuoja kito žaidėjo strategiją Y

Image
kur S X ir S Y yra atitinkami žaidėjo laimėjimai ir s padidina pasirinkimo jėgą. Manome, kad stiprios atrankos atvejis yra toks, kad retas mutantas, atsidūręs atrankinėje padėtyje, greitai pasimeta iš populiacijos 31 . Mes tiriame bendradarbiavimo strategijų sėkmę kaip grupės dydžio ir žaidėjų prisiminimų ilgio funkciją. Mes nustatome tvirtų bendradarbiavimo strategijų, kurios gali atsispirti bet kokio galimo mutanto invazijai, dažnumą. (Viršuje) Atsižvelgiant į žaidimo dydį n, palyginti su populiacija N , visuomeninių gėrybių žaidimų dinamika skiriasi. Dviejų žaidėjų žaidimuose kiekvienos kartos (kairėje) populiacijoje vyksta porų tarpusavio sąveika. Jei žaidimą žaidžia visos populiacijos, kiekviena karta (dešinėje), visi žaidėjai bendrauja vienu metu. (Apačia) Ankstesnių įvykių atmintis lemia strategijas, kurios atnaujina elgesį, atsižvelgiant į abiejų žaidėjų veiksmų istoriją. Tai leidžia kurti sudėtingesnes strategijas, pavyzdžiui, tas, kurios baudžia už retą broką arba apdovanoja už retą bendradarbiavimą.

Visas dydis

Mes sutelkiame dėmesį į ilgalaikio kolektyvinio veiksmo evoliuciją, tai reiškia strategijų, kurios, kai jas naudoja kiekvienas gyventojų narys, vystymąsi, sukuria pusiausvyros žaidimą su visais kiekviename ture bendradarbiaujančiais žaidėjais. Tai gali būti laikoma geriausiomis įmanomomis socialinėmis žaidimo baigtimis, nes tai sukuria maksimalią bendrą visuomenės naudą. Tolygaus bendradarbiavimo perspektyvas mes palyginome su nuolatinio neveiklumo perspektyvomis, ty strategijomis, kurios, kai jas naudoja kiekvienas gyventojas, sukuria pusiausvyros žaidimą, kai visi žaidėjai pralaimi kiekvieną turą. Tai gali būti laikoma blogiausiomis įmanomomis socialinėmis žaidimo baigtimis, nes jos rezultatas nėra visuomenės gerovės kūrimas.

Norėdami ištirti kolektyvinio veiksmo ir neveikimo evoliucines perspektyvas, nustatome „tvirtų strategijų apimtį“, kurios sukuria nuolatinį bendradarbiavimą ar pralaimėjimą pakartotiniame n žaidėjo žaidime, kuriame žaidėjai turi atmintį. Žaidimas žaidžiamas gerai sumaišytoje populiacijoje, kurią sudaro N haploidai, kurie dauginasi pagal „kopijavimo procesą“, atsižvelgiant į jų išmokas (1 pav.) 36 . Tvirtų strategijų apimtis rodo, kiek daug kartų vystysis bendradarbiavimas ar nesėkmė 31 . Tiksliau tariant, ši apimtis yra tikimybė, kad atsitiktinai sudaryta strategija, kuria užtikrinamas nuolatinis bendradarbiavimas (arba nesėkmė), gali atsispirti visų kitų galimų strategijų, kurios neduoda tvaraus bendradarbiavimo (arba trūkumų), įsiveržimui 19, 31, 32, 33, 34 . Kaip jau parodėme 31, tvirtų strategijų apimtys lemia bendradarbiavimo ir nesėkmių evoliucinę dinamiką kartojamuose žaidimuose. Mes patvirtiname šio metodo naudingumą palyginę savo analitines prognozes su Monte Karlo modeliavimu, tirdami populiacijos dydžio, grupės dydžio ir atminties talpos įtaką bendradarbiavimo raidai.

Savo analizę pradedame apibūdindami koordinačių sistemą, pagal kurią analitiškai galima nustatyti tvirtų strategijų kiekį žaidžiant n dydžio žaidimus, žaidžiamus N dydžio populiacijose, kuriose strategijų atminties ilgis yra m . Mes naudojame šią koordinačių sistemą, kad visiškai apibūdintume visas evoliuciškai tvirtas bendradarbiaujančias (ir trūkumus sukeliančias) strategijas, kurių negali įsiveržti jokie nebendradarbiaujantys (arba nekokybiški) mutantai iteratoriniame n- žaidėjų viešųjų gėrybių žaidime. Šiuos rezultatus taikome tam, kad padarytume konkrečias prognozes apie grupės dydžio ir atminties talpos įtaką kolektyvinio veiksmo raidai vykstant nuolatiniam bendradarbiavimui. Galiausiai išnagrinėsime šių prognozių pasekmes bendrajam bendradarbiavimo vystymuisi ir pačiai atminties talpai.

Be dviejų žaidėjų žaidimų ir 1 atminties strategijų

Neseniai „Press“ ir „Dyson“ pristatė vadinamąsias nulinio determinanto (ZD) strategijas kartojamuose dviejų žaidėjų žaidimuose 18 . ZD strategijos yra įdomios, nes kai žaidėjas vienašališkai pasirenka tokią strategiją, ji sukuria linijinį santykį tarp savo ilgalaikio ir savo varžovo išmokėjimo ir tokiu būdu įgyja tam tikrą žaidimo rezultato kontrolės pobūdį. 37, 38, 39, 40, 41 . Keletas autorių stengėsi išplėsti „Press“ ir „Dyson“ sistemą, naudodami daugelio žaidėjų žaidimus 30, 39, ir apibūdino kelių žaidėjų ZD strategijas, atskleisdami daugybę įdomių savybių.

Kiti tyrimai išplėtė „Press“ ir „Dyson“ sistemą, kad ištirtų visas įmanomas atminties-1 strategijas be galo pakartotiems dviejų žaidėjų žaidimams 19, 31, 32, 33, 34 . Šis darbas apima visų atminties 1 strategijų erdvės koordinačių sistemos sukūrimą 19, leidžiančią apibūdinti tiesų (nors nebūtinai linijinį) ryšį tarp dviejų žaidėjų ilgalaikių išmokų. Šis santykis tarp ilgalaikių žaidėjų išmokėjimų leido mums visapusiškai apibūdinti visą atminties-1 Nash pusiausvyrą ir visas evoliucines tvirtas strategijas, skirtas be galo pakartotiems dviejų žaidėjų žaidimams, žaidžiamiems pakartojančių N individų populiacijoje 19, 31, 32, 34 .

Čia apibendriname šį darbą, sukurdami koordinačių sistemą, skirtą atminties strategijų erdvei n žaidėjų žaidimuose, kurių dydis n , tokiu būdu, kad visi n žaidėjų ilgalaikiai išmokėjimai būtų susieti tiesiogiai (nors nebūtinai tiesiškai). Vienas esminis triukas, leidžiantis mums pasiekti šį tikslą, yra nubraižyti „ n- player“ žaidimo atminties strategijas ir susijusio „ n × m“ žaidėjo „memory-1“ strategijas. Tuomet sukonstruojame daugelio žaidėjų žaidimų „1 atminties“ strategijų koordinačių sistemą, leidžiančią lengvai apibūdinti bendradarbiaujančias ir invazijai atsparias strategijas. Šiuos metodus taikome pasikartojančių n- žaidėjų viešųjų gėrybių žaidimų atveju ir tiksliai apibūdiname visas evoliucines patikimas atminties strategijas - ty tas strategijas, kurios, gyvendamos baigtinėje N žaidėjų populiacijoje, gali atsispirti selektyviam visų kitų įsiveržimui. galimos strategijos - tokiu būdu išaiškinamos bendradarbiavimo raidos perspektyvos labai bendroje aplinkoje.

Koordinačių sistema, skirta daugelio žaidėjų žaidimų ilgos atminties strategijoms

Mūsų tikslas yra ištirti grupės dydžio ir atminties poveikį kolektyvinio veiksmo dažnumui ir pobūdžiui viešųjų gėrybių žaidimuose. Leidžiant ilgos atminties strategijas ir žaidimus su daugiau nei dviem žaidėjais, labai padidėja elgesio sudėtingumo galimybė, nes žaidėjai sugeba reaguoti į kelių priešininkų elgesį per kelias ankstesnes sąveikas. Taigi vien tai, kad nustatysite išmokas, kurias žaidėjai gauna tokiame pasikartojančiame viešųjų gėrybių žaidime, gali sukelti nemažą iššūkį. Siekdami išspręsti šią problemą, mes sukūrėme strategijų parametrų nustatymo koordinačių sistemą, kurioje vis dėlto nesunkiai suprantamas žaidimo tarp kelių žaidėjų, naudojančių ilgos atminties strategijas, rezultatas.

Žaidėjas, naudojantis atminties strategiją, pasirenka savo žaidimą kiekviename pasikartojančio žaidimo raunde tokiu būdu, kuris priklauso nuo visų n žaidėjų ankstesnių M raundų žaidimų istorijos. Apskritai tokią strategiją sudaro 2 n × m bendradarbiavimo tikimybės šiame ture. Pagrindinio žaidėjo bendradarbiavimo tikimybę užrašome pačia bendra forma:

Image

kur

Image
žymi žaidėjo i žaidimų istoriją. Kiekvienas
Image
atitinka užsakytą m žaidimų seką žaidėjui i , kiekvienas įrašas turi c (bendradarbiauja) arba d (defektas) reikšmes. 2 n × m bendradarbiavimo tikimybės sudaro pagrindą
Image
ir sudaro atminties strategijų erdvės koordinačių sistemą n- žaidėjų žaidimuose. Papildomoje informacijoje išsamiai aprašome, kaip sukonstruoti alternatyvią 2 n × m vektorių koordinačių sistemą, kuri taip pat sudaro pagrindą
Image
, ir tai labai supaprastina ilgalaikių išmokų itertuose žaidimuose analizę. Žemiau aprašome šią alternatyvią koordinačių sistemą, skirtą konkrečiam pasikartojančių viešųjų gėrybių žaidimui, kurie yra šio tyrimo objektas.

(i) Atminties atvaizdavimas atmintyje-1

Siekdami supaprastinti savo ilgos atminties strategijų analizę, mes suvoksime, kad pagrindinis žaidėjas, naudojantis „ n- player“ žaidime „memory- m“ strategiją, yra žaidėjas, kuris vietoj to naudoja „atminties-1“ strategiją susijusiame „ n × m- grotuvo“ žaidime. . Tai yra, mes galvosime apie n žaidėjų žaidimą, kuriame pagrindinis žaidėjas naudoja atminties m strategiją, kalbant apie lygiavertį n × m žaidėjo žaidimą, kurį sudaro n „tikri“ žaidėjai kartu su m - 1 šešėliniai “žaidėjai, susieti su kiekvienu tikru žaidėju. Šešėliniai žaidėjai žaidžia taip pat, kaip ir jų susietas tikras žaidėjas t raundų anksčiau, 2 ≤ t ≤ m . Taigi pagrindinio žaidėjo atminties strategija yra identiška „ n- m“ žaidėjo žaidimo „atmintis-1“ strategijai, kur atitinkama atminties-1 strategija reaguoja į didelį „šešėlinių“ žaidėjų, kurių veiksmai ankstesniame ankstesniame ture tiesiog koduojami, rinkinį. veiksmus, kurių n ankstesnių m raundų atliko n tikras žaidėjas. Šis triukas leidžia mums sumažinti ilgalaikės atminties strategijų tyrimo problemą iki atminties-1 strategijų tyrimo problemos, nors ir esant didesniam žaidimo žaidėjų skaičiui.

Viskas, ko reikia, yra sukurti šešėlinių žaidėjų strategijas, kad sistemos būsena ankstesniuose m raunduose būtų tinkamai atkurta kiekviename susijusio n × m- žaidėjo žaidimo raunde. Ši konstrukcija yra tiesi. Jei pagrindinis žaidėjas žaidė c praėjusiame raunde, tada mes nustatome, kad jos pirmasis šešėlinis žaidėjas žais c kitame ture (ty jis nukopijuos paskutinį jos ėjimą). Panašiai jos antrasis šešėlinis žaidėjas nukopijuos paskutinį pirmojo šešėlinio žaidėjo judesį ir panašiai - iki pat savo ( m - 1) šešėlinio žaidėjo. Tas pats pasakytina apie kiekvienos iš n -1 priešininkių šešėlinius žaidėjus. Tokiu būdu visos paskutinių „ m“ raundų pjesės n- žaidėjo žaidime užkoduojamos kiekviename susijusio n × m žaidėjo žaidimo raunde.

Pavertę savavališką „ n- grotuvo“ atminties strategiją į susietą atminties-1 strategiją „ n × m“ žaidėjo žaidime, dabar aprašome atminties-1 strategijų koordinačių sistemą, leidžiančią mums nustatyti paprastą ryšį tarp pusiausvyros išmokos visiems žaidėjams. Mes apibrėžėme šią savavališkų žaidimų koordinačių sistemą papildomoje informacijoje (3 skyrius) ir žemiau pateiktus viešųjų prekių žaidimų atvejus.

(ii) Parametrų nustatymas viešųjų gėrybių žaidimuose

Pagal viešųjų gėrybių žaidimą žaidėjas, bendradarbiaujantis su k oponentais, gauna grynąjį pelną B ( k + 1) / n - C , o žaidėjas, kuris pralaimi, kol k oponentai bendradarbiauja, gauna grynąjį pelną Bk / n. . Tai yra, gautas atlyginimas priklauso nuo to, ar pagrindinis žaidėjas bendradarbiavo, ar nuo bendradarbiaujančių priešininkų skaičiaus, tačiau tai nepriklauso nuo bendradarbiaujančių priešininkų tapatybės. Panašiai, jei žaidėjas turi atmintį iš ankstesnių pakartotinių viešųjų gėrybių žaidimo raundų, tada jos išmokėjimas per šiuos turus priklauso nuo viso to, kiek kartų ji bendradarbiavo ir kiek kartų priešininkai bendradarbiavo, bet tai nepriklauso dėl skirtingų žaidėjų bendradarbiavimo tvarkos ar dėl jos bendradarbių priešininkų tapatybės. Todėl užuot tyrę 2 n × m bendradarbiavimo tikimybių erdvę, galime apsiriboti pasikartojančių viešųjų gėrybių žaidimų analize iki strategijų, kurios seka bendrą pagrindinio žaidėjo bendradarbiavimo ir jos kartų skaičių. oponentės bendradarbiavo pagal jos atmintį. Taigi pagrindinio žaidėjo strategija gali būti išreikšta taip:

Image

kiekvieno turo bendradarbiavimo tikimybės,

Image
, kur l reiškia bendrą skaičių kartų, kai žaidėjo oponentai bendradarbiavo ankstesniuose m raunduose (kurių skaičius gali svyruoti nuo 0 iki ( n - 1) m ), o l p reiškia bendrą kartų skaičių, kai pats žaidėjas bendradarbiauja ankstesni m raundai (kurie gali skirtis nuo 0 iki m ).

Nors tikimybės

Image
yra galbūt natūraliausios koordinatės, apibūdinančios atminties strategiją pasikartojančiame n- žaidėjų viešųjų gėrybių žaidime, mes sukūrėme alternatyvią koordinačių sistemą, apibrėžtą 2 pav., kuri supaprastina pusiausvyros išmokų ir evoliucinio tvirtumo analizę. strategijas. Alternatyvi sistema
Image
tam tikro žaidėjo strategijos koordinatės apibūdinamos parametrais
Image
apibrėžtos 2 pav. Mes nustatome ribines sąlygas
Image
kartu su vienu kitu tiesiniu ryšiu Λ sąlygomis (žr. pagrindžiančią informaciją). Kokybiškai ši koordinačių sistema apibūdina bendradarbiavimo tikimybę tam tikrame ture,
Image
, atsižvelgiant į svertinę penkių komponentų sumą: (1) polinkis kartoti praeities elgesį; (2) pradinis polinkis bendradarbiauti ( κ ); (3) polinkis bendradarbiauti proporcingai pagrindinio žaidėjo gaunamoms išmokoms (χ); (4) polinkis bausti (ty už trūkumus) proporcingai jos priešininkų gautoms išmokoms ( φ ) ir (5) polinkis bausti reaguojant į konkretų ankstesnių turų rezultatą (
Image
).

Image

Mes atsižvelgiame į formos strategijų erdvę

Image
, tokia, kad žaidėjai bendradarbiauja su tokia tikimybe, kuri priklauso nuo to, kiek kartų ji bendradarbiauja su savo priešininkais ir kiek kartų ji bendradarbiauja savo atmintyje. Pagrindinio žaidėjo strategiją apibrėžiame koordinatėmis
Image
kaip parodyta paveiksle. Šios koordinačių sistemos komponentai aiškinami intuityviai: tikimybė, kad žaidėjas bendradarbiauja, priklauso nuo (1) ankstesnio jos polinkio bendradarbiauti, (2) nuo pradinio polinkio bendradarbiauti ( κ ), (3) polinkio bendradarbiauti proporcingai jos pačios išmoka ( χ ), (4) polinkis bausti (t. y. už trūkumus) proporcingai priešininkų išmokoms ( ϕ ) ir (5) sąlyginė bausmė, kuri priklauso nuo konkretaus žaidimo rezultato per ankstesnius turus (
Image
).

Visas dydis

Šios koordinačių sistemos naudojimo pranašumas yra tas, kad ji suteikia paprastą ryšį tarp ilgalaikio išmokėjimo pagrindiniam žaidėjui 0, S 0 ir kiekvieno jos oponento i ilgalaikio išmokėjimo S i iteraciniame n žaidime. žaidimas viešosioms prekėms:

Image

Čia terminas

Image
žymi pusiausvyros greitį, kuriuo įsibrovęs žaidėjas bendradarbiauja
Image
kartų ir jo priešininkai bendradarbiauja
Image
kartų per ankstesnius m raundus ir
Image
žymi nekontroliuojamą pagrindinės strategijos nubaudimą bendro žaidėjo požiūriu (žr. pagrindžiančią informaciją apie 1 išvestį).
Image
yra paprastu būdu susijęs su terminais
Image
, kad didėja
Image
dideja
Image
(žr. papildomą informaciją).

Rezultatai

Grupės dydžio poveikis tvirtam bendradarbiavimui

1 punkte apibendrinti santykiai tarp išmokų suteikia išsamią įžvalgą apie pakartotinių viešųjų gėrybių žaidimų rezultatus. Ypač įdomios yra bendradarbiavimo perspektyvos, kai auga grupės n ir populiacijos dydis N. Visuomeninių prekių žaidimai yra gerai žinomi kolektyvinio ieškinio problemos pavyzdžiai, kai padidėjęs žaidimo žaidėjų skaičius pablogina bendradarbiavimo perspektyvas . Didesnei gyventojų daliai, atvirkščiai, yra lengviau palengvinti tvirtą bendradarbiavimą, bent jau žaidžiant dviejų žaidėjų žaidimus 32 . Naudosime 1, norėdami išsiaiškinti, koks yra kompromisas tarp grupės dydžio ir populiacijos dydžio, bei tvirto bendradarbiavimo elgesio, kuris gali pasireikšti žaidžiant įvairius žaidėjus, pobūdį.

1 leidžia apibūdinti kooperatinės strategijos sugebėjimą atsispirti bet kurios kitos strategijos invazijai N dydžio 19, 31, 32, 34 populiacijoje . Mes apibrėžiame bendradarbiavimo strategiją kaip tokią, kuri, kai ją vaidina kiekvienas gyventojų narys, garantuoja, kad visi žaidėjai bendradarbiauja pusiausvyroje ir taip gauna išmoką už abipusį bendradarbiavimą, B - C. Tai reiškia būtiną sąlygą

Image

, taigi, jei visi žaidėjai bendradarbiavo ankstesniuose raunduose, žaidėjui, kuris naudojasi bendradarbiavimo strategija, garantuojama, kad jis bendradarbiaus kitame raunde. Tokias strategijas mes vadiname „bendradarbiais“, tai reiškia, kad jos sukuria nuolatinį bendradarbiavimą gyvenant populiacijoje. Aukščiau sukurtoje alternatyvioje koordinačių sistemoje būtina sąlyga nuolatiniam bendradarbiavimui yra κ = B - C.

Priešingai, mes taip pat atsižvelgiame į strategijas, kurios lemia kolektyvinį neveikimą , reiškiantį nuolatinį nesėkmę. Tokias strategijas privalo turėti

Image
, tai reiškia būtiną sąlygą κ = 0 alternatyvioje koordinačių sistemoje. Šią sąlygą tenkinančias strategijas mes vadiname „trūkumais“, reiškiančiais, kad gyvenant populiacijoje jie sukuria ilgalaikį trūkumą.

Retas i mutantas gali įsibrauti į N dydžio populiaciją, kurioje yra įgyvendinama bendradarbiavimo strategija, tik jei jis gauna išmoką S i , viršijančią kooperacijos rezidento gaunamą išmoką. Apsvarstydami žaidėjų gaunamų išmokų ribas (žr. Pagrindžiančią informaciją), mes nustatėme būtinas ir pakankamas sąlygas bendradarbiavimo strategijai.

Image
atsispirti selektyviai bet kurios mutantės strategijos invazijai - tai yra, kad bendradarbiavimo strategija būtų tvirta evoliucijos link:

Image

Ek. 2 leidžia mums padaryti keletą pastebėjimų apie tvirto bendradarbiavimo perspektyvas ir pobūdį. Pirma, nors Eq. 2 priklauso nuo pusiausvyros žaidimo greičio

Image
, kuri savaime priklauso nuo strategijos, kurią naudoja ir pagrindinė strategija, ir pagalbininkas, nes
Image
mes vis dėlto galime pasirinkti
Image
kad būtų užtikrinta Eq. 3 yra patenkintas, o strategija yra tvirta prieš visus mutantus. Visų pirma, tam tikram ϕ , χ, jei pasirinksime pakankamai dideles reikšmes
Image
strategija bus tvirta. Tai reiškia, kad užtikrinant, kad neapibrėžtosios bausmės yra „pakankamai stiprios“, kad žaidėjai galėtų sėkmingai nubausti už retą pražangą. Antra, teigiamos values ​​vertės, atitinkančios dosnesnes strategijas 32, kuriose žaidėjai linkę dalintis abipusio bendradarbiavimo pranašumais, taip pat padeda strategijai įvykdyti tvirto bendradarbiavimo reikalavimus. Taigi sudėtingos strategijos, kurios baudžia už retą nesėkmę ir yra dosnios kitiems žaidėjams, linkusios į tvirtą bendradarbiavimo elgesį besivystančioje populiacijoje. Galiausiai galime naudoti „Eq“. 2 įvertinti bet kokios bendradarbiavimo strategijos tvirtumą, apskaičiuojant pusiausvyros žaidimo greitį pagal keturias „ekstremalias“ strategijas, kurios maksimaliai padidina arba sumažina žaidėjų balų sumą ir skirtumą (žr. SI, taip pat 39 ).

Ek. 2 taip pat parodo, kad didesnės n vertės, atitinkančios žaidimus su daugiau žaidėjų, paprastai reikalauja mažesnių tvirtų bendradarbiavimo strategijų. Tai galima pastebėti kairėje pusėje esant pirmajai nelygybei per 2, kur didėjant n sumažėja neapibrėžtų bausmių poveikis tvirtumui. Panašiai, tai taip pat galima pastebėti nelygybės dešinėje pusėje, kai n padidėjimas n sumažina dosnumo įtaką tvirtumui.

Grupės dydžio (ty žaidėjų skaičiaus tam tikrame žaidime) poveikį bendradarbiavimo galimybėms galima iliustruoti įvertinant du kraštutinius atvejus. Kai visi gyventojai dalyvauja vieno žaidėjo žaidime, taigi n = N , tada 2 reiškia, kad strategijos gali būti tvirtos tik tuo atveju, jei χ ≥ ϕ . Tačiau norint sukurti perspektyvią strategiją, reikia χ ≤ ϕ (2 pav.); taigi vienintelis įmanomas būdas užtikrinti tvirtą bendradarbiavimą šiuo kraštutiniu atveju yra χ = ϕ . Sąlyga χ = ϕ suteikia strategiją, kuri būtų tinkama už titrą, ir ji sukelia nestabilų bendradarbiavimo elgesį esant triukšmui 31 . Taigi, atsižvelgiant į daugybę žaidimų, kaip ir visas gyventojų skaičius, tvirto evoliucinio bendradarbiavimo perspektyvos yra menkos. Tačiau kontrastingu atveju, kai gyventojų skaičius yra daug didesnis nei žaidžiamo žaidimo dydis, tai yra

Image
, tada 2 parodo, kad už pakankamai neapibrėžtas bausmes visada egzistuoja teigiamas tvirtų bendradarbiavimo strategijų kiekis
Image
, net labai dideliuose žaidimuose.

Norint suprasti numatomą bendradarbiavimo lygį žaidžiant daugelio žaidėjų žaidimus, reikia palyginti tvirtų bendradarbiavimo strategijų apimtį su tvirtų trūkumų šalinimo strategijų apimtimi. Retas i mutantas gali įsibrauti į populiaciją, kurioje gyvena trūkumų šalinimo strategija, tik tuo atveju, jei jis gauna išmoką S i , viršijančią išmoką, kurią gauna nuolatinis defektorius. Tuomet susidaro būtinos ir pakankamos sąlygos defektų strategijų tvirtumui:

Image

Dar kartą matome iš Eq. 3, jei pasirinksime pakankamai dideles reikšmes

Image
, todėl retesni bendradarbiai gali būti griežčiau baudžiami pažeidėjų populiacijoje, o trūkumų šalinimo strategija bus tvirta. Tačiau, priešingai nei bendradarbių atveju, mažesnės values ​​vertės, kurios defektams atitinka labiau priekabiaujantį elgesį, kai žaidėjai bando padidinti savo pranašumą priešininkų sąskaita 18, daro netinkamą strategiją, kuri labiau patenkins reikalavimus. už tvirtumą. Galiausiai, nors didesnės n reikšmės gali susilpninti neapibrėžtų bausmių poveikį tvirtumui, jos taip pat palengvina tvirtos, priekabiavimo strategijos sukūrimą; o pastarasis efektas visada yra stipresnis, todėl didesni žaidimai leidžia didesnį trūkumų strategijų kiekį. Apskritai, Eq. 3 reiškia, kad didėjant žaidėjų skaičiui kiekviename žaidime n , priešingai nei jo poveikis tvirtiems bendradarbiams, padidėja patikimų defektų skaičius.

Mes patvirtinome savo grupės dydžio įtakos tvirtų kooperatyvų ir defektorių tūriui prognozes analitiškai apskaičiuodami tvirtų tūrių apimtį (nuo 2, 3 ekvivalentų) ir palygindami tiesioginiu kooperatorių ir defektorių invaziškumo modeliavimu atsižvelgiant į didelį mutantų spektrą. įsibrovėliai (3a pav.). Didėjant grupės dydžiui, tvirtų bendradarbių skaičius mažėja, palyginti su tvirtų defektorių kiekiu, todėl bendradarbiavimas tampa sunkiau vystytis.

Image

Mes apskaičiavome santykinius tvirto bendradarbiavimo kiekius - tai yra absoliutus tvirtų bendradarbiavimo strategijų tūris, padalytas iš bendro patikimų bendradarbių ir defektorių tūrio - ir palyginome tai su santykiniu trūkumų (vientisų linijų) kiekiu, skaitmeniškai integruodami ekvivalentus. 2, 3. Šiuos analizės rezultatus mes taip pat patikrinome atsitiktinai sudarydami 10 6 kooperatines ir 10 6 defektų strategijas ir nustatydami jų sėkmę pasipriešinant invazijai iš 10 5 atsitiktinių mutantų, turinčių tą pačią atmintį (taškus). Mes apskaičiavome žaidėjo išmokas imituodami 2 × 10 3 viešųjų prekių žaidimo raundus. Tada nubraižėme santykinius patikimų bendradarbių ir tvirtų defektorių tūrį kaip grupės dydžio n funkciją (su fiksuota atmintimi m = 1, kairėje) ir kaip atminties talpos m funkciją (kai fiksuotas grupės dydis n = 2, dešinėje). Padidėjus grupės dydžiui, padidėja santykinis tvirtų defektų kiekis; padidindamas atminties ilgį padidina santykinį tvirto bendradarbiavimo tūrį. Atlikdami visus skaičiavimus ir modeliavimus, naudojome kainą C = 1 ir naudą B, kaip parodyta paveikslėlyje.

Visas dydis

Yra paprasčiausia intuicija, kodėl didesni žaidimai daro bendradarbiavimą ne tokį tvirtą, o defektų tvirtumą: Žaidžiant viešąsias prekes, kuriose yra daugiau žaidėjų, ribinis išmokos, tenkančios žaidėjui, kuris pereina nuo bendradarbiavimo prie pralaimėjimo, pokytis yra C - B / n , taigi paskata trūkumų išauga augant grupės dydžiui. Tai, be abejo, yra grupės dydžio paradoksas, ir tai yra gerai žinomas bet kokio kolektyvinio veiksmo problemos reiškinys42. Išimtiniu atveju n = N vienintelė tvirto bendradarbiavimo viltis yra strategijos, orientuotos į „už pakabą“, kurios gali palaikyti ir ilgalaikį bendradarbiavimą, ir ilgalaikį pralaimėjimą, atsižvelgiant į jų priešininko elgesį.

Apskritai, tiek bendradarbiai, tiek defektai turi teigiamą tvirtų strategijų kiekį, jei n < N . Iš esmės gali vystytis ir bendradarbiavimas, ir nesėkmės. Nors šios tvirtos strategijos negali selektyviai įsiveržti į jokią kitą strategiją, gyvenant populiacijoje, jos gali būti neutraliai pakeistos nepatvaria to paties tipo strategija, kuri, savo ruožtu, gali būti įsibrovusi. As a result, there is a constant turnover between cooperation and defection over the course of evolution, with the relative time spent at cooperation versus defection determined by their relative volumes of robust strategies 31, 34 .

Our results show that the problem of collective action is alleviated by sufficiently large population sizes. That is, for an arbitrarily large group size n we can always find yet larger population sizes N such that robust cooperative strategies are guaranteed to exist. Moreover, increasing the population size N leads to increasing volumes of robust cooperative strategies and decreasing volumes of robust defecting strategies (Fig. S1).

The effects of memory on robust cooperation

We have not yet said anything about the impact of memory capacity on the prospects for cooperation. Indeed, the robustness conditions Eqs 2, 3 do not depend explicitly on memory length m , as they do on group size n and on population size N . However, memory does have an important impact on the efficacy of contingent punishment,

Image

, on the left-hand sides of the inequalities in 2 and 3. Figure 3 illustrates the impact of increasing memory m on the volume of robust cooperative and robust defecting strategies. Here we see the opposite pattern to the effect for group size: as memory increases, there is a larger volume of robust cooperation relative to robust defection.

We can develop an intuitive understanding for the effect of memory on sustained cooperation by considering its role in producing effective punishment. A longer memory enables a player to punish opponents who seek to gain an advantage through rare deviations from the social norm: that is, rare defectors in a population of cooperators or rare cooperators in a population of defectors. However, using a long memory to punish rare defectors is a more effective way to enforce cooperation than punishing rare cooperators is to enforce defection (since in the latter case the default behavior is to defect anyway, and so increasing the amount of “punishment” has little overall effect on payoff). And so as memory increases, cooperators become more robust relative to defectors, as 2–3 and Fig. 3 show.

The change in the efficacy of punishment for rare deviants from the social norm as memory capacity increases is illustrated in Fig. S2, where we calculate the average

Image
for randomly-drawn cooperative or defecting strategies. We see that as memory capacity increases, a randomly drawn cooperator tends to engage in more effective punishment (larger values of
Image
) whereas a randomly drawn defector tends to engage in less effective punishment (smaller values of
Image
). This trend explains why increasing memory capacity increases the volume of robust cooperators relative to defectors.

Evolution of memory

Our results on the relationship between memory capacity and the robustness of cooperation raise a number of interesting questions. In particular, memory of the type we have considered does not seem to convey a direct advantage to cooperation (or defection), because a robust cooperative (or defecting) strategy is robust against all possible invaders , regardless of their memory capacity. However increased memory can nonetheless make robust cooperation easier to evolve, because it allows for more effective contingent punishment. This tends to have a stronger impact when games are small because, as described in Eqs 2, 3, the impact of contingent punishment on robustness is attenuated by a factor N – n , and thus the effect of longer memory on the contributions of

Image

terms to robust cooperation is smaller in larger games. And so, at least when the number of players is relatively small, we might expect long memories to facilitate the evolution of cooperation in populations.

What our analysis has not yet addressed is whether memory capacity itself can adapt, and what its co-evolution with strategies in a population will imply for the longterm prospects of cooperation. To address this question we undertook evolutionary simulations, allowing heritable mutations both to a player's strategy and also to her memory capacity. These simulations, illustrated in Fig. 4, confirm that (i) longer memories do indeed evolve and (ii) this leads to an increase in the amount of cooperation in a population (Fig. 4). In a two-player game, memory tends to increase over time, which in turn drives an increase in the frequency of cooperators and a decline in defectors. This is accompanied by a large overall increase in the population mean fitness. By contrast, when the group size is large, n = N , there is little evolutionary change in memory capacity and defection continues to be more frequent than cooperation even as strategies and memory co-evolve. In a two-player game, even when memory comes at a substantial cost, an intermediate level of memory evolves, and there is a corresponding increase in the degree of cooperation (Fig. S3).

Image

We simulated populations playing the iterated n -player public-goods game, proposing mutant strategies until reaching equilibrium, and then also proposing mutations to a player's memory capacity m , each at rate μ /10. In these simulations all players initially have memory m = 1, with payoff parameters C = 1 and B = 1.2. Mutations to strategies were drawn uniformly from the full space of memory- m strategies. Mutations perturbing the memory m caused it to increase or decrease by 1, with a lower bound of m = 1. Evolution was modeled according to a copying process under weak mutation 31 in a population of size N = 10 individuals. ( a ) When the group size is small, n = 2, defecting strategies are initially dominant in the population, but they are quickly replaced by cooperators as memory capacity evolves to higher values. ( b ) When group size is large, n = N = 10, defecting strategies initially dominate the population and they remain dominant as memory evolves. In both ( a, b ) the overall frequency of cooperators and defectors (that is, the fraction of robust cooperative (and defecting) strategies among all cooperative and (defecting) strategies) decline as the dimension of strategy space increases, in line with the decline in the overall volume of robust strategies (Fig. S4). ( c ) When the game size is small memory evolves rapidly to larger values, reflecting the greater success of longer-memory strategies at invading (Fig. S3), and driving the increase in cooperative as compared to defecting strategies. ( d ) When the group size is large memory does not evolve to large values, reaching only m = 2 across 50, 000 generations, and reflecting the decline in long-memory strategies' success as invaders in larger games. ( e ) As cooperation increases so does the average payoff of the population, by a factor of 5–10 fold. ( f ) The lack of increase in cooperation results in a much more modest (although still appreciable) increase in average payoff for the population as defectors become less frequent.

Visas dydis

How are we to understand why memory evolves at all in these co-evolutionary simulations? The change in memory capacity is puzzling, at first glance, because a longer memory conveys no direct advantage against a resident robust strategy – since robustness implies uninvadability by any opponent, regardless of the opponent's memory capacity. The key to understanding this co-evolutionary pattern is to note that longer memories are, on average, better at invading non-robust strategies, due to their greater capacity for contingent punishment (Fig. S3). Thus, when games are sufficiently small, the neutral drift that leads to turnover between cooperation and defection 31, 34 also provides opportunity for longer-memory strategies to invade and fix.

Diskusija

We have constructed a coordinate system that enables us to completely characterize the evolutionary robustness of arbitrary strategies in iterated multi-player public-goods games. This allows us to quantify the contrasting impacts of the number of players who engage in a game, and the memory capacity of those players on the evolution of cooperative behavior and collective action. In particular we have shown that while increasing the number of players in a game makes both cooperation and longer memories harder to evolve, in small groups, memory capacity tends to increase over time and drives the evolution of cooperative behavior.

To understand the evolution of social behavior it is not sufficient to simply determine whether particular types of strategies exist or not. Indeed, for repeated games, strategies that enforce any individually rational social norm are guaranteed to exist by the famous Folk Theorems 44 . The more incisive question, from an evolutionary viewpoint, is how often strategies of different types arise via random mutation, how often they reach fixation, and how long they remain fixed in the face of mutant invaders and other evolutionary forces such as neutral genetic drift. To address these questions we have analyzed the evolutionary robustness of strategies that result in sustained cooperation. We have shown that a strategy is more likely to be evolutionary robust if it can successfully punish defectors. We have shown that players with longer memories have access to a greater volume of such evolutionary robust strategies, and that, as a result, over the course of evolution populations that evolve longer memories are more likely to evolve cooperative behaviors. Memory of the type we have considered does not result in better strategies per se, but in a greater quantity of robust cooperative strategies.

In contrast to memory capacity, larger games favor defecting strategies over cooperating strategies, because larger games reduce the marginal cost to a player of switching from cooperation to defection, and make it harder for even long-memory players to effectively punish defectors. Thus we find in evolutionary simulations that only in small groups do both long-memory strategies and cooperation tend to evolve and dominate. The continued evolution of longer memories in small groups in our simulations is particularly striking, and reflects not the greater robustness of longer memory strategies, but their success as invaders.

It is important to emphasize that all of these effects of memory and group size are driven by changes in the volume of robust cooperative strategies. There is no single “best” strategy or memory length that evolution favors. Greater volumes of cooperative strategies lead to a greater degree of cooperation over the course of evolution in a population; and greater success as an invader among long-memory strategies leads to the evolution of longer memories. This is true even when memory comes at a cost , provided longer-memory strategies still enjoy increased success as invaders compared to shorter-memory strategies, which they often do (Fig. S3). According to the results of Press and Dyson 18, a memory-1 player can always treat a longer-memory opponent as though he also has memory-1. And so when memory comes at a cost, it is always possible to construct a memory-1 strategy that outcompetes a longer memory strategy. This leads to opposing forces on the evolution of memory length, when memory comes at a cost, and complex evolutionary dynamics (Fig. S3).

How memory will evolve in natural populations depends on the genetic architecture of the organism and the magnitude of costs of memory 22, 23 . Our results show that the evolution of cooperation in iterated games is strongly influenced by the memory capacity available to players, and therefore it cannot be adequately understood in general by restricting study to the space of memory-1 strategies, despite the results of Press and Dyson 18 .

A complex balance between behavior, memory, group size and environment can lead to wide variation in evolutionary outcomes in the presence of social interactions. Understanding this balance is vital if we are to understand and interpret the role of cooperative behavior in evolution. Despite the complexity of the problem, and the very general n -player memory- m setting we have analyzed, we have arrived at a few simple qualitative predictions, which may admit to testing not only in the social interactions of natural populations 12 but also through experiments with human players 45, 46 . Of course, the type of memory discussed here is only a small part of the story. We have ignored the possibility of other kinds of memory, which allow players to “tag” one another 26, 27 after the completion of a game. We have ignored the role of spatial structure, of demographic structure, and of dispersal 5 . We have failed to specify the underlying mechanisms by which public-goods and players' decisions are produced and executed. Accounting for all of these additional factors is an important challenge as researchers seek to elucidate the emergence of collective action in evolving populations and beyond.

Papildoma informacija

How to cite this article : Stewart, AJ and Plotkin, JB Small groups and long memories promote cooperation. Mokslas. Rep. 6, 26889; doi: 10.1038/srep26889 (2016).

Papildoma informacija

PDF failai

  1. 1.

    Papildoma informacija

Komentarai

Pateikdami komentarą jūs sutinkate laikytis mūsų taisyklių ir bendruomenės gairių. Jei pastebite ką nors įžeidžiančio ar neatitinkančio mūsų taisyklių ar gairių, pažymėkite, kad tai netinkama.