Natūralios skalės pagal geografinę struktūrą | mokslinės ataskaitos

Natūralios skalės pagal geografinę struktūrą | mokslinės ataskaitos

Anonim

Dalykai

  • Taikomoji matematika
  • Kompiuterių mokslas

Anotacija

Žinojama, kad žmogaus mobilumas pasiskirsto keliomis fizinių atstumų dydžio dalimis, todėl paprastai sunku endogeniniu būdu surasti ar apibrėžti tipiškas ir reikšmingas skales. Atrodo, kad atitinkama analizė, pradedant judesiais ir baigiant geografinėmis pertvaromis, yra susijusi su tam tikra ad-hoc skale arba jos visai nėra. Remdamiesi geografiškai pažymėtais duomenimis, surinktais iš nuotraukos, kuria dalijamasi socialinėje žiniasklaidoje, taikome bendruomenės aptikimą judėjimo tinklams, kuriuos riboja didėjantys atstumo paskirstymo procentai. Naudodamiesi paprastu parametrų neturinčiu nepertraukiamumo aptikimo algoritmu, mes atrandame aiškius fazės perėjimus bendruomenės skaidinių erdvėje. Šių fazių aptikimas yra pirmasis objektyvus būdas apibūdinti endogenines, natūralias žmogaus judėjimo skales. Mūsų tyrimas apima devynis regionus, pradedant nuo miestų iki įvairaus dydžio ir tarpvalstybinių sričių. Visuose regionuose natūralių skalių skaičius yra nepaprastai mažas (2 arba 3). Be to, mūsų rezultatai rodo, kad elgesys, susijęs su mastu, o ne su mastu susijusiais vartotojais. Natūralios skalės pertvaros leidžia nubrėžti atskiras daugiapakopes geografines ribas, galinčias suteikti svarbiausių įžvalgų tokiose srityse kaip epidemiologija ar kultūrinis užkrėtimas, kur esminis dalykas yra erdvinių ribų įvedimas.

Įvadas

Geografinis masto keitimas buvo daugelio žmogaus mobilumo tyrimų pagrindas. Viena vertus, ne kartą buvo įrodyta, kad fiziniai atstumai tarp susijusių asmenų ar tarp susijusių vietų beveik nepaiso jokio skiriamojo masto, jau nekalbant apie skirtingas fazes. Dideli geografiškai pažymėti žmogaus elgesio duomenų rinkiniai, stebimi atstumo dažniu, paprastai būna nevienareikšmiai, pasiskirstę keliais dydžiais, nesvarbu, ar tai ryšiai, pagrįsti mobiliojo telefono judesiais 1, 2 ir skambučiais 3, 4, 5, socialinės žiniasklaidos „registracijomis“ 6, 7 arba 8, važiuoja 9, 10 į darbą ar atgal, važiuoja taksi 11 arba artefaktai 12 išplatinami. Kita vertus, šio tipo duomenys pastaruoju metu buvo naudojami siekiant nustatyti geografiškai nuoseklias sritis, paremtas vietų grupėmis, judėjimais ar sąveika. 4, 6, 13, 14, 15, 16, 17, 18, 19, 20 kur Iš esmės atitinkama literatūra paprastai remiasi prielaida, kad norint sudaryti bendrą visuminį vaizdą turėtų būti atsižvelgiama į visus empirinius matavimus, neatsižvelgiant į jų skirtingą erdvinį dydį. Tinkamą aprašo skalę gali pasirinkti žiūrintysis: ex ante , kai renka duomenis tam tikrame ribojimo laukelyje, ir dažnai ex post , sutelkdamas dėmesį į tinkamą aprašo skalę. Čia elgesio pėdsakai, apimantys keletą dydžių, paprastai apibendrinami nepriklausomai nuo fizinės masto, kurį jie atitinka; tada bendruomenės aptikimo algoritmai atskleidžia geografines sritis ar modelius; pagal kurį nors kriterijų galutinai pasirenkamas galutinis aprašymo lygis. Praktiškai šie metodai paprastai sukuria dendrogramas, apibrėžiančias įterptą geografinių skaidinių seriją, kai žemesnio lygio skaidiniai apima aukštesnio lygio pertvaras, vis labiau grubiai apibūdinamose skalėse. Galiausiai pasirenkamas tinkamas dendrogramos lygis, nes jis arba padidina tam tikrą kiekį (paprastai moduliškumą tinkliniais metodais 17 ), suteikia aiškią dichotomiją 4, arba geriausiai atitinka tam tikrą a priori žinomą aprašymo skalę 16 . Taigi rezultatai yra vieno masto, o ne mastelio: paprastai tikslas yra atrasti arba, veikiau, atkurti tam tikros srities aukso standartinį geografinį skaidinį - pavyzdžiui, Belgijos padalijimą į dvi kalbines bendruomenes 4 arba administracinio suskirstymą. Didžiosios Britanijos regionai 15 . Nors kai kurie tyrimai parodė, kad apibrėžiant 17 klasterius, tarpmiestiniai ir tolimi ryšiai vaidina skirtingą vaidmenį, reikia ieškoti idealaus klasterių rinkinio, kurį reikia atrasti kartą ir visiems laikams (ir galbūt sujungti į didesnius 16 blokus, kol bus dvejetainė dichotomija). sulaukė 4 ) lieka nėščia.

Čia parodome, kad stebėjimo skalių pasirinkimas nėra nei egzogeninis, nei vienareikšmis. Šiuo tikslu mes parodome, kad įmanoma endogeniniu būdu atskleisti nedidelį skaičių prasmingų aprašymo skalių diapazonų nuo, matyt, neapdorotų neapdorotų duomenų. Kitaip tariant, geografiniai žmogaus elgesio duomenys apima keletą kartu egzistuojančių ir natūralių fazių, kurias mes atgauname, nepaisant to, kad nėra mažesnio masto ryšio atstumo pasiskirstymo masto.

Empiriškai mes pasikliaujame žmonių mobilumo duomenimis, gautais iš „Instagram“ - internetinės nuotraukų dalijimosi paslaugos, skirtos išmaniųjų telefonų vartotojams. Pastebimų atstumų tarp paskesnių vartotojo vietų pasiskirstymas stebėtinai neturi tipinio masto (žr. S2 pav.). Tiesa, šis nevienalytiškumas reiškia, kad susipynė įvairūs žmonių elgesiai, pradedant nuo vietinių kelionių į darbą ir vykstant į tolimas keliones. Visuotinis atstumų pasiskirstymas be masto tikrai sujungia įvairaus pobūdžio ryšius (ir, savo ruožtu, priklauso nuo skirtingų geografinių modelių, tokių kaip sienos). Tačiau mes padarome aiškiai skirtingas išvadas, palyginti su dabartine šiuolaikine technologine prasme, atsižvelgiant į jos reikšmingumą. Užuot naudojęsi visais duomenimis ir aptarę aukšto lygio stebėjimo skalės optimalumą a posteriori, mes dirbame atvirkščiai, remdamiesi ryšių skale, kad aklai apibrėžtume nuo masto priklausomų tinklų seriją. Šie tinklai yra pagrįsti didėjančiu ryšio atstumo slenksčiu ir tokiu būdu sukonfigūruoja didėjantį judėjimo spindulį. Tuomet gaunama eilė geografinių skaidinių, iš kurių gauname nedaug nepaprastai nuoseklių aukšto lygio stebėjimo skalių. Tuo pačiu metu nustatomas nedidelis atitinkamų žemo lygio skalių rinkinys, atsižvelgiant į jungties atstumą arba judėjimo spindulius.

Kitaip tariant, mes išskaidėme endogeninę masto struktūrą, eksponuodami fazių perėjimus, remiantis geografinių modelių panašumu. Todėl, nors mes pripažįstame, kad teritorijos gali būti struktūriškai išdėstytos iš dalies sutampančiomis pertvaromis, mes tvirtiname, kad elgesys atitinka tik keletą protingų skalių. Mes šį netiesioginį radinį prilyginame aiškioms, žmogaus sukurtoms hierarchijoms, kurias galima rasti tradiciškesniuose „iš viršaus į apačią“ metoduose, remiantis diskrečiomis ontologijomis, turinčiomis nedaug įterptųjų erdvinių skalių, pavyzdžiui, administraciniu suskirstymu (pvz., NUTS) 16 .

Empirinis požiūris

Žmonių judėjimo įvairiuose geografiniuose regionuose duomenų rinkinius gavome iš viešų duomenų, surinktų iš „Instagram“ per 16 mėnesių (žr. Skyrių „ Medžiagos ir metodai“, kuriame pateiktas išsamus ir oficialus čia aptartų metodų ir algoritmų aprašymas). Šiuolaikiniuose išmaniuosiuose telefonuose yra geografinės padėties nustatymo technologija, kurią galima naudoti nuotraukoms žymėti, ir daugelis vartotojų sutinka su šiuo parametru. „Instagram“ susieja nuotraukas su jas paėmusių vartotojų identifikatoriumi, be to, tai daro ir laiko žymes.

Visuotinis „Instagram“ priėmimas per pastaruosius kelerius metus pavertė jį nemaža geosocialinių duomenų skraidančios literatūros šaltiniu. Konkrečiai kalbant apie mobilumą, keli naujausi darbai parodė, kad patikimus duomenis apie mobilumą galima gauti iš nuotraukų paskelbimo ir registracijos platformų 6, 7, 8, 13, tuo tarpu „Instagram“ atrodo abu. Susitelkimas į atskirus judesius 21 rodo, kad iš „Instagram“ išplaukiantys geografiniai modeliai yra panašūs į tuos, kurie randami duomenyse, gautuose „Foursquare“, vadinamojoje „registracijos“ platformoje, kur vartotojai paprastai perduoda savo poziciją savo draugams (tačiau laikini modeliai ir skelbimas) elgesys skirtingose ​​dviejose platformose skiriasi, o tai rodo, kad jie atitinka skirtingą interneto naudojimą). Neseniai atliktame tyrime 18 tiksliau nagrinėjami socialiniai ir erdviniai modeliai bei susiskaldymas miestų lygmeniu. Jame aprašoma, kaip „Instagram“ gali būti naudojama norint atskleisti kokybiškai reikšmingas vartotojų grupes ir vietas, atitinkančias rankinę informacijos, kurią vartotojai pateikia savo paskyroje, analizę (apibūdinančią, pavyzdžiui, jų profesiją, priklausymą, pomėgius).

Šio darbo tikslais mums įdomios ne pačios nuotraukos, o tik metaduomenys. Stebėdami vietas, kuriose konkretus vartotojas fotografavo, galime įžvelgti tikėtiną ryšį tarp dviejų nurodytų regiono vietų.

Mes sutelkiame dėmesį į devynias skirtingas sritis, kurios buvo pasirinktos siūlyti įvairius atvejus pagal kelis kriterijus: Belgija, Portugalija, Lenkija, Ukraina, Izraelis, platesnis Beneliukso regionas ir Berlyno bei Paryžiaus miestai. Taigi turime penkias įvairaus dydžio šalis, tarpvalstybinį Vakarų Europos regioną ir du miestus.

Voronoi diagramos ir žmogaus judėjimo grafikai

Mes dirbame su dviem pagrindiniais formalizmais: Voronoi 22 diagramomis ir svertiniais žmogaus judėjimo tarp vietų grafikais. Atsižvelgiant į iš anksto apibrėžtą geografinių pozicijų rinkinį regione, vadinkime juos sėklomis, Voronoi diagrama padalija plokštumą ląstelėse taip, kad kiekviena ląstelė atitiktų sėklą. Voronoi diagramos pasižymi tuo, kad bet kuris ląstelės taškas yra arčiau ląstelės sėklos nei bet kuri kita. Tai leidžia mums išskaidyti erdvę, kiekvienai regiono nuotraukai priskiriant Voronoi ląstelę. Iš anksto apibrėžtos padėtys taip pat yra viršūnės grafike, o briaunos svoris yra tiesiog vartotojų skaičius, kurį turi abi viršūnės - tai yra vartotojų, kurie padarė bent vieną nuotrauką kiekvienoje vietoje, skaičius.

Iš šių svertinių grafikų sudarome atstumų kraštais pasiskirstymą, kurį padalijame į 100 procentilių. Tai sudaro visą skalių spektrą, su kuriuo mes dirbame. Taikant atstumo pasiskirstymo procentilius, galima apibrėžti palyginamąsias skales pagal regionus, tuo tarpu absoliučias atstumo vertes, atitinkančias kiekvieną skalę, lemia žmogaus judėjimas tam tikrame regione. Grafikas, jungiantis pozicijas regione, sudaromas kiekvienam iš šių procentilių, atsižvelgiant tik į ryšius su atstumu iki nurodytos procentilės. Kitaip tariant, kiekvieno regiono grafikas skalėje s surenka visų stebimų judesių procentus%, suskirstytą į didėjantį atstumą, ty judesius iki atstumo spindulio, kuris atitinka procentilį.

Geografinės sankaupos ir ribos

Nuo mastelio priklausantys grafikai yra padalijami naudojant bendruomenės aptikimo algoritmą . Geografinių grupių nustatymas dažnai priklauso nuo tinklo nustatymo tinklo metodais, pavyzdžiui, nuoroda. 5, kur apskrities lygio sienos yra rekonstruojamos maksimaliai padidinant grafikų bendruomenių moduliškumą JAV mobiliųjų telefonų duomenyse, ref. 6, kuris remiasi svertiniu registracijos trajektorijų tinklu arba nuoroda. 16, kur „Louvain“ yra naudojamas priemiestinių tinkle. Ši algoritmų klasė bando rasti grafiko skaidinį, kurio moduliavimas yra didžiausias, ty kraštų dalis pertvarų viduje, normalizuota numatoma trupmena atsitiktiniame grafike su tokiu pačiu laipsnio pasiskirstymu. Taigi moduliavimas išmatuoja tam tikro pertvaros stiprumą 23 .

Šiame etape pereiname prie Voronoi schemų. Jų ląsteles dabar galima priskirti geografinėms grupėms pagal aukščiau aprašyto žingsnio rezultatus. Norėdami pašalinti likusį triukšmą, padalintoms schemoms taikomas išlyginimo procesas. Dabar galima apskaičiuoti tikrąsias geografines ribas. Dvi vietos laikomos kaimynėmis, jei jų atitinkamos Voronoi ląstelės turi bendrą ribą. Kraštai, kuriuos dalijasi dvi „Voronoi“ ląstelės, priskirtos skirtingoms bendruomenėms, nubrėžtos kaip ribos.

Rezultatai

Faziniai perėjimai ir natūralios skalės

Aptikę bendruomenę ir išlyginę kiekvieną procentilio skalę, galime analizuoti skalių panašumą. Kalbant konkrečiau, mums įdomu sužinoti, ar yra aiškiai apibrėžtų skalių diapazonų, kurie yra pakankamai panašūs vienas į kitą ir pakankamai skirtingi, kad galėtume kalbėti apie natūralias skales, o 100 procentines reikšmes sumažinti iki mažesnio skalių skaičiaus.

Naudodami paprastą parametrų neturintį lūžio taško aptikimo algoritmą galime rasti fazių perėjimus mastelio erdvėje. „Fazinį perėjimą“ mes suprantame bendruoju būdu, ty tai reiškia staigų pertvarų elgesio pasikeitimą, kai šiek tiek padidinamas judesio spindulys, pereinant nuo mastelio prie kito. Devyniuose tiriamuose regionuose mūsų algoritmas nustato, kad mastelio erdvė yra padalinta į ne daugiau kaip 2 arba 3 gerai diferencijuotus skalių intervalus, kuriems būdingi labai panašūs modeliai. Agreguojantys vis ilgesni saitai, likdami žemiau nurodyto intervalo viršutinės ribos, reikšmingai nepakeičia tam intervalui būdingos erdvės pertvaros. Šiuos intervalus mes vadiname natūraliomis skalėmis . Be to, automatiškai randami mūsų algoritmo lūžio taškai dažniausiai atitinka vizualinę intuiciją: 1 pav. Matome, kad šie fazių perėjimai taip pat yra gana akivaizdūs paprasčiausiai apžiūrint.

Image

Skirtumų vertės normalizuojamos regione iki [0, 1] skalės. Šviesesnės spalvos reiškia didesnį skirtumą. Grynai juoda spalva (0, 0) reiškia, kad tobulai sutampa, ryškiai geltona (1, 0) - didžiausias regione nustatytas skirtumas. Brūkšniuotos mėlynos linijos nurodo nepertraukiamumus, nustatytus lūžio taško aptikimo algoritmu ir atitinkamai natūraliomis skalėmis; žali taškai žymi kiekvieno natūralaus masto intervalo prototipinę skalę. Parodyta vidutinė absoliutaus skirtumo vertė vienai intervalų porai. Vertė žaliame fone atitinka vidinį vidutinį skirtumą (intervalas lyginamas su savimi); juodas fonas rodo vidutinį skirtingų intervalų skirtumą.

Visas dydis

Daugiapakopiai pertvaros ir prototipinės skalės

Atsižvelgiant į panašių arba natūralių skalių intervalus, dabar pageidautina, kad būtų metodas, pagal kurį būtų parodomos pertvaros apibrėžtos ribos tais intervalais. Mes siūlome paprastą sprendimą: nurodykite procentinę dalį, kuri geriausiai atspindi visą intervalą. Mes tai prototipine procentile vadiname prototipiniu tiriamo regiono mastu . Tam tikro intervalo prototipinė skalė yra intervalo su atitinkama pertvara procentinė dalis, kuri yra labiausiai panaši į visas kitas pertvaras. Prototipinės skalės, rastos kiekvienam regionui, taip pat pavaizduotos 1 pav., Kartu su natūraliomis skalėmis. Taigi pagal konstrukciją atskiros natūralaus mastelio skalės turi būti maždaug panašios į atitinkamo prototipo skalę. Tolesniuose žemėlapiuose prototipinės skalės yra naudojamos kaip vaizdinės natūralių skalių reprezentacijos.

2 paveiksle naudojami Belgijos rezultatai, siekiant parodyti, kaip natūralios skalės atitinka pertvaras žemėlapyje ir kaip keletą natūralių skalių galima sujungti į vieną daugialypį žemėlapį, kuriame pateikiama turtingesnė informacija apie geografinius regiono modelius nei tai, kas įmanoma su labiau tradiciniai metodai. Naudodami visą grafiką (procentilė 100) ir priversdami bendruomenės aptikimo algoritmą rasti geriausią skaidinį dviejose bendruomenėse, pateikiame dvipartį teritorijos padalijimą. Kaip galima pastebėti, susidariusi pertvara beveik visiškai atitinka dviejų didžiausių kalbinių bendruomenių Belgijoje sieną. Tai yra gerai žinomas rezultatas 4, 24 ir parodo du dalykus. Viena vertus, supaprastinę savo metodą tokiu būdu, kad jis taptų lygiaverčiu anksčiau paskelbtiems metodams, gauname panašius rezultatus, kurie pateikia tam tikrų teisingumo įrodymų. Kita vertus, šių supaprastinimų priėmimas greičiausiai nėra geriausias būdas išardyti judėjimo struktūrų struktūrą Belgijoje: atvirkščiai, visoms mastelio fazėms dviejų dalių skaidymas nepasiekia geriausio moduliškumo, kuris paprastai atitinka didesnį skaičių. geografinių vietovių (2 pav.).

Image

( a ) Šilumos žemėlapis, paimtas iš 1 pav. b ) Tolimųjų skalių kraštinės. c ) Mažų atstumų skalės ribos. d ) vidutinio nuotolio skalės kraštinės. e ) daugiapakopės sienos. f ) kraštinės, pagrįstos optimaliu dviejų visos bendruomenės diagramų skaidiniu. g ) Belgijos kalbų bendruomenės. Visi žemėlapiai, išskyrus g ), buvo sukurti autorių naudojant „Basemap Matplotlib Toolkit ver“. 1.0.8 (//matplotlib.org/basemap/). Žemėlapis g) „Wikimedia“ bendradarbiai Vasceris ir Knorckas, licencijuoti pagal CC BY-SA 3.0. Licencijos sąlygas galite rasti šioje nuorodoje: //creativecommons.org/licenses/by-sa/3.0/.

Visas dydis

Taikant mūsų metodą, Belgija gali būti tiksliau suskaidyta kaip trijų didėjančio prabangumo teritorinių pertvarų perdanga. Didžiausią natūralų mastelį atspindi pertvara, pagrįsta nedaugeliu plačių plotų, kurių ribos atitinka judumą tarp miestų, nes jis iškyla tik tada, kai jungiamos ilgesnės nei 81, 5 km jungtys. Priešingai, mažiausias natūralus mastas yra toks, kad dauguma sienų supa ir juosia vietinę sostinę; jis remiasi jungtimis, mažesnėmis nei r ≤ 38, 6 km. Vidutinis natūralus mastelis pasirodo, kai atsižvelgiama į sąsajas tarp 38, 6 ir 81, 5 km. Įdomu tai, kad nuo didelių atstumų masto jis skiriasi tik keliomis ribomis: pavyzdžiui, nors Haseltas yra platesnio olandų kalba kalbančio klasterio dalis dideliame žemėlapyje, jis priklauso tai pačiai grupei kaip Liege vidutinio masto.

Galiausiai 3 pav. Toliau pateikiame visų devynių regionų daugialypius žemėlapius. Mes taip pat pavaizduojame absoliučius fizinius atstumus, susijusius su visomis natūralios skalės ribomis. Atminkite, kad absoliuti fizinė „didelio“ ar „mažo“ masto reikšmė labai priklauso nuo regiono: Paryžiui, kuris yra gana tankus metropolis, besidriekiantis palyginti mažame plote, mažiausias natūralus mastelis paprastai apima pėsčiųjų judėjimą ( r ≤ 2, 1 km). Berlyne perjungimas tarp mažų ir didelių natūralių svarstyklių vyksta r ≤ 10, 0 km spinduliu, kuris galėtų atitikti „vietines“ keliones pėsčiomis, dviračiais ar metro. Atrodo, kad didžiuosiuose regionuose, tokiuose kaip Lenkija, Rumunija ar Ukraina, jie atitinka didesnį motorizuotų tarpmiestinių poslinkių diapazoną, maždaug maždaug šimto kilometrų dydžio.

Image

Žalia atitinka mažiausią natūralų skalę, mėlyna - vidurį (jei tokia yra) ir raudona - didžiausią. Visi žemėlapiai buvo sukurti autorių naudojant „Basemap Matplotlib Toolkit ver“. 1.0.8 (//matplotlib.org/basemap/). Žemėlapių plytelės, naudojamos Berlyno ir Paryžiaus žemėlapių „OpenStreetMap“ bendradarbių fone, licencijuotos pagal CC BY-SA (www.openstreetmap.org/copyright). Licencijos sąlygas galite rasti šioje nuorodoje: //creativecommons.org/licenses/by-sa/2.0/.

Visas dydis

Aukštos skiriamosios gebos žemėlapių, skirtų visoms gamtinėms skalėms, rinkinį, taip pat visų regionų įvairaus masto vaizdus galima rasti Supp. Informacija. Atlikti išsamią šių žemėlapių socialinę ir geografinę analizę nepatenka į šio straipsnio taikymo sritį, tačiau galime nustatyti kai kurias ypatybes, patvirtinančias liaudies žinias apie tam tikrus regionus. Portugalijoje didelės apimties ribos nusako labai turistinius Algarvės paplūdimius pietuose ir miglotai padalija šalį į šiaurinius ir pietinius regionus, o trumpos skalės suteikia protingas vietines pertvaras, pavyzdžiui, tankų Porto miestą ir socialinę bei ekonominę atskirtį tarp sostinė Lisabona ir kaimyninė, bet turtingesnė Cascais / Estoril pakrantės zona. Beniliukso žemėlapis praturtina ankstesnę Belgijos įžvalgą pateikdamas platesnį galimų tarpvalstybinių sąsajų vaizdą - tai neįmanoma pasiekti su literatūroje tradiciškai naudojamais konkrečių šalių duomenų rinkiniais - čia didžiausio masto ekspozicija rodo tikėtinų tarptautinių sienų derinį ( pavyzdys tarp Belgijos ir Nyderlandų) ir neryškių tarpvalstybinių erdvių (tokių kaip platus priemiesčio plotas aplink Liuksemburgą arba siauros juostos, esančios greta Prancūzijos ir Belgijos sienos, pvz., aplink Lilę), paliekant vietos tarpvalstybinėms nedidelio masto erdvėms modeliai. Paryžiuje yra tradicinis miesto rytų-vakarų sociologinis padalijimas, o žemesniame lygmenyje (Lotynų kvartetas, Belvilis, vyriausybės zona) yra daugiau specifinės veiklos rajonų.

Nuo masto priklausomas vartotojo elgesys

Taigi natūralios skalės apibūdina geografines zonas ir ribas, veikiančias plačiu mastelio procentilių diapazonu, tačiau ne už jų ribų. Šiuo atžvilgiu jie atitinka atskirą judėjimo elgsenos spektrą, kuris greičiausiai atskleidžia nuoseklią, tačiau skirtingą pagrindinio regiono erdvinę praktiką. Kaip yra susijusios masteliai, ribos ir vartotojo elgesys? Viena vertus, 3 pav. Mes pastebime, kad kai kuriuose regionuose, tokiuose kaip Lenkija ar Rumunija, atrodo daug didesnė mažesnių, mažesnio masto modelių dalis nei kituose regionuose, tokiuose kaip Paryžius ar Beneliuksas. Mes pastebėjome, kad šie neatitikimai gali būti aiškinami atsižvelgiant į vartotojo lygio mobilumo elgseną: regionuose, kuriuose judesio atstumo pasiskirstymas yra didžiausias (ty kur žemieji ir aukštieji procentiliai atitinka aiškiai skirtingus fizinius atstumus), taip pat yra žymiai daugiau mažo spindulio geografinių modelių. per trumpiausią skalę (žr. papildomos informacijos S3 ir 4 pav.). Kitaip tariant, mes parodome, kad santykinis modelių skaičius visame natūralių skalių spektre atitinka santykinį faktinių fizinių ryšių atstumų pasiskirstymą tame pačiame spektre.

Toliau nagrinėsime natūralių skalių ir vartotojo lygio elgesio santykį, priskirdami vartotojams natūralių skalių rinkinį, prie kurio jie prisidėjo. Manome, kad vartotojai prisideda prie natūralios skalės, jei atlieka bent vieną judesį per atstumą per atitinkamą skalės intervalą. 4 paveiksle parodytas mišrus paveikslėlis. Apskritai vartotojų, prisidedančių tik prie aukščiausių skalių, dalis yra nedidelė, o trumpiausių skalių yra daugiausia. Tuo pačiu metu aktyviausiai vartotojai pagal aplankytas vietas (taip pat paskelbtas nuotraukas, žr. Priedo informacija) yra tie, kurie praleidžia daugiausiai skalių. Iš to darome išvadą, kad egzistuoja platus vartotojų ratas, veikiantis visomis masteliais, kuris papildomai visada surenka didelę visų vartotojų dalį (dažnai tai yra didžiausia dalis). Tai rodo, kad natūralios svarstyklės yra pagrįstos elgsena, o ne su mastais.

Image

Kiekvieno pjūvio / apskritimo plotas yra proporcingas vartotojų skaičiui, aktyviam pateiktame skalės rinkinyje (pavyzdžiui, „12“ reiškia vartotojus, prisidedančius tik prie 1 ir 2 svarstyklių). Vartotojo aktyvumą parodo gabaliukų tamsa, proporcinga aplankytų vietų skaičiui, palyginti su maksimaliu konkretaus regiono aktyvumu (100%): čia „123“ vartotojai visada yra tamsiausia / aktyviausi gabaliukai, jie nuolat lankosi daugelyje daugiau vietų nei kiti vartotojai.

Visas dydis

Baigiamosios pastabos

Efektyviai atskirdami ryšių skalę ir apibrėždami vis daugiau ir daugiau globalių tinklų, parodome, kad teritorijos automatiškai išskaidomos į iš dalies sutampančią geografinių skaidinių hierarchiją, be to, kad ši hierarchija parodo nepaprastai mažą natūralių skalių skaičių. Be to, įgyvendindami erdvinio mobilumo tinklus, įgyvendinome siekį surasti natūralias fazes bendruomenės pertvarose, remdamiesi tam tikra skiriamąja geba (žr. 25 nuorodą apie tinklus, kuriuose nėra geografinio masto). Priešingai nei klasikiniai lūkesčiai, kad apibendrinti mobilumo duomenys iš esmės nėra mastelio, mes sugebėjome atskleisti diskretinį atstumo slenksčių skaičių ir spindulius, konfigūruodami nuoseklius judėjimo modelius.

Žvelgiant plačiau, mobilumo modelių supratimas ir suskaidymas, kaip nedidelio skaičiaus endogeninio masto elgesio modelių persidengimas, turi svarbių padarinių įvairiose srityse, tokiose kaip epidemiologija, kultūrinis užkrėtimas ir viešoji politika 26, 27, 28, kur žemo lygio poslinkių modeliavimas 7, 8, 29, 30, 31 yra esminis dalykas: čia ypač naudingas gali būti ribinių sąlygų įvedimas, pagrįstas nedidelio skaičiaus natūralių skalių, atsirandančių iš duomenų duomenų, pastoliais.

Metodai

Šiame darbe naudotus duomenų rinkinius galima gauti pateikus prašymą atitinkamam autoriui. Programų, įgyvendinančių visas šiame dokumente aptartas duomenų gavimo ir apdorojimo užduotis, išeities kodas buvo išleistas kaip atvirojo kodo ir prieinamas viešoje saugykloje 32 .

Duomenų rinkimas ir pirminis apdorojimas

„Instagram“ API leidžia rinkti visus meta duomenis ir nuotraukų komentarus maksimaliu 5 km spinduliu aplink nurodytą geografinę koordinatę. Norėdami apibrėžti lankytinas vietas, šalims naudojame pasaulinę geografinių vietų, turinčių daugiau nei 500 gyventojų, duomenų bazę. Miestams mes paprasčiausiai nustatome pakankamai tankų tinklelį, kuris garantuoja, kad bus aptverta visa teritorija, atsižvelgiant į 5 km spindulį aplink kiekvieną tašką. Tada užklausosime dėl visų nuotraukų meta-duomenų maksimaliu spinduliu aplink kiekvieną tašką. Atsižvelgiant į artimoje vietoje esančių vietų sutapimo galimybę, mes atliekame tolesnį duomenų apdorojimą, kad pašalintume kopijas ir susietume kiekvieną nuotrauką su artimiausia žinoma vieta.

Tinklai, masteliai ir ribos

Mes naudojame ankstesnius duomenis, kad sukurtume svertinį grafiką, jungiantį vietų rinkinį. Ši schema nėra nukreipta ir pagrįsta vartotojo judėjimu, atsižvelgiant į vietų, kuriose tas pats vartotojas fotografavo, rinkinį. Briaunos svoris rodo vartotojų skaičių, kurie fotografavo abiejose briaunos sujungtose vietose. Paprastai šią diagramą galime pavaizduoti kaip G = { V, E }, kur V yra vietų aibė ir

Image

svertinių briaunų rinkinys.

Galiausiai pašaliname visas viršūnes, turinčias labai žemą laipsnį (kurį ad hoc būdu apibrėžiame kaip mažiau nei 5 visuose regionuose). Intuityviai tai reiškia, kad mes atsižvelgiame tik į vietas, kuriose bent 5 skirtingi vartotojai fotografavo. Šios labai mažo aktyvumo vietos yra labai jautrios mėginių iškraipymams ir sukelia triukšmą bendruomenės aptikimo procese.

Procentiniai grafikai

Kiekvienai atstumo procentinei daliai sudaromas vienas grafikas, kuris taip nusako skalę. Laikykime, kad m s yra didžiausias absoliutus atstumas procentile ar skalėje s , o d (e ) yra funkcija, suteikianti atstumą tarp dviejų briaunos e viršūnių. Tada skalės s grafikas G s apibrėžiamas taip:

Image

Tinklo skaidiniai

Mes naudojame gerai žinomą „Louvain“ metodą 33 - de facto aukso standartą tinklo bendruomenės aptikime, plačiai naudojamą aukštos kokybės rezultatams už mažą skaičiavimo kainą - kaip įdiegtą „igraph“ programinės įrangos pakete 34, 35 . Tikriausiai „NP-hard“ yra optimalus bendruomenės aptikimas, kaip ir daugelis grupavimo problemų 36 . Taigi Louvain metodas yra apytikslis algoritmas. Tai taip pat nėra determinuota. Norėdami pasiekti aukštesnės kokybės skaidinius ir padidinti pertvarų stabilumą skirtingose ​​skalėse, kiekvienam grafikui atliekame 100 „Louvain“ serijų ir pasirenkame rezultatą, kuris pasiekia aukščiausią moduliškumą. Kitas įprastas požiūris yra atsižvelgti į visus daugybės vykimų rezultatus ir vizualizuoti pertvaras taip, kad vaizdinis svoris būtų priskiriamas riboms proporcingai jų pasirodymo kartų skaičiui 17 . Atsižvelgiant į tai, kad dirbame su papildomais masto aspektais, vengiame šio požiūrio paprastumo dėlei.

Atkreipkite dėmesį, kad bendruomenės aptikimas atliekamas vietų grafike, neturint informacijos apie viršūnių geografinį artumą. Laimei, mes pastebime, kad aptiktos bendruomenės dažniausiai yra gretimose vietose ir kelia tam tikrą triukšmą (žr. Papildomą informaciją.).

„Louvain“ metodas gali sudaryti savavališką pertvarų skaičių. Norėdami patvirtinti savo rezultatus, mes taip pat esame suinteresuoti gaminti pertvaras. Norėdami tai pasiekti, paimame geriausią Louvain rastą skaidinį ir išsamiai išbandome visus galimus duotų skaidinių sujungimus į dvi dalis. Pasirinktas sujungimas su didžiausiu moduliškumu (nors paprastai mažesnis už Louvain sukurtą rezultatą).

Geografinių ribų išlyginimas

Mes naudojame šią Voronoi kaimynystės sąvoką, kad apibrėžtume išlyginimo procesą. Nuo ankstesnio skyriaus skaidymo proceso kiekviena vieta priskiriama bendruomenei. Jei dauguma vietos kaimynų (įskaitant pačią vietovę) priklauso kitai bendruomenei, ląstelė priskiriama šiai daugumos bendruomenei. Procesas kartojamas pakartotinai, kol nesuaktyvinama ankstesnė sąlyga.

Geografines ribas pagaliau apibrėžia Voronoi ląstelių ribos, kurių atžvilgiu dviejų gretimų kamerų vietos nepriklauso tai pačiai bendruomenei.

Skalių panašumas, lūžio taško aptikimas ir natūralios skalės

Matuojamas skaidinių panašumas

Pirmiausia mes nustatome panašumo metriką tarp dviejų to paties vietų rinkinio skaidinių, naudodami „Rand“ rodyklę 37 . Apsvarstykite V vietų komplektą (kaip ir anksčiau) ir P s ir P s ′ dvi V pertvaras, susidariusias skalėse s ir s ′, aptikdamos bendruomenę, po to išlygindamos. Skirstinys yra apibrėžiamas kaip vietų pogrupių rinkinys, todėl jis yra įtrauktas į

Image

Apibrėžkime funkciją μ P ( i, j ), kurios reikšmė yra 1, jei ir i, ir j priklauso tam pačiam skaidinio P , 0 pogrupiui:

Image

Tada galime apibrėžti P s ir P s ′ panašumą kaip V poros vietų, turinčių tą pačią μ reikšmę ir P, ir P s ′, santykį (ty jie panašiai klasifikuojami skalėse s ir s ′), o bendras galimų vietų porų skaičius:

Image

Panašių skalių intervalai

Aukščiau pateikta δ metrika leidžia mums palyginti kiekvieno procentilio grafiko skirsnius su kiekvienu kitu procentiliu. Neatidėliotinas pritaikymas yra vizualinis patikrinimas, sukuriant šilumos žemėlapius, kaip parodyta 1 pav. Pagrindinis šiame straipsnyje pateikto tyrimo klausimas yra tas, ar pertvaros P s keičiasi sklandžiai, didėjant, ar yra aiškių pertraukimų. Šilumos žemėlapiai gana aiškiai rodo, kad yra netolygumų.

Norėdami nustatyti pertvarų panašumo ribinius taškus, pateiksime kitą metriką, šiek tiek panašią į moduliuose pateiktą grafikų sąvoką - nors ir dar paprastesnę. Ši metrika matuoja intervalų atskyrimą , atsižvelgiant į ribų taškų rinkinį B = { b 0,

.

, b n }. Panagrinėkime ir intervalų, apibrėžtų šiais lūžio taškais, rinkinį:

Image

. Taigi intervalo atskirtis tam tikram B gali būti apibrėžta taip:

Image

Intuityviai kalbant, tai yra santykis tarp vidutinio panašumo per intervalus (sverto pagal intervalo dydį) ir maksimalaus panašumo tarp iš eilės einančių skirsnių skirtingais intervalais. Kuo didesnė σ , tuo didesnis panašumas tarp pertvarų tuo pačiu intervalu, palyginti su blogiausiu atveju panašumas tarp pertvarų abiejose lūžio taško pusėse tarp iš eilės einančių intervalų.

Naudodamiesi šia metrika, mes apibrėžiame paprastą algoritmą, kuris pakartotinai prideda lūžio taškus, kol σ nebegalima pagerinti. Norėdami išvengti triukšmingų pašalinių reikšmių išskyrimo, mes nustatome mažiausiai 5 intervalo dydžius. Praktiškai minimalus intervalas turi įtakos tik dviem miestams, kurių galutinės skalės iš tiesų yra gana triukšmingos.

Prototipinės svarstyklės

Intervalai taip apibūdina natūralias skales ir tam tikru intervalu I apibrėžiame prototipinę skalę s I kaip I procentinę dalį su skaidiniu, kuris yra panašiausias į visus kitus I skirsnius. Norėdami įforminti:

Image

Kelių mastelių lyginimas

Anksčiau aprašytas išlyginimo metodas gali būti išplėstas į pertvarų rinkinį skirtingomis skalėmis. Kiekvienai „Voronoi“ plytelei priskiriame žymą, susidedančią iš bendruomenės numerio ( c i ), kuriai plytelė x priklauso kiekvienoje skalėje uždėjus „Louvain“:

Image

Tokie tipai yra traktuojami kaip vertės, o daugumos taisyklė taikoma kaip anksčiau. Jei tam tikra gretta yra daugumoje, esančioje šalia t x , tada t x įeina į tą gretos reikšmę.

Šio požiūrio pranašumas yra tas, kad jis lemia didesnį skirtingų masto sienų sutapimą. Kaina yra tokia, kad prarandamas tam tikras tikslumas. Kaip matyti, pavyzdžiui, 2 pav., Yra keletas nuokrypių nuo atskirų natūralių skalių ribų iki tų pačių daugialypio žemėlapio skalių ribų. Mes tvirtiname, kad tai yra pagrįstas kompromisas, norint žemėlapyje nustatyti skirtingų natūralių skalių ryšį.

Papildoma informacija

Kaip pacituoti šį straipsnį: Menezes, T. ir Roth, C. Natūralios svarstyklės geografiniuose modeliuose. Mokslas. Rep. 7, 45823; „doi“: 10.1038 / srep45823 (2017).

Leidėjo pastaba: „ Springer Nature“ išlieka neutralus paskelbtų žemėlapių jurisdikcijos reikalavimų ir institucinių ryšių atžvilgiu.

Papildoma informacija

PDF failai

  1. 1.

    Papildoma informacija

Komentarai

Pateikdami komentarą jūs sutinkate laikytis mūsų taisyklių ir bendruomenės gairių. Jei pastebite ką nors įžeidžiančio ar neatitinkančio mūsų taisyklių ar gairių, pažymėkite, kad tai netinkama.