Žmogaus gefyrinas yra įtrauktas į milžiniškas funkcines nekoduojančias yin-yang sekas gamtos komunikacijos

Žmogaus gefyrinas yra įtrauktas į milžiniškas funkcines nekoduojančias yin-yang sekas gamtos komunikacijos

Anonim

Dalykai

  • Haplotipai
  • Gyventojų genetika

Anotacija

Gefirinas yra labai konservuotas genas, kuris yra gyvybiškai svarbus organizmui, slopinančiam receptorius, organizmui, molibdeno kofaktoriaus biosintezei ir kitoms įvairioms funkcijoms. Specifinė jo funkcija yra griežtai reguliuojama ir buvo pastebėta, kad ji sukelia nenormalią daugelio žmonių ligų veiklą. Pateikiame puikų yin-yang haplotipo modelį, apimantį gefiriną . Yin-yang haplotipai atsiranda, kai DNR ruožas išskiria dvi skirtingas formas, turinčias skirtingas nukleotidų variacijų būsenas per ilgį. Gefirino yin-yang pora susideda iš 284 skirtingų nukleotidų būsenų ir abu variantai smarkiai skiriasi nuo jų protėvių haplotipo, ir tai rodo greitą evoliuciją. Kelios nepriklausomos įrodymų eilutės rodo stiprų teigiamą regiono pasirinkimą ir rodo, kad šie aukšto dažnio haplotipai atspindi du skirtingus funkcinius mechanizmus. Šis atradimas turi potencialą pagilinti mūsų supratimą apie kintamo žmogaus specifinio gefirino reguliavimą, tuo pačiu pateikdamas užuominas apie greitus evoliucijos įvykius ir alelinę migraciją, palaidotą žmonijos istorijoje.

Įvadas

Gefirinas yra 93 kDa daugiafunkcis baltymas, kuris buvo pavadintas graikų kalbos žodžiu „tiltas“ dėl savo vaidmens jungiant neurotransmiterių receptorius su mikrotubulų citoskeletu. Jis jungiasi su dideliu afinitetu polimerizuotą tubuliną, greičiausiai dėl motyvo, turinčio didelį sekų panašumą su MAP2 ir Tau 1, 2 rišamosiomis sritimis. Šis baltymas dinamiškai suteikia pastolius baltymų grupavimui tiek glicino, tiek GABA-A receptoriams slopinamosiose sinapsėse, vaidina lemiamą vaidmenį sinapsių formavime ir plastiškume bei, manoma, kad atlieka pagrindinį vaidmenį palaikant homeostatinį sužadinimo ir slopinimo balansą 3 . Gefirinas atlieka nepaprastai įvairias funkcijas. Jis susijęs su transliacijos inicijavimo mechanizmais ir yra susijęs su sinapsinių baltymų sintezės reguliavimu 4 . Jis taip pat sąveikauja su žinduolių rapamicino (mTOR), pagrindinio baltymų, reaguojančio į maistines medžiagas, ląstelių ciklo reguliavimu, tikslais ir įrodyta, kad jo reikia pasroviui perduodant mTOR 5 . Įdomu tai, kad dėl GABAerginių sinapsių susikaupusį gefirino kiekį padidina iš smegenų išvestas neurotrofinis faktorius, veikiantis mTOR, ir sumažina glikogeno sintazės kinazės 3β fosforilinimas 6 . Gefirinas taip pat yra būtinas molibdeno kofaktoriaus (MoCo) biosintezei, nes jis yra būtinas norint įterpti molibdeną šio esminio proceso metu 3 . MoCo trūkumas sukelia didelę neurologinę žalą ir ankstyvą vaikystę. Manoma, kad senovės funkcijos (MoCo biosintezės) susiliejimas su evoliuciškai jauna funkcija (neuroreceptorių grupavimas) daro įtaką MoCo sintezės kataliziniam efektyvumui, nes pagerina produkto ir substrato kanalizaciją 7 . Galiausiai neseniai buvo pastebėta, kad gefirinas lokalizuojasi nežinomos sudėties neneuroninėse ląstelėse ~ 600 kDa citoplazmos komplekse, ir buvo spėliojama, kad šis kompleksas gali būti susijęs su maistinių medžiagų jutimu, gliukozės metabolizmu ar senėjimu, galbūt dėl ​​gefirino sąveikos. su mTOR 8 .

Gefirino baltymus koduojantys regionai yra identiški šimpanzės ortologui ir yra labai konservuoti tarp rūšių. Priešingai, šio geno reguliavimas yra labai įvairus. Gefyrinas gamina sudėtingas alternatyvias sujungimo izoformas, kurios yra labai svarbios jo įvairioms funkcijoms atlikti, ir mažiausiai 8 iš 29 šio mozaikos geno egzonų yra alternatyvusis sujungimas rūšių, audinių, ląstelių ir (arba) aplinkai būdingomis manieromis 1, 9., 10, 11, 12, 13 . Manoma, kad slopinamose sinapsėse esantis gefyrino karkasas yra šešiakampė grotelė, turinti dvejopą ir trigubą simetriją, o kai kurios alternatyvios jungiamosios izoformos ardo šią struktūrą 14 . Šios alternatyvios formos gali suteikti plastiškumo ir receptorių tvirtinimo dinamiką veikdamos kaip dominuojantys-neigiami variantai, kurie suriša ir pašalina receptorius iš sinapsių 14 . Atitinkamai, MoCo biosintezės aktyvumas taip pat priklauso nuo izoformos, nes įvairūs kasetės intarpai ar delecijos inaktyvuoja šią sintezę 15 . Dėl šių priežasčių būtina išsiaiškinti reguliavimo mechanizmus, norint išsiaiškinti ir suprasti gefirino dinaminę ir įvairią veiklą ir funkcijas.

Žymenys intronuose ir artimoje genominėje plotmėje yra svarbūs kandidatai į reguliavimo elementus, o regioną, apimantį gefiriną , anksčiau pažymėjo dvi skirtingos grupės. Šioje vietoje buvo aptiktas 2, 1 Mb homozigotiškumo (ROH) regionas (nuoroda 16). ROH yra koreliuojami su jungties pusiausvyra (LD) ir buvo pastebėta, kad kartais jie turi ryškiai skirtingus haplotipus 17 . Savo 2010 m. Dokumente Curtis ir Vine 16 nustatė 20 genomo sričių, kuriose buvo daugiausiai asmenų, rodančių ROH, ir ištyrė 9 vieno branduolio polimorfizmų (SNP) haplotipus kiekvieno iš šių regionų centre, stebėdami, kad haplotipai parodė reikšmingą perteklinį skirtumą, tai yra porų polinkį tuo pačiu metu skirtis keliuose SNP. Yin – yang haplotipų terminas buvo sugalvotas, kad būtų galima užfiksuoti tokių struktūrų poliškumą, kai Zhang et al . Atrado 24 SNP modelį, kurio du haplotipai kiekvienoje vietoje yra skirtingos, o jų bendras dažnis yra 0, 50. 18 Curtis ir Vine 16 pažymėjo, kad dešimties labiausiai paplitusių devynių SNP haplotipų gefirino srityje buvo bendras dažnis - 0, 67, tai rodo stebėtinai mažą haplotipų įvairovę. Įdomu tai, kad aštuoni iš šių dešimties haplotipų davė keturias poras yin-yang haplotipų, kurių kiekviena turėjo skirtingas aleliškas būsenas visuose devyniuose SNP, nurodant, kad atsiradę haplotipai labai skyrėsi vienas nuo kito.

2012 m. Tyrime, nesusijusiame su yin-yang haplotipais, šį regioną nustatė 19 parkas, atlikdamas viso genomo LD nuskaitymą. Šis tyrimas nustatė išskirtinai stiprų LD blokadą ir aptarė „nepaprastųjų“ dažnių spektrus visoms „HapMap 20“ populiacijoms 1 Mb zonoje, kurios centre yra gefirino 2 intronas. Park'as padarė išvadą, kad šį reiškinį gali lemti selektyvus valymas, ir apžvelgė daugybę atrankinio slėgio analizių, pažymėdamas, kad šis regionas buvo įtrauktas į papildomą medžiagą dviejuose iš šių tyrimų 21, 22, o kiti to visiškai nepastebėjo. 19 parkas pabrėžė šio regiono unikalumą, tačiau esminis yin-yang modelis nebuvo pastebėtas.

Tirdami duomenis apie genomo populiacijos duomenis, SNP duomenims, taikomiems HapMap 20 populiacijose, taikome neseniai sukurtą metodą, pavadintą „BlocBuster 23“, ir atrandame aukšto dažnio 284-SNP yin-yang haplotipų porą, įterptą nekoduojančiuose regionuose gefirino ir jo apylinkėse. . Abu haplotipai labai skiriasi nuo jų protėvių haplotipų, tačiau jie yra labai konservuoti tarp visų pasaulio gyventojų, nurodant du radikaliai skirtingus evoliucijos kelius viename genomo regione. Be to, mes pranešame apie kelias nepriklausomas įrodymų linijas, rodančias, kad identifikuotiems yin ir yang haplotipams yra atrankinis spaudimas, taigi siūlome du skirtingus ir funkciškai reikšmingus mechanizmus, kuriais grindžiami šie regionai.

Rezultatai

Gefirinas yra yin-yang haplotipų poroje

Mes pritaikėme savo „BlocBuster 23“ metodą (žr. Metodus) nesusijusių asmenų SNP duomenims keturiose „HapMap“ populiacijose 20 : Šiaurės ir Vakarų Europos protėviai (CEU), Hanų kinai Pekine, Kinija (CHB), japonai Tokijuje (JPT) ir Joruba. Ibadanas, Nigerija (YRI). „BlocBuster“ konstruoja tinklus, kurie atskleidžia haploidines SNP alelių grupes, kurios yra tarpusavyje susijusios, vadinamos blokais . Rezultatai buvo labai vienodi visose autosominėse chromosomose, išskyrus 14 chromosomą, kuriai būdingos neįprastos tinklo savybės (1 papildoma pastaba). Tada „BlocBuster“ pritaikėme „HapMap“ duomenims apie keturias skirtingas populiacijas: gudžarati indėnai, gyvenantys Hiustone, JAV (GIH), Luhya Webuye mieste, Kenijoje (LWK), Masajai Kinyawa mieste, Kenijoje (MKK) ir Toscani Italijoje (TSI) 20 ir vėl 14 chromosoma buvo pašalinė. Išsamesnis tyrimas atskleidė anomalijų šaltinį - 73% visų pirmojo tinklo kraštų buvo sukoncentruoti į vieną bloką su 255 SNP aleliais, o 74% antrojo tinklo kraštų buvo sukoncentruoti į 2 blokus su 264 ir 257 SNP aleliai, atitinkamai. Du antrojo tinklo blokai turi bendrą 241 SNP, kiekviename bloke yra priešingi aleliai. Be to, šie SNP apima tą patį genomo regioną, kaip ir pirmojo tinklo blokas.

Apskritai, atliekant dvi analizes rasti trys blokai užfiksuoja vieną yin – yang haplotipų porą. Trys blokai turi 226 SNP bendrai ir apima 284 unikalius SNP iš viso (1 papildomas duomenų rinkinys). Mes apibrėžėme šią yin-yang porą naudodamiesi šiais 284 labai koreliuojančiais SNP. (Žr. 1 papildomąją pastabą ir papildomą 1 pav., Kur aprašomas papildomas blokas, atitinkantis yang haplotipą pirmajai analizei.) Ši yin – yang pora yra 14q23.3, apimanti gefiriną ( GPHN ) ir besitęsianti maždaug 300 kb prieš ir po gefirino (1 pav.). Įdomu tai, kad visi skirtingi žymenys atsiranda intronuose, ilgose nekoduojančiose RNR arba tarpgeninėse srityse. Kaip parodyta spalvota juosta virš pirmųjų dviejų matricų stulpelių 1 pav., Keli SNP yra pasroviui nuo gefirino (atitinkamai 2%, 3, 4% ir 5, 1% 255, 264 ir 257-SNP blokams). ) ir nė vienas iš jų nėra MPP5 . Maždaug penktadalis SNP yra prieš srovę nuo gefirino (19, 2%, 18, 6% ir 20, 6%), o visi trys blokai turi tuos pačius aštuonis SNP ilgoje nekoduojančioje RNR LINC00238 . Didžioji dalis SNP yra nekoduojamuose gepirino regionuose (78, 0%, 78, 0% ir 74, 3%).

Image

(Geriausiai žiūrimas spalvotas, aukštos skiriamosios gebos vaizdas, prieinamas internete, kaip 3 pav.). Viršutinis skydelis: yin – yang sritis su spalvotais genais ir padėtimis kb. Apatinė plokštė: yin – yang haplotipų genotipai. Pirmasis matricų stulpelis parodo „yin“ bloką, nustatytą analizuojant GIH, LWK, MKK ir TSS populiacijas. Vidurinis stulpelis parodo „yin“ bloką iš CEU, CHB, JPT ir YRI analizės. Paskutiniame stulpelyje pateikiami galimi yin-yang SNP kiekvienai iš trijų papildomų HapMap populiacijų: ASW, CHD ir Meksikos protėviams Los Andžele, Kalifornijoje. Kiekvienai matricai kiekvienas stulpelis žymi SNP, o kiekviena eilutė reiškia asmenį (eilutės pertvarkomos taip, kad panašūs asmenys būtų išdėstyti vienas šalia kito). Pirmųjų dviejų stulpelių viršuje esančios spalvų juostos nurodo SNP pozicijas, suderindamos genų spalvą iš viršutinio skydelio. Tamsiai mėlyna spalva rodo homozigotą SNP aleliui bloke, raudona - homozigotą pakaitiniam aleliui, šviesiai mėlyną - heterozigotą ir baltą - trūkstamų duomenų. Tvirtai tamsiai mėlyna horizontali linija žymi individą, turintį du yin haplotipus, o vientisa raudona linija - yang homozigotą. Kiekvienos matricos dešinėje pusėje parodyti procentai asmenų, kurie yra yin ir yang haplotipų homozigotai arba heterozigotai. Yin (mėlyna) ir yang (raudona) haplotipų dažnis yra parodytas lentelių diagramoje virš kiekvienos matricos, balta spalva nurodant haplotipų procentą, kuris nėra 100% yin ir 100% yang.

Visas dydis

Dėl didelės heterozigotų dalies Azijos populiacijose mes toliau tardėme šiuos rezultatus, naudodamiesi skaičiavimo etapais CHB ir JPT populiacijų haplotipais, kuriuos pateikė „HapMap“ konsorciumas. Yra nedaug yin-yang SNP pasroviui nuo gefirino ir jie yra retesni ir kintamesni už kitus SNP; taigi, mes jų neįtraukėme į šią analizę (žr. metodus). Turimi faziniai haplotipai neapėmė visų yin-yang SNP, o pašalinus SNP, kurių trūksta> 5% duomenų, liko 236 SNP faziuose haplotipuose 170 CHB + JPT asmenų, iš viso 340 fazių chromosomų. 2 paveiksle parodytas yin ir yang SNP alelių procentas, rastas kiekvienoje iš 340 fazių chromosomų. Šie brėžiniai parodo dviejų skirtingų haplotipų svarbą ir tarpinių haplotipų retumą.

Image

Parodyti CHB ir JPT fazių chromosomų, turinčių įvairius ( a ) yin ir ( b ) yang SNP alelių procentus, skaičius. Kadangi tai yra biallelic SNP, brėžiniai yra veidrodiniai vaizdai (pavyzdžiui, haplotipai, atspindintys 0–10% diapazoną a, yra tie patys haplotipai, atspindintys 90% –100% diapazoną b ). Tik 9 iš 340 fazių chromosomų yra yin arba yang alelių 10–90% diapazone.

Visas dydis

Tarpusavyje esančių SNP, esančių tarp yin-yang SNP, paprastai yra žemas mažasis alelių dažnis, kaip parodyta 3 pav. Ir papildomuose 4–11 pav. Atidus Azijos gyventojų tarpusavyje besiplečiančių SNP tyrimas rodo, kad keli žmonės linkę turėti didžiąją dalį mažųjų alelių (didelės raiškos vaizduose rodomi kaip horizontalios punktyrinės linijos per matricos yin-yang sritį). Atkreipkite dėmesį, kad šie asmenys nėra koreliuojami su yin ar yang haplotipų būkle, todėl nėra tikėtina, kad variantai bus autostopu su yin ar yang haplotipais.

Image

Parodyti galimi HapMap SNP yin-yang regione (355 pirmosioms keturioms populiacijoms ir 436 antrosioms keturioms populiacijoms), kartu su 300 SNP prieš srovę ir 300 pasroviui. (Geriausiai žiūrima spalvotai; išsamesnę informaciją žr. 1 pav. Antraštėje.) Mažosios alelės homozigotai CEU arba TSS populiacijose yra raudonos spalvos, heterozigotai yra šviesiai mėlyni, homozigotai pakaitiniame alelyje yra tamsiai mėlyni, o trūkstamų duomenų yra balta. SNP, kurių žemas mažasis alelių dažnis (MAF), yra vertikalios kolonos, kuriose vyrauja tamsiai mėlyna arba raudona spalvos. Spalvotos juostos virš kiekvienos grupės rodo SNP pasiskirstymą tarp genomų sričių. Didelės skyros vaizdus galima rasti internete kaip papildomus 4–11 pav.

Visas dydis

Šie rezultatai rodo išskirtinai aukštą ryšį tarp 284 SNP, kurių aprėptis yra didesnė kaip 1 Mb ir kurie daugiausia yra nekoduojamuose gefirino regionuose ir iškart prieš srovę. Pažymėtina, kad du atskiri haplotipai, turintys skirtingas būsenas visuose SNP, yra neįprasti ir atsiranda visame pasaulyje.

Yin-yang haplotipų išsaugojimas Homo populiacijose

Kaip parodyta 1 pav., Yin ir yang haplotipai yra svarbūs visoms 11 HapMap populiacijų, kurių bendras dažnis svyruoja nuo 0, 28 iki 0, 80. 1 pav. Pyrago lentelėse nurodomi yin ir yang haplotipų dažniai, o balti regionai parodo dalinio haplotipo dalį su viena ar daugiau alelių, neatitinkančiomis viso yin ar yang modelio. Homozigotų ir heterozigotų procentai yra išvardyti kiekvienos matricos dešinėje. Dviejose Europos protėvių populiacijose - CEU ir TSS - yra didelis yin homozigotų procentas. Trys Afrikos populiacijos, LWK, MKK ir YRI, turi aukštą yang haplotipų dažnį ir turi rekombinacijos bloką šalia haplotipų pabaigos, tuo tarpu individams, turintiems Afrikos protėvius Pietvakarių JAV (ASW), yang dažnis yra 0, 07 ir trumpesnė rekombinacija. blokuoti.

Rytų ir Pietų Azijos gyventojai (CHB, kinai Denverio metropolijoje, Koloradas, JAV (CHD), GIH ir JPT) demonstruoja stipriausią yin ir yang haplotipų mišinį. Kiekvienos iš šių keturių populiacijų dažnis yra mažiausiai 0, 25 kiekvienam iš yin ir yang haplotipų, o bendras CHB ir JPT populiacijų dažnis siekia atitinkamai 0, 76 ir 0, 80. CHD yra panašus į CHB, nors jau yra tam tikra rekombinacija prasidėjus CHD haplotipams. GIH, kurio protėviai yra iš Indijos subkontinento, dažnis yra panašus į Rytų Azijos populiaciją, nors ir sumažėjusių yang homozigotų ir padidėjusio haplotipo įvairovės.

Į „1000 genomų projektą 24“ įtraukiami duomenys apie 2 504 individų iš 26 pasaulio populiacijų genotipo duomenis, atspindinčius kiekvieno pagrindinio žmogaus protėvius. Nors į šiuos failus yra įtraukti sąlyginiai duomenys, mes sukūrėme „BlocBuster“ tinklą, kad patikrintume HapMap duomenų rezultatų patikimumą, kaip aprašyta 2 papildomoje pastaboje. Šiems asmenims yin ir yang haplotipai yra tariami (papildomas 2 pav.)., tokiu būdu palaikydami „HapMap“ rezultatus.

Protėvių aleliai 284 yin-yang SNP buvo nustatyti palyginus žmogaus ir šimpanzės DNR (žr. Metodus) ir parodyti 4 pav. Tiek yin, tiek yang haplotipai reikšmingai skiriasi nuo protėvių haplotipo: jie turi tik 51, 4% ir 48, 6 % tapatybės atitinkamai pagal valstiją. Makakos, orangutano ir šimpanzės haplotipai taip pat parodyti 4 pav. Ir paprastai yra panašūs į protėvių haplotipus.

Image

Parodyti makakų, orangutanų ir šimpanzių referenciniai aleliai iš UCSC Genomo naršyklės duomenų bazės. Protėvių aleliai tiekiami iš NCBI dbSNP tinklalapio (žr. Metodai). Raudonas šriftas rodo šių yin ir yang haplotipų skirtumus nuo šių protėvių alelių, haplotipą, paimtą iš individo iš Denisovano fosilijos vietos 28 ir 15 SNP alelių, atstovaujančių kelis Neandertalio ir Denisovano individus (Neand / Denis, žr. Metodai). Visi 125 nustatyti Denisovano haplotipo genotipai yra homozigotiniai parodyto alelio atžvilgiu ir šis haplotipas atitinka yang haplotipą visose 125 vietose. Tačiau jis taip pat labai panašus į protėvių haplotipą: 95, 2% alelių atitinka. Kita vertus, 11 iš 15 Neand / Denis alelių sutampa su yin aleliais, o likę keturi - protėvių, šimpanzių, orangutanų ir makakų aleliais. Visi Neando / Deniso aleliai, išskyrus vieną, atitinka protėvių haplotipą, o išvestas alelis atitinka yin haplotipą. Atkreipkite dėmesį, kad variacija, apibrėžianti yin ir yang haplotipus (raudonas šriftas), yra daugiausia unikali, nes 92, 6% iš 284 alelių neatitinka Neand / Denis, Denisovan, šimpanzės ar orangutano alelių (mėlynos spalvos šešėliai). Yin ir yang haplotipai skiriasi nuo protėvių haplotipų, turintys tik maždaug pusę SNP alelių, tačiau šie du haplotipai yra labai išsaugoti šiuolaikinių žmonių populiacijose. Norėdami gauti papildomos informacijos, žiūrėkite 1 papildomą duomenų rinkinį.

Visas dydis

Turimi Neandertalio ir Denisovano duomenys taip pat daugiausia sutampa su protėvių aleliais. 4 paveiksle pavaizduoti 15 SNP alelių trims Neandertal ir vienam asmeniui, kurį galima rasti iš Denisovan fosilijos vietos 25, 26 (Neand / Denis), kurie buvo įvesti Affymetrix HuOrigin masyve 27 . „SNO“ nustatymo metodas „HuOrigin“ masyvui turėjo SNP paklaidą, suderinant Denisovano ir šimpanzės alelius (žr. Metodai). Kaip parodyta 4 pav., Visi iš 15, išskyrus 1, sutampa su šimpanzės ir protėvių aleliais. Iš viso 11 iš 15 SNP alelių, įskaitant išvestą alelį, atitinka yin haplotipą. Taip pat parodyti 4 pav. „Denisovan Individual 28 “ geografiniai tipai, kuriems taikoma aukšta aprėptis. Priešingai nei Neand / Denis duomenys, visi 125 SNP atitinka yang haplotipą. Nors nėra akivaizdžios priežasties tikėtis šių duomenų šališkumo, 95, 2% alelių yra identiški pagal būklę (IBS) tiek su protėvių, tiek su šimpanzės aleliais. Tai netikėta, nes mažiau nei pusė yang alelių yra IBS su protėvių aleliais.

Apskritai, nors yin-yang genotipiniai modeliai nėra išsaugoti ne Homo genties rūšims, jie yra labai konservuoti HapMap populiacijose. Jų bendras dažnis porose svyruoja nuo 0, 28 iki 0, 80, kaip parodyta 1 pav.

Yin ir yang haplotipų pasirinkimas

Keli įrodymai rodo, kad yin ir yang haplotipai yra stipriai parinkti ir yra labai svarbūs. Pirma, įvairių statistinių atrankos testų serija rodo teigiamą regiono atranką, kaip parodyta 5 pav. Kairėje paveikslo plokštėje pateikiami keturių atrankos testų, apskaičiuotų per keturias HapMap populiacijas, rezultatai. Dešiniajame skydelyje rodomi atrankos testų, apskaičiuotų per „1000 genomų projekto“ duomenis (paskelbta 2012 m. Balandžio mėn.), Rezultatai. Aukščiausias paveikslas dešinėje pavaizduotas kaip selektyvus neandertalio ir žmogaus polimorfizmų skenavimas, o po to - 13 atrankos testų pagal 29 atranką (žr. Metodus). Abiejose plokštėse pateikti „Fay“ ir „Wu“ 30 H testo rezultatai. Šis testas buvo specialiai sukurtas atskirti teigiamą atranką nuo pirminės atrankos, naudojant duomenis iš pašalinių rūšių. Kaip parodyta paveiksle, yin – yang intervalas turi statistiškai reikšmingą H reikšmę. Visi šie rezultatai rodo stiprią teigiamą atranką yin-yang regione.

Image

Rezultatai iš „Haplotter 22“ (kairėje) ir „The 1000 Genomes Selection Browser 1.0“ (nuoroda 29) (dešinėje). Testų aprašymo metodą rasite skyriuje. Kairiajame skydelyje rodomi atrankos testų rezultatai per 5 Mb langą, kurio centre yra gefirinas, esant keturioms HapMap populiacijoms: CEU, YRI, CHB ir JPT. CHB ir JPT yra sujungti ir pažymėti kaip „ASN“ sklypuose. Į šiuos sklypus įeina „Voight“ ir kt . „IHs 22“, „Fay“ ir „Wu“ H- testas 30, „Tajima“ D 57 ir „ F ST“ . Viršutinis dešiniajame krašte pateiktas selektyvus neandertalio ir žmogaus polimorfizmų skenavimas, naudojant Z -core ± dispersiją (Neandertal), po kurio seka 13 atrankos testų. Rango balai buvo apskaičiuoti naudojant išorinį metodą, pagrįstą surūšiuotais viso genomo balais, o smailės žymi regionus, kuriuose atranka teigiama 29 . Priskiriami Tadžimos D (Taj_D) 57, Nei Dh (Dh) 62, Ramos-Onsins ir Rozos R2 (R2) 59, Sabeti ir kt . XP-EHH * (XPEHH) 60, Weir ir Cockerham pora F ST. (Fst) 64, Chen ir kt . XP-CLR (XPCLR) 65, Fay ir Wu H testas (FayWu_H) 30, Fu ir Li D (FuLi_D) 58, Fu ir Li F (FuLi_F) 58, Sabeti et. al . EHH vidurkis * (EHH) 61, Kelly's ZnS (ZnS) 63, Hoferio ir kt . absoliutusis ΔDAF (absDAF) 66 ir Hofer ir kt . standartas ΔDAF (DAF) 66 . Žvaigždutė rodo, kad metodą modifikavo Pybus ir kt . Nurodytos 29 populiacijos. Šis vaizdas apima modifikuotus ekrano vaizdus iš //hsb.upf.edu/ ir //haplotter.uchicago.edu/.

Visas dydis

Verta paminėti, kad Nielsen ir kt . 31 nustatė, kad gefirinas nerodo teigiamos selekcijos įrodymų ( P-vertė = 1, 0) geno koduojančiose srityse. Jų skaičiavimai buvo specialiai pagrįsti nesinoniminių ir sinoniminių mutacijų santykiu koduojančiuose regionuose. Atsižvelgiant į stiprų selekcinį spaudimą priimančiojo genomo regione, bet ne į gefyrino egzonus , darytina išvada, kad atrankos slėgis gali veikti funkcinius elementus nekoduojančiuose regionuose.

Antra, yin ir yang haplotipų dydis, sudėtis ir geografinis pasiskirstymas rodo greitą evoliuciją, rodančią stiprią teigiamą atranką. Nors 284 identifikuotuose SNP tarp yin ir yang porų yra 0 IBS, šių haplotipų atsiradimas 11-yje skirtingų populiacijų turi būti tapatus pagal kiekvieno haplotipo kilmę, atsižvelgiant į šimtų SNP alelių identiškas būsenas. Prisiminkite, kad yin haplotipas yra ryškus Europos populiacijose, yang yra ryškus Afrikos populiacijose, o Azijos gyventojų proporcijos yra beveik vienodos. Šis pastebėjimas kartu su prielaida, kad haplotipai yra identiški kilimo metu, leidžia manyti, kad Azijos reiškiniai atsirado dėl genų srauto ar jų maišymo. Darytina išvada, kad daugiau nei 100 nukleotidų mutacijų buvo fiksuotos kiekvienam iš dviejų haplotipų po to, kai jie buvo suskaidyti vienas nuo kito ir prieš jiems migruojant į Aziją. Tokia sparti raida rodo stiprią atranką. Keista, bet šiuolaikinėse populiacijose šios mutacijos paprastai išlieka fiksuotos, o visi tarpiniai haplotipai, atsiradę tarp pradinio suskaidymo ir fiksuotų būsenų, yra žemo dažnio arba visiškai išnyko.

Trečia, neįprasti rekombinacijos modeliai šiame regione palaiko atranką, palankią yin ir yang haplotipams. Atidus 1, 2, 3 paveikslų tyrimas leidžia manyti, kad rekombinantai, apimantys ir yin, ir yang tėvų haplotipą, dažniausiai yra reti, ypač gefirino viduje ir aukščiau šio geno. Toks rekombinantas pasirodys kaip horizontali juosta, apimanti blokus, kurie 1 paveiksle pavaizduoti dviem skirtingomis spalvomis. Kaip parodyta 2 pav., 340 CHB ir JPT haplotipų 9 9–10% sudaro yin / yang kompozicijos; 6 iš jų reiškia yin-yang rekombinantus, o 3 - tarpinius yin arba yang haplotipus su> 10% mutacijų variacijomis. Iš tikrųjų kiekvieno iš skirtingų yin ir yang haplotipų paplitimas, nepaisant didelių sambūvio ir rekombinacijos galimybių, rodo labai mažus yin ir yang haplotipų rekombinacijos įvykius. Tačiau, kaip parodyta 6 pav., Ankstesnėje šio regiono analizėje, kurią pateikė „HapMap Consortium“ (//hapmap.ncbi.nlm.nih.gov/downloads/recombination/), buvo pranešta apie vidutinę rekombinaciją regione, įskaitant numatytą rekombinacijos greitį. 9, 2 cM Mb −1 ties rs10133120 gefirino 5′-gale. Visi šie rezultatai aiškiai rodo, kad rekombinantai, apimantys du yin haplotipus, ir (arba) rekombinantai, apimantys du yang haplotipus, yra labiau paplitę nei rekombinantai, sujungiantys yin ir yang haplotipus. Šis pastebėjimas leidžia manyti, kad yin ir yang haplotipai galėjo būti parinkti geriau nei sujungti yin ir yang rekombinantai.

Image

Parodytos rekombinacijos normos, kurias „HapMap“ konsorciumas teikia yin – yang regionui. Šios normos buvo apskaičiuotos naudojant CEU, CHB, JPT ir YRI populiacijos duomenis. Visos šios padėtys yra yin-yang srityje ir 9, 2 cM Mb −1 rekombinacijos greitis buvo įvertintas rs10133120 ″ gepirino 5 ′ gale.

Visas dydis

Diskusija

Apskaičiuota, kad 5% žmogaus genomo yra atranka, tačiau tik ~ 1% genomo yra koduojami baltymai 32, tai rodo, kad atranka veikia daugiau nekoduojančių, o ne koduojančių regionų. Be to, transkripcija yra paplitusi ir perrašoma ~ 70–90% žmogaus genomo, sukuriant daugybę nekoduojančių RNR 33 . Buvo užfiksuota, kad kai kurios ilgos nekoduojamos RNR vaidina svarbų reguliavimo vaidmenį. Pvz., X-inaktyvuotam stenograma yra gyvybiškai svarbi, norint inaktyvuoti X chromosomą moterims tiesiogiai jungiant epigenetinį kompleksą. Arčiau baltymus koduojančių regionų, neperkeltuose regionuose yra vidinės ribosomų įėjimo vietos ir ribos jungikliai, dalyvaujantys ekspresijos reguliavime, taip pat alternatyvūs sujungimai 34 . Be to, 3'-netransliuojamuose regionuose yra mikroRNR, slopinančių 35 vertimą, surišimo vietos. Intronic regionai gali suteikti nekoduojančią RNR, be to, jie dalyvauja atliekant alternatyvų sujungimą ir transkripcijos reguliavimą 36 . Kaip alternatyva, antisenso sruogų transkripcija gali sukelti nekoduojančias RNR, dalyvaujančias atliekant įvairius biologinius vaidmenis37.

Gefirino baltymus koduojantys regionai yra labai konservuoti, o jo įvairūs vaidmenys atliekami keičiant reguliavimą. Nekoduojantys elementai jo vidiniuose ir aukščiau esančiuose elementuose yra pagrindiniai kandidatai tokiai reguliavimo kontrolei. Svarbu tai, kad nenormalus šio geno reguliavimas buvo susijęs su daugybe sudėtingų ligų. Dėl Alzheimerio ligos (AD) 38, 39, 40, epilepsijos 9, 41, 42, autizmo 10, šizofrenijos 10, 43, hiperekpleksijos 13 ir choreino nepakankamumo, disfunkcija reguliuojant gefirino ekspresijos lygius ir (arba) izoformos susidarymą. AD smegenų smegenyse gefirino lygis yra žymiai sumažėjęs 39, o normalios stiprios koreliacijos tarp gefyrino gamybos ir šešių labiausiai paplitusių GABA subvienetų gausos yra pažeistos AD smegenyse 38 . Taip pat pastebėta, kad nenormalios mažos molekulinės masės gefirino plokštelių sankaupos sutampa su β-amiloido plokštelėmis 40 . Epilepsijai būdingas nenormalus per didelis sužadinamasis neuronų aktyvumas ir pagrindinė priežastis gali būti slopinamųjų neuronų disfunkcija ir (arba) slopinamųjų grandinių žemas reguliavimas 41 . Gefirinas vaidina gyvybiškai svarbų vaidmenį slopinamosiose grandinėse. Tiek epileptogenezėje 9, 41, 42 buvo pastebėtas tiek sumažėjęs gefirino gamybos lygis, tiek ir abejotinų gefirino izoformų atsiradimas . Pastebėta, kad asmenims, kuriems trūksta gefyrino mutacijų, dėl ląstelių streso atsiranda keturios netaisyklingos gefirino izoformos, kurių trūksta egzonų. Šios izoformos daro dominuojantį neigiamą poveikį normaliam gefirinui epileptogenezėje 9 . Kitos alternatyvios izoformos buvo identifikuotos kaip autizmo ir šizofrenijos rizikos veiksniai, jos taip pat gali veikti kaip dominuojantys-neigiami variantai 10 . Athanasiu ir kt . 43 atliko viso genomo asociacijos tyrimą apie šizofreniją Norvegijos ir Europos mėginiuose ir pateikė 32 SNP žmogaus genome su reikšmingiausiomis asociacijomis. Septyni iš 32 yra tarp yin-yang SNP, ypač šie: rs1952070, rs6573695, rs17247749, rs17836572, rs1885198, rs6573706 ir rs7154017. Apskritai, gefirino reguliavimo sąsajos su pusšimčiu sudėtingų ligų stipriai motyvuoja poreikiu suprasti genetinę mechanizmą, sukeliantį šio labai konservuoto geno įvairius pasireiškimus.

Mes pristatome nepaprastai ilgą yin-yang haplotipų porą, apimančią nekoduojančius gefirino regionus. Šis genetinis reiškinys yra daugiau nei laipsniu didesnis nei bet kuri anksčiau pranešta yin – yang pora ir yra paplitęs tarp visų pasaulio gyventojų. Nepaisant to, kad šie haplotipai išsaugomi žmonių populiacijose, abu yra labai nepanašūs į bendrą protėvių haplotipą, o tai rodo, kad jie yra dviejų skirtingų žmogaus specifinių evoliucijos kelių padariniai. Mes keliame šią hipotezę pateikdami keletą nepriklausomų įrodymų, pagrindžiančių dviejų haplotipų atranką. Kartu paėmus, šis tyrimas sudaro pagrindą giliam supratimui apie gefirino reguliavimo kontrolę.

Neaišku, kaip atsirado ši genetinė anomalija. Mutacija ir rekombinacija sukūrė didžiulę haplotipų įvairovės įvairovę daugelyje rūšių, įskaitant žmones. Ankstesnėse ataskaitose buvo teigiama, kad žmonėms būdingi bruožai išryškėjo pirmiausia dėl teigiamos atrankos nekoduojančiuose regionuose, susijusiuose su genų reguliavimu 45, 46, 47 . Ryškiausios iš šių savybių yra žmogaus smegenys, turinčios padidėjusį dydį ir sustiprintą pažinimą, ir įrodyta, kad atranka, veikianti nekoduojančius regionus, daugiausia susijusi su nervų vystymusi, tuo tarpu atranka, veikianti baltymus koduojančius regionus, yra susijusi su imunitetu, uoslė ir vyrų reprodukcija 47 . Trumpai tariant, galima tikėtis, kad žmonėms pritaikytas gepirino pritaikymas atsiranda dėl reguliavimo mechanizmų, esančių nekoduojančiuose regionuose, ypač esančiuose arti.

Kyla pagrindinis klausimas: kodėl tokios adaptacijos metu atsirastų du labai skirtingi keliai? Viena iš galimybių yra chromosomų inversija, dėl kurios trūksta rekombinacijos tarp pradinio ir atvirkštinio varianto. Tokiu atveju originalūs ir apversti haplotipai išsivystytų savarankiškai. Strong positive selection could drive the evolution of a single high-frequency haplotype for each group. Several systematic searches for inversions have been conducted over the human genome 48, 49, 50 . The most recent investigation mapped 6.1 million clones to distinct genomic positions for eight HapMap individuals (four YRI, two CEU, one CHB and one JPT) and identified 224 inversions 50 . One of these is a 31.1-kb inversion in FUT8 , which is 763 kb upstream from gephyrin . However, none of the three studies identified an inversion in the yin–yang region.

Another possible impetus for this pattern could be incompatible mutations: that is, two independent mutations each possess a selective advantage individually, but the combination of the two mutations reduces fitness. For example, each of the mutations could increase the expression of a particular gene in a beneficial manner, but together they may produce deleteriously high expression. Selection would favour haplotypes possessing either mutation and recombinants possessing both or neither mutation would become rare. Over time, the two haplotypes bearing each of the original mutations would evolve in distinct manners.

At least one other alternate mechanism could have led to the extreme divergence of the yin and yang haplotypes: convergent evolution in isolated ancient populations followed by gene flow 51 . Opportunities for such events have been common throughout human history. For example, recent sequencing of fossil DNA has led to an estimate that modern non-African populations may possess ~1.5%–2.1% Neandertal DNA 52 . DNA related to the single individual found at Denisova is also found in modern island Southeast Asia and Oceania populations, with modern Papuans possessing 6% of their DNA closely related to the Denisovan individual's DNA 28 . As shown in Fig. 4, the Neandertal and Denisovan genotypes are highly similar to the ancestral haplotype. However, in addition to the small number of Neandertal genotypes, another weakness of this analysis is that the currently available data are based on few individuals. Increased sample size, increased marker density and further investigations, such as comparisons with nuclear DNA from the 300, 000-year-old hominins from Sima de los Huesos 53 when it becomes available, are needed to determine the likelihood that ancient admixture lies at the root of this yin–yang.

All of the described hypothetical mechanisms are likely to exhibit differential recombination as is observed for the gephyrin yin–yang pair. The recombination rate among yin haplotypes and the rate among yang haplotypes appear substantially higher than the rate between yin and yang parental haplotypes. Selection is likely to be the strongest for chromosomal inversions, as a recombination event between yin and yang haplotypes results with too few or too many copies of genes upstream and downstream from the cross-over point and general abolition of a gene spanning this point. The existence of recombinants, including those with cross-over points within gephyrin , casts doubt that an inversion underlies this anomaly. On a different note, a test for differential recombination might prove to be a valuable tool for assessing functionality of other yin–yang haplotype pairs previously identified and those to be mapped in the coming years. In general, if the yin and yang haplotypes are not functional, this type of differential recombination across coexisting haplotypes would be improbable.

The forces that produced this phenomenon, as well as the biological implications of its presence, invite exploration of an evolutionary 'road less travelled' that produced two highly divergent, and uniquely human, genetic patterns intricately interwoven with the conserved protein-coding regions of gephyrin . These results solicit new questions and provide material for hypotheses generation. Several avenues of future research have appealing potential, a couple of which are highlighted below.

With regard to gephyrin in particular, deep sequencing of the yin–yang region for ancient and modern populations could be valuable for discerning molecular-level function as well as providing insights into the historical journeys of the haplotypes. In addition, testing for associations between yin–yang status and various phenotypes could provide valuable knowledge. Candidate phenotypes include transcript isoforms, variations of gene expression and susceptibilities to complex diseases such as epilepsy, autism and schizophrenia, which have been previously shown to be associated with distinct isoforms of gephyrin 9, 10 . It should be noted that the use of animal models in previous studies of gephyrin might have been confounded and misleading, as both the yin and yang haplotypes are uniquely human.

More generally, mapping of additional yin–yang haplotypes within the human genome, and other genomes of interest, may pinpoint genetic mechanisms underlying convergent pathways and/or expose regions undergoing rapid evolution. In addition, when combined with geographic distributions, these patterns may provide distinguishable flags for understanding the histories of individuals and populations. Importantly, they may capture valuable features of an individual's genetic background and their susceptibility to complex traits, perhaps aiding personalized medicine. Looking forward, in addition to increasing our understanding of the human-specific regulation of a vitally important gene, this haplotype pair may serve as a model for studying yin–yang haplotypes and their biological implications for human health and development.

Metodai

HapMap data

HapMap bulk data were downloaded from //hapmap.ncbi.nlm.nih.gov/. Release HapMap r28, nr.b36 dated 18 Aug 2010 files were downloaded from directory/downloads/genotypes/2010-08_phaseII+III/forward/. Some of the individuals were related, as tabulated here: //hapmap.ncbi.nlm.nih.gov/downloads/samples_individuals/relationships_w_pops_121708.txt. Data for the children were removed from the data sets, leaving presumably unrelated individuals. For each analysis, the SNPs that were common for all four populations were determined. Next, these data were cleaned to reduce the quantity of missing genotypes as follows. First, the SNPs with at least 50% missing data were removed, then the individuals with at least 50% missing data were removed and finally SNPs with at least 10% missing data were removed. The remaining individuals also had no >10% missing data.

In the first analysis, data for four populations were considered: CEU, CHB, JPT and YRI. After removing the children and cleaning, the final data consisted of 1, 115, 561 autosomal SNPs for 112 CEU, 137 CHB, 113 JPT and 116 YRI, a total of 478 individuals.

In the second analysis, data for four different populations were used: GIH with at least three grandparents from Gujarat (the northwest region of the Indian subcontinent), LWK, MKK and TSI. After removing children and cleaning the data, the final data consisted of 1, 242, 039 autosomal SNPs for 101 GIH, 110 LWK, 143 MKK and 102 TSI, a total of 456 individuals.

The three remaining HapMap populations were used to further validate the yin–yang haplotype pair: ASW, CHD and Mexican ancestry in Los Angeles, California. For each population, the genotypes for the 284 SNPs were extracted when available and haplotype frequencies were computed. The genotypes were also plotted for visual inspection (Fig. 1). All of the processed data sets can be obtained by contacting the first author.

The 1000 genomes data

Chromosome 14 data were downloaded from the 1000 Genomes Project website at ftp://ftp-trace.ncbi.nih.gov/1000genomes/ftp/release/20130502/ on 17 Nov 2014. File ALL.chr14.phase3_shapeit2_mvncall_integrated_v5.20130502.genotypes.vcf.gz, with the last modification noted on 17 Sept 2014, was obtained. A total of 2, 504 individuals were genotyped. All markers between 66974125 and 67648525 (GRCh37 coordinates) were extracted, yielding 13, 992 markers in the yin–yang region. We extracted the 13, 564 biallelic SNPs within this set.

Neandertal and Denisova data

One Neandertal and two Denisovan data sets were used. The Neand/Denis data for three Vindija Neandertal 25 and one individual from the Denisovan fossil site 26 were downloaded from ftp://ftp.cephb.fr/hgdp_supp10/Harvard_HGDP-CEPH/annotation.txt. The Affymetrix HuOrigin array 27 was used and included 15 SNPs from the yin–yang haplotypes. The data file includes the numbers of high-quality reads for each allele. Only 1 of the 15 SNPs had more than 1 nucleotide state detected for all of the Neandertal and Denisovan reads. SNP rs6573754 (AX-50160621) had one ' A ' and five ' G ’s for the Denisovan individual, and three ' G ’s for the Neandertal. The ' G ' allele is shown for Neand/Denis in Fig. 4 of the main paper and Supplementary Data Set 1.

Panel 13 of the SNP ascertainment for the HuOrigin array only included SNPs for which the Denisovan allele matched the chimpanzee allele, as this policy facilitated validations 27 . This panel accounted for 20.2% of the original 750, 184 SNPs selected, presenting some bias when comparing the 15 Neand/Denis alleles with chimpanzee and ancestral alleles.

The second set of Denisovan data was downloaded from UCSC's Table Browser website (//genome.ucsc.edu/cgi-bin/hgTables) by selecting the 'Denisova Assembly and Analysis' group and 'Denisova Variants' track from the Human GRCh37/hg19 assembly. The genetic material was drawn from the inner portion of the phalanx of the same individual represented in the Neand/Denis data. A single-stranded library preparation method was used to produce the high-coverage sequence 28 . These data included 125 of the yin–yang haplotype SNPs, three of which were among the 15 SNPs in the Neand/Denis data.

BlocBuster

BlocBuster is a network approach that uses a multi-faceted, allele-oriented correlation measure 23, 54 . Briefly, we developed the approach with an aim to identify combinations of correlated alleles that are subjected to genetic heterogeneity. The correlation metric, CCC, is customized for genotype data and appreciates heterogeneity by evaluating four distinct correlations that retain independence between different types of pair-wise correlations. This specification of correlation types is retained in an allele-specific network construction, which increases the network infrastructure yet maintains high efficiency. We determined the CCC threshold using the default method of setting the number of edges in the network equal to the number of SNPs. After preprocessing and cleaning the data, there were 36, 542 SNPs in the CEU, CHB, JPT, YRI chromosome 14 data set and 40, 820 SNPs in the GIH, LWK, MKK, TSI chromosome 14 data set, and each of the networks contained the corresponding number of edges, representing the most significant CCC correlations for each analysis. Consequently, the average degree of each node in each of the networks was one. The significance of this correlation threshold was tested using permutation trials 23 . After the networks were constructed, groups of nodes that were connected by edges were readily identified, as they were completely isolated from each other. Each of these groups of connected nodes, referred to as blocs, represent a haploid pattern of inter-correlated SNP alleles. The entire pattern of SNP alleles for each of these blocs was tested for possession by each individual. Our open-source code is available at www.blocbuster.org or by contacting the first author.

Determination of ancestral allelic similarities

Ancestral alleles were compiled from NCBI's dbSNP webpage (//www.ncbi.nlm.nih.gov/projects/SNP/). These alleles were supplied by Dr Jim Mullikin of the National Human Genome Research Institute and were determined by comparing human and chimpanzee DNA 55 . A complete list of the alleles for the 284 unique SNPs is supplied in Supplementary Data Set 1. Haplotype similarities were measured by tallying the numbers of markers that were IBS, a simple yet accurate metric 56 .

Selection tests

The selection test results were drawn from three sources. First, the Haplotter 22 website (//haplotter.uchicago.edu/) was used to plot results for four statistics: integrated haplotype score (iHs), H , D and F ST for four HapMap populations (CEU, CHB, JPT and YRI) over a 5-Mb region centred on gephyrin . Voight et al .'s 22 iHs is based on an integration of the extended haplotype homozygosity (EHH) statistic and is designed to capture very recent positive selection. Fay and Wu's 30 H -statistic detects the effects of hitchhiking on the frequency spectrum as a function of recombination rate. Tajima's D statistic tests the neutral mutation hypothesis based on the relationship between the average number of nucleotide differences and the number of segregating sites 57 . The fixation index, F ST, is based on Wright's measure of population differentiation.

Second, the 1000 Genomes Selection Browser 1.0 (ref. 29) was used to plot the results for a number of statistical tests computed over the 1000 Genomes Project data (//www.1000genomes.org/) for CEU, CHB and YRI populations. These resequencing data yield higher density information than the original HapMap data and remove most of the SNP ascertainment bias, making them valuable for summary statistics. We included the rank scores, which were computed using an outlier approach based on sorted genome-wide scores 29 . Peaks in the plots represent regions under positive selection. Some of the methods were modified by Pybus et al . 29 and are marked in the following with an asterisk. Three families of statistical tests were included: allele frequency spectrum, LD structure and population differentiation. The allele frequency spectrum family included Tajima's D (Taj_D) 57, Fay and Wu's H (FayWu_H) 30, Fu and Li's D (FuLi_D) 58, Fu and Li's F (FuLi_F) 58 and Ramos-Onsins and Rozas' R 2 (R2) 59 . The LD structure family included Sabeti et al .'s XP-EHH* (XPEHH) 60, Sabeti et al .'s EHH_average* (EHH) 61, Nei's Dh (Dh) 62 and Kelly's ZnS (ZnS) 63 . The population differentiation family included Weir and Cockerham's pairwise F ST (Fst) 64, Chen et al .'s XP-CLR (XPCLR) 65, Hofer et al .'s absolute ΔDAF (absDAF) 66 and Hofer et al .'s standard ΔDAF (DAF) 66 .

Third, we used selection statistics generated by Nielsen et al . 31, which were determined by comparing synonymous and non-synonymous mutations within coding regions. More specifically, the ratio of non-synonymous substitutions per non-synonymous site to synonymous substitutions per synonymous site was tested against the neutral null hypothesis of the ratio being one.

Determination of protein conservation

The conservation of the gephyrin protein across species was determined using UCSD Signaling Gateway (//www.signaling-gateway.org/molecule/).

Haplotype data

The haplotypes for the combined CHB and JPT individuals were identified as follows. First, the SNPs that lie within gephyrin or upstream from gephyrin were extracted from the full HapMap data (positions 65, 893, 425–66, 709, 924 from HapMap r28, nr.b36). After removing the five individuals (two CHB and three JPT) with excessive missing data, the SNPs with >5% missing data were discarded, leaving 326 SNPs. Next, the phased haplotypes from the same region for the JPT+CHB individuals were downloaded from the HapMap website (//hapmap.ncbi.nlm.nih.gov/downloads/phasing/2009-02_phaseIII/HapMap3_r2/). These haplotypes had been inferred using PHASE 67, 68 and included 170 individuals from the combined CHB and JPT data. We discarded all SNPs that had been identified as having >5% missing values in the original genotype data, leaving a total of 303 phased sites.

Haplotype composition plots

The haplotype composition plots were constructed using the phased haplotypes for the CHB+JPT populations. These haplotypes were computationally inferred using PHASE 67 . Of the 303 phased sites, 236 represented divergent yin–yang SNPs and the haplotypes comprising these 236 SNP alleles were extracted for the 170 individuals. For each of the 340 phased chromosomes, the percentages of SNP alleles matching the yin and yang haplotypes, respectively, were computed.

Genotype heat maps

The genotype values for SNPs in the yin–yang region were plotted for visual inspection (Figs 1 and 3). Individuals (rows) were reordered, to place similar individuals near each other. We used our rearrangement clustering method, TSP+ k 69 for this reordering. Briefly, the genotype values for the SNPs for each pattern were extracted from the data and converted to an instance of the Traveling Salesman Problem (TSP) 70 in which each individual was represented as a city. We inserted a dummy city to provide a natural break to the circular TSP tour and determined the ordering of the cities using an iterated Lin–Kernighan local search as implemented by Applegate, Bixby, Chvatal and Cook in the Concorde package (//www.math.uwaterloo.ca/tsp/concorde/index.html). The individuals were reordered using this solution and the genotypes were colour encoded with dark blue, light blue, red and white, representing homozygote for the identified allele, heterozygote, homozygote for the alternate allele and missing data, respectively.

Papildoma informacija

How to cite this article: Climer, S. et al . Human gephyrin is encompassed within giant functional noncoding yin–yang sequences. Nat. Bendruomenė. 6:6534 doi: 10.1038/ncomms7534 (2015).

Papildoma informacija

PDF failai

  1. 1.

    Supplementary Figures, Notes and References

    Supplementary Figures 1-11, Supplementary Notes 1-2 and Supplementary References

„Excel“ failai

  1. 1.

    1 papildomas duomenų rinkinys

    Details of yin-yang haplotype pair. For each of the three blocs identified by BlocBuster, the SNP IDs, allele frequencies, and positions are tabulated for each SNP. The SNP alleles for the ancestral haplotype are also listed.

Komentarai

Pateikdami komentarą jūs sutinkate laikytis mūsų taisyklių ir bendruomenės gairių. Jei pastebite ką nors įžeidžiančio ar neatitinkančio mūsų taisyklių ar gairių, pažymėkite, kad tai netinkama.