Integruotas fenominis daugialypės alelinės asociacijos metodas | europos žmogaus genetikos žurnalas

Integruotas fenominis daugialypės alelinės asociacijos metodas | europos žmogaus genetikos žurnalas

Anonim

Anotacija

Padidėjęs genomo asociacijų įgyvendinimas lėmė, kad asociacija tampa pagrindiniu metodu, naudojamu lokalizuoti genetinius variantus, sukeliančius fenotipinius pokyčius. Daug dėmesio buvo skiriama didžiulėms daugybinių bandymų problemoms, kylančioms analizuojant daugybę vieno nukleotido polimorfizmų. Vis dėlto mažiau eksperimentų sulaukė I tipo klaidų procentinė dalis, ištyrus daugelį fenotipų. Daugialypės analizės gali būti naudojamos aptikti tiek pleiotropinius efektus, turinčius įtakos latentiniam bendram veiksniui, tiek monotropinius efektus, kurie veikia kintamajam būdingą lygį, kartu kontroliuodami fenotipų nepriklausomumą. Šiame tyrime pateikiamas maksimalios tikimybės metodas, apimantis tiek latentinius, tiek kintamiesiems būdingus testus ir kuris gali būti naudojamas su atskirais ar šeimos duomenimis. Modeliavimo rezultatai rodo, kad esant faktoriaus lygio asociacijai, kombinuotoji daugiamatė (CMV) analizės metodika gerai veikia su minimaliais galios praradimais, palyginti su faktoriaus ar suminio balo (SS) vienmatėmis analizėmis. Didėjant nuokrypiui tarp alelinių efektų modelio ir faktorinių apkrovų, drauge mažėja ir faktoriaus, ir SS vien variacijų analizės galia, o CMV metodo galia išlaikoma. Mes parodykime šio metodo naudingumą ištyrę ryšį tarp dopamino receptorių D2 TaqIA ir marihuanos, trankvilizatorių ir stimuliatorių inicijavimo duomenų, pateiktų „Add Health Study“ duomenyse. „Perl“ scenarijus, kurie įveda „ped“ ir „dat“ failus ir sukuria „Mx“ scenarijus bei duomenis CMV metodui paleisti, galima atsisiųsti iš tinklalapio www.vipbg.vcu.edu/~sarahme/WriteMx.

Įvadas

Nors dauguma genomo asociacijų tyrimų renka informaciją apie simptomų ar susijusių bruožų rinkinį, naudojami analitiniai metodai ir tiriamos hipotezės fenotipo atžvilgiu beveik išimtinai yra nevienarūšiai. Vienas paprastas daugiamatės analizės metodas yra analizuojamų požymių skaičiaus sumažinimas atliekant faktorinę analizę. Šis populiarus įvairių kintamųjų duomenų apibendrinimo metodas iš esmės yra daugiamatės daugialypės regresijos pratęsimas, kuris leidžia apibrėžti latentinius kintamuosius, kad būtų galima įvertinti kintamųjų, kurie, kaip manoma, egzistuoja, bet neišmatuoti, poveikį. Paprastai kai kurie ar visi stebimi kintamieji nurodomi tam, kad regresuotų pagal vieną ar daugiau latentinių veiksnių. Taigi šie veiksniai apibendrina stebimų kintamųjų kovariaciją. Neskirstomasis dispersija ir matavimo paklaida yra įtraukiami į papildomą latentinių kintamųjų (likučių) rinkinį, būdingą kiekvienam stebimam kintamajam.

Tačiau faktorių balai - ar bet koks kitas svertinis bruožų derinys - turi tiek faktoriaus lygio, tiek bruožams būdingą poveikį, o genetinis ryšys su latentiniu veiksniu iš esmės yra pleiotropinis, tačiau ryšys su liekamuoju dispersijos komponentu nėra. Jei šie du efektų tipai atsveria, gali atsirasti klaidingų negatyvų (II tipo klaidos). Lange ir kt. 1 įgyvendino daugiamatę asociacijų analizę, pagrįstą pagrindinio komponento analize FBAT-PC programinėje įrangoje. Panašiai Lange et al 2 FBAT-GEE metodas leidžia išbandyti ryšį su keliais fenotipais, naudojant visuminį metodą. Rezultatas yra daugiamatis testas, kurio laisvės laipsniai yra lygūs tiriamų fenotipų skaičiui. Tačiau tiek FBAT-PC, tiek FBAT-GEE reikalauja šeimos duomenų. Be to, šie požiūriai neišskiria veiksnių ir bruožų lygio asociacijos. Šiame tyrime pateikiamas maksimalios tikimybės metodas, apimantis tiek latentinius, tiek kintamiesiems būdingus testus ir kuris gali būti naudojamas su atskirais ar šeimos duomenimis.

Rezultatai

I tipo klaida

Kaip parodyta 4 lentelėje, pagal scenarijus faktorių lygio ir kintamiesiems būdingi testai parodė tikėtinus I tipo klaidų lygius, kai jie vertinami atskirai. Faktoriaus lygio ir kintamojo specifinių testų P verčių pasiskirstymas buvo vienodas (žr. Papildomus 1–4 paveikslus). CMV metodas lėmė padidintą I tipo klaidą, vidutinis α = 0, 084. Norėdami kontroliuoti šią infliaciją esant I tipo klaidų lygiui, kiekvienam faktoriaus lygio ir kintamojo tipo bandymui mes priėmėme 0, 025 α lygį, po kurio rezultatas buvo šiek tiek konservatyvus, vidutinis α = 0, 043. Šis sumažėjęs α lygis buvo naudojamas atliekant tolesnes analizes. Konservatyvus CMV metodo pobūdis atsiranda dėl faktoriaus lygio ir kintamojo specifinių testų kovariacijos. Kadangi šios kovariacijos dydis priklauso nuo stebimų duomenų faktorinės struktūros, tyrėjai gali įvertinti tikslią Bonferroni pataisą savo duomenims permutacijos ar modeliavimo būdu arba patvirtinti šiek tiek konservatyvų α lygį - 0, 025.

Pilno dydžio lentelė

Galia

1a – c paveiksluose apibendrinti penkių asociacijų modelių galios analizės rezultatai pagal devynis daugiamatį scenarijų. Kiekvienu atveju parodyta galia CMV metodui ir SS (SS), RFS ir BFS vienmatėms analizėms.

Image
Image

a ) Galia aptikti asociaciją (apibrėžta kaip testų, turinčių reikšmingą α 0, 05 procentą), turinti daugiapakopį a, b ir c pagrindą 2–6 asociacijų modeliams (aprašyti 2 lentelėje). Kiekvienu atveju rodoma galia taikant kombinuotą daugiamatį metodą (CMV) ir suminį balą (SS), regresijos koeficiento (RFS) ir Bartlett'o faktoriaus balą (BFS) vienmatėms analizėms. ( b ) Galia aptikti ryšį pagal įvairius d, e ir f pagrindus 2–6 asociacijų modeliams. c ) Galia aptikti asociacijas daugiapakopiais fonais g, h ir i, esant 2–6 asociacijų modeliams.

Visas dydis

Situacijos, kai asociacija paveikė visus kintamuosius, tiek faktoriaus lygiu (3 asociacijos modelis), tiek lygiaverte visiems kintamiesiems (4 asociacijos modelis), visi keturi asociacijos testai buvo atlikti gerai. Šiuose scenarijuose šiek tiek konservatyvus α pataisų pobūdis atliekant kombinuotus testus yra akivaizdus kaip nedidelis galios praradimas, kuris akivaizdžiausias, kai faktoriaus apkrovos yra didelės. Tačiau sumos ir koeficiento analizės galia smarkiai sumažėja, nes asociacijos efektų modelis skiriasi nuo faktorių apkrovų (2, 5 ir 6 asociacijos modelis). Šis poveikis aiškiausiai pastebimas atliekant kontrastingų efektų modeliavimą (6 asociacijos modelis), kuriame asociacijų kryptis skiriasi tarp kintamųjų. Vienatūrėms sumų ir faktorių balų analizėms galios nustatyti tokio tipo alelinį poveikį yra labai menkos ir dažnai nesiskiria nuo atsitiktinumo. Tai atitinka ankstesnį darbą, kuris parodė, kad daugiamatės sąsajos analizės yra galingiausios, kai QTL sukelta kovariacija skiriasi nuo fono koreliacijos. 17

Kaip buvo galima tikėtis, iš trijų vienatūrių analizių SS buvo mažiausiai galinga visose situacijose, tuo tarpu BFS aplenkė RFS. Atvirkščiai, visų nagrinėjamų situacijų spektre CMV metodas yra tvirtas ir paprastai turi tokią pačią ar didesnę statistinę galią nei vienatūris apibendrinamųjų priemonių analizė. Kaip parodyta 5 lentelėje, bendras 30% trūkumo lygis sumažino galią maždaug 4, 5% (nuo 0, 922 iki 0, 879 vieno kintamojo asociacijai ir nuo 0, 775 iki 0, 740 faktoriaus lygio asociacijai). Tačiau kai „tikrasis“ asociacijos efektas buvo faktoriaus lygyje, reikšmingas trūkumas (50% 3 kintamojo) turėjo tik nedidelę įtaką gebėjimui aptikti asociaciją, todėl galia sumažėjo ∼ 1% ( 0, 775 vs 0, 769).

Pilno dydžio lentelė

Taikomas pavyzdys

Norėdami parodyti CMV metodą, išanalizavome DRD2 TaqIA polimorfizmo ir trijų medžiagų - marihuanos, trankvilizatorių ir stimuliatorių - inicijavimo (visada naudojamo) ryšį, naudodamiesi 864 kaukazo vyrų duomenimis. Marihuanos, raminamųjų ir stimuliatorių iniciacija buvo vidutiniškai koreliuojama ir visi trys stipriai veikiami bendro faktoriaus (3 lentelė). Nebuvo įrodymų apie faktoriaus lygio ryšį ( χ 1 2 = 0, 65, β faktorius = 0, 06). Tačiau reikšmingas ryšys pastebėtas kintamajam būdingu lygiu ( χ 3 2 = 13, 91; α = 0, 025; P pataisyta = 0, 006; β stimuliatoriai = −0, 19, β trankvilizatoriai = 0, 14, β marihuana = 0, 11). Šie rezultatai rodo, kad T-alelis padidina stimuliatorių vartojimo riziką, tačiau sumažina trankvilizatorių ir marihuanos vartojimo riziką, o tai atitinka 3 lentelėje pateiktus paplitimo genotipo modelius. Įdomu tai, kad šiais duomenimis krypčių skirtumai alelio efektų kintamajam lygiu panaikina vienas kitą faktoriaus lygiu. Norėdami išsiaiškinti, ar šie rezultatai būtų buvę akivaizdūs atlikus nevienarūšę analizę, atlikome kiekvieno kintamojo post-hoc analizę. Ryšys tarp stimuliatorių vartojimo ir DRD2 buvo reikšmingai reikšmingas (0, 05 lygyje) prieš koreguojant daugybinius testus ( χ 1 2 = 3, 88, P = 0, 049, β = −0, 18). Tačiau nebuvo duomenų apie ryšį nei su raminamuoju ( χ 1 2 = 1, 65, β = 0, 13), nei su marihuanos vartojimu ( 2. 1 2 = 2, 60, β = 0, 11), be to, nė vienas iš nevienarūšių bandymų su skirtingais vaistais nebūtų išlieka reikšmingi atlikus Bonferroni pataisą. Galios padidėjimas, susijęs su daugiamatės analizės atlikimu asociacijos sistemoje, yra analogiškas padidėjimo stebėjimui. 17, 18

Šie rezultatai gali atrodyti priešingi, atsižvelgiant į paskelbtas ataskaitas 9, 12, 19, kad DRD2 A1 (T) aleliai yra daugelio skirtingų medžiagų vartojimo fenotipų rizikos aleliai ir kad didžiąją dalį medžiagos vartojimo fenotipų kovariacijos galima paaiškinti įprasta etiologine etiologija. faktoriai. Tačiau stimuliatorių poveikis (įskaitant padidėjusį aktyvumą, nuotaiką ir euforiją) labai skiriasi nuo raminamųjų ir marihuanos vartojimo (paprastai tai apima atsipalaidavimą, letargiją, lengvą euforiją ir nerimo mažinimą). Tiek, kiek asmenų, turinčių didesnį D2 receptorių tankį, kuris yra susijęs su DRD2 Taq1A1 (T-aleliu), 15 labiau linkę į psichostimuliuojančio vaisto (metilfenidato, kuris, kaip ir kokainas, blokuoja dopamino pernešėjus) poveikį kaip nemalonų, 14 tikėtina, kad asmenys, turintys T-alelį, gali dažniau išbandyti vaistus, kurie, kaip manoma, padidina pagyvėjimą ir pagyvinimą, nei tie, kurie, manoma, turi priešingą poveikį. Nors šią asociaciją dar reikia pakartoti, išvados rodo padidėjusią CMV požiūrio aiškinamąją galią.

Diskusija

Nors vienfaktorinė faktoriaus balo analizė gali aptikti ryšį faktoriaus lygyje, o kiekvieno fenotipo nevienarūšė analizė savo ruožtu gali aptikti alelinį poveikį, poreikis taisyti kelis bandymus yra nepalankus. Be to, tokia procedūra neišnaudoja galios padidėjimo, gauto iš daugiamatės analizės. Dabartinio požiūrio tinkamumas tam tikru mastu priklauso nuo analizuojamų fenotipų. Našumas yra didesnis nei alternatyvų, kai fenotipinis kovariacija, atsirandanti dėl kitų genetinių ir aplinkos poveikių, skiriasi nuo to, kurį sukuria QTL. Mes tikimės, kad daugiamatis požiūris bus naudingas analizuojant sudėtingus bruožus, susijusius su elgesio, psichologiniais ar kitais veiksniais, kuriuos iš prigimties sunku įvertinti. Tai turėtų būti ypač vertinga analizuojant duomenis, kuriuose trūksta reikšmių, galbūt dėl ​​struktūrizuoto duomenų rinkimo formato, arba kai buvo pasirinktas dalinis pavyzdys išsamesniems ar brangesniems vertinimams. Metodo išplėtimas į faktorinius mišinių modelius suteiktų natūralų bruožų, tokių kaip migrena ir ADHD, analizės sistemą, kurioje simptomų modeliai rodo potipių buvimą. Karkasas yra tiesiogiai tinkamas kartoti vieno ar kelių bruožų matavimus ir gali būti naudojamas tais atvejais, kai matuojama nekintama. 20, 21

Norėdami palengvinti CMV metodo taikymą, mes sukūrėme „Perl“ scenarijų, kurį galima atsisiųsti iš (www.vipbg.vcu.edu/~sarahme/WriteMx). Šis scenarijus gali būti naudojamas su šeimos ar individualiais duomenimis. Jis skaito standartinius „Merlin“ .ped ir .dat failus ir rašo duomenų failą bei pritaikytus scenarijus, kad galėtų vykdyti analizę Mx (kurią galima laisvai atsisiųsti daugeliui operacinių sistemų //www.vcu.edu/mx/). Mx leidžia pilnai nurodyti vartotoją; todėl čia aprašytą požiūrį galima lengvai išplėsti, kad būtų galima analizuoti įvairius veiksnius, ir scenarijus, rodančius šį plėtinį, galima atsisiųsti iš (www.vipbg.vcu.edu/~sarahme/WriteMx). Be to, šis metodas gali būti išplėstas, kad apimtų įvairių tipų giminaičių (tėvų, senelių ir kt.) Duomenis.

Dabartinis „Mx“ įgyvendinimas turi tam tikrų trūkumų. Šiuo metu neįmanoma priskirti trūkstamų genotipų pagal CMV metodą, o šiuo metu asmenys, neturintys genotipų, bus analizuojami. Tačiau iš anksto implicitinius genotipus galima lengvai išanalizuoti per Mx, o informacija apie imputacijos tikslumą gali būti įtraukta naudojant mišinių modeliavimą. Be to, Mx gali analizuoti nuolatinius arba eilinius (dvejetainius ir (arba) polichotominius) duomenis. Tačiau dabartinėje Mx versijoje nėra paprasto bendro požiūrio į bendrą dvejetainių ir tęstinių kintamųjų analizę, nors tai praktiškai daryti, kai trūkstamų nuolatinių kintamųjų modelių yra nedaug. Šiuo metu kuriama programinės įrangos R kalbos atvirojo kodo versija šią funkciją įgyvendins tiesiogiai. Tuo tarpu vienas iš šios problemos sprendimo būdų yra ištisinius kintamuosius paversti ordinalais, naudojant decilius, ir atlikti daugiamatę ordinarinę analizę.

Apibendrinant galima pasakyti, kad šiame straipsnyje pateikiami trys pagrindiniai straipsniai. Pirmiausia pristatomas integruotas alelinės asociacijos modelis, kuris leidžia išbandyti ryšį su bendru veiksniu arba kintamųjų specifinių komponentų rinkiniu. Šis metodas pagerina aiškinamąją analizės galią, analogišką analizei, gautam naudojant kelyje pagrįstus asociacijų metodus, papildančius tradicinę vieną SNP analizę. 22 Antra, ji pateikia laisvai prieinamą programinę įrangą, palengvinančią kombinuotą asociacijos metodą, kuriant scenarijus ir duomenis Mx analizei iš „Merlin“ formato ped ir dat failų. Trečia, jis iliustruoja metodą, kuriame naudojami medžiagų naudojimo duomenys iš „Add Health“ tyrimo. Mes skatiname tyrėjus žiūrėti ne tik į diagnozę ar SS analizę, kai dirbame su sudėtingais bruožais, tikėdamiesi, kad tai padės nustatyti naujus jautrumo genus ir giliau suprasti būdus, kaip nustatyti variantai daro įtaką elgesiui ir sudėtiniams bruožams.

Papildoma informacija

PDF failai

  1. 1.

    Papildomi 1-4 paveikslai

    Papildoma informacija pridedama prie dokumento Europos žmogaus genetikos tinklalapyje (//www.nature.com/ejhg)