Naminės ožkos (capra hircus) genomo sekos nustatymas ir automatinis viso genomo optinis žemėlapių sudarymas | gamtos biotechnologijos

Naminės ožkos (capra hircus) genomo sekos nustatymas ir automatinis viso genomo optinis žemėlapių sudarymas | gamtos biotechnologijos

Anonim

Dalykai

  • Genetinis žemėlapių sudarymas
  • Genomika
  • Sekavimas

Anotacija

Mes pranešame apie Yunnan juodosios ožkos patelės ∼ 2, 66-Gb geno seką. Seka buvo gauta sujungiant trumpai perskaitytus sekos duomenis ir optinio žemėlapio duomenis iš didelio pralaidumo viso genomo kartografavimo prietaiso. Viso genomo žemėlapių sudarymo duomenys palengvino super pastolių, 5x ilgesnių, surinkimą pagal N50 metriką, nei pastolių, padidintų fosmidinių galų sekos nustatymu (pastoliai N50 = 3, 06 Mb, super pastoliai N50 = 16, 3 Mb). Super pastoliai yra pritvirtinti prie chromosomų, remiantis konservuota galvijų sinteze, ir jų surinkimą gerai palaiko du 1-osios chromosomos hibridiniai radiacijos hibridiniai žemėlapiai. Mes anotuojame 22 175 baltymus koduojančius genus, kurių didžioji dalis buvo atkurta RNR seq duomenų dešimtyje. audinius. Lyginamoji kašmyro ožkos pirminių ir antrinių folikulų transkriptominė analizė atskleidė 51 geną, kuris yra skirtingai išreikštas tarp dviejų tipų plaukų folikulų. Šis tyrimas, kurio rezultatai palengvins ožkų genomiką, rodo, kad viso genomo žemėlapių sudarymo technologija gali būti naudojama didelių genomų de novo surinkimui.

Pagrindinis

Naminė ožka ( Capra hircus ) plačiai auginama visame pasaulyje, ypač Kinijoje, Indijoje ir kitose besivystančiose šalyse 1 . Ožkos yra svarbus mėsos, pieno, pluošto ir kailio šaltinis, taip pat nuo pat ankstyvųjų žmonių civilizacijos laikų atliko žemės ūkio, ekonomikos, kultūros ir net religinius vaidmenis 2 . Įrodymai rodo, kad ožka galėjo būti prijaukinta prieš du laukinius ožiaragius ( Capra aegagrus ir Capra falconeri ) ∼ prieš 10 000 metų derlingoje pusmėnulio dalyje, o vėliau greitai pasklido pagal žmonių migracijos ir prekybos modelius 3 . Remiantis JT maisto ir žemės ūkio organizacijos ataskaita (//www.fao.org/corp/statistics/en/), pasaulyje yra> 1000 ožkų veislių, o visame pasaulyje laikoma> 830 milijonų ožkų. Be to, kad ožkos yra vertingos kaip naminiai gyvūnai, jos dabar naudojamos kaip gyvūnų modeliai biomedicininiams tyrimams, siekiant ištirti sudėtingų bruožų genetinį pagrindą ir gaminant transgeninius peptidinius vaistus 4, 5 . Nepaisant žemės ūkio ir biologinės ožkų svarbos, veisimo ir genetikos tyrimams trukdė pamatinės genomo sekos nebuvimas. Šiame darbe mes sujungėme naujos kartos „Illumina“ sekos sudarymo technologiją ir didelių genomų viso genomo žemėlapių sudarymą, kad gautume naminės ožkos genomo seką. Tada mes pakomentavome genomą ir nustatėme greitai besivystančius genus. Be to, remdamiesi anotuotų ožkų genų rinkiniu, mes sukūrėme ir palyginome antrinių plaukų folikulų (iš kurių susidaro kašmyro pluoštas) transkriptomus duomenis su duomenimis iš Vidinės Mongolijos kašmyro ožkos pirminių plaukų folikulų, atskleidžiant formacijos genetinius pagrindus. kašmyro pluoštų.

Viso genomo žemėlapių sudarymas yra patobulinta didelio pralaidumo optinio žemėlapių sudarymo technologija. Optiniu žemėlapiu buvo naudojamasi palyginti bakterijų 6, 7, 8, 8, 8, 8, 10, 9, 10, genų rinkinį, padėti sudaryti bakterijų dirbtinę chromosomą (BAC) 11 ir ištaisyti genomo surinkimo klaidas 12 . Du augalų genomai 13, 14 neseniai buvo sekvuoti, naudojant BAC, surinktus per tokį optinį žemėlapių sudarymą. Tačiau tradicinis optinių žemėlapių duomenų generavimo procesas dažniausiai apima rankinius veiksmus, todėl pagrindiniai optinio žemėlapių taikymo būdai buvo bakterijų genomų surinkimas, BAC galų sekos nustatymas ir BAC klonų surinkimas bei pakartotinis rinkinių taisymas. Nors tradiciniai optinio žemėlapių sudarymo metodai buvo sėkmingai taikomi, jie yra sudėtingi ir mažo pralaidumo, visų pirma todėl, kad reikalingi DNR išplėtimo, vaizdo fiksavimo ir duomenų analizės veiksmai yra neefektyvūs. Dėl šios priežasties nebuvo įmanoma sugeneruoti ir tvarkyti didžiulės apimties optinių žemėlapių duomenų, reikalingų didelio ir sudėtingo genomo surinkimui.

Norėdami gauti ožkos viso genomo apribojimo žemėlapį, naudojome automatizuotą didelio našumo viso genomo žemėlapių sudarymo instrumentą ir neseniai sukurtą duomenų apdorojimo programinę įrangą. Prietaisas naudoja į lustą panašų kanalų formavimo įrenginį (CFD), kad ištemptų ir imobilizuotų atskiras DNR molekules ant teigiamai įkrauto stiklo paviršiaus vienkartinės kasetės viduje (1a pav. Ir papildomi metodai). Tai kartu su automatizuota vaizdo atvaizdavimu ir duomenų analize pašalina daugelį neveiksmingumų, kurie riboja optinio žemėlapio taikymą dideliems genomams. Priemonė automatiškai sukūrė 100 000 vienos molekulės restrikcijos žemėlapių per 3 valandas, užtikrinant 12 kartų didesnį fizinį ožkos genomo aprėptį. Tada mes panaudojome hibridinio surinkimo metodą, kad gautume labai ilgus pastolius (super pastolius), derindami eksperimentiškai išmatuotus vienos molekulės žemėlapius su silico restrikcijos žemėlapiais, apskaičiuotais iš pastolių, surinktų iš „Illumina“ sekos duomenų (1b pav. Ir papildomi metodai). Ilgi super pastoliai palengvino pastolių pritvirtinimą prie chromosomų.

Image

a ) Mėginiai sudedami į mikroschemų pavidalo, didelio tankio, kanalų formavimo įtaisą (CFD). Kanalais tekantis buferinis skystis ištempia didelės molekulinės masės DNR ant teigiamai įkrauto stiklo paviršiaus, kuris palaiko DNR orientaciją ir vientisumą atliekant kitus veiksmus. Imobilizuotos atskiros DNR molekulės 10 minučių suardomos su restrikcijos fermentu 37 ° C temperatūroje, dažomos dažais JOJO-1 ir atvaizduojamos. Vaizdai analizuojami kanalu po vieną, kad būtų galima filtruoti netiesinius iškraipytus fragmentus ir mažas molekules, nustatyti tarpus tarp fragmentų ir išmatuoti sulaikytų aukštos kokybės fragmentų (žalios spalvos) dydį, kad būtų sudaryti vienos molekulės restrikcijos žemėlapiai. b ) Pastoliai, gauti iš naujos kartos sekos duomenų surinkimo de novo , paverčiami restrikcijos žemėlapiais , suardant restrikcijos fermento fermentą. Tada atstumas tarp restrikcijos fermento vietų sekos sudarytuose pastoliuose suderinamas su optinių fragmentų ilgiais vienmolekulės restrikcijos žemėlapiuose. Atitikimai leidžia pastolius prailginti ir sujungti į super pastolius.

Visas dydis

Rezultatai

Trumpai perskaityta de novo seka ir surinkimas

Mes sukūrėme genomo DNR iš 3 metų Yunnan juodosios ožkos patelės. Aukštos kokybės DNR, išgauta iš kepenų audinio, buvo panaudota 14 porų galų sekos sudarymo bibliotekoms, kurių intarpai buvo ∼ 180 bp, 350 bp, 800 bp, 2 kb, 5 kb, 10 kb arba 20 kb, sudaryti (1 papildoma lentelė). Naudodamiesi „Illumina“ sekos sudarymo platforma, mes sukūrėme 191, 5 Gb aukštos kokybės skaitymų (65, 6 karto viršija numatytą genomo dydį), kurių skaitymo ilgis svyruoja nuo 45 iki 101 bp (papildomas 1 pav.). Šios sekos buvo surinktos de novo naudojant SOAPdenovo (1.03 versija) programinę įrangą 15, todėl buvo gauti 542 145 kontigai ir 285 383 pastoliai, ilgesni nei 100 bp. Ištisinis N50 dydis buvo 18, 7 kb, tai rodo dydį, virš kurio galima rasti pusę viso sekos rinkinio ilgio. Pastolių N50 dydis buvo 2, 21 Mb (1 lentelė). Norėdami prailginti pastolių ilgį, mes suklasifikavome fosidų bibliotekos, kurios vidutinis intarpas yra ∼ 40 kb, pagaminto iš tos pačios ožkos DNR, galus (papildomi metodai ir papildomas 2 pav.). Iš viso iš fosidų galų buvo pagaminta 2 041 189 suporuotų unikalių sekų, iš kurių 140 296 poros buvo suderintos su skirtingais pastoliais ir buvo panaudotos pastoliams sujungti. Šis procesas padidino pastolių N50 dydį iki 3, 06 Mb (1 lentelė) ir, siekiant užpildyti spragas, davė ∼ 2, 66 Gb agregatą, kuriame buvo ∼ 140 milijonų N s (5, 26%). Surinktas genomas sudaro ∼ 91% apskaičiuoto ožkos genomo ∼ 2, 92-Gb dydžio, remiantis prognozėmis, naudojant 17 - meer metodą (papildomas 3 pav.). Norėdami patvirtinti šios sąrankos kokybę, į ją sugretinome neapdorotus rodmenis, gautus iš mažų įterpimo bibliotekų, kurios buvo naudojamos kontingento surinkimui ir tarpų užpildymui. Daugiau kaip 89% neapdorotų suporuotų galūnių gali būti priskiriami surinktų ožkų genomui, iš kurių 95% turėjo teisingą orientaciją ir atstumą tarp galų, tai rodo, kad surinkimas vietos lygiu iš esmės yra teisingas (2 papildoma lentelė). .

Pilno dydžio lentelė

Super pastolių konstrukcija

Informacija apie dideles jungčių grupes, tokias kaip chromosomos, yra svarbi jungčių analizei veisiant gyvūnus. Nors naujos kartos sekavimo duomenis surinkti į grimzlės genomą, apimantį pastolius, yra gana paprasta, sudaryti chromosomų struktūros fizinį žemėlapį vis dar sudėtinga ir brangu. Kadangi genetinio ar fizinio ožkos žemėlapio dar nėra, mes panaudojome viso genomo žemėlapių sudarymo technologiją, kad susidarytume ožkos genomo restrikcijos žemėlapį, o tada pastolius surinkome į super pastolius, kurie buvo pagal pilnų chromosomų ilgį.

Norėdami gauti vienos molekulės restrikcijos žemėlapius, mes panaudojome dideles DNR molekules iš fibroblastų ląstelių linijos, esančios iš odos iš sekvenevuotos Yunnan juodos ožkos ausies (papildomas 4 pav.). Iš viso, naudojant SpeI restrikcijos fermentą, buvo sukurti 3, 447, 997 vienos molekulės restrikcijos žemėlapiai, ilgesni nei 250 kb, o vidutinis dydis - 360 kb. Bendras apribojimų žemėlapio duomenų dydis buvo 24 1 241 Gb. Gretimų pastolių identifikavimui ir jų santykinei vietai bei orientacijai nustatyti buvo naudojamas hibridinis surinkimo algoritmas, kuris lygina eksperimentiškai nustatytus restrikcijos žemėlapius su in silico restrikcijos žemėlapiais, apskaičiuotais iš pastolių, surinktų iš trumpai skaitytų duomenų, ir buvo nustatytas jų santykinis išdėstymas bei orientacija (Papildomi metodai). Šis procesas sujungė 2 090 pastolių, kurių vidutinis ilgis buvo> 1, 2 Mb, į 315 super pastolius. Galutinio mazgo N50 buvo 16, 3 Mb, jis apėmė 92% surinktų pastolių. Likę 8% pastolių buvo per maži (vidutinis ilgis 713 bp), kad būtų naudojami viso genomo kartografavimui. Didžiausias superpastatas buvo 56, 4 Mb (1 lentelė).

Norėdami įvertinti super pastolių kokybę, mes panaudojome juos ožkų išreikštų sekų etikečių (EST) sekų žemėlapiams iš NCBI duomenų bazės (//www.ncbi.nlm.nih.gov/nucest) ir surinko de novo ožkų transkriptus, kuriuos gavome. iš dešimties audinių (iš viso ∼ 56 Mb). Iš 38 006 EST, kurie buvo> 300 bp (vidutinis ilgis 1 006, 5 bp), 99, 2% turėjo atitikčių, apimančių ≥96, 3% jų ilgio, kaip parodyta naudojant BLAT 16 (34 versija, tapatumas> 95%) (papildomi metodai ir 3 lentelė).

Norėdami įvertinti ožkos sąranką, mes taip pat panaudojome pagrindinį eukariotų genų žemėlapių metodą (CEGMA). Su juo mes suskaičiavome 97, 58% pagrindinių eukariotų genų (//korflab.ucdavis.edu/Datasets/cegma/) iš šešių modelinių organizmų ( Homo sapiens , Drosophila melanogaster , Arabidopsis thaliana , Caenorhabditis elegans , Saccharomyces cerevisiae ir Saccharomyces pomes ). ožkų super pastoliai, kurių padengimas yra> 70% (4 papildoma lentelė). Šis kartografavimo greitis yra didesnis nei gautas galvijų genome 18, o tai patvirtina ožkų super pastolių komplektavimo išsamumą ir aukštą kokybę.

Super pastolių tvirtinimas prie chromosomų

Naminė ožka turi 29 poras autosomų ir vieną porą lytinių chromosomų (2 n = 60) 19 . Citogenetiniai palyginimai rodo aukštą ožkų ir galvijų chromosomų kineziterapijos lygį, o visos 30 ožkų chromosomų buvo užsakytos pagal Tarptautinę galvijų chromosomų nomenklatūros sistemą 20 . Remdamiesi chromosomų kolinearitybe, mes panaudojome du galvijų genomo rinkinius (UMD_3.1 ir Btau_4.0), kad sutvirtintume superpastovus ožkų chromosomoms. Tiksliau sakant, 302 iš 315 super pastolių ir 140 kitų pastolių, kurie nebuvo įtraukti į super pastolius, buvo surinkti į 30 ožkos pseudo-chromosomų. Iš viso mes pritvirtinome 2, 52 Gb prie 30 pseudochromosomų ir priskyrėme 138 Mb neorientuotų ar neorientuotų mažų pastolių ar super pastolių dirbtinėms chromosomoms, pažymėtoms U. Šis rinkinys, kurį mes vadiname CHIR_1.0, yra viešai prieinamas per genomo naršyklės sąsają ir duomenų bazę (//goat.kiz.ac.cn/GGD/).

Norėdami įvertinti chromosomų tvirtinimo patikimumą, ištyrėme 28 ožkos genus, kurie buvo priskirti tam tikrai 21 chromosomos vietai (5 papildoma lentelė). Visų 28 genų chromosomų priskyrimas atitiko mūsų rezultatus. Kaip dar vieną mūsų pseudo-chromosomų rinkinio kokybės testą, mes palyginome 1 pseudo-chromosomą su dviem radiacijos hibridiniais ožkų 1-osios chromosomos žemėlapiais, kuriuos sukūrėme vyriškos lyties ožkoms iš 1 222 vieno nukleotido polimorfizmo (SNP) žymeklių Iliuminoje. „BovineSNP50 BeadChip“ (2a pav. Ir papildomi metodai) arba 1567 SNP gamintojai „Illumina OvineSNP50 BeadChip“ (2b pav. Ir papildomi metodai). Super pastolių, kurie buvo surinkti nenaudojant informacijos apie galvijų kineziteraciją, aptikome keletą pakeitimų. Be to, mes nustatėme keletą pertvarkymų tarp 1 pseudochromosomos rinkinio ir dviejų radiacijos hibridinių žemėlapių. Visi šie rezultatai leidžia daryti išvadą, kad super pastolių ir chromosomų rinkiniai yra tikslūs.

Image

( a, b ) Žemėlapiai buvo sukurti naudojant „BovineSNP50 BeadChip“ ( a ) ir „OvineSNP50 BeadChip“ ( b ). Ožkos „GenomeMap“ yra surinktos 1 pseudochromosomos, generuojamos pritvirtinant super pastolius ir pastolius (regionus tarp super pastolių), naudojant paskelbtą galvijų genomą (UMD_3.1 ir Batu_4.0). Ant chromosomos pritvirtinti ypač dideli pastoliai yra nurodyti šalia „GenomeMap“. Super pastoliuose yra tik keletas pertvarkymų (mėlynos linijos tarp „RHMap“ ir „GenomeMap“).

Visas dydis

Mes išplėtėme palyginimą tarp ožkos ir galvijų pagal visas chromosomas. Visos autosomos buvo stiprios kolinearinės vertės (papildomas 5a pav.). Kadangi dauguma ožkų super pastolių yra ilgi (N50 = 16, 3 Mb), jei super pastoliai būtų žemos kokybės, mes tikėtumesi pamatyti daug pertvarkymų tarp ožkos ir galvijų, tačiau taip nėra (aukšto pavyzdžio atveju) kineziterapija tarp ožkos ir galvijos chromosomos, žr. papildomą 5b pav.)

Visų pirma, mes pastebėjome didelius ožkų ir galvijų X chromosomų pertvarkymus (papildomas 6 pav.), Net jei X chromosomų jungčių grupė paprastai yra išsaugota placentos žinduoliuose 21 . Tie patys X chromosomų pokyčiai buvo stebimi lyginant juos su abiejų galvijų genomo rinkiniais (UMD_3.1 ir Btau_4.0). Netgi viename ožkos superkelyje yra didelių pertvarkymų (papildomas 6c pav.). Kadangi super pastoliai buvo surinkti nenurodant galvijų sintezės informacijos, šie pertvarkymai greičiausiai nėra netinkamo surinkimo, paremto optiniais žemėlapių duomenimis, rezultatas, o veikiau dėl dviejų rūšių skirtumų. Be to, avių etaloninis genomas, kuris buvo sukurtas integruojant tankius fizinius žemėlapius ir didelį BAC sekos duomenų rinkinį (Y. Jiang ir Tarptautinis avių genomo konsorciumas, neskelbti duomenys), labai sutampa su mūsų ožkų genomu ir jame yra tokie patys pertvarkymai. X chromosoma. Šie stebėjimai rodo, kad dideli galvijų ir ožkų X chromosomų pertvarkymai yra tikri ir patvirtina aukštą mūsų ožkos genomo rinkinio kokybę.

Pasikartojančios sekos ir perkeliami elementai

Perkeliami elementai sudaro didelę dalį žinduolių genomų ir prisideda prie genų ir (arba) genomo evoliucijos 22 . Ožkos genome yra perkeliamų elementų, panašių į galvijų 22, tuo, kad genome yra daug atrajotojams būdingų pakartojimų, kurie sudaro 42, 2% ožkos genomo (3 pav. Ir 6 papildoma lentelė). Tačiau ožkų genome yra ∼ 80% mažiau SINE-BovA pasikartojimų (971 273 ožkose ir 1 839 497 galvijuose) ir> 40% daugiau SINE-tRNR pasikartojimų (665 366 ožkose ir 388 920 galvijuose) nei galvijų genome, kas rodo, kad SINE-BovA pakartojimas pirmiausia išsiplėtė galvijų genome 22, tuo tarpu SINE-tRNR pakartojimas išsiplėtė būtent ožkose.

Image

(1) 30 ožkos chromosomų ideogramos (Mb skalėje). Numatomas kiekvienos chromosomos ilgis nurodomas kraštiniame apskritime. Pakabinamų super Pastolių ir Pastolių ribos parodytos juodomis linijomis. (2) Genų tankis, išreikštas sekų, koduojančių genų procentinę dalį, nedengiančių 1 MB langai, procentine dalimi. (3) Kartotinių sekų, apimančių nepersidengiančius 1 Mb langus, procentinė dalis. (4) Procentais išreikštas GC kiekis nepersidengiančiuose 1 MB languose. (5) Transkripcijos būsena. Kiekvieno geno transkripcijos lygis buvo įvertintas, vidutiniškai suskaičiuojant fragmentus iš kb egzono modelio milijonui susietų skaitymų (FPKM) iš skirtingų audinių nepersidengiančiuose 3 Mb languose.

Visas dydis

Mes taip pat išanalizavome kiekvieno tipo perkeliamų elementų skirtumų laipsnį ožkos genome ir nustatėme keletą neseniai išsiskyrusių perkeliamų elementų klasių (papildomas 7 pav.). Tai gali kilti dėl to, kad sunku pakartoti labai panašiai iš trumpai perskaitytų sekų duomenų 23 . Tačiau bendras perkeliamų elementų klasių pasiskirstymas tarp chromosomų yra panašus kaip ir kitų surinktų žinduolių genomų 24, 25 (papildomas 8 pav.).

Genų ir genų šeimos anotacija

Baltymus koduojančių genų komentavimui mes panaudojome tris genų prognozavimo metodus (homologija paremtą anotaciją, ab initio prognozavimą ir RNR-sek / EST / cDNR pagrįstą anotaciją). Tada mes sujungėme kiekvieno metodo rezultatus, kad gautume 22 175 baltymus koduojančių genų sutarimo genų rinkinį (3 pav., 7 ir 8 papildomos lentelės), kurių vidutinis kodavimo sekos ilgis yra 1 385 bp ir aštuonių egzonų kiekvienam genui vidurkis. Vidutinis egzonų ir intronų ilgis buvo atitinkamai 168 bp ir 3955 bp (7 papildoma lentelė). Iš viso 17 927, pažymėti baltymus koduojančiais genais, buvo ekspresuojami bent viename iš dešimties audinių, ištirtų transkripto sekos būdu (RNR-seq) (3 pav., 9 papildoma lentelė ir //goat.kiz.ac.cn/GGD/). . Kadangi netransliuojamus regionus sunku komentuoti, mes panaudojome RNR-seq tekstus, kad prailgintume 4 740 genų neišverstus regionus. Genų modeliai, gauti ožkai, buvo labai panašūs į artimai susijusių rūšių modelius, ir tai patvirtino anotacijos kokybę (papildomas 9 pav.).

Mes nustatėme 17 129 ortologinių genų porų tarp ožkų ir galvijų ir 16 771 ortologinių genų porų tarp ožkų ir žmonių. Filogenetinis medis, pagamintas iš 8 325 vienkartinių ožkų, galvijų, arklių, šunų, oposumo ir žmonių ortologų, rodo, kad ožkos turėjo bendrą protėvį su galvijais maždaug prieš 23 milijonus metų (4a pav.). Toliau palyginome ortologinių genų poras tarp ožkos ir galvijų, remdamiesi nesinoniminių ( Ka ) ir sinoniminių ( Ks ) pakaitų santykiais, kad būtų galima nustatyti 44 greitai besivystančius genus, esant teigiamai atrankai (papildoma 10 lentelė), iš kurių septyni yra imuninės sistemos genai ir trys yra hipofizės hormonai arba susiję genai. Greita imuninės sistemos genų evoliucija taip pat pastebėta galvijams 24 . Greita hipofizės hormonų raida gali būti susijusi su ožkų ir galvijų pieno gamybos skirtumais, vaisiaus vystymosi sparta ir (arba) plaukų svyravimais, kurie yra požymiai, susiję su hipofizės horizontais 26, 27 (papildoma diskusija).

Image

a ) Filogenetinis medis, pastatytas su keturis kartus išsigimusiomis 8 325 vienos kopijos genų vietomis. Kiekviename mazge nurodomi nukrypimo laiko įverčiai ir jo intervalas, pagrįstas sekos identiškumu. b ) Venno diagrama, rodanti unikalių ir bendrų genų šeimų skaičių iš devynių žinomų žinduolių rūšių. c ) Dinaminė ortologinių genų klasterių raida. Numatomas ortologinių grupių skaičius (16 998) naujausiose protėvių rūšyse (MRCA) parodytas šaknies mazge. Ortologinių grupių, išsiplėtusių ar sumažėjusių kiekvienoje giminėje, skaičius nurodytas atitinkamoje šakoje; +, išplėtimas; -, susitraukimas.

Visas dydis

Surinkime buvo 262 rRNR, 829 tRNR ir 1 010 mažų branduolinių RNR genų (11 papildoma lentelė). Taip pat mes nustatėme 487 mikroRNR (miRNR) genus, iš kurių 157 buvo 44 genomo klasteriuose, kuriuose yra nuo 2 iki 46 miRNR genų (papildomas 10a pav.). Šis pasiskirstymo būdas yra panašus į galvijų. Tačiau yra keletas miRNR genų grupių, būdingų ožkoms (papildomas 10b pav.). Didžiausias miRNR geno klasteris yra 21 ožkos chromosomoje (papildomas 11 pav.), Kuri yra konservuota žinduolių miRNR klasterė. Mes panaudojome miRNR sekas kitoms rūšims (žmonėms, galvijams, šunims, šimpanzėms, pelėms ir žiurkėms), kad nustatytume ožkai būdingus miRNR genus ir iš viso rastume šešis ožkai būdingus miRNR genus (12 papildoma lentelė), kurie turi tipiškas miRNR struktūras ( Papildomas 12 pav.) Ir daugybė taikinių genų (papildomas 13 pav.).

Remdamiesi porų baltymų sekos panašumu, mes atlikome visų ožkų genų grupių grupavimo analizę, palyginti su galvijų, arklių, šunų, pelių, žiurkių, oposumo, šimpanzės ir žmogaus genais. 19 607 ožkos genus buvo galima suskirstyti į 15 628 genų šeimas (4b pav. Ir 13 papildoma lentelė). Mes nustatėme 40 specifinių ožkų genų šeimų, kuriose yra 106 genai; ir 43 iš šių genų buvo ekspresuoti dešimtyje sekos sudarytų audinių (14 papildoma lentelė). Iš 115 genų, rastų 90 atrajotojams būdingų genų šeimų, 68 buvo ekspresuoti (15 papildoma lentelė). Šios konkrečiai linijai būdingos genų šeimos galėjo prisidėti prie ožkų ar atrajotojų evoliucijos.

Mes taip pat išanalizavome genų šeimos išplėtimo ar susitraukimo atvejus ožkoms, galvijams, arkliams, šunims ir žmonėms. Visuose penkiuose genomuose mes nustatėme didesnį genų susitraukimo dažnį nei genų išsiplėtimo įvykiai (4c pav.), Kaip buvo pastebėta anksčiau 28 . Mes sutelkėme dėmesį į reikšmingiausius išsiplėtimo ar susitraukimo įvykius ( P <0, 01) ir rankiniu būdu išfiltravę genų šeimas, kurių nariai turėjo skirtingas funkcijų funkcijas (16 papildoma lentelė), mes aptikome tris išplėstines uoslės receptorių genų pošeimius, bet tik vieną susitraukusį pošeimį. ožka, palyginti su galvijumi, arkliu, šunimi ir žmogumi. Gali būti, kad uoslės receptorių išsiplėtimas gali prisidėti prie išskirtinio ožkų gebėjimo pašaro 29 . Taip pat pastebėjome, kad ožkos feritino sunkiosios grandinės (FTH1) genas išsiplėtė, ožkos FTH1 genų skaičius beveik septynis kartus viršija žmogaus ir du kartus - galvijų. Dėl FTH1 išsiplėtimo ožkose gali atsirasti neįprastas jo detoksikacijos gebėjimas, taigi ir platus pašaro racionas, nes feritinas vaidina pagrindinį vaidmenį geležies sekvestravime, detoksikacijoje ir laikyme 30 .

Du kontigai, turintys avių pagrindinį histokompatibilumo (MHC) lokusą (dar vadinamą avių limfocitų antigenu arba OLA), sugeneruoti BAC pagal BAC seka 31, buvo naudojami ieškant CHIR_1.0 ožkų MHC lokusuose. Kaip ir buvo galima tikėtis, ožkos MHC lokusai buvo išdėstyti 23-ojoje chromosomoje. Panašiai kaip avių MHC, ožkos MHC yra atitinkamai du 2, 25 Mb ir 360 kb ilgio regionai (5a pav.). Remdamiesi palyginimu su avių MHC, kuriame yra 177 genai, mes anotavome 160 baltymus koduojančių genų (17 papildoma lentelė), naudodami tą patį metodą, kaip ir avių MHC anotacijoje 31 . Remdamiesi anotacija mes taip pat išanalizavome konservuotus MHC lokų genus avims, ožkoms ir žmonėms. Nors yra keletas inversijų, būdingų MHC lokusams, dauguma konservuotų genų pasižymi dideliu ožkų, avių ir žmonių koloiniškumu (5b pav.). Šie rezultatai ne tik rodo, kad mūsų ožkos genomo rinkinys yra geros kokybės, bet ir pateikia išsamų ožkos MHC žemėlapį, kuris bus naudingas atliekant imunologinius tyrimus ir kuriant vakcinas.

Image

a ) Ožkos MHC žemėlapis ir ožkos MHC palyginamumas su avių MHC (OLA). Žalios linijos parodo sintetinį ryšį tarp ožkos MHC ir OLA. Žymimi tik ožkos MHC genai. Taip pat parodytas GC kiekis (%, su nepersidengiančiais, 1 kb langais). b ) Ožkų MHC (GLA), avių MHC (OLA) ir žmogaus MHC (HLA) konservuoti genai yra sujungti juodomis linijomis.

Visas dydis

Pirminių ir kašmyro plaukų folikulų nuorašai

Žinduolių plaukai yra labai keratinizuotas audinys, kurį gamina plaukų folikulai odoje. Yra dviejų tipų plaukų folikulai: pirminis plaukų folikulas sukuria šiurkščius plaukus visais žinduoliais, o antrinis plaukų folikulas iš kai kurių žinduolių, įskaitant ožkas ir antilopes 32, sukuria kašmyro arba „plonuosius plaukus“ (papildomas 14 pav.) . Kašmyro pluoštas, pasižymintis puikiomis ir minkštomis savybėmis, daugiausia gaunamas iš kašmyro ožkos. Nepaisant 2500 metų istorijos ir milžiniško neapdoroto kašmyro gaminimo, kuris, manoma, yra maždaug 10 000 tonų per metus Kinijoje, didžiausiame pasaulyje kašmyro gamintoju 33, mažai žinoma apie molekulinius kašmyro formavimo ir vystymosi mechanizmus.

Mes ištyrėme genetinį pagrindą, pagrindžiantį kašmyro skaidulų vystymąsi, seką sudarydami pirminių ir antrinių plaukų folikulų transkriptomis ir atvaizdavus ožkos genomo rinkinį bei anotuotus genus. RNR buvo išgaunama iš vidinės Mongolijos kašmyro ožkos 20–50 antrinių ar pirminių plaukų folikulų, kiekviename mėginyje gaunant 144–588 ng RNR, o trijų porų pirminių ir antrinių plaukų folikulų mėginių (trijų biologinių replikų) transkripcijos buvo tiesiogiai sekvenuotos be amplifikacija, gaunant 20, 3 Gb sekos duomenis (18 papildoma lentelė). Didžioji (∼ 75%) visų FPKM (fragmentų viena kilobaze egzono ir milijonas suskaidytų fragmentų) reikšmė abiejuose plaukų folikuluose buvo iš keratino ir su keratinu susijusių baltymų genų (19 papildoma lentelė). Visuose trijuose suporuotuose mėginiuose pirminiuose plaukų folikulų mėginiuose nustatėme 10 077 genus ir antriniuose plaukų folikulų mėginiuose - 7772 genus, kurių FPKM> 0, 1. Iš 2572 genų pirminiuose plaukų folikulų mėginiuose ir 1947 genų antriniuose plaukų folikulų mėginiuose, kurių FPKM> 5, 51 parodė, kad išraiškos pokyčiai bent du kartus yra tarp visų trijų antrinių ir pirminių plaukų folikulų mėginių porų (20 papildoma lentelė)., kai antrinis, palyginti su pirminiais folikulais, 28 yra reguliuojami 23, o kiti - 23.

Keratinas ir su keratinu susiję baltymai yra pagrindiniai plaukų skaidulų struktūriniai baltymai, lemiantys pluošto kokybę. Dviejų tipų (I ir II tipo) keratinai yra suporuoti, kad sudarytų privalomus heteropolimerus 34, tuo tarpu su keratinu susiję baltymai gali būti atsakingi už standžiojo plauko ašies formavimą ir plaukų struktūros bei skersmens 35 pakeitimą . Iš viso mes anotavome 49 keratino genus (21 papildoma lentelė) ir 30 su keratinu susijusių baltymų genų ožkos genome (22 lentelė), iš kurių 29 keratino genai ir visi 30 su keratinu susijusių baltymų genų buvo aptikti FPKM> 5 abiejų tipų folikulai (23 papildoma lentelė). Pažymėtina, kad du iš 29 keratino genų ir 10 iš 30 su keratinu susijusių baltymų genų visuose trijuose mėginių rinkiniuose buvo nuosekliai diferencijuoti tarp pirminių ir antrinių plaukų folikulų, ir visi šie baltymai buvo ekspresuojami labiau antriniuose nei pirminiuose folikuluose (papildoma lentelė). 24), leidžia manyti, kad su keratinu susiję baltymų genai gali būti svarbesni nustatant kašmyro skaidulų struktūrą. Du skirtingai išreikšti keratino genai (keratinas 40 ir 72) buvo atitinkamai 1 ir 2 tipo (papildomas 15 pav.). Su keratinu susijusius baltymus galima suskirstyti į tris pagrindines grupes: aukštos sieros, ypač aukštos sieros ir aukštos glicino tirozino 36 . Dešimt skirtingai išreikštų su keratinu susijusių baltymų buvo visi labai sieros turinčioje grupėje (papildomas 16 pav.), Kas rodo, kad ši baltymų grupė gali būti svarbi formuojant kašmyrui.

Kiti antrinių plaukų folikulų reguliuojami genai apima fibroblastų augimo faktorių 21 (GOAT_ENSP00000222157), kuris gali skatinti perėjimą prie katageno 37, ir kazeino kinazę Iɛ (goat_GLEAN_10015556), svarbų β-katenino reguliatorių Wnt kelyje, kuris yra vienas iš svarbiausi plaukų folikulų vystymosi keliai 38 .

Ant antrinių plaukų folikulų susilpninti genai apėmė du aminorūgščių biosintezės fermentus: asparagino sintetazę (goat_GLEAN_10019946) ir fosfoserino aminotransferazę (GOAT_ENSP00000388939), kurie yra pagrindiniai asparagino ir serino biosintezės fermentai, ir tai rodo, kad šios aminorūgštys gali aktyviau dalyvauti pirminėje plaukų augime. . Tarp kitų sureguliuotų genų buvo „Gap“ jungimosi alfa-1 baltymas („goat_GLEAN_10013034“) ir „Desmoglein 1“ (GOAT_ENSBTAP00000018382), apie kuriuos pranešta, kad jie dalyvauja plaukų folikulų ląstelių komunikacijoje ir plaukų folikulų morfogenezėje 38, 39, ir izopentenil-difosfato3APAP003AP0000000038383 ) ir ląstelių retinoinę rūgštį jungiantis baltymas 2 (GOAT_ENSBTAP00000007515), kurie abu yra susiję su retinoinės rūgšties biosinteze ir gali reguliuoti plaukų augimą ir plaukų gyvenimo ciklą per Wnt signalą 40, 41 . Tolesnė šių išraiškos duomenų analizė sudarė papildomas hipotezes, susijusias su genais ir būdais, kurie gali būti kašmyro pluošto gamybos pagrindas (papildoma diskusija, papildomas 17 pav. Ir papildomos lentelės 25–29).

Diskusija

Ožkos genomas, mūsų žiniomis, yra pirmasis didelis genomas, kurį reikia sekuoti ir surinkti de novo, naudojant viso genomo žemėlapių sudarymo technologiją, parodantį, kad šį metodą galima naudoti norint gauti labai gretimą didelio genomo junginį be tradicinės genetikos pagalbos. žemėlapiai. Ilgi super pastoliai suteikia pakankamą jungčių grupės informaciją genų kartografavimui ir veisimui pagal žymeklį. Jie yra pakankamai ilgi, kad būtų pritvirtinti prie chromosomų, naudojant grubią informaciją apie kitus artimai susijusius žinduolius, kurių visi genomai yra. Mes planuojame atnaujinti ožkos genomo rinkinį, kai tik bus gauti visų chromosomų radiacijos hibridiniai žemėlapiai.

Ožkų genomo seka bus naudinga atvaizduojant rodmenis, gautus pakartotinai sekveneeruojant daugiau ožkų veislių, o tai palengvins SNP žymenų identifikavimą, naudojant genomo žymeklį, kuriam padedama. Mūsų žiniomis, ožka yra pirmasis mažas atrajotojas, kurio genomas buvo išskaidytas. Ožkos genomas turėtų būti naudingas norint suprasti genomo ypatybes, skiriančias atrajotojus nuo atrajotojų rūšių. Tai taip pat bus naudinga siekiant pagerinti ožkos, kaip biomedicinos modelio ir bioreaktoriaus, naudingumą. Be to, genai, kuriuos nustatėme ir kurie yra susiję su kašmyro pluošto gamyba, galėtų būti naudojami kaip geresnių kašmyro ožkų veisimo žymekliai, arba jie gali būti potencialūs genetinių ar negenetinių manipuliacijų taikiniai.

Metodai

DNR / RNR išskyrimas, bibliotekos sudarymas ir sekų sudarymas.

Genominė DNR buvo išskirta iš juodosios Yunnan patelės kepenų audinio standartiniais molekulinės biologijos metodais. DNR buvo nukirptos iki 180–800 bp, 2 kb, 5 kb, 10 kb ir 20 kb fragmentų, kad būtų suformuotos PE bibliotekos (išsamią informaciją žr. Papildomuose metoduose). Visos šios DNR bibliotekos buvo seka Illumina Genome Analyzer II platformoje.

Aukštos kokybės DNR, išgauta iš juodojo Yunnos patelės kepenų audinio, buvo naudojama fosmidų bibliotekos statybai (išsamiau žr. Papildomus metodus). Fosidų galų seka buvo atliekama tokia tvarka: suskaidymas ir galų taisymas, dydžio parinkimas ir gryninimas, suvirškintos tiesinės DNR cirkuliacija, atvirkštinė PGR ir 400–700 bp DNR fragmentų praturtinimas (išsamiau žr. Papildomus metodus). Tada buvo atlikta trumpų intarpų bibliotekų sekos.

RNR buvo išgryninta naudojant TRIzol (Invitrogen). RNR sekos sudarymo bibliotekos buvo sukonstruotos naudojant „mRNA-Seq Prep Kit“ (Illumina, JAV). Mes sekame 200 bp RNA-seq porinių galų bibliotekas, naudodamiesi Illumina HiSeq 2000 platformos suporuotų galų sekos moduliu (90 bp kiekviename gale) (išsamią informaciją žr. Papildomame metode).

Pastolių statyba.

Ožkų genomo pastoliai buvo pastatyti naudojant SOAPdenovo programinę įrangą (1.03 leidimas, //soap.genomics.org.cn/, parametras „-K 41 -d 1 -M 2 -F“, išsamią informaciją žr. Papildomuose metoduose). Galutinės sekos iš fosidų bibliotekos buvo naudojamos pastoliams pailginti, naudojant procedūrą, aprašytą Papildomuose metoduose.

Viso genomo žemėlapių sudarymas (WGM) ir super pastolių statyba.

Mes panaudojome naują „WGM“ technologiją, kurią sukūrė „Argus System“ ir „OpGen“ programinės įrangos paketas („Genome-Builder“), kad gautume didžiulius optinio žemėlapio duomenis, apdorotume šiuos duomenis ir visiškai automatiškai išplečiame pastolius. Sistema integruoja šlapios laboratorijos chemiją, įskaitant virškinimą ir dažymą, į automatizuotą procesą, naudodama „MapCard“ ir „MapCard Processor“, o po to „Argus Mapper“ prietaisas automatiškai surenka daugiau nei 7000 fluorescencinių mikroskopų vaizdų kiekvienoje „MapCard“. Veiksminga „Genome-Builder“ versija, skirta mažiems duomenų rinkiniams, yra įterpta į „Argus“ sistemą, tačiau dideliems duomenų rinkiniams „Genome-Builder“ reikia įdiegti į kompiuterio serverį.

Didelės molekulinės masės DNR iš fibroblastų ląstelių linijos iš juodosios Yunnan moters odos audinio buvo perduota per kanalą formuojantį prietaisą (CFD), kad atskiros DNR molekulės būtų nukreiptos ir ištempiamos ant teigiamai įkrauto stiklinio paviršiaus „MapCard“, kuris turėjo atskiras kameras visiems reagentai, kuriuos reikia iš anksto pakrauti (išsamesnės informacijos žr. Papildomame metode). DNR buvo pailginta ir imobilizuota į paviršių, po to, kai ji tekėjo žemyn CFD mikro kanalais. Tvirtindami DNR prie paviršiaus, išvengėte pakartotinio suvyniojimo, užtikrindami optimalią DNR orientaciją, kad vaizdas būtų fiksuojamas CCD kamera. Imobilizuotos atskiros DNR molekulės buvo suardytos SpeI 10 minučių 37 ° C temperatūroje ir vėliau nudažytos JOJO-1 (Life Technologies) MapCard procesoriuje (MCP) (papildomas 4a pav.). MCP automatizuoja nuoseklų restrikcijos fermento skaidymo ir dažymo veiksmus.

Atskiros DNR molekulės ir atitinkami restrikcijos fragmentai buvo pavaizduoti lazeriu apšviestomis fluorescencinėmis mikroskopijomis, naudojant „Argus Mapper“ (daugiau informacijos žr. Papildomuose metoduose). Restrikcijos fermento išpjaustytos vietos buvo aptiktos kaip DNR atvaizdų spragos, ir buvo nustatytas kiekvieno restrikcijos fragmento dydis tarp gretimų supjaustytų vietų (papildomas 4c pav.). „Mapper“ analizuoja vaizdų kanalus kanalais, filtruoja netiesinius iškraipytus fragmentus ir mažas molekules, nustato spragas tarp fragmentų ir išmatuoja išsaugotų aukštos kokybės fragmentų dydį. Šiam projektui buvo sukurti 3 447 997 vienos molekulės restrikcijos žemėlapiai (> 250 kb), kurių vidutinis dydis 360 kb. Bendras vienos molekulės restrikcijos žemėlapio duomenų dydis buvo apie 1 241 Gb.

Super pastoliai su WGM duomenimis.

Super pastoliai su WGM duomenimis buvo atlikti naudojant neseniai „OpGen“ sukurtą „Genome-Builder“ programinę įrangą. Šis programinės įrangos rinkinys naudoja hibridinį metodą, kad atliktų de novo sekos ilgo nuotolio pastolius. Trumpai tariant, jis naudoja „Argus“ sukurtus vienos molekulės žemėlapius, kad prailgintų sekų pastolius, sudarytų sutampančius regionus tarp gretimų pastolių ir sujungtų pastolius, remiantis jų poromis. Įvestų sekų pastoliai buvo pagrįsti de novo sąranka ir pirmiausia buvo paverčiami restrikcijos žemėlapiais , suardant restrikcijos fermento fermentą. Gauti silikono žemėlapiai buvo naudojami kaip pradiniai sėklų žemėlapiai iteraciniam pratęsimo procesui. Išsami algoritmo informacija yra aprašyta 4 papildomame paveiksle ir papildomuose metoduose.

Super pastoliai buvo įvertinti CEGMA 17 ir EST, atsisiųstų iš NCBI (13 849 įrašai), ir de novo surinkti EST iš dešimties audinių RNR-seq įrašų (99 707 įrašai, išsamią informaciją žr. Papildomuose metoduose).

Pseudochromosomų surinkimas ir įvertinimas.

Palyginimas su ožkų super pastoliais / pastoliais ir galvijų genomu (UMD 3.1) su BLASTN buvo palygintas iš 108 850 SNP zondų, gautų iš OvineSNP50 BeadChip ir BovineSNP50 BeadChip, sekos, kad būtų galima nustatyti nepamatuotus super pastolius ir kitus pastolius. viso genomo žemėlapių sudarymas į 30 pseudochromosomų (išsamiau žr. Papildomus metodus). Tada WGM duomenys buvo naudojami pakartotinai patikrinti pritvirtintų super pastolių ar pastolių eiliškumą. Dislokacijos, patvirtintos mūsų eksperimentinių WGM duomenų, buvo tikrosios derinimo skirtumų priežastys, kurias sukėlė ožkos ir galvijų nekolinearumas. Pastolių, super pastolių ir jų atitinkamų .agp instrukcijų failus galite rasti adresu //goat.kiz.ac.cn/GGD/.

Norėdami įvertinti ožkos genomo chromosominę komplektaciją, mes palyginome 1 pseudochromosomą su dviem radiacijos hibridiniais ožkų 1-osios chromosomos žemėlapiais, kuriuos sukūrėme Boer ožkai. Mes nustatėme 1 222 SNP žymeklių duomenis „Illumina BovineSNP50 BeadChip“ ir 1567 SNP gamintojų „Illumina OvineSNP50 BeadChip“, kurie gali būti pavaizduoti ožkos genome 5000 radijo ožkų ir žiurkėnų radiacijos hibridiniame skydelyje, kuriame buvo 93 „Boer“ ožkos ląstelių linijos. Mes taip pat atlikome sintezės pagrindu atliktus visų chromosomų palyginimus tarp ožkos CHIR_1.0 ir abiejų galvijų Btau_4.0 ir UMD3.1 rinkinių (išsamiau žr. Papildomą metodą).

Genomo komentarai ir analizė.

Genomo komentarai apima pasikartojančių elementų (perkeliamų elementų), baltymus koduojančių genų, ne baltymus koduojančių genų ir genų šeimų anotacijas. Remiantis genomo anotacijomis, genomo analizė buvo nukreipta į teigiamo atrankos genus ir genų šeimos evoliuciją. Čia buvo išvardyti trumpi metodai, o visa informacija yra išsamiai aprašyta Papildomuose metoduose.

Tandemo pakartojimai genomo rinkinyje buvo nustatyti naudojant „Tandem Repeat Finder 42“ . Nepertraukiami pakartojimai genome buvo aptikti naudojant „RepeatMasker 43“ . Perkeliami elementai genomo rinkinyje buvo identifikuoti DNR ir baltymų lygiu. DNR lygiu „RepeatModeler“ (//www.repeatmasker.org/RepeatModeler.html) ir „LTR_FINDER 44“ programinė įranga buvo naudojama kuriant de novo pakartotines bibliotekas. „RepeatMasker“ (3.2.9 versija) buvo paleisti prieš „ de novo“ biblioteką ir atskirai replikuoti 45, kad būtų galima nustatyti homologinius pakartojimus, kurie buvo klasifikuojami į žinomas pakartojimų klases 46 . Baltymų lygiu RM-BLASTX programinės įrangos pakete „RepeatProteinMask“ programoje „RepeatMasker“ buvo naudojamas prieš perduodamų elementų baltymų duomenų bazę.

Norėdami numatyti baltymus koduojančius genus, informacija buvo integruota iš trijų skirtingų metodų: ab initio numatymo, homologija paremtos anotacijos ir RNR-sek / EST / cDNR pagrįstos anotacijos. RNR-seq duomenys buvo naudojami genų sekoms išplėsti, ypač 5 ′ UTR, kur didelis GC kiekis paprastai trukdo sekti Illunima.

„InterProScan 47“ (4.5 versija) buvo naudojamas ožkų baltymams tikrinti pagal penkias duomenų bazes („Pfam 48“, 24.0 leidimas; PRINT 49, 40.0 leidimas; PROSITE 50, 20.52 versija; ProDom 51, 2006.1; MART, 6.0 versija). KEGG 52, 53 (58 leidimas), „Uniprot“ / „SwissProt 54“ (2011 m. Leidimas) ir „UniProt / TrEMBL 55“ (2011 m. Leidimas) duomenų bazėje buvo ieškoma homologijomis pagrįstų funkcijų priskyrimų (GO priskyrimų).

„TRNAscan-SE 56“ (1.23 versija) programinė įranga su numatytaisiais eukarioto parametrais buvo naudojama tRNR anotacijai. rRNR anotacija buvo pagrįsta žmogaus rRNR rinkinių homologine informacija, naudojant BLASTN (2.2.21 versija). „INFERNAL 57“ programinė įranga numatė miRNR ir mažų branduolinių RNR genų palyginimą su „Rfam“ duomenų baze 58 .

„Treefam 59“ metodika buvo naudojama apibrėžti genų šeimą kaip genų grupę, kylančią iš vieno geno bendrame ožkos, galvijo, arklio, šuns, pelės, žiurkės, oposumo , šimpanzės ir žmogaus protėvyje ( Ensembl leidimas 56).

Vienos kopijos genai, apibrėžti kaip ortologiniai „Treefam“ vamzdynų genai, filogenetinei analizei buvo parinkti naudojant „MrBayes“ programinę įrangą 60 . Bajeso atsipalaidavęs molekulinis laikrodis (BRMC) metodu buvo naudojamas įvertinti rūšies skirtumo laiką naudojant programą MCMCTREE (4 versija), kuri buvo PAML paketo 61 dalis . Kalibravimo metu buvo naudojamas žmogaus ir šuns nukrypimo laikas iš „TimeTree“ duomenų bazės (//www.timetree.org/).

CAFE (kompiuterinė genų šeimos evoliucijos analizė, versija 2.1) 62 buvo naudojama aptikti genų šeimos išplėtimą ir susitraukimą atitinkamai žmonėms, šunims, arkliams, galvijams ir ožkoms. KaKs_ Calculator 63 programinė įranga buvo apskaičiuota Ka / Ks santykis 14 906 ortologinių ožkų, galvijų ir žmonių poroms. Toliau šios genų poros buvo patikrintos teigiamu selekcija.

Pirminių plaukų folikulų ir antrinių plaukų folikulų transkriptų palyginimas.

Filtravę žemos kokybės / užterštus / PGR artefaktus, nuskaito, nuskaito iš RNR seq pirminių plaukų folikulų (PHF) ir antrinių plaukų folikulų (SHF) porų pavyzdžius, palyginti su ožkos rinkiniu, naudodami „Tophat 64“ . Kiekvieno baltymą koduojančio geno FPKM vertė buvo apskaičiuota Cuffdiff (//cufflinks.cbcb.umd.edu). Dviejų mėginių diferencijuotų genų reikšmingumo lygis ( P vertė ) buvo apskaičiuotas naudojant Cuffdiff, naudojant numatytuosius parametrus. FPKM> 5 buvo naudojamas kaip griežtas ribas, norint identifikuoti atitinkamai išreikštus genus. Skirtingai išreikšti genai yra tie, kurių FPKM pokytis tarp PHF ir SHF mėginių yra bent dvigubas visuose trijuose PHF / SHF palyginimuose.

Prisijungimo kodas.

Ožkos viso genomo šautuvo projektas, DDBJ / EMBL / GenBank: AJPT00000000. DNR sekos sudarymo trumpas tekstas, SRA: SRA051557. RNR sekos trumpas tekstas, GEO: GSE37456. Kadangi dar nėra duomenų banko, kuriame būtų galima saugoti optinius žemėlapių duomenis, ožkos viso genomo žemėlapių duomenis galima gauti iš //goat.kiz.ac.cn/GGD/. 1 chromosomos radiacijos hibridinio žemėlapio duomenis taip pat galima rasti //goat.kiz.ac.cn/GGD/.

Prisijungimai

Pirminės prieigos

Genų ekspresijos omnibusas

  • GSE37456

NCBI atskaitos seka

  • AJPT00000000

Eilių skaitymo archyvas

  • SRA051557

Papildoma informacija

PDF failai

  1. 1.

    Papildomas tekstas ir figūros

    Papildoma diskusija, papildomi metodai, papildomos 1–18, 20–29 lentelės ir papildomi 1–17 paveikslai

„Excel“ failai

  1. 1.

    19 papildoma lentelė

    Genų ekspresijos profilis PHF ir SHF (be filtro)