Miežių genomo fizinės, genetinės ir funkcinės sekos rinkinys | gamta

Miežių genomo fizinės, genetinės ir funkcinės sekos rinkinys | gamta

Anonim

Dalykai

  • Funkcinė genomika
  • Augalų genetika

Anotacija

Miežiai ( Hordeum vulgare L.) yra vieni anksčiausiai prijaukintų ir svarbiausių pasėlių augalų pasaulyje. Tai diploidas, turintis didelį 5, 1 gigabazių (Gb) haploidinį genomą. Čia pateikiame integruotą ir išdėstytą fizinės, genetinės ir funkcinės sekos išteklius, apibūdinančius miežių genų erdvę struktūrizuotame viso genomo kontekste. Mes sukūrėme 4, 98 Gb fizinį žemėlapį, kuriame daugiau nei 3, 90 Gb yra pritvirtinta prie aukštos skiriamosios gebos genetinio žemėlapio. Projektuojant gilų viso genomo ginklo pistoletą, papildomus DNR ir gilių RNR sekų duomenis į šią sistemą palaikomos 79 379 nuorašų grupės, įskaitant 26 159 „didelio pasitikėjimo“ genus, turinčius homologinę paramą iš kitų augalų genomų. Gausūs alternatyvūs sujungimai, priešlaikiniai terminavimo kodonai ir nauji transkripciniu požiūriu aktyvūs regionai rodo, kad perdirbimas po transkripcijos sudaro svarbų reguliavimo sluoksnį. Įvairių prisijungimų apklausų sekos atskleidžia didžiulį vieno nukleotido variacijos kraštovaizdį. Mūsų duomenys yra platforma, kuriai atlikti tiek genomo atliekami tyrimai, tiek leidžiantys pagerinti šiuolaikinius pasėlius.

Pagrindinis

Auginami miežiai, gauti iš jo laukinio palikuonio Hordeum vulgare ssp. spontaneum , yra viena iš anksčiausiai pasaulyje prijaukintų augalų rūšių 1 ir šiandien yra ketvirta gausiausia javų rūšis tiek pagal plotą, tiek pagal nuimtą derlių (//faostat.fao.org). Maždaug trys ketvirtadaliai pasaulinės produkcijos sunaudojama gyvūnų pašarams, 20% salyklo naudojama alkoholiniams ir nealkoholiniams gėrimams, 5% - kaip įvairių maisto produktų sudedamoji dalis 2 . Miežiai yra plačiai pritaikyti įvairioms aplinkos sąlygoms ir yra atsparesni stresui nei artimi giminaičiai kviečiai 3 . Dėl to miežiai tebėra pagrindinis maisto šaltinis skurdesnėse šalyse 4, išlaikant derlingą derlių atšiaurioje ir ribotoje aplinkoje. Labiau išsivysčiusiose visuomenėse jis neseniai buvo klasifikuojamas kaip tikras funkcinis maistas. Miežių grūduose yra ypač daug tirpių maistinių skaidulų, o tai žymiai sumažina rimtų žmonių ligų, įskaitant II tipo diabetą, širdies ir kraujagyslių ligas bei gaubtinės ir tiesiosios žarnos vėžį, kurie kenčia šimtus milijonų žmonių visame pasaulyje, riziką 5 . JAV maisto ir vaistų administracija leidžia teigti apie miežių grūdų ląstelių sienelės polisacharidų sveikatingumą žmonių sveikatai.

Miežiai, kaip diploidiniai, tarpvietiniai, vidutinio klimato pasėliai, tradiciškai buvo laikomi augalų genetinių tyrimų modeliu. Didelės gemalų kolekcijos, kuriose yra geografiškai skirtingų elito veislių, laukinių augalų ir laukinių augalų, yra lengvai prieinamos 6 ir neabejotinai turi alelių, kurios galėtų palengvinti klimato pokyčių poveikį ir dar labiau padidinti maistinių skaidulų kiekį grūduose. Praturtinant jos didelę gamtinę įvairovę, buvo sukurtos, apibūdintos ir kruopščiai prižiūrimos išsamios apibūdinamos mutantų kolekcijos, kuriose yra visi morfologiniai ir raidos pokyčiai, pastebėti rūšyse. Pagrindinė šių išteklių naudojimo pagrindiniame ir selekciniame moksle kliūtis yra referencinės genomo sekos arba tinkamos įgalinančios alternatyvos nebuvimas. Pateikti bet kurį iš jų buvo pagrindinis tyrimų iššūkis pasaulinei miežių bendruomenei.

Atsakydami į šį iššūkį, pristatome naują genomo išteklių, reikalingų miežiams sustiprinti, pristatymo modelį, kaip Triticeae genties, kuriai priklauso duona ir kietieji kviečiai, miežiai ir rugiai, pavyzdį. Mes pristatome miežių genomo genų erdvę, kurią mes apibrėžiame kaip integruotą daugiasluoksnį informacinį šaltinį, suteikiantį prieigą prie daugumos miežių genų labai struktūruotoje fizinėje ir genetinėje struktūroje. Kartu su lyginamosios sekos ir transkripto duomenimis, genų erdvė suteikia naują molekulinį ir ląstelinį įžvalgą apie rūšies biologiją, sukurdama platformą geno atradimui ir pasėlių gerinimui, naudojant genomą.

Eilėmis praturtintas miežių fizinis žemėlapis

Mes sukūrėme viso genomo fizinį miežių veislės (cv.) Morex žemėlapį, naudodamiesi didelės informacijos turiniu pirštų atspaudais 7 ir kontingentu 8 iš 571 000 bakterijų dirbtinės chromosomos (BAC) klonų (∼ 14 kartų haploidinis genomas), gautų iš šešių. nepriklausomos BAC bibliotekos 9 . Atlikus automatizuotą surinkimą ir rankinį kuravimą, fizinį žemėlapį sudarė 9 265 BAC kontigai, kurių numatomas N50 kontigo dydis buvo 904 kilobazės, o bendras ilgis - 4, 98 Gb (metodai, 2 papildoma pastaba). Jį parodo minimalus plytelių klojimo kelias (MTP) - 67 000 BAC klonų. Atsižvelgiant į 5, 1 Gb 10 genomo dydį, fiziniame žemėlapyje pavaizduota daugiau nei 95% miežių genomo, palyginti su 1 036 kontigais, kurie sudaro 80% 1 Gb kviečių 3B 11 chromosomos.

Fizinį žemėlapį patobulinome integruodami informaciją apie 5 341 geno, turinčio 12, 13 ir 937 atsitiktinai parinktus BAC klonus (metodai, 2 ir 3 papildomos pastabos ir 4 papildoma lentelė) ir 304 523 BAC pabaigos sekos (BES) poras (3441 geno turinčius 12–13). 3 lentelė). Jie pateikė 1166 megabazes (Mb) genomo sekos, integruotos tiesiai į fizinį žemėlapį (3 ir 4 papildomos lentelės). Ši sistema palengvino viso genomo šovinių sekų duomenų įtraukimą ir fizinių bei genetinių žemėlapių integravimą. Mes sugeneravome viso genomo šovinių sekų duomenis iš cv genomo DNR. „Morex“ trumpai skaitant „Illumina GAIIx“ technologiją, naudojant 300 bazinių porų (bp) suporuotų galų ir 2, 5 kb mate-porų bibliotekų derinį, kad> 50 kartų padidėtų haploidinis genomas (papildoma 3.3 pastaba). De novo surinkimo metu sekos kontigai buvo viso 1, 9 Gb. Dėl didelės pasikartojančios DNR dalies nemaža dalis viso genomo kulkosvaidžio duomenų sugriuvo į palyginti mažus kontigus, kuriems būdingas ypač didelis skaitymo gylis. Apskritai, 376, 261 kontigai buvo didesni nei 1 kb (N50 = 264 958 kontigai, N50 ilgis = 1 425 bp). Iš jų 112 989 (308 Mb) galėtų būti pritvirtinti tiesiai prie sekos praturtinto fizinio žemėlapio, atlikdami sekos homologiją.

Mes įgyvendinome hierarchinį metodą, kad toliau įtvirtintume fizinius ir genetinius žemėlapius (Metodai, 4 papildoma pastaba). Iš viso 3 241 genetiškai susietas vieno nukleotido variantas (SNV) ir 498 165 genetiniai žymenys su sekos žymenimis 14 leido mums panaudoti sekos homologiją, kad kiekvienos miežių chromosomos genetinėms pozicijoms būtų priskiriami 4556 sekos praturtinti fizinio žemėlapio kontigai, apimantys 3, 9 Gb. Papildomi 1881 kontigai buvo priskirti chromosomų šiukšliadėžėms pagal homologiją su chromosomos ir rankos specifinių sekų duomenų rinkiniais 15 (4.4 papildomoji pastaba). Taigi, 6 437 fizinio žemėlapio kontigai, kurių bendra vertė yra 4, 56 Gb (90% genomo), buvo priskirti chromosomų rankoms. Dauguma jų buvo linijine tvarka. Neapstiprinti kontigai paprastai buvo trumpi ir jiems trūko genetiškai informatyvių sekų, reikalingų padėties priskyrimui.

Pagal miežių chromosomų peri-centromerinius ir centromerinius regionus, suderintus su kitų žolių rūšių 16 genomo seka, pastebimai sumažėja rekombinacijos dažnis - tai bruožas, kuris kompromituoja genetinės įvairovės išnaudojimą ir neigiamai veikia genetinius tyrimus bei augalų veisimą. Maždaug 1, 9 Gb arba 48% genetiškai įtvirtinto fizinio žemėlapio (3, 9 Gb) buvo priskirta šiems regionams (1 pav. Ir papildomas 11 pav.).

Image

Sekti a suteikia septynias miežių chromosomas. Žalia / pilka spalva parodo sutvirtintų pirštų atspaudų (FPC) kontingento suderinamumą su jų chromosomos rankos priskyrimu, pagrįstu chromosomos-rankos šautuvo seka (išsamesnės informacijos žr. 4 papildomoje pastaboje). 1H buvo galima priskirti tik visos chromosomos seką. B takelis, didelio pasitikėjimo genų pasiskirstymas genetiniame žemėlapyje; c takas, jungtys susieja genų padėtis tarp genetinio ir integruoto fizinio žemėlapio, pateikto d taške. Pateikta I klasės trasos LTR retrospektyvų ir f klasės II klasės DNR transposonų padėtis ir pasiskirstymas. Sekti BAC seką, paskirstymą ir išdėstymą.

Visas dydis

  • Atsisiųskite „PowerPoint“ skaidrę

Pasikartojantis miežių genomo pobūdis

Miežių genomo ypatybė yra pasikartojančių DNR gausa 17 . Pastebėjome, kad maždaug 84% genomo sudaro mobilieji elementai ar kitos kartotinės struktūros (5 papildoma pastaba). Didžiąją jų dalį (76% atsitiktinių BAC) sudaro retrotransposonai, iš kurių 99, 6% yra ilgo galinio pakartojimo (LTR) retrotransposonai. Ne LTR retrotransposonai sudaro tik 0, 31%, o DNR transposonai - 6, 3% atsitiktinės BAC sekos. Genomo dalyje, turinčioje didelę pasikartojančių elementų dalį, LTR gypsy retrotransposon superfamily buvo 1, 5 karto gausesnė nei Copia superfamily, priešingai nei Brachypodium 18, tiek ryžių 19 stebėjimai. Tačiau, naudojant genų turinčius BAC, šiek tiek trūko retrotransposonų, suderinamų su Brachypodium 18, kur jauni Copia retroelementai yra pirmiausia aptinkami genuose turtinguose rekombinogeniniuose regionuose, iš kurių pasyvios čigonų retroelementos buvo prarastos per LTR – LTR rekombinaciją. Apskritai matome sumažėjusį pasikartojančio DNR kiekį galiniame 10% kiekvienos miežių chromosomos rankos fiziniame žemėlapyje (1 pav.). I ir II klasės elementuose pavaizduotas ne kiekybinis atvirkštinio vaizdo pasiskirstymas išilgai miežių chromosomų (1 pav.) - bruožas, būdingas kitiems žolių genomams 16, 20 ir parodytas fluorescencinio in situ hibridizacijos (FISH) žemėlapiuose 17 . Nenuostabu, kad viso genomo kulkosvaidžių rinkinys rodo mažesnį LTR retrotransposonų kiekį (vidutiniškai 53%) nei genų turinčių BAC. Tai, kad LTR retrotransposonai yra ilgi (∼ 10 kb), labai pasikartojantys ir dažnai įterpiami 21, patvirtina mūsų prielaidą, kad trumpi skaitymai arba sugriuvo, arba nesusirinko. Trumpai susikertantys elementai (SINEs) 22, trumpi (80–600 bp) neautonominiai retrotransposonai, kurie labai pasikartoja miežiuose, neparodė jokio skirtumo nuo agregatų. Tačiau miniatiūriniai atvirkščiai kartojami perkeliami elementai (MITE), maži neautonominiai DNR transpozonai 23, viso genomo šovinio agregatuose buvo dvigubai praturtinti, palyginti su BES rodmenimis ar atsitiktiniais BAC, atsižvelgiant į agregatų turtingumą ir jų ryšį su genai 23 . Tiek MITE, tiek SINE yra 1, 5–2 kartus praturtinti genų turinčiais BAC, kurie galėtų reikšti, kad SINE taip pat yra labiau integruoti į genus turinčius regionus arba todėl, kad jie yra senesni už LTR retroelementus, gali tiesiog likti matomi genuose ir aplink juos, kur retro intarpai buvo pasirinkti prieš.

Perrašyta miežių genomo dalis

Perrašytas miežių genų erdvės komplektas buvo komentuotas atvaizduojant 1, 67 milijardo RNR-seq rodmenis (167 Gb), gautus iš aštuonių miežių vystymosi stadijų, ir 28 592 miežių viso ilgio cDNR 24 į viso genomo kulkosvaidžio jungtį (Metodai, papildomas 6, 7 pastabos ir papildomos 20–22 lentelės). Egono aptikimas ir konsensuso genų modeliavimas atskleidė 79 379 nuorašų grupes, iš kurių 75 258 (95%) buvo pritvirtinti prie viso genomo kulkosvaidžių komplekto (7.1.1 ir 7.1.2 papildomos pastabos). Remiantis į šeimą nukreiptu palyginimu su sorgo , ryžių, Brachypodium ir Arabidopsis genomais, 26 159 iš šių perrašytų lokusų patenka į grupes ir turi homologinę paramą bent vienam pamatiniam genomui (papildomas 16 pav.); jie buvo apibrėžti kaip labai pasitikintys genai. Palyginimas su Arabidopsis thaliana 25 metabolinių genų duomenų rinkiniu parodė 86% aptikimo dažnį, leidžiantį įvertinti miežių genų rinkinį kaip maždaug 30 400 genų. Dėl homologijos trūkumo ir dėl trūkstamos genų grupių grupių palaikymo 53, 220 transkripto lokusai buvo laikomi žemu patikimumu (1 lentelė). Aukšto patikimumo ir žemo patikimumo miežių genai pasižymėjo skirtingais požymiais: 75% labai patikimų genų turėjo daugiaeksoninę struktūrą, palyginti su tik 27% žemo patikimumo genų (1 lentelė). Aukšto pasitikėjimo genais vidutinis dydis buvo 3, 013 bp, palyginti su 972 bp žemo pasitikėjimo genais. Iš viso 14 481 žemo patikimumo genai parodė tolimą homologiją su augalų baltymais viešosiose duomenų bazėse (7.1.2, 7.1.4 ir 18 pav. Papildomos pastabos), identifikuodami juos kaip galimus genų fragmentus, žinomus kaip Triticeae genomų populiaciją, turintį didelį kopijų skaičių ir kurie dažnai atsiranda dėl perkeliamosios elementų veiklos 26 .

Pilno dydžio lentelė

Iš viso 15 719 didelio pasitikėjimo genų gali būti tiesiogiai siejami su genetiškai įtvirtintu fiziniu žemėlapiu (4 papildoma pastaba). Papildomi 3 743 buvo integruoti raginant išsaugoti sintezės modelį (4.5 papildoma pastaba), o dar 4692 - susiejant juos su chromosomos rankos viso genomo ginklo duomenimis (4.4 papildoma pastaba ir 15 papildoma lentelė). Svarbu tai, kad viso genomo karabinų sekos, turinčios aukšto patikimumo genus, N50 ilgis buvo 8 172 bp, o to paprastai pakanka, kad būtų įtraukta visa koduojanti seka, ir 5 ′ ir 3 ′ neperkeltų sričių (UTR). Iš viso 24 154 pasitikėjimo genai (92, 3%) buvo susieti ir įtaisyti fiziniame / genetiniame rėmelyje, atstovaujant penkių genų / Mb genų tankiui. Proksimaliniai ir distaliniai chromosomų galai yra turtingesni genų ir vidutiniškai turi 13 genų viename Mb (1 pav.).

Palyginus su sekamais augalų genomo modeliais, genų šeimos analizė (7.1.3 papildoma pastaba) atskleidė kai kurias genų šeimas, kuriose buvo būdingas miežių specifinis išsiplėtimas. Šių šeimų narių funkcijas apibrėžėme naudodamiesi genų ontologijos (GO) ir PFAM baltymų motyvais (25 papildoma lentelė). Į genų šeimas, kuriose labai daug atstovaujamų GO / PFAM terminų, buvo genai, koduojantys (1, 3) -β-gliukano sintazes, proteazės inhibitoriai, cukrų surišantys baltymai ir cukraus pernešėjai. NB-ARC (nukleotidus rišantis adapteris, kuriuo naudojasi APAF-1, tam tikri R geno produktai ir CED-4 27 ) domeno baltymai, kurie, kaip žinoma, dalyvauja gynybinėse reakcijose, taip pat buvo per daug atstovaujami, įskaitant 191 NBS-LRR tipo genus. Jie linkę susikaupti link miežių chromosomų distalinių regionų (papildomas 17 pav.), Įskaitant pagrindinę miežių chromosomos 1HS grupę, esančią kartu su MLA miltligės atsparumo atsparumo geno grupei 28 . Neobjektyvus paskirstymas regionuose, kuriuose gausu rekombinacijos, suteikia genominę aplinką generacijai sekų įvairovei, reikalingai norint susidoroti su dinaminėmis patogenų populiacijomis, 29, 30 . Pažymėtina, kad labai reprezentuojami (1, 3) -β-gliukano sintazės genai taip pat buvo susiję su augalų ir patogenų sąveika 31 .

Genų ekspresijos reguliavimas

Giluminiai RNR sekos duomenys (RNR-seq) suteikė įžvalgos apie erdvės ir laiko geno ekspresijos reguliavimą (7.2 papildomoji pastaba). Mes nustatėme, kad visuose spatiotemporaliniuose RNR-seq mėginiuose yra išreikšta 72–84% patikimo geno (2a pav.), Šiek tiek mažiau nei 32 ryžių, kur ∼ 95% nuorašų rasta daugiau nei viename vystymosi ar audinio mėginyje. . Dar svarbiau, kad atrodė, kad 36–55% patikimumo miežių genų yra skirtingai reguliuojami tarp mėginių (2b pav.), Pabrėžiant būdingą miežių genų raiškos dinamiką.

Image

a, Miežių geno ekspresija skirtinguose erdviniuose ir laiko RNR seq mėginiuose (6, 7 papildomos pastabos). Skaičiai nurodo aukšto patikimumo genus. b, Dendrograma, vaizduojanti mėginių ir spalvotos matricos ryšį, parodanti reikšmingai padidintų aukšto patikimumo genų skaičių poriniais palyginimais. Σ, bendras nereikalingų, labai patikimų genų, padidintų, palyginti su visais kitais mėginiais, skaičius. Aukštis, visas jungties sankaupos atstumas (log 2 (fragmentai viename egzotės kilobaze per milijoną fragmentų pažymėti)); žr. 7.2.5.1 papildomą pastabą. c) Alternatyviai sujungtų miežių nuorašų pasiskirstymas ir persidengimas tarp RNR sekų mėginių. d) Alternatyvių sujungimo nuorašų, atitinkančių PTC + kriterijus, pasiskirstymas ir persidengimas, aptinkamas skirtinguose erdviniuose ir laiko RNR-seq mėginiuose (7.4 papildomoji pastaba).

Visas dydis

  • Atsisiųskite „PowerPoint“ skaidrę

Dvi pastebimos savybės patvirtina perdirbimo po transkripcijos kaip centrinio reguliavimo sluoksnio svarbą (7.3 ir 7.4 papildomos pastabos). Pirma, mes stebėjome įrodymus, kad yra platus alternatyvus sujungimas. Iš intronų turinčių labai patikimų miežių genų 73% turėjo alternatyvių sujungimų įrodymų (55% viso aukšto pasitikėjimo rinkinio). Alternatyvių sujungiamųjų nuorašų erdvinis ir laiko pasiskirstymas žymiai skyrėsi nuo bendro nuorašų atsiradimo skirtinguose analizuojamuose audiniuose (2c pav.). Tarp visų mėginių buvo paskirstyta tik 17% alternatyvių sujungimo nuorašų, o 17–27% alternatyvių sujungimų nuorašų buvo aptikta tik atskiruose mėginiuose, tai rodo ryškų alternatyvų sujungimo variantą. Mes nustatėme 2466 priešlaikinio termino kodono turinčius (PTC +) alternatyvius sujungimo nuorašus (9, 4% didelio pasitikėjimo genų) (2d pav. Ir 2 lentelė), panašų į nesąmonių sukelto skilimo (NMD) kontroliuojamų genų procentą plačiame rūšių diapazonas 33, 34 . Priešlaikiniai kodonai suaktyvina NMD kelią 35, kuris lemia greitą PTC + nuorašų skilimą ir yra susijęs su transkripcijos reguliavimu ligos metu ir reaguojant į stresą žmogaus ir Arabidopsis atveju , atitinkamai 34, 36, 37, 38, 39 . PTC + nuorašų pasiskirstymas buvo ryškiai skirtingas tiek erdviniu, tiek laiko atžvilgiu: tik 7, 4% pasiskirstė ir nuo 31% iki 40% buvo stebimi tik viename pavyzdyje (2d pav.). Genai, koduojantys PTC + turinčius nuorašus, rodo platų GO terminų ir PFAM domenų spektrą ir yra labiau paplitę išplėstose genų šeimose. Šie stebėjimai pagrindžia alternatyvų iš splaisingo / nuo NMD priklausomą PTC + nuorašų skilimą kaip mechanizmą, kontroliuojantį daugelio skirtingų miežių genų ekspresiją.

Pilno dydžio lentelė

Antra, naujausi pranešimai išryškino daugybę naujų transkripciniu požiūriu aktyvių ryžių regionų, kuriems trūksta homologijos su baltymus koduojančiais genais ar atvirų skaitymo rėmų (ORF) 40 . Miežiuose net 27 009 mielai, turintys omenyje mažo patikimumo genus, gali būti klasifikuojami kaip spėjami nauji transkripcijos požiūriu aktyvūs regionai (7.1.4 papildomoji pastaba). Mes ištyrėme jų galimą reikšmingumą palyginę miežių naujų transkripciniu požiūriu aktyvių regionų homologiją su ryžių ir Brachypodium genomais, kurie atitinkamai atspindi 50 ir 30 milijonų evoliucijos skirtumų metus 18 . Iš viso 4830 ir 2450 naujų transkripciniu požiūriu aktyvių regionų davė homologinę atitiktį atitinkamai Brachypodium ir ryžių genomams (sankirtos riba 2 046; BLAST P reikšmė ≤ 10 −5 ), rodančius tariamą funkcinį vaidmenį atliekant ikimRNR perdirbimą ar kitus RNR reguliuojančius elementus. procesai 41, 42 .

Natūrali įvairovė

Miežiai buvo prijaukinti maždaug prieš 10 000 metų 1 . Išsami genotipinė įvairių gemalų analizė atskleidė, kad ribotas perėjimas (0–1, 8%) 43, kartu su maža rekombinacija pericentromeriniuose regionuose, leido sukurti šiuolaikinius gemalus, kurių regioninė haplotipų įvairovė yra ribota 44 . Mes ištyrėme genomo įvairovės dažnį ir pasiskirstymą, atlikdami keturių skirtingų miežių veislių ('Bowman', 'Barke', 'Igri' ir 'Haruna Nijo') ir H. spontaneum prisijungimo (8 metodai ir 8 papildoma pastaba) gilumą. 5–25 kartus didesnis, o kartografavimo seka yra susijusi su miežių veislės ‘Morex’ genų erdve. Mes nustatėme daugiau nei 15 milijonų nereikalingų vieno nukleotido variantų (SNV). H. spontaneum SNV sukelia beveik dvigubai daugiau nei kiekviena veislė (28 papildoma lentelė). Iki 6 mln. SNV per įstojimą gali būti priskirta chromosomų ginklams, įskaitant iki 350 000, susijusių su egzonais (29 papildoma lentelė). Maždaug 50% eksonuose esančių SNV buvo integruoti į genetinę / fizinę struktūrą (3 pav., 30 papildoma lentelė ir papildoma 31 pav.), Sukurdami pagrindą sukurti tikrą genomo žymeklio technologiją aukštos skyros genetikai ir genomui. - pagalbinis veisimas.

Image

Miežių chromosomos, nurodytos kaip vidinis pilkų juostų ratas. Jungčių linijos suteikia genetinį / fizinį ryšį miežių genome. SNV dažnio pasiskirstymas rodomas kaip penkios spalvotos apskritos histogramos (mastelis, santykinis SNV gausumas prisijungimo metu; gausa, bendras SNV skaičius nepersidengiantiais 50 kb intervalais susieti „Morex“ genomo pastoliai; diapazonas nuo nulio iki maksimalaus SNV skaičiaus per 50 kb intervalas). Pasirinkti SNV dažnio modeliai, pažymėti spalvotomis rodyklėmis (daugiau informacijos žr. 8 papildomoje pastaboje). Rodyklių galvučių dažymas reiškia veislę, kurios SNV dažnis skiriasi atitinkamame regione.

Visas dydis

  • Atsisiųskite „PowerPoint“ skaidrę

Pastebėjome SNV dažnio sumažėjimą link visų miežių chromosomų centromerinių ir peri-centromerinių sričių. Šis modelis miežių veislėse atrodė ryškesnis. Šią tendenciją palaikė SNV, identifikuotas RNR-seq duomenimis iš šešių papildomų veislių, pažymėtų Morex genomo rinkinyje (8.2 papildoma pastaba). Tokį išnaikintos genetinės įvairovės modelį mes priskiriame mažai rekombinacijai pericentromeriniuose regionuose, o tai sumažina efektyvų populiacijos dydį ir atitinkamai haplotipų įvairovę. Kadangi H. spontaneum čia gali tarnauti kaip genetinės įvairovės rezervuaras, pati šios įvairovės panaudojimas gali būti pažeistas dėl ribotos rekombinacijos ir dėl to kylančio nesugebėjimo nutraukti glaudžius ryšius tarp geidžiamų ir kenksmingų alelių. Keista, bet 4H chromosomos trumpoji ranka turėjo žymiai mažesnį SNV dažnį nei visos kitos miežių chromosomos (papildomas 33 pav.). Tai gali būti tolesnio šios chromosomos rekombinacijos dažnio sumažėjimo, kuris yra genetiškai (bet ne fiziškai) trumpiausias, pasekmė. Sumažėjusi SNV įvairovė taip pat pastebėta regionuose, kuriuos mes suprantame kaip nesenos veisimosi istorijos padarinius arba galinčius parodyti prijaukinimo orientyrus (3 pav.).

Diskusija

Triticeae grūdų genomų dydis dėl labai pasikartojančios DNR sudėties labai pakenkė viso genomo kulkosvaidžių sekų surinkimui ir sudarė kliūtį aukštos kokybės etaloninių genomų generavimui. Mes išvengėme šių problemų, integruodami papildomus ir nevienalyčius iš sekų pagrįstus genominius ir genetinius duomenų rinkinius. Tam reikėjo sujungti gilų fizinį žemėlapį su didelio tankio genetiniais žemėlapiais, sudėti giliai trumpai perskaitytus viso genomo šovinių pistoletus ir gautą linijinę, nors ir skyrybos, genomo seką komentuoti su gilios aprėpties RNR gautais duomenimis (viso ilgio cDNR ir RNR). -seq). Tai leido mums sistemiškai atskirti maždaug 4 Gb (80%) genomą, įskaitant daugiau nei 90% išreikštų genų. Gauta genomo struktūra suteikia išsamią įžvalgą apie fizinį genų ir pasikartojančių DNR pasiskirstymą ir kaip šie požymiai yra susiję su genetinėmis savybėmis, tokiomis kaip rekombinacijos dažnis, genų ekspresija ir genetinės variacijos modeliai.

Miežių chromosomų centromerinėse ir peri-centromerinėse srityse yra daugybė funkcinių genų, sujungtų į rekombinaciniu požiūriu „inertinius“ genomo regionus 45, 46 . Genų erdvės pasiskirstymas pabrėžia, kad šie regionai išsiplečia iki beveik 50% atskirų chromosomų fizinio ilgio. Atsižvelgiant į nusistovėjusius konservuotos sintezės lygius, tai greičiausiai bus bendras susijusių žolių genomų bruožas, kuris turės svarbių praktinių padarinių. Pavyzdžiui, reta rekombinacija gali veikti palaikant evoliuciškai pasirinktus ir kartu adaptuotus genų kompleksus. Tai tikrai apribos genetinės įvairovės išlaisvinimą, reikalingą atsieti naudingus nuo kenksmingų alelių, kurie yra potencialas gerinant genetinį pelną. Šių padarinių supratimas turės svarbių padarinių pasėlių gerinimui. Be to, siekiant nustatyti geną, perspektyvios genetinės strategijos, pagrįstos rekombinacija, nebus veiksmingos šiuose regionuose. Kai kuriems taikiniams egzistuoja alternatyvūs metodai (pavyzdžiui, sujungiant pakartotinio sekos nustatymo technologijas su natūralių ar sukeltų mutantų alelių kolekcijomis), daugeliui požymių tai išlieka rimta kliūtimi. Tikimasi, kad rekombinacijos modeliai bus manipuliuojami genetine ar aplinkos intervencija 47 . Gana stebėtinai, mūsų duomenys taip pat atskleidžia, kad bandant susieti miežių genus su funkcijomis, reikės atsižvelgti į sudėtingą post-transkripcijos reguliavimo lygį. Ryšiai tarp post-transkripcinio reguliavimo, tokių kaip alternatyvios jungtys ir funkcinės biologinės pasekmės, išlieka tik keletu konkrečių pavyzdžių 48, tačiau mūsų stebėjimų mastas rodo, kad šis sąrašas žymiai išsiplės.

Taigi, miežių genų erdvė, apie kurią pranešta, yra esminė genetinių tyrimų ir veisimo nuoroda. Tai yra bruožo atskyrimo, natūralios genetinės įvairovės supratimo ir panaudojimo centras, tiriantis unikalią vieno iš pirmųjų pasaulyje prijaukintų augalų biologiją ir evoliuciją.

Metodų santrauka

Metodus galima rasti internetinėje darbo versijoje.

Internetiniai metodai

Fizinio žemėlapio sudarymas

Šešių „Morex“ 9, 49 veislės bibliotekų BAC klonai buvo analizuojami naudojant didelio informacijos turinio pirštų atspaudus (HICF) 7, 9 . Iš viso buvo surinkta 571 000 suredaguotų profilių, naudojant FPC v9.2 8 (2 papildoma lentelė) (Sulstono balo riba 10–90, tolerancija = 5, toleruoti Q klonai = 10%). Devyni kartojami automatiniai pakartotiniai surinkimai buvo atlikti paeiliui sumažinus griežtumą (Sulstono balas nuo 10–85 iki 10 –45 ). Paskutinis FPC kontigių rankinio sujungimo žingsnis buvo atliktas esant mažesniam griežtumui (Sulstono balo slenkstis 10–25 ), atsižvelgiant į žymenų, kurių genetinis atstumas ≤ ± 5 cM, genetinę inkaravimo informaciją. Taip atsirado 9 265 FPkontigai (apytiksliai 14 kartų padidino haploidinį genomą) (2 papildoma lentelė).

Genomo sekos nustatymas

BAC pabaigos seka (BES). BAC intarpų galai buvo sekuojami, naudojant Sanger seką (2.1 papildoma pastaba). Sekų pėdsakų failų vektorinis ir kokybės apkarpymas buvo atliktas naudojant LUCY 50 (//www.jcvi.org/cms/research/software/). Trumpi skaitiniai (tai yra <100 bp) buvo pašalinti. Organelinės DNR ir miežių patogenų sekos buvo filtruojamos BLASTN palyginimais su viešų sekų duomenų bazėmis (//www.ncbi.nlm.nih.gov/).

BAC šautuvo sekos nustatymas (BACseq). FPC žemėlapio sėkliniai BAC buvo sekuojami, kad būtų atskleista geno sekos informacija fiziniam žemėlapio įtvirtinimui. 4095 BAC klonai buvo sušaudyti 2 x 48 atskirų brūkšninių kodų BAC telkiniuose, suskirstytuose į Roche / 454 GS FLX arba FLX Titanium 51, 52 . Eilės buvo surinktos naudojant MIRA v3.2.0 (//www.chevreux.org/projects_mira.html) numatytaisiais parametrais, turinčiais „tikslus“, „454“, „genomas“, „denovo“ požymius. Papildomi 2, 183 geną turintys BAC (3.2 papildomoji pastaba) buvo sekami naudojant „Illumina HiSeq 2000“ 91 kombinatoriniame baseine 13 . Dekonvoliuoti rodmenys buvo surinkti naudojant VELVET 53 . Surinkimo statistika pateikta 4 papildomoje lentelėje.

Viso genomo ginklų sekos nustatymas. Iš skirtingų miežių veislių ('Morex', 'Barke', 'Bowman') suskaidytos genominės DNR 54 buvo suformuotos iliuminuotų porų (PE; fragmento dydis ∼ 350 bp) ir mate-porų (MP; fragmento dydis ∼ 2, 5 kb) bibliotekos., 'Igri') ir laukinių miežių prisijungimo B1K-04-12 55 ( Hordeum vulgare ssp. Spontaneum) vienos sėklos selekcija. Bibliotekos buvo sekamos „Illumina GAIIx“ ir „Hiseq 2000“. „Haruna Nijo“ veislės genomo DNR (600–1000 bp dydžio) buvo sekvuotos, naudojant „Roche 454 GSFLX Titanium“ chemiją.

Viso genomo kulkosvaidžių sekos surinkimas

PE ir MP viso genomo kulkosvaidžių bibliotekos buvo sukalibruotos pagal fragmentų dydžius, poruojant pagal miežių chloroplastinę seką (NC_008590) naudojant BWA 56 . Sekos buvo kokybiškai apkarpytos ir de novo surinktos naudojant „CLC Assembly Cell v3.2.2“ (//www.clcbio.com/). Nepriklausomi de novo rinkiniai buvo atlikti pagal 'Morex', 'Bowman' ir 'Barke' veislių duomenis.

Transkripto sekos nustatymas

Giliam RNR sekventavimui (RNR-seq) buvo atrinkti aštuoni „Morex“ veislės audiniai (kiekviename - trys biologinės replikacijos), skirti miežių gyvenimo ciklo etapams nuo daiginamų grūdų iki brandinančio kariokopio. Augalų augimas, mėginių ėmimas ir seka išsamiai aprašyti papildomoje informacijoje (6 papildoma pastaba). Papildomi mRNR sekos nustatymo duomenys buvo gauti iš aštuonių papildomų vasarinių miežių veislių atskirame tyrime ir buvo naudojami čia sekų įvairovės analizei (8.2 papildoma pastaba).

Fizinio žemėlapio genetinė struktūra

Miežių fizinio žemėlapio įtvirtinimo genetinė sistema buvo sudaryta remiantis vieno nukleotido variacijos (SNV) 57 žemėlapiu (4.3 papildomoji pastaba), kuriame nustatytas didžiausias žymeklio tankis (3, 973) ir skiriamoji geba ( N = 360, RIL / F8). vienkartinė dviejų tėvų kartografinė populiacija miežiuose. Papildomi didelio tankio genetinių žymenų žemėlapiai (4.3 papildomoji pastaba) buvo palyginti ir suderinti remiantis bendrais žymekliais. Be to, mes panaudojome genotipų nustatymą pagal seką (GBS) 58, kad gautume didelio tankio genetinius žemėlapius, apimančius 34 396 SNV ir 21 384 SNV, taip pat 241 159 ir 184 796 dominuojančius (buvimas / nebuvimas) žymes dviem dvigubai išaugintoms haploidų populiacijoms Oregon Wolfe Barley 14 ir „Morex“ × „Barke 45“ atitinkamai. Iš viso buvo panaudotos 498 165 žymeklių sekos žymos (papildoma 11 lentelė).

Genetinis inkaravimas

Fizinio žemėlapio genetinė integracija apėmė tiesioginio ir netiesioginio tvirtinimo procedūras.

Tiesioginis tvirtinimas. Genetiniai žymekliai buvo priskiriami BAC klonams / BAC kontigams trimis skirtingais būdais (4.3 papildomoji pastaba ir 9 papildomoji lentelė). 2 032 PGR pagrįsti žymekliai iš paskelbtų 59, 60 genetinių žemėlapių buvo PGR patikrinti pagal pasirinktinius daugialypius (MD) DNR telkinius (//ampliconexpress.com/), gautus iš BAC bibliotekos HVVMRXALLeA 9 . Pavienis šių MD grupių haploidinis genomo ekvivalentas buvo naudojamas 42 302 miežių EST gautų unigeno, atvaizduojamo pasirinktiniame 44K „Agilent“ mikrotrauke, kaip aprašyta anksčiau, multipleksuotai atrankai. 27 231 miežių unigenes, iš jų 1 121, kurių genetinio žemėlapio padėtis 45, 62, galėtų būti priskirta 12 313 BAC. 14 600 klonų iš BAC bibliotekos HVVMRXALLhA buvo patikrinti naudojant 3 072 SNP žymenis „Illumina GoldenGate“ tyrimuose 45, po to 1 677 žymekliai buvo tiesiogiai priskirti BAC 13 ; maždaug trečdalis šios informacijos buvo įtraukta į šį darbą.

Netiesioginis tvirtinimas. Su FPCmap sistema susiję sekos ištekliai sudarė pagrindą išsamiai integruoti genetinių žymenų informaciją silico (4.3 papildomoji pastaba ir 11 papildoma lentelė). Pakartoti užmaskuotas BES sekas, įtvirtintų žymeklių sekas ir 6 295 sekventuotus BAC leido į FPC žemėlapį integruoti 307 Mb „Morex“ viso genomo šaudymo pistoleto kontigus. Genetiniai žymekliai ir miežių genų sekos buvo pažymėti šia nuoroda griežtai sekos homologijos asociacija. Iš viso 8 170 (∼ 4, 6 Gb) BAC kontigai gavo sekos ir (arba) tvirtinimo informaciją (4 papildoma pastaba). Prie genetinės struktūros buvo pritvirtinti 4556 FPC kontigai (Σ = 3, 9 Gb).

Pasikartojančios DNR analizė ir pakartotinis maskavimas

Pakartotinis aptikimas ir analizė buvo atlikta, kaip aprašyta anksčiau, 18, 20, išskyrus atnaujintą pakartojimo biblioteką, papildytą de novo aptiktais pasikartojančiais elementais iš miežių (5 papildoma pastaba).

Genų komentarai, funkcinis suskirstymas į kategorijas ir diferencinė išraiška

Projekte sugeneruoti viešai prieinami miežių viso ilgio cDNR 24 ir RNR-seq duomenys (6 papildoma pastaba) buvo naudojami struktūriniam genų iškvietimui (7 papildoma pastaba). Pilno ilgio cDNR ir RNR-seq duomenys buvo inkrustuoti, kad būtų pakartoti užmaskuoti viso genomo šovinio sekos kontigai, naudojant atitinkamai „GenomeThreader 63“ ir „CuffLinks 64“, pastarieji taip pat teikia informaciją apie alternatyviai sujungtus transkriptus. Struktūriniai genų iškvietimai buvo sujungti ir ilgiausią kiekvieno lokuso ORF buvo naudojamas kaip reprezentatyvus genų šeimos analizei (7.1.2 papildoma pastaba).

Genų grupių grupavimas buvo atliktas naudojant OrthoMCL (7.1.3 papildomoji pastaba), palyginant juos su Oryza sativa (RAP2), Sorghum bicolor , Brachypodium distachyon (v. 1.4) ir Arabidopsis thaliana (TAIR10 išleidimas) genomais.

Diferencijuotos genų ekspresijos analizė (7.2 papildoma pastaba) atlikta RNR seq duomenimis, naudojant CuffDiff 65 .

Sekos įvairovės analizė

Viso genomo SNV buvo įvertintas atvaizduojant (BWA v0.5.9-r16 56 ), pradinė seka surašytų sekvencuotų genotipų atžvilgiu buvo nustatyta iš naujo veislės 'Morex' de novo . RNR-seq sekos rodmenys buvo susieti su „Morex“ rinkiniu. Informacija pateikiama 8 papildomoje pastaboje.

Prisijungimai

Duomenų indėliai

Šiame tyrime sugeneruoti arba surinkti sekų ištekliai buvo perduoti EMBL / ENA arba NCBI „GenBank“. Pilnas sekų pirminių duomenų prisijungimo numerių sąrašas, taip pat URL duomenų atsisiuntimui, vizualizavimui ar paieškai pateiktas 1 papildomoje pastaboje ir 1 papildomoje lentelėje.

Papildoma informacija

PDF failai

  1. 1.

    Papildoma informacija

    Šioje rinkmenoje yra papildomas tekstas, papildomi 1-33 paveikslai, papildomos 1-24 ir 26-33 lentelės (žr. Atskirą 25 papildomos lentelės failą) ir papildomos nuorodos - daugiau informacijos rasite turinyje.

„Excel“ failai

  1. 1.

    Papildomi duomenys

    Šiame faile yra 25 papildoma lentelė, kurioje pavaizduoti GO terminai ir PFAM domenai, per dideli ir nepakankamai atstovaujami miežių išsiplėtusių genų klasteriuose.

Komentarai

Pateikdami komentarą jūs sutinkate laikytis mūsų taisyklių ir bendruomenės gairių. Jei pastebite ką nors įžeidžiančio ar neatitinkančio mūsų taisyklių ar gairių, pažymėkite, kad tai netinkama.