Sorgo bicolor genomas ir žolių įvairinimas | gamta

Sorgo bicolor genomas ir žolių įvairinimas | gamta

Anonim

Anotacija

Sorgas, afrikinė žolė, susijusi su cukranendrėmis ir kukurūzais, auginama maistui, pašarams, pluoštui ir degalams gaminti. Pateikiame pradinę ∼ 730 megabazių Sorghum bicolor (L.) Moench genomo analizę, pateikdami ∼ 98% genų jų chromosominiame kontekste, naudodami viso genomo kulkosvaidžių seką, patvirtintą genetine, fizine ir sintenine informacija. Genetinė rekombinacija iš esmės apsiriboja maždaug trečdaliu sorgo genomo, kurio genų tvarka ir tankis yra panašūs kaip ryžių. Retrotransposono kaupimasis rekombinaciniu požiūriu neatsitiktiniame heterochromatine paaiškina, kad sorgo genomas yra size 75% didesnis, palyginti su ryžiais. Nors genų ir pasikartojantys DNR pasiskirstymai buvo išsaugoti nuo paleopoliploidizacijos prieš 70 milijonų metų, daugiausiai dubliuotų genų rinkinių prarado vieną narį prieš sorgo ir ryžių išsiskyrimą. Dėl suderintos evoliucijos vienas dubliuotas chromosomų segmentas atrodo tik keletą milijonų metų. Apie 24% genų yra būdingi žolei, o 7% - sorgui. Naujausi genų ir mikroRNR dubliavimai gali prisidėti prie sorgo atsparumo sausrai.

Pagrindinis

Saccharinae augaluose yra keletas efektyviausių biomasės akumuliatorių, tiekiančių maistą ir degalus iš krakmolo (sorgo) ir cukraus (sorgo ir Saccharum , cukranendrių), ir jie gali būti naudojami kaip celiuliozės biokuro pasėliai (sorgas, cukranendrės, Miscanthus ). Saccharinae produktyvumui išskirtinė reikšmė yra C 4 fotosintezė, apimanti biochemines ir morfologines specializacijas, kurios padidina grynosios anglies įsisavinimą aukštoje temperatūroje 1 . Nepaisant bendros fotosintezės strategijos, Saccharinae morfologiniai ir genominiai pokyčiai yra daug (papildomas 1 pav.).

Dėl mažo jo genomo (∼ 730 Mb) sorgas tampa patraukliu Saccharinae ir kitų C 4 žolių funkcinės genomikos modeliu. Ryžiai, pirmasis visiškai išskaidytas javų genomas, labiau atspindi C 3 fotosintetines žoles. Dėl tolerancijos sausrai sorgas ypač svarbus sausuose regionuose, tokiuose kaip šiaurės rytų Afrika (jos įvairovės centras) ir pietinėse JAV lygumose. Genetiniai anglies padalijimo į cukraus atsargas skirtumai, palyginti su ląstelių sienelių mase, ir daugiametiškumas bei su tuo susijusios savybės, kaip kasimas ir stiebelio atsargų išlaikymas 2, sorgo paverčia patrauklia sistema, tiriančia daugiamečių celiuliozės biomasės kultūrų požymius, svarbius. Dėl aukšto įbrėžimo lygio ji tampa patrauklia asociacijos genetikos sistema 3 . Transgeninį sorgo gerinimo metodą riboja didelis genų srautas piktžolėtiems giminaičiams 4, todėl žinios apie jo vidinį genetinį potencialą tampa dar svarbesnės.

Rekonstruojamas pakartotinai turtingas genomas iš šovinių sekų

Šiuo metu pirmenybė teikiama ištisų genomų sekos sudarymui, kai šaudymo iš pistoleto seką 5 reikia naudoti iki minimalaus genomo klonų „klojimo kelio“ arba tiesiogiai prie genomo DNR. Pastarasis metodas, viso genomo šovinio (WGS) sekos nustatymas, yra plačiai naudojamas žinduolių genomams, nes yra greitas, santykinai ekonomiškas ir mažina klonavimo paklaidą. Tačiau abejojama jo pritaikomumu pasikartojantiems DNR turtingiems augalų genomams 6 .

Nepaisant pasikartojančio content 61%, iš homozigotinio sorgo genotipo BTx623 buvo surinkta aukštos kokybės genomo seka, naudojant WGS ir įtraukus: (1) ∼ 8, 5 genomo ekvivalentus suporuotų galų 7 skaitymui iš genomo bibliotekų, apimančių ∼ 100 -sulenkite įdėklų dydžius (1 papildoma lentelė), išskirdami daugelį pasikartojančių sričių; ir 2) aukštos kokybės skaitymo ilgis, vidutiniškai 723 bp, palengvinantis surinkimą. Palyginimas su 27 baigtomis bakterijų dirbtinėmis chromosomomis (BAC) parodė, kad WGS rinkinys yra> 98, 46%, tikslus ir tikslus <1 paklaida 10 kb (2.5 papildoma pastaba).

Palyginimas su didelio tankio genetiniu žemėlapiu 8, „pirštų atspaudų kontūro“ (FPC) pagrindu sukurtu fiziniu žemėlapiu 9 ir ryžių seka 6 pagerino sorgo WGS rinkinį (1 ir 2 papildomos pastabos). Tarp 201 didžiausių pastolių (apimančių 678, 9 Mb, 97, 3% agregato) 28 parodė neatitikimus su dviem ar daugiau šių įrodymų linijų (2.6 papildomoji pastaba), dažnai šalia pasikartojančių elementų. Išardžius mazgą neatitikimo taškuose, gautų 229 pastolių N50 (pastolių skaičius, kurie kartu padengia ne mažiau kaip 50% agregato) yra 35 ir L50 (trumpiausių pastolių ilgis tarp tų, kurie kartu dengia 50% 7, 0 Mb. Iš viso 38 (2%) iš 1 869 FPC kontigų 9 buvo laikomi klaidingais, turinčiais> 5 BAC galus, kurie pateko į skirtingos sekos pastolius.

Iš viso 127 pastoliai, kuriuose yra 625, 7 Mb (89, 7%) DNR ir 1 476 FPC kontigai, gali būti priskirti chromosomų vietoms ir orientuoti. Penkiolika iš dvidešimties chromosomos galų baigiasi telomeriniais pasikartojimais. Kiti 102 pastoliai paprastai buvo mažesni (53, 2 Mb, 7, 6%), 85 (83%) turėjo žymiai didesnį nei vidutinis Cen38 (nuoroda 10) centromerų kartojimo gausą ir turėjo tik 374 numatomus genus. Šie 102 pastoliai sujungė tik 193 FPC kontingentus, greičiausiai dėl didesnio kartojimų, kurie yra neatsiejami nuo klonų pagrįsto fizinio žemėlapio 9, gausa ir kurie gali būti praleisti atliekant BAC pagal BAC metodus 11 .

Genomo dydžio raida ir jos priežastys

∼ 75% didesnis DNR kiekis sorgo genome, palyginti su ryžiais, yra daugiausia heterochromatinas. Derinimas prie genetinių 8 ir citologinių žemėlapių 12 rodo, kad sorgo ir ryžių euchromatino kiekiai yra panašūs (atitinkamai 252 ir 309 Mb; 7 papildoma lentelė), kurie sudaro 97–98% rekombinacijos (atitinkamai 1 025, 2 cM ir 1 496, 5 cM) ir 75, 4 –94, 2% atitinkamų grūdų genų, daugiausiai kolinearinių genų tvarka 9 . Sorgo heterochromatinas užima mažiausiai 460 Mb (62%), daug daugiau nei ryžiuose (63 Mb, 15%). Kukurūzų ome 3 × genomo išplėtimas, išsiskyrus iš sorgo 13, buvo labiau išsisklaidęs - rekombinogeninė DNR išaugo 4, 5 × iki 382 Mb, daug daugiau, nei galima paaiškinti genomo dubliavimu 14 .

Sorgo genomo, palyginti su ryžiais, grynojo dydžio išplėtimas daugiausia susijęs su ilgojo galinio pakartojimo (LTR) retrotranspononais. Sorgo genome yra 55% retrotranspononų, tarpinių tarp didesnio kukurūzų genomo (79%) ir mažesnio ryžių genomo (26%). Sorgas labiau primena ryžius, turėdamas didesnį čigonų ir kopijų elementų santykį (3, 7–1 ir 4, 9–1 ) nei kukurūzai (1, 6–1: 10 papildoma lentelė).

Nors pastaruoju metu retroelementų aktyvumas yra labai paplitęs sorgo genome, apykaita vyksta sparčiai (kaip ir kituose grūduose 15 ), pericentromeriniai elementai išlieka ilgiau. Jauni LTR retrotransposono intarpai (prieš 0, 01 mln. Metų (Myr)) atsitiktinai pasiskirstę po chromosomas, kas rodo, kad jie pirmiausia yra pašalinami iš genų turtingų 9 regionų, bet kaupiasi regionuose, kuriuose nėra daug genų (1 pav.; Taip pat žiūrėkite papildomą 3.1 pastabą). . Įterpimo laikas rodo pagrindinę retrotransponavimo bangą <1 m. Atgal, po mažesnės bangos 1–2 m. Atgal (papildomas 2 pav.).

Image

Ploto diagramose kiekybiškai įvertinti retrotransposonai (55%), genai (6% egzonų, 8% intronai), DNR transposonai (7%) ir centromeriniai pakartojimai (2%). Linijos tarp 3 ir 9 chromosomų jungia kolinearinius dubliuotus genus. Šilumos žemėlapio takeliai detalizuoja pasirinktų elementų pasiskirstymą. Visų sorgo chromosomų skaičiai pateikti 3 papildomoje pastaboje. Cen38, sorgui būdingas centromerinis pakartojimas 10 ; RT, retrotransposons (I klasė); LTR-RT, ilgojo terminalo pakartotiniai retrotransposonai; DNR-TE, DNR transposonai (II klasė).

Visas dydis

  • Atsisiųskite „PowerPoint“ skaidrę

Panašu, kad CACTA tipo elementai, vyraujantys sorgo DNR transpozonai (4, 7% genomo), perkelia genus ir genų fragmentus, kaip ir ryžiai „Pack-MULEs“ 16 bei kukurūzų helitronai 17 . Daugelis sorgo CACTA elementų yra ne autonominiai delecijos dariniai, kuriuose transposono genai buvo pakeisti ne transposono DNR, įskaitant vieno ar daugiau ląstelių genų egzonus, kaip pavyzdys G118 šeimai (2 pav.). Iš identifikuotų 13 775 CACTA elementų (3.4 papildoma pastaba), 200 nekoduoja baltymų, turinčių transposoną, tačiau juose yra bent vienas ląstelinio geno fragmentas.

Image

CACTA šeima G118 turi tik vieną išsamų ir numanomą autonominį „motinos“ elementą. Tarp 18 delecijos darinių yra išsaugotas tik galutinis 500–2 500 bp, o 8 viduje nešantys genų fragmentai. Manoma, kad neseniai atsirado vienas gana homogeninis pogrupis (106, 111 ir 112), tuo tarpu kiti dariniai yra unikalūs. Žinomų ryžių baltymų aptikimo vietos pažymėtos spalvotomis dėžutėmis. Po langeliais nurodyti svetimų genų fragmentų aprašymai. HP, hipotetinis baltymas.

Visas dydis

  • Atsisiųskite „PowerPoint“ skaidrę

Iš viso DNR transposonai sudaro 7, 5% sorgo genomo, tarpinį tarp kukurūzų (2, 7%) ir ryžių (13, 7%; 10 papildomoji lentelė). Miniatiūriniai atvirkščiai kartojami perkeliami elementai, 1, 7% genomo, yra siejami su genais (1 pav.; Taip pat žr. 3 papildomą pastabą) kaip ir kituose grūduose 6 . Helitronams, ∼ 0, 8% genomo, beveik visuose trūksta helikazės, kaip 17 kukurūzų sorge, tačiau sorge yra mažiau genų fragmentų nei kukurūzuose (3.5 papildomoji pastaba). Organelinės DNR įterpimas į sorgo branduolio genomą sudarė tik 0, 085%, kur kas mažiau nei 0, 53% ryžių (2.7 papildomoji pastaba).

Sorgo genų komplementas

Tarp 34 496 sorgo genų modelių mes radome, 6 27 640 bona fide baltymus koduojančių genų, derindami homologinius ir ab initio geno prognozavimo metodus su išreikštomis sorgo, kukurūzų ir cukranendrių sekomis (4 papildoma pastaba). Įrodymai dėl kito pakavimo yra rasti 1 491 lokuse.

Kiti 5 197 genų modeliai paprastai yra trumpesni nei bona fide genai (dažnai <150 amino rūgščių); turi keletą egzonų (dažnai vieną) ir neturi palaikomosios sekos žymės (EST) (palyginti su 85% bona fide genų); labiau skiriasi nuo ryžių genų; ir dažnai aptinkami didelėse šeimose, turinčiose „hipotetines“, „neįprastas“ ir (arba) su retroelementais susijusias pastabas, nepaisant pakartotinio maskavimo (4 papildoma pastaba). Didelė koncentracija pericentromeriniuose regionuose, kuriuose nėra pakankamai bona fide genų (1 pav.), Rodo, kad daugelis iš šių žemo pasitikėjimo genų modelių yra išvestiniai su retroelementais. Mes taip pat nustatėme 727 perdirbtus pseudogenus ir 932 modelius, kuriuose yra domenai, žinomi tik iš transposonų.

Ortologinio sorgo ir ryžių genų egzono pasiskirstymas pagal dydį labai skiriasi, o intronų padėtis ir fazė rodo> 98% atitiktį (5 papildoma pastaba). Tarp sorgo ir ryžių buvo išsaugotas introno dydis, nors dėl perkėlimo jis padidėjo kukurūzuose 18 .

Daugelis sorgo paralogų yra dubliuojami, įskaitant 5 303 genus 1 947 šeimų, turinčių ≥2 genų (4.3 papildomoji pastaba). Ilgiausias tandemo genų rinkinys yra 15 citochromo P450 genų. Kiti sorgo specifinio tandemo geno išplėtimai apima į halogenines dehalogenazę panašias hidrolazes (PF00702), FNIP pakartojimus (PF05725) ir vyriškojo sterilumo baltymus (PF03015).

Mes patvirtinome 67 žinomų sorgo mikroRNR (miRNR) genomines vietas ir nustatėme 82 papildomas miRNR (4.4 papildomoji pastaba). Penkios grupės, esančios 500 bp atstumu viena nuo kitos, rodo numanomas policistristrines miRNR, panašias į Arabidopsis ir Oryza grupes. Natūralūs miRNA4 šeimos antisense miRNR pirmtakai (nat-miRNR) (nuoroda 19) buvo identifikuoti trijose kopijose.

Palyginamieji angiospermų genų aprašai

Sorgo genų šeimų skaičius ir dydis yra panašūs kaip Arabidopsis , ryžių ir tuopų (3 pav. Ir 4.6 papildoma pastaba). Iš viso 9 503 (58%) sorgo genų šeimos buvo pasidalintos tarp visų keturių rūšių ir 15 225 (93%) su bent viena kita rūšimi. Beveik 94% (25 875) sorgo genų ortologų yra ryžiuose, Arabidopsis ir (arba) tuopose, o šie geno papildai kartu apibūdina 11 502 protėvių angiospermo genų šeimas, atstovaujamas bent viename šiuolaikiniame žolių ir rožių genome. Tačiau 3 983 (24%) genų šeimos nariai priklauso tik sorgui ir ryžiams; Atrodo, kad 1 153 (7%) yra unikalus sorgas.

Image

Nurodomas genų šeimų (grupių) skaičius ir bendras sugrupuotų genų skaičius kiekvienai rūšiai ir rūšių sankirtai.

Visas dydis

  • Atsisiųskite „PowerPoint“ skaidrę

Pfam domenai, kuriuose sorgas yra per didelis, nepakankamai atstovaujamas arba jo visai nėra, palyginti su ryžiais, tuopomis ir Arabidopsis , gali atspindėti Sorgo giminaičiui būdingus biologinius ypatumus (20 papildoma lentelė). Domainai, kuriuose yra daugiau nei sorgo, paprastai būna kituose organizmuose, išimtis yra α-kafirino domenas, kuris sudaro daugumą sėklų baltymų ir atitinka kukurūzų zeinus 20, tačiau jo nėra ryžiams.

Su augalų imunine sistema susieti baltymai, kuriuose yra daug nukleotidų turinčių daug leucino (NBS-LRR), sorge yra tik maždaug perpus mažiau nei ryžiuose. Paieška su 12 NBS domenų iš paskelbtų ryžių, kukurūzų, kviečių ir Arabidopsis genų sekų atskleidė 211 NBS-LRR koduojančius genus sorge, 410 ryžiuose ir 149 Arabidopsis 21 . Sorgo NBS-LRR genai daugiausia koduoja CC tipo N-galinius domenus. Tik du sorgo genai (Sb02g005860 ir Sb02g036630) turi TIR domeną, nė viename iš jų nėra NBS domeno. NBS-LRR genai gausiausi 5 sorgo chromosomoje (62) ir jos ryžių homologe (11, 106 chromosoma). NBS-LRR genų praturtinimas šiuose atitinkamuose genominiuose regionuose rodo R geno vietos išsaugojimą, priešingai nei teiginys, kad R geno judėjimas gali būti naudingas 22 .

Skirtingų kelių ir procesų raida

C 4 fotosintezės evoliucija Sorghum linijoje apėmė C 3 pirmtakų genų nukreipimą, senojo ir naujausių genų dublikatų įdarbinimą ir funkcinius skirtumus. Vienintelis sorgo C 4 piruvato ortofosfato dikinazės ( ppdk ) ir fosfoenolpiruvato karboksilazės kinazės ( ppck ) genas ir dvi jo izoformos (gaminamos viso genomo dubliavimosi metu) turi tik vieną ryžių ortologą. Papildomi kukurūzų dublikatai po sorgo ir kukurūzų padalijimo ( Zmppck 2 ir Zmppck 3). C4 NADP priklausomas obuolių fermento ( me ) genas turi gretimą izoformą, tačiau kiekvienas iš jų atitinka skirtingą kukurūzų homologą, o tai rodo tandemo dubliavimąsi prieš sorgo ir kukurūzo skilimą. C4 malato dehidrogenazės ( mdh ) genas ir jo izoforma taip pat yra greta, tačiau jie turi 97% aminorūgščių panašumo ir atitinka vienintelį žinomą kukurūzų Mdh geną, o tai rodo tandemo dubliavimą sorge po jo suskaidymo su kukurūzais. „Ryžių Me“ ir „ Mdh“ genai yra viena kopija, rodanti dubliavimąsi ir pritraukimą į C 4 kelią po Panicoideae – Oryzoideae nukrypimo (9 papildoma pastaba).

Sorgo seka sustiprina išvadas, kurios anksčiau buvo pagrįstos tik ryžiais, apie tai, kaip skirtingi žolių ir dviskilčių genų aprašai yra susiję su jų atitinkamomis ląstelių sienelių rūšimis 23, 24. Žolėse celiuliozės mikrofibrilės, padengtos mišriais ryšiais (1 → 3), (1 → 4) -β-d-gliukanai, yra susipynusios su gliukuronoarabinoksilanais ir dideliu fenilpropanoidų kompleksu 25 . Sorgo seka iš esmės patvirtina skirtumus tarp dviskilčių ir ryžių ląstelių sienelės biogenezės genų pasiskirstyme (10 papildoma pastaba). Pvz., „CesA / Csl“ šeimos ir kallozės sintazės arba išsiskyrė, sudarydamos naujus pogrupius, arba buvo pasirinktinai prarasti funkciškai neesminiai pogrupiai, pvz., CslB ir CslG, prarasti iš žolių, o CslF ir CslH, prarasti iš rūšių, turinčių dviskilčių pavidalo ląsteles. sienos 26 . Anksčiau ryžiams būdingi CslF ir CslH genai yra sorge . Arabidopsis turi vienos grupės F GT31 geną, o sorgas ir ryžiai turi atitinkamai šešis ir dešimt.

Būdingas sorgo prisitaikymas prie sausros iš dalies gali būti susijęs su vienos miRNR ir kelių genų šeimų išsiplėtimu. Ryžių miRNA 169g, padidinta 27 sausros streso metu, turi penkis sorgo homologus (sbi-MIR169c, sbi-MIR169d, sbi-MIR169.p2, sbi-MIR169.p6 ir sbi-MIR169.p7). Sbi-MIR169 pošeimos skaičiavimo prognozuojamas tikslas apima augalų branduolio faktoriaus Y (NF-Y) B transkripcijos faktorių šeimos narius, susijusius su pagerintu našumu po sausros Arabidopsis ir kukurūzų 28 . Citochromo P450 domeno turinčių genų, dažnai naudojančių toksinų, tokių kaip sukaupti reaguojant į stresą, šalinimą, gausu sorge - 326, palyginti su 228 ryžiais. Expansinai, fermentai, kurie ardo vandenilio ryšius ir yra atsakingi už įvairius augimo atsakus, kurie gali būti siejami su sorgo patvarumu, yra 82 egzemplioriuose sorge, palyginti su 58 ryžiuose ir 40 - Arabidopsis ir tuopose.

Grūdų genomų dubliavimasis ir įvairinimas

Bendrojo javų protėvio viso genomo dubliavimasis atsispindi sorgo ir ryžių genų „kvartetuose“ (4 pav.). Iš viso 19 929 (57, 8%) sorgo geno modelių buvo kolineariuose blokuose su ryžiais (6 papildomoji pastaba). Po bendro viso genomo dubliavimosi, buvo paliktas tik vienas 13 667 (68, 6%) kolinearinių genų egzemplioriai, o 13 526 (99%) buvo ortologiški ryžių – sorgų ore, o tai rodo, kad didžioji dalis genų praradimų įvyko prieš taksonų skirtumus. Ir sorgas, ir ryžiai išlaikė abi 4 912 (14, 2%) genų kopijas, tuo tarpu sorgas prarado vieną 1 070 (3, 1%) egzempliorių, o ryžiai - 634 (1, 8%) egzempliorius. Šie modeliai gali numatyti kitų žolių genomus, nes maždaug tuo pačiu metu pagrindinės žolių rūšys išsiskyrė iš bendro protėvio 29 (taip pat žr. 7 papildomą pastabą).

Image

Taškiniai brėžiniai rodo tarpgenominius (aukso) ir intragenominius (juodus) derinimus. Didinamas vienas sorgo – ryžių kvartetas, kuriame matyti ir ortologiniai, ir paraloginiai (dubliuoti) regionai. Retas genų praradimas (raudonas; žr. Legendą) po sorgo ir ryžių skirtumų sukelia „ypatingus atvejus“, kai yra paralogai, bet nėra ortologų. Kiekvienas sorgo regionas atitinka du dubliuotus kukurūzų regionus 39, o kukurūzų geno praradimas rodo, kad sorgo lokusai sutampa tik su vienu iš dviejų. Kadangi kukurūzų BAC dažniausiai būna nebaigti, sorgo lokusai yra suderinti su centrais. Atkreipkite dėmesį į skirtingą skalę, reikalingą kukurūzų fiziniam atstumui. Didesni taškiniai brėžiniai pateikiami 6 papildomoje pastaboje.

Visas dydis

  • Atsisiųskite „PowerPoint“ skaidrę

Nors daugiausiai gendant po dubliavimosi genų neteko įprastas javų protėvis, pasitaiko tam tikrų linijai būdingų modelių. Iš viso 2 ir 10 baltymų funkciniai (Pfam) domenai parodė, kad sorgas, bet ne ryžiai, yra atitinkamai dubliuoti ir pavieniai (6.1 papildomoji pastaba). Kadangi manoma, kad sorgo ir ryžių skirtumai įvyko po 20 Myrų ar daugiau po genomo dubliavimosi 29, tai rodo, kad net ilgalaikis genų praradimas skirtingai veikia genų funkcines grupes.

Viename genomo regione įvyko aukšto lygio suderinta evoliucija. Anksčiau buvo pasiūlyta, kad ryžių 11 ir 12 chromosomos turėtų, 3 5–7-erių amžiaus segmentinį dubliavimąsi 30, 31, 32 . Atitinkamuose sorgo 5 ir 8 chromosomų regionuose mes radome dubliuotą segmentą (5 pav.). Šio regiono sorgo – sorgo ir ryžių – ryžių parabolės sinoniminės DNR pakaitalo normos ( K s ) yra atitinkamai 0, 44 ir 0, 22, tik 34 ir 17 skiriasi. Tačiau sorgo – ryžių ortologų K s vertė yra 0, 63, panašiai kaip atitinkami viso genomo vidurkiai (0, 81, 0, 87). Mes hipotezuojame, kad akivaizdus segmentinis dubliavimasis iš tikrųjų kilo dėl viso grūdų viso genomo dubliavimosi ir tapo skirtingas nuo likusios chromosomos (-ų) dėl suderintos evoliucijos, nepriklausomai veikiančios sorgo, ryžių ir galbūt kitų javų. Genų konversija ir neteisėta rekombinacija yra dažnesnė ryžių 11–12 regione nei kitur genome 33 . Fiziniai ir genetiniai žemėlapiai rodo bendrus atitinkamų chromosomų galinius segmentus kviečiuose (4, 5) 34, lapinės soros soruose (VII, VIII) ir perliniuose sorose (jungčių grupės 1, 4) 35 .

Image

Parodytos keturios homologinių ryžių ir sorgo chromosomos (11 ir 12 ryžiuose; 5 ir 8 sorge), pažymėti genų tankiai. „L“ ir „S“ atitinkamai rodo ilgą ir trumpą rankas. Linijos rodo K tarp homologinių genų porų, o spalvos naudojamos skirtingoms konversijos įvykių datoms parodyti.

Visas dydis

  • Atsisiųskite „PowerPoint“ skaidrę

Sintezė ir pasekmės

Sorgo, ryžių ir kitų genomų palyginimas paaiškina žolės genų rinkinį. Ortologinio sorgo ir ryžių genų poros kartu su naujausiais paraloginiais dubliavimais nusako 19 542 konservuotų žolių genų šeimas, kiekviena iš jų reprezentuoja vieną sorgo ir ryžių protėvio geną. Mūsų sorgo genų skaičius yra panašus į rankiniu būdu kuriamos ryžių anotacijos (RAP2) 36 duomenis, tačiau šis panašumas užmaskuoja kai kuriuos skirtumus. RAP2 nėra apie 2 054 sintetinius ortologus, kuriuos dalijasi mūsų sorgo anotacijoje, ir TIGR5 (nuoroda 37) ryžių anotaciją. Ir atvirkščiai, , 000 12 000 TIGR5 komentarai gali būti perkeliami elementai arba pseudogenai, apimantys dideles hipotetinių genų grupes tiek sorge, tiek ryžių RAP2, dažnai su trumpais egzonais, keliais intronais ir ribota EST parama. Filogenetiniu požiūriu nenuoseklūs akivaizdaus genų praradimo atvejai (pavyzdžiui, genai, kuriuos dalijasi Arabidopsis, ir sorgas, bet ne ryžiai: 3 pav.), Taip pat gali parodyti sekos spragas ar neteisingus pastebėjimus.

Žolės genomo architektūra gali atspindėti euchromatinui būdingą rekombinacijos ir selekcijos poveikį, kuris yra pritaikytas prie neadaptacinių mutacijų ir genetinio dreifo procesų, kurie taikomi visoms genominėms sritims 38 . Nepaisant didelės specifinių pasikartojančių elementų apyvartos, genų ir pasikartojančių DNR struktūrų santykiai homologinėse chromosomose, dubliuotose prieš 70 m. Stentozė yra didžiausia, o retroelementų gausa mažiausia distalinėse chromosomų srityse. Spartesnis regeneruotų elementų pašalinimas iš genų turtingo euchromatino, kuris dažnai rekombinuojasi, nei iš heterochromatino, kuris retai rekombinuojasi, palaiko hipotezę, kad rekombinacija gali išsaugoti genų struktūrą, tvarką ir (arba) tarpus, veikiant naujus intarpus 9 atrankai. Mažesnė euchromatino ir heterochromatino poliarizacija kukurūzuose, kur retrotransposono išsilaikymas euchromatine atrodo dažnesnis, gali atspindėti žolės genomo architektūros pokyčius arba galbūt vėlyvesnes pastarojo meto genomo dubliavimosi pasekmes 39 .

Konservuotų DNR sekų identifikavimas gali padėti mums suprasti esminius genus ir rišimo vietas, apibrėžiančias žoles. Brachypodium distachyon 40 sekos nustatymo progresas nustato panicoidų – oryzoidų – pooidų filogenetinę genominių pokyčių trianguliaciją, taip pat kai kurių tokių pokyčių ryšį su fenotipais, pradedant molekuliniais (genų raiškos modeliai) ir baigiant morfologiniais. Skirtumas tarp sorgo, ryžių ir Brachypodium yra pakankamas, kad atsitiktinai pasirinktų nefunkcinę seką, palengvinant konservuotos nekoduojančios sekos (CNS) atradimą 41, 42 (papildomas 9 pav.). Tolimesni palyginimai su dviskilčiais Arabidopsis rodo egzono išsaugojimą, bet CNS nėra (papildomas 10 pav.). Chloridoidų ir arundinoidų genomo sekos yra reikalingos norint ištirti likusias žolių linijas, o toks pogrupis kaip Ananas (ananasai) ar Musa (bananas) padėtų identifikuoti genus ir sekas, apibrėžiančias žoles.

Tai, kad sorgo genomas nesikartoja M 70 Myr 29, daro jį vertingu išeitimi genų porų ir CNS likvidavimui žolėse, kurios sumažėjo. Pavieniai sorgo regionai atitinka du regionus, atsirandančius dėl kukurūzams būdingo genomo, padvigubinančio 39 - genų dalijimasis yra akivaizdus (4 pav.), Ir tikėtinas subfunkcionalizavimas (papildomas 10 pav.). Sorgas gali pasirodyti ypač vertingas norint išaiškinti genomo evoliuciją artimesniame Saccharum - Miscanthus klade: du genomo dubliavimai, nes jis skiriasi nuo sorgo prieš 8–9 metus. 43 apsunkina cukranendrių genetiką 44, tačiau Saccharum BAC rodo iš esmės konservuotą genų tvarką su sorgu (Papildas 11 pastaba).

Žolių genų struktūros ir tvarkos išsaugojimas palengvina DNR žymenų kūrimą, siekiant paremti pasėlių gerinimą. Sorge (1 papildomas sąrašas) nustatėme 71 000 paprastos sekos pakartojimų (SSR); iš 212 mėginių tik 9 (4, 2 proc.) nurodo savo šaltinio lokalo paralogus. Konservuoti intronų skenavimo pradmenys (2 papildomas sąrašas), skirti 6 760 genams, suteikia DNR žymenis, naudingus daugeliui vienaląsčių augalų, ypač vertingų „našlaičiams grūdams“ 45 .

Kaip pirmasis Afrikos kilmės augalų genomas, sorgas etnobotaniniams tyrimams suteikia naujų dimensijų. Ypatingas susidomėjimas bus alelių, atrinktų ankstyviausiuose sorgo auginimo etapuose, nustatymu, kurie yra vertingi norint patikrinti hipotezę, kad atitinkamų genų konvergencijos mutacijos prisidėjo prie skirtingų grūdų savarankiškos kilmės 46 . Įtaigus sorgo pagerinimas būtų naudingas tokiems regionams kaip Afrikos „Sahelis“, kur tolerancija sausrai padaro sorgo pagrindą žmonių populiacijai, kuris per metus padidėja 2, 8%. Sorgo derliaus pagerėjimas atsiliko nuo kitų grūdų derlingumo. Afrikoje 1961–63– 2005–2007 m. Viso derlingumas išaugo nuo 37% (vakarų) iki 38% (rytų) (12 papildoma pastaba).

Metodų santrauka

Genomo sekos nustatymas

Maždaug (8, 5 karto) nereikalingų porinių šautuvų seka buvo atliekama naudojant standartines „Sanger“ metodikas iš mažų (∼ 2–3 kb) ir vidutinių (5–8 kb) intarpų plazmidžių bibliotekų, vienos fosmidų bibliotekos (∼ 35 kb intarpų) ir dviejų BAC bibliotekos (įdėklo dydis 90 ir 108 kb). (1 papildoma pastaba)

Šautuvo surinkimas į genetinius ir fizinius žemėlapius

Patikrinti didžiausi 201 pastolių, kurių visi dydžiai viršija 39 kb, išskyrus „N“, ir kurie kartu sudaro 678 902 941 bp (97, 3%) nukleotidų, galimi chimeros, kuriuos pasiūlė sorgo genetinis žemėlapis, sorgo fizinis žemėlapis, staigūs genų pokyčiai ar pakartotinis tankis, ryžių genų tvarka ir aprėptis BAC arba fosmid klonais (2 papildoma pastaba).

Pakartokite analizę

De novo ieškojo LTR retransliacijų, naudotų LTR_STRUC. Defaktyvus CACTA-DNR transpozonų ir MITE aptikimas naudotas pasirinktinėmis programomis (3 papildoma pastaba). Žinomus pasikartojimus nustatė „RepeatMasker“ („Open-3-1-8“ (//www.repeatmasker.org) su mips-REdat_6.2_Poaceae - žolių pakartojimų rinkiniu, apimančiu sorgui būdingus LTR retrotransponatus (//mips.gsf.de). / proj / augalas / webapp / recat /). Pilno ilgio LTR-retrotransposonų įterpimo amžius buvo nustatytas pagal evoliucinį atstumą tarp 5 ′ ir 3 ′ soloLTR, gautą iš ClustalW suderinimo dviem soloLTR.

Baltymus koduojančio geno anotacija

Tariami baltymus koduojantys lokusai buvo nustatyti remiantis BLAST suderintais ryžių ir Arabidopsis peptidais bei sorgo ir kukurūzų EST. „GenomeScan 47“ buvo pritaikytas naudojant specifinius kukurūzų parametrus. Numatytos kodavimo struktūros buvo sujungtos su EST duomenimis apie kukurūzus ir sorgus naudojant PASA 48 .

Tarpgenominiai ir intragenominiai derinimai

Taškų brėžiniuose naudota „ColinearScan 49“ ir daugialypiuose derinimuose naudojama „MCScan 50“, pritaikyta RAP2 36 (žemėlapių tipiniai modeliai, 29 389 lokusai) ir „sbi1.4“ anotacijos rinkinyje (34 496 lokusai). Potencialiems inkarams atkurti buvo naudojamas porinis BLASTP ( E <1 × 10 -5, penki populiariausi įvykiai) tiek kiekviename, tiek tarp dviejų genomų. Buvo atsisiųstos Zea BAC sekos ir FPC kontinento koordinatės (//www.maizesequence.org, leidimas 2008 m. Sausio 7 d.). Naudojant išverstą BLAT, kurių minimalus balas buvo 100, buvo ieškoma galimų Sorghum koduojančių sekų ortologų iš Zea BAC.

Papildoma informacija

PDF failai

  1. 1.

    Papildoma informacija

    Šioje rinkmenoje yra papildomi metodai, papildomi duomenys, papildomos pastabos, papildomi 1-15 paveikslai su legendomis, papildomos 1-23 lentelės ir papildomos nuorodos

  2. 2.

    Papildomas šilumos žemėlapis

    Šiame faile yra šilumos žemėlapis, kuriame parodytas visų chromosomų, įskaitant 1 paveiksle pavaizduotas, genominis kraštovaizdis

ZIP failai

  1. 1.

    Papildomas sąrašas

    Šioje byloje yra visų genome rastų tandemų kartojimų, įskaitant tekste nurodytus SSR ir kitus tandemiškai kartojamus elementus, papildomas sąrašas.

  2. 2.

    Papildoma informacija

    Šis failas nurodo konservuotus introno nuskaitymo pradmenis, nurodytus tekste

Komentarai

Pateikdami komentarą jūs sutinkate laikytis mūsų taisyklių ir bendruomenės gairių. Jei pastebite ką nors įžeidžiančio ar neatitinkančio mūsų taisyklių ar gairių, pažymėkite, kad tai netinkama.