Prieskrandžio mikrobiomų narių auginimas ir seka iš Hungate1000 kolekcijos | gamtos biotechnologijos

Prieskrandžio mikrobiomų narių auginimas ir seka iš Hungate1000 kolekcijos | gamtos biotechnologijos

Anonim

Dalykai

  • Kompiuterinė biologija ir bioinformatika
  • Ekologija
  • Genomas
  • Mikrobų ekologija
  • Mikrobiologija

Anotacija

Atrajotojų gyvulių produktyvumas priklauso nuo prieskrandžio mikrobiotos, kurios fermentuoja nevirškinamus augalų polisacharidus į maistines medžiagas, naudojamas augimui. Suprasti prieskrandžio mikrobiotos funkcijas yra svarbu norint sumažinti atrajotojų šiltnamio efektą sukeliančių dujų kiekį ir iš lignoceliuliozės gaminti biokurą. Mes pristatome 410 kultivuojamų bakterijų ir archajų bei jų pamatinius genomus, atstovaujančius kiekvienai kultivuotai su prieskrandžiu susijusiai archeologinei ir bakterijų šeimai. Įvertiname polisacharidų skilimą, trumpų grandinių riebalų rūgščių susidarymą ir metanogenezės kelius bei priskiriame specifinius funkcijų taksonus. Iš viso turimuose prieskrandžio metagenomikos duomenų rinkiniuose buvo 336 organizmai, o žmogaus žarnyno mikrobiomų duomenų rinkiniuose - 134 organizmai. Palyginimas su žmogaus mikrobiomu atskleidė genų, koduojančių vitamino B 12 de novo sintezę, specifinį prieskrandžio praturtėjimą, vykstančią evoliuciją dėl genų netekimo ir potencialų prieskrandžio mikrobiomo vertikalų paveldėjimą, pagrįstą nepakankamu aplinkos streso žymenų atstovavimu. Mes apskaičiavome, kad mūsų Hungato genomo ištekliai sudaro ∼ 75% prieskrandyje esančių bakterijų ir archeologinių taksonų genties lygio.

Pagrindinis

Klimato pokyčiai ir augančio pasaulio gyventojų maitinimas yra du didžiausi žemės ūkio iššūkiai 1 . Atrajotojai gyvuliai vaidina svarbų vaidmenį užtikrinant aprūpinimą maistu 2 ; jie žemos vertės lignoceliuliozinę augalinę medžiagą paverčia didelės vertės gyvūniniais baltymais, į kuriuos įeina pienas, mėsa ir pluošto produktai. Mikroorganizmai, esantys prieskrandžio 3, 4, fermentuoja polisacharidus, kad susidarytų trumpos grandinės riebalų rūgštys (SCFA; acetatas, butiratas ir propionatas), absorbuojamos per prieskrandžio epitelį ir atrajotojų naudojamos palaikymui ir augimui. Raumenys yra viena iš greičiausių ir veiksmingiausių žinomų lignoceliuliozės depolimerizacijos ir panaudojimo sistemų ir yra perspektyvus fermentų šaltinis, naudojant biokurą lignoceliuliozės pagrindu 5 . Enterinė fermentacija atrajotojais taip pat yra didžiausias antropogeninis metano (CH 4 ) 6 šaltinis, ir kiekvienais metais šie gyvūnai į atmosferą išskiria apie 125 mln. Tonų CH4. Jungtinių Tautų klimato kaitos pagrindų konvencijos 2015 m. Paryžiaus susitarime buvo pasiūlyti tikslai sumažinti žemės ūkio anglies išmetimą 7, > 100 šalių įsipareigodamos sumažinti išmetamų žemės ūkio šiltnamio efektą sukeliančių dujų kiekį. Taigi, geresnės žinios apie anglies srautą pro prieskrandį didinant lignoceliuliozę ir fermentuojantis į SCFA ir CH 4, yra svarbios užtikrinant maistą, tvarumą ir šiltnamio efektą sukeliančių dujų išmetimą.

Suprasti prieskrandžio mikrobiomo funkcijas yra nepaprastai svarbu kuriant technologijas ir praktiką, palaikančią veiksmingą atrajotojų maisto gamybą visame pasaulyje, kartu sumažinant šiltnamio efektą sukeliančių dujų išmetimą. Remiant Pasaulinio mokslinių tyrimų aljanso Gyvulininkystės tyrimų grupei (//globalresearchalliance.org/research/livestock/), buvo įkurtas „Rumumen“ mikrobų genomikos tinklas (//www.rmgnetwork.org/), siekiant šią supratimą sustiprinti su kartos atstovais. referencinio mikrobų genomo katalogo - projekto „Hungate1000“ - kaip pagrindinio bendradarbiavimo tikslo. Nors prieskrandžio mikrobų ekologija ilgą laiką buvo 8, 9 tyrimo dalis, projekto pradžioje referenciniai genomai buvo prieinami tik 14 bakterijų ir vieno metanogeno, taigi genomo įvairovė iš esmės nebuvo tyrinėta.

„Hungate1000“ projektas buvo inicijuotas kaip bendruomenės išteklius 2012 m., O surinktoje kolekcijoje yra beveik visos bakterijų ir archeologijos rūšys, išaugintos iš įvairių gyvūnų grupių prieskrandžių 10 . Mes apklausėme Rumunų mikrobų genomikos tinklo narius ir paprašėme, kad jie pateiktų dominančias kultūras. Mes jas papildėme papildomomis kultūromis, įsigytomis iš kultūros kolekcijų, kad būtų sukurta kuo išsamesnė kolekcija. Šios kultūros yra prieinamos tyrėjams, ir mes manome, kad į papildomus organizmus bus įtrauktos jų genomo sekos, nes bus galima kultivuoti daugiau prieskrandžio mikrobų.

Didelės apimties etaloniniai genomo katalogai, įskaitant Žmogaus mikrobiomų projektą (HMP) 11 ir Bakterijų ir archajų genomo enciklopediją (GEBA) 12, padėjo geriau suprasti mikrobiomų funkcijas, įvairovę ir sąveiką su šeimininku. Šių pastangų sėkmė paskatino nuolat tobulinti aukštos kokybės etaloninių genomų katalogus 13, 14 ir paskatino mikroorganizmų auginimo bandymų augimą 15, 16, 17 . Šis aukštos kokybės etaloninis prieskrandžio bakterijų ir archajų genomo katalogas padidina mūsų supratimą apie prieskrandžio funkcijas, atskleidžiant skilimo ir fiziologines galimybes bei nustatant galimas su prieskrandžiu susijusios specifinės adaptacijos.

Rezultatai

Pamatiniai prieskrandžio genomai

Devynių „phyla“, 48 šeimų ir 82 genčių nariai (1 papildoma lentelė ir 1 papildoma pastaba) yra „Hungate“ kolekcijoje. Organizmai buvo pasirinkti taip, kad kultūrinių prieskrandžio mikrobai būtų kuo geriau aprėpti 10 . Nors iš kai kurių polisacharidus ardančių genų ( Butyrivibrio , Prevotella ir Ruminococcus ) sekos buvo išskirtos daugybe , daugelis rūšių yra tik vienas ar keli izoliatai. Šiame tyrime buvo išskirta 410 etaloninių genomų, kurie buvo analizuojami kartu su 91 viešai prieinamu genomu 18 . Visi „Hungate1000“ genomai buvo sekuojami, naudojant „Illumina“ arba „PacBio“ technologijas, ir surinkti ir anotuojami taip, kaip apibendrinta internetiniuose metoduose. Visi genomai buvo įvertinti kaip aukštos kokybės, naudojant „CheckM 19“, vidutiniškai> 99%, ir pagal siūlomus standartus 20 . Genomo statistiką galima rasti 2 papildomoje lentelėje.

Šiame tyrime ištirti 501 seka organizmai yra išvardyti 1 papildomoje lentelėje. Šiuos 501 genomus (480 bakterijų ir 21 archają) mes vadiname Hungate'o genomo katalogu. 3 papildomoje lentelėje pateiktas išsamus chronologinis sąrašas visų viešai prieinamų didžiojo prieskrandžio mikrobų genomo sekos nustatymo projektų, įskaitant anaerobinius grybus ir genomus, kurie buvo atkurti iš metagenomų, bet kurie nebuvo įtraukti į mūsų analizę.

Firmicutes ir Bacteroidetes phyla nariai daugiausia paplitę prieskrandyje 21, 22 ir sudaro didžiąją Hungato genomo sekų dalį (atitinkamai 68% ir 12, 8%; papildomas 1a pav.), O Lachnospiraceae šeima sudaro didžiausią atskirą grupę (32, 3%). ). Archaea daugiausia yra iš Methanobrevibacter genties arba yra Methanomassiliicoccales tvarka. Vidutinis genomo dydis yra ∼ 3, 3 Mb (papildomas 1b pav.), O vidutinis G + C kiekis yra 44%. Dauguma organizmų buvo išskirti tiesiai iš prieskrandžio (86, 6%), likusi dalis - išmatomis ar seilėmis. Daugiausia auginamų organizmų buvo iš galvijų (70, 9%) arba avių (17, 6%) šeimininkų, tačiau taip pat yra kitų atrajotojų ar kupranugarių rūšių (1 lentelė).

Pilno dydžio lentelė

„Visuotinio prieskrandžio surašymo“ projektas 22 apžvelgė 742 prieskrandžio mėginių, esančių įvairiose atrajotojų rūšyse, mikrobų bendruomenes ir nustatė, kad 684 mėginiuose, kurie atitiko įtraukimo į analizę kriterijus, didžiojoje prieskrandio dalyje buvo panašių bakterijų ir archajų. Septynių gausių genčių lygio grupių mikrobiomas buvo apibrėžtas 67% visuotinio prieskrandžio surašymo sekų 22 . Mes uždengėme 16S rRNR geno sekas iš 501 Hungate genomo į 16S rRNR geno amplikono duomenų rinkinį iš „Global Rumen Census“ projekto (1 pav.). Tai atskleidė, kad mūsų Hungato genomai sudaro ∼ 75% genties lygio taksonų, apie kuriuos pranešta iš prieskrandžio.

Image

Dvi gausių, bet šiuo metu neklasifikuojamų bakterijų grupės pažymėtos mėlynais ( Bacteroidales , RC-9 žarnyno grupė) ir oranžiniais ( Clostridiales , R-7 grupė) taškais. Spalvoti žiedai aplink medžius rodo kiekvieno OTU taksonominę klasifikaciją iš „Ribosomal Database Project“ duomenų bazės (nuo vidinės iki atokiausios): gentis, šeima, tvarka, klasė ir slaptažodžiai. Spalvos stiprumas rodo procentinį OTU panašumą į seką, esančią to taksonominio lygio KPP duomenų bazėje.

Visas dydis

Ankstesni prieskrandžio mikrobiomo tyrimai parodė, kad neklasifikuotos bakterijos yra vienos gausiausių prieskrandžio mikroorganizmų 10, 21, be to, mes taip pat pranešame apie 73 padermių genomo sekas, kurios dar neturi būti taksonomiškai priskirtos gentims arba apibūdintos fenotipiškai (1 papildoma lentelė). Gausiausias iš šių netirtų kamienų yra Bacteroidales (RC-9 žarnyno grupė) ir Clostridiales (R-7 grupė) nariai ir šis gausumas rodo, kad šiems kamienams tenka pagrindinis vaidmuo didžiojoje prieskrandžio fermentacijoje 22 . RC-9 žarnyno grupės bakterijos turi mažus genomus (∼ 2, 3 Mb), o artimiausi giminaičiai (84% tapatumo 16S rRNR genas) yra Alistipes genties, Rikenellaceae šeimos nariai . R-7 grupė yra labiausiai susijusi su Christensenella minuta (86% 16S rRNR geno tapatumas), Christensenellaceae šeima.

Skrandžio mikrobiomo funkcijos

Polisacharido skilimas.

Atrajotojams reikalingas efektyvus lignoceliuliozės suskaidymas, kad būtų patenkinti jų energijos poreikiai, tačiau atrajotojų genomai, kaip ir žmogaus genomas, koduoja labai ribotus skilimo fermentų pajėgumus. Galvijai turi vieną kasos amilazę 23 ir kelis lizocimus 24, kurie veikia kaip virškinimo fermentai, kurie gali sunaikinti gramteigiamas bakterijas 25 .

Mes ieškojome CAZy duomenų bazėje kiekvieno Hungate genomo (//www.cazy.org/) 26, kad apibūdintume angliavandeniuose aktyvių fermentų ir juos jungiančių baltymų spektrą (papildomas 2 pav. Ir 4 papildoma lentelė). Iš viso Hungate'o genomai koduoja 32 755 skaidomus CAZyimus (31 569 glikozidų hidrolazes ir 1 186 polisacharidų lipazes), kurie sudaro 2, 2% bendro ORFeome. Didžiausi ir įvairiausi CAZyme repertuarai (2a pav.) Rasti izoliatuose su dideliais genomais, įskaitant Bacteroides oleus (daugiau kaip 320 glikozidų hidrolazių (GH) ir polisacharidų lipazių (PL) iš ∼ 60 skirtingų šeimų), Lachnospiraceae bakterija NLAE-zl-G231. (296 GH ir PL), Ruminoclostridium cellobioparum ATCC 15832 (184 GH ir PL) ir Cellvibrio sp. BR (158 GH ir PL). Prognozuojama, kad bakterijos, kurios inicijuoja augalų skaidulų skilimą, yra svarbios didžiojoje prieskrandžio mikrobų fermentacijoje (2b pav.), Įskaitant bakterijų grupių, galinčių skaidyti celiuliozę, hemiceliuliozę (ksilano / ksilogliukano) skaidymą, bakterijos, kurios inicijuoja augalų skaidulų skilimą (2b pav.) ) ir pektino (2c pav.).

Image

a ) Skiliamųjų CAZyimų (GH, glikozidų hidrolazės ir PL, polisacharidų lipazės) skaičius skirtingose ​​šeimose kiekviename iš 501 Hungate katalogo genomo. Genomai yra spalvinami ffile. b ) Supaprastinta iliustracija, rodanti augalų struktūrinių angliavandenių skaidymą ir metabolizmą vyraujančiose bakterijų ir archeologinėse grupėse, nurodytose Visuotiniame prieskrandžio surašymo projekte 22, naudojant metabolizmo tyrimų ir etaloninių genomų analizės informaciją. Lentelėje pateikti duomenys apie gausą ir paplitimą paimti iš visuotinio prieskrandžio surašymo projekto 22 . Gausumas rodo vidutinį santykinį tos genties lygio grupės gausumą (%) mėginiuose, kuriuose yra ta grupė, o paplitimas rodo tos genties lygio grupės paplitimą visuose mėginiuose ( n = 684). * Cholino virsmas trimetilaminu, ir propandiolis propionatui generuoti toksiškus tarpinius produktus, esančius bakterijų mikrokompartmentuose (BMC). Kultūros iš etaloninio genomo rinkinio, koduojančios genus, reikalingus BMC susidarymui reikalingiems struktūriniams baltymams gaminti, parodytos 5 papildomoje lentelėje. C ) Polisacharidus ardančių CAZymes, užkoduotų aštuonių gausiausių bakterijų grupių atstovų genomuose, skaičius. Celiuliozė: GH5, GH9, GH44, GH45, GH48; pektinai: GH28, PL1, PL9, PL10, PL11, CE8, CE12; ksilanas: GH8, GH10, GH11, GH43, GH51, GH67, GH115, GH120, GH127, CE1, CE2.

Visas dydis

Išnagrinėjus CAZyme profilius (papildomas 3 pav.), Išryškėja skilimo strategijos, kurias naudoja skirtingi mūsų kolekcijoje esantys taksai. Prieglobsčio bakteroidų nariai sukūrė polisacharidų panaudojimo lokusus (PUL), genominius regionus, kuriuose koduojami visi reikalingi komponentai specifinių glikano struktūrų surišimui, transportavimui ir depolimerizacijai. Visų 64 Bacteroidetes genomų iš Hungate katalogo PUL organizavimo prognozės buvo integruotos į specialią PULDB duomenų bazę 27 . Pektino komponentas ramnogalakturonanas II (RG-II) yra struktūriškai sudėtingiausias augalų polisacharidas, o visi jo skaidymui reikalingi CAZyimai vyksta viename dideliame PUL, neseniai aptinkamame Bacteroides thetaiotaomicron 28 . Panašūs PUL, koduojantys visus būtinus fermentus, taip pat buvo rasti prieskrandžio izoliatuose, priklausančiuose trims skirtingoms šeimoms, priskiriamoms prieglobsčio bakteroidatams (papildomas 2 pav. Ir papildomas 4 pav.). Kitas Bacteroidetes genomų ir PUL požymis yra GH šeimų paplitimas, skirtas gyvūnų glikanų skaidymui (2 papildomas paveikslas). Nemanoma, kad glikanai-šeimininkai bus naudojami kaip angliavandenių šaltinis prieskrandžio bakterijoms, o dauguma genomų su dideliu šių fermentų repertuaru ( Bacteroides spp.) Buvo iš rūšių, kurios buvo išskirtos iš išmatų. Tačiau atrajotojai išskiria gausias seiles ir gyvulinius glikaną ardančius fermentus prieskrandyje Prevotella spp. tai gali jiems padėti panaudoti seilių N-sujungtus glikoproteinus 29 ir paaiškinti jų gausą prieskrandžio mikrobiome 22 .

Daugiasluoksnė celiuliozė yra alternatyvi kompleksinio glikano skaidymo strategija, kurioje mažas modulis (dokkerinas), pridedamas prie glikaną skaldančių fermentų, įtvirtina įvairius katalizinius vienetus ant giminingų koheino pakartojimų, rastų dideliame pastolių baltyme 30 . Buvo pranešta apie nedaugelį celiuliozių rūšių, daugiausia Ruminococcaceae šeimoje Clostridiales tvarka . 4 papildomoje lentelėje pateiktas dokkerino ir cohesin modulių, rastų pamatiniuose genomuose, skaičius ir pagrindinės celiuliozinės bakterijos, paryškintas 2 papildomame paveiksle. Mes pastebime, kad Clostridiales bakterijas galima suskirstyti į keturias plačias kategorijas: i) tas, kurios neturi nei dockerinų, nei kohesinai (ne celiuliozinės rūšys), (ii) tie, kuriuose yra tik keli dokkerinai ir nėra kohesinų (greičiausiai ne celiuliozominiai), iii) tie, kuriuose yra daug dokkerinų ir daug kohezinų (tikrosios celiuliozinės bakterijos, tokios kaip Ruminococcus flavefaciens ) ir (iv) tie, kuriuose yra daug dokkerinų, bet tik keletas cohesinų, tokių kaip R. albus ir R. bromii . Tikėtina, kad R. albus vienintelis kohesinas yra skirtas inkrustuoti izoliuotus dokkeriną turinčius fermentus ant ląstelės paviršiaus, o ne kurti bona fide celiuliozę. R. bromii krakmolą skaldantys enzimai turi dokkerino domenus, leidžiančius jiems susiburti į 31 -ojo kokozino amilozomas, analogiškas celiuliozomoms, veikiančias prieš kietosioms dalelėms atsparius krakmolus. R. bromii padermės iš žmogaus žarnos mikrobiotos, o prieskrandis koduoja panašų fermentą papildantį 31 .

Fermentacijos keliai.

Didžioji dalis to, kas žinoma apie mikrobų fermentacijos procesus prieskrandyje, buvo gauta atlikus galutinio produkto srauto matavimus arba gauta iš grynų arba mišrių mikroorganizmų kultūrų in vitro ir remiantis referenciniais metabolizmo keliais, esančiais ne prieskrandžio mikrobuose. Santykinis tam tikrų rūšių dalyvavimas kiekviename kelyje arba jų indėlis į galutinio produkto formavimąsi in vivo yra mažai apibūdinamas. Norėdami nustatyti sekvenuotų rūšių funkcinį potencialą, kartu su publikuota literatūra panaudojome informaciją apie genomą, norėdami priskirti bakterijas skirtingoms metabolizmo strategijoms, remiantis jų substrato naudojimu ir specifinių fermentacijos galutinių produktų gamyba (5 papildoma lentelė). Pagrindiniai metabolizmo keliai ir strategijos yra bent vienoje iš gausiausių prieskrandžio bakterijų ir archeologinių grupių arba jų deriniuose (2b pav.); Todėl dabar mes galime geriau suprasti, kuriuos kelius užkoduoja šios grupės. Analizė taip pat pateikia pirmąją informaciją apie gausų, bet nepatyrusių Bacteroidales ir Clostridiales būrių narių indėlį į prieskrandžio fermentaciją. Ši metabolinė schema suteikia pagrindą šių organizmų genų funkcijai ištirti ir strategijų, kurios gali leisti manipuliuoti prieskrandžio fermentacija, kūrimui.

Genų praradimas.

Vienas įdomus kelių prieskrandžio bakterijų bruožas yra identifikuojamos enolazės nebuvimas, tai yra priešpaskutinis fermentinis glikolizės etapas, kuris yra išsaugotas visose gyvenimo srityse. Ištyrus> 30 000 izoliatų iš integruotų mikrobų genomų su mikrobiomais (IMG / M) 32 duomenų bazės, paaiškėjo, kad enolazės neigiami kamienai buvo reti (<0, 5% viso) ir kad didelę tokių padermių dalį sudarė prieskrandžio izoliatas, priklausantis genčiai. Butyrivibrio ir Prevotella bei nepatyrę Lachnospiraceae šeimos nariai (5 papildoma lentelė). Butyrivibrio gentis maždaug pusei paeiliui padermių trūksta enolazės, tuo tarpu kai kurios turi apipjaustytą formą. Šio fermento pasiskirstymas, palyginti su šios genties filogeneze, parodytas 3 paveiksle. Ši analizė rodo, kad enolazę praranda kai kurie prieskrandžio butirivibrio izoliatai ir kad mes galime stebėti aplinkos specifinės evoliucijos pavyzdį. genų praradimas 33 . Nors adaptacinis pranašumas, kurį suteikia enolazės praradimas, nėra aiškus, galimas ryšys su piruvato metabolizmu ir laktato gamyba. Keli enolazės neigiami Butyrivibrio štamai negamina laktato, o 12 taip pat trūksta L-laktato dehidrogenazės geno. Enolazės ir L-laktato dehidrogenazės genai, atvirkščiai, yra septyniuose kamienuose. Bandymas nustatyti papildomas funkcijas, parodančias panašų genų praradimo modelį (arba papildantį funkcijos padidėjimą) palyginus teigiamą enolazės ir enolazės neigiamą Butyrivibrio spp. padermės nedavė jokių reikšmingų papildomų įžvalgų (6 papildoma lentelė).

Image

Didžiausias tikimybių medis, pagrįstas 56 konservuotų žymenų baltymų, sujungtų iš visų Butyrivibrio padermių, Hungate kolekcijoje, suderintu suderinimu. Padermės, kuriose nėra aptinkamo enolazės geno, žymimos šviesiai rožinės spalvos šešėliais, o tos, kuriose yra apipjaustyta enolazė, - levandų šešėliavimu. Padermės be šešėlio turi nepažeistą enolazę.

Visas dydis

Kitas genų praradimo pavyzdys yra bakterijose, kurios prarado visą glikogeno sintezę ir panaudojimo kelią, kaip parodo tuo pačiu metu prarastos šeimos GH13, GH77, GT3 arba GT5 ir GT35 (papildomas 2 pav.). Šioms bakterijoms priskiriami maistiniai maistiniai firmicutes ( Allisonella histaminiformans , Denitrobacterium detoxificans , Oxobacter pfennigii ) ir proteobakterijos ( Wolinella succinogenes ) nariai, taip pat praradę didžiąją dalį savo skaidomųjų CAZymes, teigdami, kad jie išsivystė pasroviui paskui antrinius fermentus. maitinasi fermentacijos produktais (acetatu, piruvatu, aminorūgštimis) iš pirminių skilėjų.

Biosintetinių genų klasteriai.

Mes ieškojome Hungato genomų biosintetinių genų grupių (papildomas 5 pav. Ir 7 papildoma lentelė), kad nustatytume antrinių metabolitų, kurie galėtų būti naudojami kaip prieskrandžio modifikatoriai, siekiant sumažinti metano gamybą per jų antimikrobinį aktyvumą, įrodymus 34 . Iš Hungato genomų buvo prognozuojami iš viso 6 906 biosintetiniai klasteriai (2 papildoma pastaba).

CRISPR.

CRISPR-Cas sistemų ir jų homologinių prototipų iš virusų, plazmidžių ir mikrobų genomų identifikavimas galėtų parodyti ankstesnius susitikimus su svetimais mobiliaisiais genetiniais elementais 35 ir šiek tiek netiesiogiai - buveinių pasiskirstymą ir ekologinę sąveiką 36 . Iš viso buvo numatytos 6344 CRISPR tarpininkų sekos iš 241 Hungato genomo ir jų buvo ieškoma įvairiose duomenų bazėse (8 papildoma lentelė). Tarpininkų paieška pagal kultūringų ir nekultūringų DNR virusų ir retrovirusų (IMG / VR) duomenų bazę atskleidė naujas asociacijas tarp 83 virusinių operacinių taksonominių vienetų (OTU) ir 31 Hungate šeimininko. Didžioji šių virusų dalis buvo gauta iš žmogaus žarnyno ir atrajotojų mėginių. Išsami informacija ir papildomi rezultatai pateikti 3 papildomoje pastaboje.

Metagenominės sekos įdarbinimas

Mes įvertinome, ar Hungate katalogas gali prisidėti prie metagenominės analizės, naudojant iš viso 1 468 357 kodavimo sekas (CDS) iš 501 referencinių genomų, kad būtų galima ieškoti ∼ 1, 9 milijardo CDS, prognozuojamų iš daugiau nei 8200 metagenominių duomenų rinkinių iš įvairių buveinių. Iš viso 892 995 Hungate CDS (∼ 60%) buvo patekę į 13 364 644 metagenomos baltymus, kurių aminorūgščių tapatumas ≥ 90%. 466 iš 501 Hungate išskyrė pasikartojančias sekas iš 2219 metagenominių duomenų rinkinių, gautų iš su šeimininkais susijusių, aplinkos ar inžinerinių šaltinių (4 pav. Ir 9 papildoma lentelė). Didelis pasamdytų žmonių mėginių skaičius (1 699) gali būti siejamas su didesniu žmonių mėginių prieinamumu, palyginti su kitų žinduolių, įskaitant atrajotojus, metagenomomis. Atsižvelgiant į izoliuotų CDS, turinčių pataikymų į metagenomų sekas, skaičių (aprėpties procentas), dauguma Hungato genomų (413/501) pateikiami didžiojo prieskrandžio metagenomų mėginiuose, taip pat žmogaus ar kituose stuburinių gyvūnų pavyzdžiuose (4 pav.). Vidutinis 466 pasamdytų genomų procentinis uždengimas sudarė 26, 5% viso CDS, o Sharpea azabuensis DSM 18934 parodė didžiausią (95, 6%) avių prieskrandžio metagenomos užfiksavimą (95, 6%) (Papildomas 6 pav.).

Image

Didžiausias tikimybės medis, pagrįstas 16S rDNR genų suderinimu su prieskrandžio kamienais. Medžių skraistės yra pažymėtos spalva pagal spalvų žymėjimą. Kelių juostų diagrama, vaizduojanti vidutinį viso izoliato CDS procentinį padengimą metagenomų mėginiais iš kiekvienos ekosistemos kategorijos, buvo nupiešta naudojant iTOL 55 . Pabrėžtose dėžutėse pabrėžiami įdomūs įdarbinimo pavyzdžiai, tokie kaip izoliatai, aptinkami tiek prieskrandžio, tiek žmogaus mėginiuose (kaštoninės dėžės) arba aptikti žmonių, bet ne prieskrandžio mėginiuose (raudonos dėžės) ir kiti. Skaičių klavišas yra toks (skliausteliuose pateiktas vidutinis procentinis aprėptis%): 1. Sharpea azabuensis str. (∼ 88%), Kandleria vitulina str. (∼ 87%); 2. Staphylococcus epidermidis str. (∼ 40%), Lactobacillus ruminis str. (∼ 51%); 3. Streptococcus equinus str. (∼ 38% pagal prieskrandį, ∼ 35% pagal žmogų); 4. Prevotella bryantii str. (∼ 38% pagal prieskrandį, ∼ 9% pagal žmogų); 5. Bacteroides spp. (∼ 38%); 6. Bifidobacterium spp. (∼ 24%), Propionibacterium acnes (∼ 39%); 7. Shigella sonnei (∼ 30% žmogaus), E. coli PA3 (∼ 31% žmogaus), Citrobacter sp. NLAE-zl-C269 (20% žmogaus); 8. Clostridium beijerinckii HUN142 (87% pagal augalą); 9. Methanobrevibacter spp. (∼ 32% ⋆ 4 paveikslas. Didžiausias tikimybės medis, pagrįstas 16S rDNR genų suderinimu su prieskrandžio kamienais. Medžių sruogos žymimos spalvomis pagal atvaizdą. Kelių juostų diagrama, vaizduojanti vidutinį viso izoliato CDS padengimo procentą, kurį sudaro metagenomų mėginiai iš kiekviena ekosistemų kategorija buvo nubrėžta naudojant iTOL55. Brūkšniuotieji langeliai išryškina įdomius įdarbinimo pavyzdžius, tokius kaip izoliatai, aptikti tiek prieskrandžio, tiek žmonių mėginiuose (kaštoninės dėžės) arba aptikti žmonių, bet ne prieskrandžio mėginiuose (raudonos dėžės) ir kiti. (vidutinis procentas aprėpties pateikiamas skliausteliuose): 1. Sharpea azabuensis str. (~ 88%), Kandleria vitulina str. (~ 87%); 2. Staphylococcus epidermidis str. (~ 40%), Lactobacillus ruminis str. 51%); 3. Streptococcus equinus str. (~ 38% prieskrandžio, ~ 35% žmogaus); 4. Prevotella bryantii str. (~ 38% pagal prieskrandį, ~ 9% žmogaus); 5. Bacteroides spp. ~ 38%); 6. Bifidobacterium spp. (~ 24%), Propionibacterium acnes (~ 39%); 7. Shigella sonnei (~ 30% žmogaus), E. coli PA3 (~ 31% žmogaus), Citro bakterijos sp. NLAE-zl-C269 (20% žmogaus); 8. Clostridium beijerinckii HUN142 (87% pagal augalą); 9. Methanobrevibacter spp. (~ 32 proc.). Vidinis apskritimas identifikuoja Hungato išmatų (★) arba seilių (♦) kilmės izoliatus. Duomenų ir kitų specifikacijų ieškokite 9 papildomoje lentelėje.

Visas dydis

Tiriant įdarbinimą pagal turimas prieskrandžio metagenomas, dauguma 336 izoliatų buvo užfiksuoti 24 prieskrandžio mėginiuose (vidutinis aprėptis 27%) (papildomas 7 pav. Ir 9 papildoma lentelė). Dar 52 prieskrandžio prieskrandžio izoliatai gali būti įtraukti, jei nukentėjusiųjų skaičiaus padidėjimo parametras sumažinamas nuo 200 iki 50. Prognozuojama, kad šie izoliatai pasitaiko santykinai mažu šių prieskrandžio metagenomų skaičiumi ir padidina įdarbinančių asmenų dalį iki beveik 80% viso Hungate katalogas. Labiausiai įdarbinta (pagal viso izoliato CDS apimtį%) organizmų, kurie anksčiau buvo identifikuoti kaip dominuojančios prieskrandžio 10, 22, 37, 38 gentys, pavyzdžiui, Prevotella spp., Ruminococcus spp., Butyrivibrio spp. ir bevardžių RC-9, R-7 ir R-25 grupių nariai. Kai kurie „Hungate“ katalogo genomai buvo aptikti tik viename ar keliuose mėginiuose, gautuose iš to paties atrajotojų šeimininko (pvz., Su Sharpea , Kandleria ir Megasphaera štamais), o kiti buvo aptikti visuose atrajotojuose (pvz., Prevotella spp.). Vis dėlto svarbu pripažinti esamų prieskrandžio metagenomų mėginių apribojimus (ne vien atsižvelgiant į jų silpnumą), nes jie buvo gauti iš gyvūnų laikantis specialių dietų (pvz., 5- mečio ar liucernos (liucernos) granulės 39 ), kurios gali būti pakeiskite mikrobiomą 22 .

Deponuotuose prieskrandžio metagenomų duomenų rinkiniuose pagal taikomas ribas nebuvo aptiktos 165 Hungato kultūros. Daugelis iš jų (∼ 50) buvo išmatų kilmės ir atspindi, kaip prieskrandžio mikrobiota skiriasi nuo kitų atrajotojų virškinimo trakto regionuose 40 .

Iš viso 68 izoliatai buvo įdarbinti tiek prieskrandžio, tiek žmogaus žarnyno mėginiuose. Jie atspindi bendras prieskrandžio ir žmogaus mikrobiomas (4 pav.), Kurie gali atlikti panašius vaidmenis. Kiti 66 Hungate izoliatai buvo įdarbinti žmonių mėginiuose, tačiau jų nebuvo aptikta prieskrandžio mėginiuose. Iš viso buvo gauti 134 Hungate katalogo genomai, kurie pasamdė įvairius žmonių mėginius, todėl jie tapo vertinga atskaitos seka žmogaus mikrobiomo mėginių analizei. Šį pastebėjimą taip pat netiesiogiai pakartoja CRISPR – CAS sistemomis pagrįsta analizė, kuri parodė ryšį su tarpikliais iš žmogaus žarnyno mėginių, ypač Hungate izoliatų iš išmatų atveju (8 papildoma lentelė). Papildoma metagenomų įdarbinimo analizės informacija pateikiama 4 papildomoje pastaboje.

Palyginimas su žmogaus žarnyno mikrobiota

Daug Hungate padermių (134/501) buvo pasidalytos tarp prieskrandžio ir žmogaus žarnyno mikrobiomų mėginių. Tai nestebina, nes abi buveinės yra didelio tankio, sudėtingų anaerobinių mikrobų bendrijos, gaminančios panašius fermentacijos produktus ir turinčios daug rūšių kryžminimą ir sąveiką 41 . Mes atlikome palyginamą analizę su turimais žmogaus žarnyno izoliatais (daugiausia iš HMP), norėdami išsiaiškinti skirtumus, kuriuos galima priskirti skirtingam prieskrandžio mikroorganizmų gyvenimo būdui ir prisitaikymo gebėjimui. Hungato ir žmogaus žarnyno izoliatų kolekcijos buvo kuriamos siekiant pašalinti perteklių, žemos kokybės genomus ir žinomus žmogaus patogenus. Tai sudarė 458 prieskrandžio ir 387 žmogaus žarnyno genomų rinkinį (10 papildoma lentelė), kurie buvo naudojami nustatyti baltymų šeimas „Pfam“ duomenų bazėje, kurių skirtingai gausu izoliatuose iš kiekvienos aplinkos. Iš 7 718 „Pfam“ domenų, rastų 458 nereikšminguose Hungate'o izoliato genomuose, nustatėme, kad 367 buvo virš reprezentacijos atrajotojų genuose ir 423 buvo nepakankamai atstovaujami remiantis klaidingo atradimo rodikliu (FDR), q reikšmė <0, 001 (11 papildoma lentelė). Į per daug reprezentuojamus Pfams (5 pav.) Buvo įtraukti fermentai, dalyvaujantys augalų ląstelių sienelių skaidyme (GH11, GH16, GH26, GH43, GH53, GH67, GH115), angliavandenius surišantys moduliai (CBM2, CBM3) ir su celiuliozėmis susiję kohinino ir dokkerino moduliai. surinkimas) ir GT41 šeimos glikozilo transferazės, kurios vyrauja dažniausiai Anaerovibrio ir Selenomonas genuose . Pažymėtina, kad kopalamino biosintezės Pfam (vitamino B 12, būtino šeimininko mikroelementams, buvo per daug. Vitamino B 12 biosintezė yra vienas sudėtingiausių gamtoje būdų, apimantis daugiau nei 30 fermentinių pakopų, atsižvelgiant į jo aukštą kiekį). medžiagų apykaitos kainą, užkoduoja tik nedidelis bakterijų ir archajos rinkinys. Išnagrinėjome šį biosintezės kelią išsamiau, naudodamiesi kitais funkciniais komentavimo tipais (KO ir Tigrfam), esančiais 501 Hungate izoliate, ir išsiaiškinome, kad 12 ar daugiau fermentinių etapų buvo per daug atstovaujama Hungato genomai ir bent 47 izoliatai gali būti sintezuojami de novo B 12 (papildoma 12 lentelė). Daugelis iš jų priklausė neigiamoms klasėms įmonėse ( Anaerovibrio , Mitsuokella ir Selenomonas ) .Daugiau 140 (įskaitant 21 archeologiniai) genomai koduoja fermentus B 12 išgavimui iš tarpinio produkto ir netgi gali veikti bendradarbiaudami (atsižvelgiant į galimą pažeidimų, esančių skirtinguose t nariai) dalintis ir sintetinti korinoidus, kad būtų naudinga bendruomenei ir (arba) šeimininkams. Šie stebėjimai atspindi didelę vitamino B 12, kuris reikalingas kaip fermentų, dalyvaujančių gliukoneogenezėje iš propionato kepenyse, kofaktorių, naštą. Šis procesas yra būtinas laktozės biosintezei ir pieno gamybai pieniniams gyvūnams 42, o atrajotojų kilmės pienas ir mėsos produktai yra svarbūs mitybiniai B 12 šaltiniai (nuoroda 43). Priešingai, buvo spėliojama, kad žmogaus žarnyno mikrobai mažai tikėtina, kad jų organizme bus daug B 12, ir tikėtina, kad konkurentai mitybos B 12 (nuoroda 44).

Image

X ašis yra atskiri Pfams, kuriuos „Metastats“ nustatė skirtingai, kurių Q vertė yra <0, 001. Y ašis yra vidutinis kiekvienos populiacijos (prieskrandžio ar žarnyno) skaičiaus log2 kartų skirtumas. Pasirinkite „Pfams“ yra paryškinti, kaip aptarta tekste. OPPP, oksidacinio pentozės fosfato kelias.

Visas dydis

Iš visų Pfams (5 pav.), Kurių Hungate'o genomai nepateikti, ryškus visų pentozės fosfato kelio (OPPP) oksidacijos atšakų etapas. OPPP vaidmuo visų pirma yra negrįžtamas redukuojančių ekvivalentų (NADPH) gaminimas, nors kiti fermentai gali būti naudojami kaip alternatyvūs redukuojančių ekvivalentų šaltiniai. Kaip aptarta aukščiau, enolazės „Pfam“ pasirodė nepakankamai atstovaujamų šeimų sąraše. Sąraše taip pat buvo keletas Pfam, susijusių su bakteriofagų funkcijomis ir sporuliacija. Sporuliacijos genų diferencinė gausa yra įdomi, nes neseniai pastebėta, kad sporuliacijos genų yra gausu žmogaus žarnyno bakterijose. Tai yra 16, 31 ir yra potencialiai susijęs su atsparumu deguonies poveikiui. Šis pastebėjimas yra ypač ryškus, atsižvelgiant į Firmicutes, archetipiškai sporą formuojančio prieglobsčio 45 paplitimą prieskrandžių rinkinyje. Dideli ir maži, nuo deguonies priklausomos I klasės ribonukleotidų reduktazės subvienetai taip pat buvo nepakankamai reprezentuojami kartu su keliais kitais Pfams, susijusiais su deguonies tolerancija, ir tai rodo, kad žmogaus žarnyno izoliatai gali patirti didesnę deguonies įtampą, palyginti su griežtai anaerobine atrajotojų ekosistema. Šie stebėjimai netiesiogiai rodo, kad šeimininko genetika ir fiziologija daro įtaką prieskrandžio mikrobiomų sudėčiai ir kad didžiojo prieskrandžio mikrobai gali būti paveldimi vertikaliai, kaip nurodyta naujausiuose tyrimuose 46, 47 . Žmogaus žarnyno (konkrečiau, išmatų) izoliatai yra perduodami iš kitų aplinkos šaltinių 31, 48 . Šiuos radinius galėjome pakartoti atlikdami šių dviejų aplinkų palyginimą metagenomomis (avių prieskrandžio mėginiai ir normalūs žmogaus išmatų mėginiai; 13 papildoma lentelė), teigdami, kad šie skirtumai negali būti paaiškinti auginimo ar gausos paklaidomis izoliatų duomenų rinkiniuose.

Diskusija

Čia pateiktame „Hungate“ genomo kataloge yra 501 bakterijų ir archeologinių kultūrų, reprezentuojančių beveik visas taksonomiškai apibūdintas kultūrinių prieskrandžių rūšis, genomo analizė, taip pat kelių naujų rūšių ir genčių atstovai. Šis aukštos kokybės nuorodų rinkinys padės aiškinti metagenomikos duomenų rinkinius, įskaitant genomus, atgautus iš metagenomų (MAG). „Hungate“ genomo katalogas taip pat leidžia atlikti patikimą lyginamąją genomo analizę, kurios neįmanoma atlikti naudojant nepilnus sekos duomenis iš metagenomų. Tyrėjai turi prieigą prie „Hungate Collection“ padermių, kurios leis geriau suprasti anglies srautą prieskrandyje, įskaitant lignoceliuliozės skaidymąsi, metabolizuojant substratus į SCFA ir fermentacijos galutinius produktus, iki paskutinio CH 4 susidarymo etapo.

„Hungate“ genomo kolekcija jokiu būdu nėra išsami. Trūksta kai kurių svarbių taksonų, ypač eilės „ Bacteroidales 10, 22“ nariai . Šio projekto pradžioje buvo galima gauti kamienų, priklausančių 11 (12, 5%) iš 88 genčių, aprašytų prieskrandžiui, genomo sekas. Šiuo metu genomo sekos yra prieinamos 73 (83%) iš tų 88 genčių, taip pat 73 padermėms, kurios identifikuojamos tik pagal šeimos ar tvarkos taksonominį lygį. Iš visų ieškomų prieskrandžių sąrašo, kurį sudaro 70 prieskrandžio bakterijų 10, „Hungate“ kolekcija dabar sudarė 30 narių. Be trūkstamų bakterijų ir archajos, didžiojo prieskrandžio eukariotų sekos nustatymas kelia nemažų techninių iššūkių ir, nors padaryta tam tikra pažanga nustatant anaerobinius grybus 49, nėra genomo duomenų apie prieskrandžio pirmuonių pirmuonius, o tik preliminarūs duomenys apie prieskrandžio virumo 50 .

Mikrobiomų tyrimai pereina nuo aprašomojo į mechanistinį ir šių mechanizmų pavertimą intervencijomis 51 . Dabar akivaizdu, kad, siekiant sumažinti CH 4 išmetimą 52 ir pagerinti produktyvumą bei tvarumo rezultatus, reikia naudoti suaktyvėjimo prieskrandžio mikrobiomų duomenis, kad būtų sušvelninti CH 4 išmetimai 52 . „Hungate“ kolekcija yra atskaitos taškas tam, atskleidžiant tai, kas apibūdinta kaip „didžiausias pasaulyje komercinis fermentacijos procesas“ 54 . Ateityje atliktais tyrimais Hungate ištekliai gali būti naudojami siekiant patobulinti prieskrandžio meta-omikos analizę, nustatyti antimikrobines medžiagas, iš angies angliavandenius ardančius fermentus šalinti gyvūnams kaip pašarų priedus ir gaminti biokurą iš lignoceliuliozės. sintetiniai mikrobų konsorciumai.

Metodai

Šiame tyrime naudojamos kultūros.

Visas projekte naudojamų kultūrų sąrašas ir jų kilmė yra pateikti 1 papildomoje lentelėje su papildoma informacija, pateikta 1 papildomoje pastaboje. Naujosios Zelandijos bakterijų kultūras iš Hungate kolekcijos galima rasti AgResearch kultūrų kolekcijoje, o kitas kultūras reikia gauti iš atitinkamos kultūros kolekcijos arba prašomos iš šaltinių, nurodytų 1 papildomoje lentelėje.

Genomo DNR išskyrimas.

Genomo DNR buvo ekstrahuota naudojant „Qiagen Genomic-tip“ rinkinį, vadovaujantis gamintojo instrukcijomis dėl 500 / G dydžio ekstrahavimo. Išgrynintai DNR buvo atlikta dalinė 16S rRNR geno sekos, kad būtų galima patvirtinti padermės tapatumą, prieš tai jas gabenant į DOE jungtinio genomo institutą (JGI), JAV, sekvenuoti.

Seka, surinkimas ir anotacija.

Visi Hungate'o genomai buvo sekvenuojami DOE jungtiniame genomo institute (JGI), naudojant „Illumina“ technologiją 56 arba „Pacific Biosciences“ (PacBio) RS technologiją 57 . Visiems genomams mes sukūrėme ir sekome „Illumina“ trumpų intarpų biblioteką, kurios vidutinis intarpas yra 270 bp, arba „Pacbio SMRTbell“ biblioteką. Genomai buvo surinkti naudojant „Velvet 58“, ALLPATHS 59 arba Hierarchinio genomo surinkimo proceso (HGAP) 60 surinkimo metodus (specifika pateikta 2 papildomoje lentelėje). Genomai buvo anotuojami DOE – JGI genomo anotacijos vamzdynu 61, 62 . Trumpai tariant, baltymus koduojantys genai (CDS) buvo identifikuoti naudojant „Prodigal 63“, po kurio sekė automatinis ir rankinis kuravimas, naudojant JGI GenePrimp vamzdyną 64 . Funkcinis komentaras ir papildomos analizės buvo atlikti per integruotų mikrobų genomų (IMG-ER) platformą 32 . Visus duomenis, taip pat išsamias sekos ir surinkimo ataskaitas galima atsisiųsti iš //genome.jgi.doe.gov/portal/pages/dynamicOrganismDownload.jsf?organism=HungateCollection.

Hungato kolekcija ir visuotinio prieskrandžio surašymo analizė.

Mes panaudojome 16S rRNR geno sekas, sugeneruotas iš Visuotinio prieskrandžio surašymo (GRC) 22, kad Hungato kolekcijos genomų filogenetines padėtis būtų pažymėta žinomu pasauliniu bakterijų ir Archaea pasiskirstymu iš prieskrandžio. Dešimt tūkstančių numatytų OTU buvo atsitiktinai parinkti iš 673 ​​507 OTU, nustatytų iš to tyrimo, kad būtų galima sukurti filogenetinį medį. 16S rRNR geno sekos, skirtos Hungate kolekcijos genomams, buvo įtrauktos į GRC pogrupį, o visos bakterijos ir Archaea buvo patikrintos dėl chimerų ir įsitikinta, kad jos atspindi atskirus OTU naudojant CDHIT-OTU 65 (turinčių 0, 97% tapatumo Ribosomal Database Project (RDP) 66). po to buvo atlikta vizuali apžiūra naudojant „JalView 67“ . Taksonominiai klasifikatoriai buvo paimti iš tų, kuriuos numatė GRC tyrimas. Tada buvo atskirai pastatytas didžiausios tikimybės medis bakterijoms ir Archaea, naudojant du „Fasttree“ turus (2.1.7 versija) 68 : pirmasis turas pastatytas maksimalios tikimybės medis naudojant GTR evoliucijos modelį ir (parinktys: -gtr –nt); antrasis turas optimizavo šakos ilgį gautai topologijai (parinktys: –gtr –nt –nome –mllen). Gauti filogenetiniai medžiai buvo vizualizuoti naudojant „iTOL 55“ su žemėlapiuotos Hungato genomų padėtys.

Angliavandeniuose aktyvūs fermentai (CAZymes).

Kiekvieno iš 501 genomo baltymų sekoms buvo atliktos lygiagrečios (i) BLAST užklausos prieš CAZy bibliotekas, tiek ištisų sekų, tiek atskirų modulių; ir (ii) HMMER paieškos naudojant „CAZy“ modulių šeimos ir antrinių šeimų bibliotekas. Šeimos priskyrimai ir bendras CAZyme moduliškumas buvo dar labiau patvirtintas atliekant žmogaus kuravimo žingsnį, kai baltymai nebuvo visiškai suderinti (be tarpų), kurių tapatumas CAZy įrašams buvo> 50%.

Konservuota vieno egzemplioriaus geno filogenija.

Butyrivibrio filogenetinio medžio statybai buvo naudojamas 56 visuotinai konservuotų bakterijų ir archaea 69 baltymų vienkartinių baltymų rinkinys. Žymeklio genai buvo aptikti ir suderinti naudojant „hmmsearch“ ir „hmmalign“, įtrauktus į HMMER3 (nuoroda 70), naudojant HMM profilius, gautus iš „Phylosift 71“ . Deriniai buvo sujungti ir filtruoti. Filogenetinis medis buvo išvestas naudojant maksimalios tikimybės metodus su RAxML (7.6.3 versija). Medžių topologijų patikimumas buvo patikrintas naudojant 100 įkrovos replikų ir standartinį LG modelį. Medžiai buvo vizualizuojami naudojant „FastTree“ ir „iTOL 55“ .

Biosintetinių klasterių prognozavimas.

Spėjamos biosintetinės grupės (BC) buvo numatytos ir anotuotos naudojant „AntiSMASH“ versiją 3.0.4 (nuoroda 72) su „imtinai“ ir „paslėptų“ galimybėmis. Visos kitos parinktys liko kaip numatytosios.

CRISPR – CAS sistemos analizė.

CRISPR – Cas tipų funkcionalumui patvirtinti buvo naudojama modifikuota „Crispr Recognition Tool“ (CRT) algoritmo 61 versija su integruotų mikrobų genomų su metagenomomis (IMG / M) 32 sistemos komentarais 32 ( buvo naudojami tik visi „Cas“ genų išdėstymai). plius tos „našlaičių“ masyvai su tuo pačiu pakartojimu iš viso to paties genomo masyvo). Ši „Hungate“ spacerio kolekcija buvo suabejota virusų duomenų baze iš integruotojo mikrobų genomo sistemos (IMG / VR duomenų bazės) 73, pasirinktinio visuotinio „spacerome“ (numatyto iš visų IMG izoliatų ir metagenomų duomenų rinkinių) ir NBCI refseq plazmidžių duomenų bazės. Visos tarpiklių paieškos buvo atliktos naudojant BLASTn-short funkciją iš „BLAST +“ paketo 74 su parametrais: e-vertės riba 1, 0 × 10 –6, procentinė tapatybė> 94% ir aprėptis> 95%. Šiuos atskyrimus rekomendavo atlikti neseniai atliktas tyrimas, kurio metu buvo lyginamas tarpinių pataikymų tikslumas% tapatumo ir aprėpties diapazonu 75 .

Metagenominių sekų įdarbinimas.

Buvo ieškoma 1 468 357 baltymus koduojančių sekų arba CDS iš 501 Hungate izoliato genomo, naudojant LAST 76, palyginti su 1, 9 milijardo CDS, prognozuojamais iš 8200 metagenominių mėginių, saugomų IMG duomenų bazėje. Hungato genomai buvo priskiriami „verbuotojams“, jei buvo įvykdyti šie kriterijai: mažiausiai 200 CDS, kurių atitikmenys ≥ 90% aminorūgščių tapatumo, 70% suderinimo ilgių pagal individualią metagenominę CDS arba ≥ 10% bendro CDS surinkimo kiekviename genome . Priežastis, dėl kurios pasirenkamas mažiausias 200 paspaudimų skaičius, buvo užtikrinti, kad įrodymai apimtų ne tik namų tvarkymo genus (kurie paprastai būna labiau konservuoti). Keliais atvejais 200 CDS įvykių skaičiaus reikalavimas buvo sušvelnintas, jei buvo užfiksuota bent 10% viso genomo CDS. 90% aminorūgščių tapatumo ribos buvo pasirinktos remiantis Luo ir kt . 77, kurie tvirtina, kad organizmai, sugrupuoti „rūšių“ lygyje, paprastai turi> 85% AAI. Mes įsitikinome, kad ≥ 90% tapatumas buvo pakankamai diskriminuojantis Hungato genomo rūšių atžvilgiu, stebint skirtingų tos pačios genties rūšių (pvz., Prevotella spp ., Butyrivibrio spp.) Įdarbinimo modelių skirtumus (paspaudimų skaičius arba CDS procentas). Bifidobacterium spp., Treponema spp.) Iš kiekvieno prigimties to paties metagenominio mėginio.

Atliekant naujų nukleotidų skaičiavimą, visi atskirų metagenomų rodmenys buvo sulyginti su pastoliais iš kiekvieno iš 501 izoliato, naudojant BWA lygintuvą 78 . Efektyvusis minimalus nukleotidų% identiškumas buvo ∼ 75%, o mažiausias lygiavimo ilgis buvo 50 bp. Derinimo rezultatai buvo ištirti atsižvelgiant į bendrą perskaitytų izoliatui parodymų skaičių (esant skirtingam procentiniam tapatumo sumažėjimui, kai ≥ 97% tapatybės buvo siūlomi kaip rūšys): vidutinis visų skaitymų, įdarbintų į tam tikrą izoliato genomą, skaitymo gylis. % viso genomo nukleotidų ilgio aprėpties.

Genomo palyginimai.

Palyginti prieskrandžio ir žmogaus izoliatus, žmogaus žarnyno izoliato genomai buvo kruopščiai atrinkti iš IMG duomenų bazės, naudojant turimus GOLD metaduomenų laukus, susijusius su izoliacijos šaltiniu (ir rūpinantis žinomų patogenų pašalinimu). Genomo perteklius tiek žmogaus, tiek prieskrandžio rinkinyje buvo pašalintas įvertinus visų geriausių dvikrypčių įvykių vidutinį nukleotidų tapatumą (ANI) ir pašalinus genomus, kurių ANI yra> 99% (bendro CDS suderinimo dalis ≥ 60%), į kitą genomą. rinkinys. Be to, žemos kokybės genomai žmonių grupėje buvo pažymėti ir pašalinti, nes nėra „aukštos kokybės“ filtro, kuriam priskirtas IMG kokybės kontrolės vamzdynas, nes trūksta prieglobsčio lygio taksonominės priskyrimo arba jei kodavimo tankis buvo 100% arba genų skaičius milijonui bazinių porų buvo 1200 (ref. 61). Dėl šio metodo atsirado 388 genomai, apibrėžti žmonių rinkinyje, ir 458 genomai, sudedami prieskrandžių rinkinyje (sąrašai pateikti 10 papildomoje lentelėje). Abiejų genomų kolekcijos turėjo panašų vidutinį genomo dydį (3, 3–3, 5 Mbp) ir išsamumą (įvertino „CheckM 19“ ). Porinis atskirų Pfams genų skaičiaus palyginimas tarp kiekvieno rinkinio narių buvo atliekamas naudojant „Metastats 79“, kuriame naudojamas neparametrinis dvipusis t -testas (arba tikslus Fišerio tiriamasis tiriamųjų skaičius) su klaidingo atradimo dažniu (FDR). klaidų taisymas, siekiant nustatyti skirtingai gausius bruožus tarp dviejų genomų rinkinių. Svarbiausi bruožai buvo nubrėžti naudojant Q vertės ribą <0, 001, taip pat buvo pašalintos mažiau populiacijos turinčios arba retai įdarbintos Pfam (kai genų skaičius kiekviename genomo rinkinyje buvo <100) (11 papildoma lentelė, darbalapis, pažymėtas „Q- val <0, 001_redited “). Antrasis darbalapis, pažymėtas „Q-val <0, 005“, rodo didesnį skirtingai gausiai gaunamų „Pfams“ pogrupį, taikydamas mažiau griežtą Q vertės <0, 005 slenkstį, įskaitant „Pfams“, turinčių nedaug skaičių, rezultatus. Pirminei analizei pasirinktas „Pfam“, nes jis yra didžiausias ir plačiausiai naudojamas rankiniu būdu kuruojamų baltymų šeimų šaltinis, apimantis (vidutiniškai) 80% visų šių mikrobų genomų CDS. KO terminai arba TIGRFAMS taip pat buvo įvertinti, kad būtų patvirtintos ir papildytos Pfam pagrįstos išvados arba atidžiau išnagrinėti konkretūs būdai. Palyginimui su teigiama enolase ir neigiama enolase Butyrivibrio spp. padermių, „Metastats 79“ buvo naudojamas kartu su kontrastingu viršutinio ir apatinio kvartilių ar procentilių genų skaičiumi, siekiant nustatyti papildomas funkcijas, turinčias panašų išsaugojimo / praradimo modelį kaip ir glikolitinis enolazės genas.

Metagenomomis pagrįstiems palyginimams anksčiau paskelbti avių prieskrandžiai (IMG ID: 3300021254, 300021255, 3300021256, 3300021387, 3300021399, 3300021400, 3300021426, 3300021431) ir žmogaus žarnynas (IMG ID: 3300008260, 3300008496, 330000729927, 330000729927, 330000729927, 3300007299, , 3300007305, 3300007717) metagenomos buvo surinktos naudojant metaSPAdes 80, anotuotos ir įkeltos į IMG. Apytikris genų kopijų skaičius (apskaičiuotas padauginus genų skaičių su pastolių, kuriuose yra genas, skaitymo gyliu) buvo palygintas naudojant metastatus (kaip aprašyta aukščiau).

Statistinė analizė.

Žr. Gyvosios gamtos mokslų ataskaitų santrauką.

Gyvybės mokslų ataskaitų santrauka.

Daugiau informacijos apie eksperimentinį dizainą galima rasti Gyvybės mokslų ataskaitų santraukoje.

Duomenų prieinamumas.

Visus turimus genomo duomenis ir komentarus galima rasti IMG portale (//img.jgi.doe.gov/). Be to, yra skirtas specialus portalas, skirtas atsisiųsti visus 410 šiame tyrime surinktus genomus: //genome.jgi.doe.gov/portal/pages/dynamicOrganismDownload.jsf?organism=HungateCollection.

Nuorodos

  1. 1.

    „Godfray“, HC ir kt. Maisto saugumas: iššūkis maitinti 9 milijardus žmonių. Mokslas 327, 812–818 (2010).

      • CAS
      • PubMed
      • Straipsnis
      • „Google Scholar“
  2. 2.

    Eisler, MC ir kt. Žemės ūkis: žingsniai link tausojančių gyvulių. Gamta 507, 32–34 (2014).

      • PubMed
      • Straipsnis
      • „Google Scholar“
  3. 3.

    Herrero, M. et al. Biomasės naudojimas, gamyba, pašarų efektyvumas ir šiltnamio efektą sukeliančių dujų išmetimas iš pasaulinių gyvulininkystės sistemų. Proc. Natl. Acad. Mokslas. JAV 110, 20888–20893 (2013).

      • CAS
      • PubMed
      • Straipsnis
      • „Google Scholar“
  4. 4.

    Morgavi, DP, Kelly, WJ, Janssen, PH & Attwood, GT Rumen mikrobų (meta) genomika ir jos taikymas atrajotojų produkcijai. „Animal 7“ (1 tiekimas), 184–201 (2013).

      • PubMed
      • Straipsnis
      • „Google Scholar“
  5. 5.

    Hess, M. et al. Metagenominis biomasės skaidymo genų ir genomų atradimas iš karvės prieskrandžio. Mokslas 331, 463–467 (2011).

      • CAS
      • PubMed
      • Straipsnis
      • „Google Scholar“
  6. 6.

    Reisingeris, A. ir Clarkas, H. Kiek tiesioginis gyvulių išmetimas iš tikrųjų prisideda prie globalinio atšilimo? Glob. Pakeiskite Biol. (2017 m.).

      • „Google Scholar“
  7. 7

    Wollenberg, E. ir kt. Žemės ūkio išmetamųjų teršalų mažinimas, kad būtų pasiektas 2 ° C tikslas. Glob. Pakeiskite Biol. 22, 3859–3864 (2016).

      • Straipsnis
      • „Google Scholar“
  8. 8.

    Bryant, MP Rūgščiosios prieskrandžio rūšys. Bakteriolis. 125–153 (1959) 23 d.

      • PubMed
      • „Google Scholar“
  9. 9.

    Hungate, RE Raumenys ir jo mikrobai (Academic Press, Niujorkas, JAV, 1966).

      • „Google Scholar“
  10. 10.

    Creevey, CJ, Kelly, WJ, Henderson, G. & Leahy, SC. ​​Skrandžio bakterijų mikrobiomo kultūringumo nustatymas. Mikrobai. Biotechnolis. 7, 467–479 (2014).

      • PubMed
      • Straipsnis
      • „Google Scholar“
  11. 11.

    Nelsonas, KE ir kt. Žmogaus mikrobiomo etaloninių genomų katalogas. Mokslas 328, 994–999 (2010).

      • CAS
      • PubMed
      • Straipsnis
      • „Google Scholar“
  12. 12.

    Mukherjee, S. ir kt. 1 003 etaloniniai bakterijų ir archeologinių izoliatų genomai praplečia gyvybės medžio aprėptį. Nat. Biotechnolis. 35, 676–683 (2017).

      • PubMed
      • Straipsnis
      • „Google Scholar“
  13. 13.

    Blaser, MJ ir kt. Prognozuojamo Žemės mikrobiomų supratimo link siekiant spręsti XXI amžiaus iššūkius. „MBio 7“, e00714 – e00716 (2016).

      • PubMed
      • Straipsnis
      • „Google Scholar“
  14. 14

    Kyrpides, NC, Eloe-Fadrosh, EA & Ivanova, NN Mikrobiomų duomenų mokslas: mūsų mikrobų planetos supratimas. Mikrobiolio tendencijos. 24, 425–427 (2016).

      • CAS
      • PubMed
      • Straipsnis
      • „Google Scholar“
  15. 15.

    Noel, S. Augalams priskiriamų prieskrandžio bakterijų auginimas ir jų kompozicijos analizė. Daktaro disertacija, Massey univ., NZ (2013).

      • „Google Scholar“
  16. 16.

    Browne, HP ir kt. Auginant „nekultūringą“ žmogaus mikrobiotą, atsiskleidžia nauji taksai ir ekstensyvi sporuliacija. Gamta 533, 543–546 (2016).

      • CAS
      • PubMed
      • Straipsnis
      • „Google Scholar“
  17. 17.

    Lagkouvardos, I. et al. Pelės žarnyno bakterijų kolekcija (miBC) suteikia konkrečiam šeimininkui įžvalgą apie kultivuojamą žarnyno mikrobiotos įvairovę ir funkcinį potencialą. Nat. Mikrobiolis. 1, 16131 (2016).

      • PubMed
      • Straipsnis
      • „Google Scholar“
  18. 18.

    Mukherjee, S. ir kt. „Genomes OnLine Database“ (GOLD) v.6: duomenų atnaujinimai ir funkcijų patobulinimai. Nukleorūgštys Res. 45 D1, D446–D456 (2017).

      • PubMed
      • Straipsnis
      • „Google Scholar“
  19. 19.

    Parks, DH, Imelfort, M., Skennerton, CT, Hugenholtz, P. & Tyson, GW CheckM: assessing the quality of microbial genomes recovered from isolates, single cells, and metagenomes. „Genome Res“. 25, 1043–1055 (2015).

      • CAS
      • PubMed
      • Straipsnis
      • „Google Scholar“
  20. 20.

    Chain, PSG et al. Genome project standards in a new era of sequencing. Science 326, 236–237 (2009).

      • CAS
      • PubMed
      • Straipsnis
      • „Google Scholar“
  21. 21.

    Kim, M., Morrison, M. & Yu, Z. Status of the phylogenetic diversity census of ruminal microbiomes. FEMS Microbiol. Ecol. 76, 49–63 (2011).

      • CAS
      • PubMed
      • Straipsnis
      • „Google Scholar“
  22. 22.

    Henderson, G. et al. Rumen microbial community composition varies with diet and host, but a core microbiome is found across a wide geographical range. Mokslas. Rep. 5, 14567 (2015).

      • PubMed
      • Straipsnis
      • „Google Scholar“
  23. 23

    Harmon, DL, Yamka, RM & Elam, NA Factors affecting intestinal starch digestion in ruminants: A review. Can. J. Anim. Mokslas. 84, 309–318 (2004).

      • Straipsnis
      • „Google Scholar“
  24. 24

    Wen, Y. & Irwin, DM Mosaic evolution of ruminant stomach lysozyme genes. Mol. Phylogenet. Evol. 13, 474–482 (1999).

      • PubMed
      • Straipsnis
      • „Google Scholar“
  25. 25

    Domínguez-Bello, MG et al. Resistance of rumen bacteria murein to bovine gastric lysozyme. BMC Ecol. 4, 7 (2004).

      • PubMed
      • Straipsnis
      • „Google Scholar“
  26. 26

    Lombard, V., Golaconda Ramulu, H., Drula, E., Coutinho, PM & Henrissat, B. The carbohydrate-active enzymes database (CAZy) in 2013. Nucleic Acids Res. 42, D490–D495 (2014).

      • CAS
      • PubMed
      • Straipsnis
      • „Google Scholar“
  27. 27

    Terrapon, N. et al. PULDB: the expanded database of Polysaccharide Utilization Loci. Nukleorūgštys Res. 46 D1, D677–D683 (2018).

      • „Google Scholar“
  28. 28.

    Ndeh, D. et al. Complex pectin metabolism by gut bacteria reveals novel catalytic functions. Nature 544, 65–70 (2017).

      • PubMed
      • Straipsnis
      • „Google Scholar“
  29. 29

    Ang, C.-S. et al. Global survey of the bovine salivary proteome: integrating multidimensional prefractionation, targeted, and glycocapture strategies. J. Proteome Res. 10, 5059–5069 (2011).

      • PubMed
      • Straipsnis
      • „Google Scholar“
  30. 30.

    Artzi, L., Bayer, EA & Moraïs, S. Cellulosomes: bacterial nanomachines for dismantling plant polysaccharides. Nat. Mikrobiolis. 15, 83–95 (2017).

      • PubMed
      • Straipsnis
      • „Google Scholar“
  31. 31

    Mukhopadhya, I. et al. Sporulation capability and amylosome conservation among diverse human colonic and rumen isolates of the keystone starch-degrader Ruminococcus bromii . Aplinka. Mikrobiolis. 20, 324–336 (2018).

      • PubMed
      • Straipsnis
      • „Google Scholar“
  32. 32.

    Chen, IA et al. IMG/M: integrated genome and metagenome comparative data analysis system. Nukleorūgštys Res. 45 D1, D507–D516 (2017).

      • PubMed
      • Straipsnis
      • „Google Scholar“
  33. 33.

    Albalat, R. & Cañestro, C. Evolution by gene loss. Nat. Rev. Genet. 17, 379–391 (2016).

      • PubMed
      • Straipsnis
      • „Google Scholar“
  34. 34.

    Knapp, JR, Laur, GL, Vadas, PA, Weiss, WP & Tricarico, JM Invited review: Enteric methane in dairy cattle production: quantifying the opportunities and impact of reducing emissions. J. Dairy Sci. 97, 3231–3261 (2014).

      • PubMed
      • Straipsnis
      • „Google Scholar“
  35. 35.

    Shmakov, SA et al. The CRISPR spacer space is dominated by sequences from species-specific mobilomes. MBio 8, e01397–e17 (2017).

      • PubMed
      • Straipsnis
      • „Google Scholar“
  36. 36.

    Paez-Espino, D. et al. Uncovering Earth's virome. Nature 536, 425–430 (2016).

      • CAS
      • PubMed
      • Straipsnis
      • „Google Scholar“
  37. 37.

    Jami, E. & Mizrahi, I. Composition and similarity of bovine rumen microbiota across individual animals. PLoS One 7, e33306 (2012).

      • CAS
      • PubMed
      • Straipsnis
      • „Google Scholar“
  38. 38.

    Lima, FS et al. Prepartum and postpartum rumen fluid microbiomes: characterization and correlation with production traits in dairy cows. Taikyti Aplinka. Mikrobiolis. 81, 1327–1337 (2015).

      • PubMed
      • Straipsnis
      • „Google Scholar“
  39. 39.

    Kamke, J. et al. Rumen metagenome and metatranscriptome analyses of low methane yield sheep reveals a Sharpea -enriched microbiome characterised by lactic acid formation and utilisation. Microbiome 4, 56 (2016).

      • PubMed
      • Straipsnis
      • „Google Scholar“
  40. 40.

    Kim, M. & Wells, JE A meta-analysis of bacterial diversity in the feces of cattle. Curr. Mikrobiolis. 72, 145–151 (2016).

      • PubMed
      • Straipsnis
      • „Google Scholar“
  41. 41.

    Dolfing, J. & Gottschal, JC in Gastrointestinal Microbiology Vol. 2 (eds. Mackie, RI White, BA & Issacson, RE) 373–433 (Chapman and Hall, New York. USA, 1997).

      • „Google Scholar“
  42. 42.

    Aschenbach, JR, Kristensen, NB, Donkin, SS, Hammon, HM & Penner, GB Gluconeogenesis in dairy cows: the secret of making sweet milk from sour dough. IUBMB Life 62, 869–877 (2010).

      • PubMed
      • Straipsnis
      • „Google Scholar“
  43. 43.

    Gille, D. & Schmid, A. Vitamin B 12 in meat and dairy products. Nutr. Rev. 73, 106–115 (2015).

      • PubMed
      • Straipsnis
      • „Google Scholar“
  44. 44.

    Degnan, PH, Taga, ME & Goodman, AL Vitamin B 12 as a modulator of gut microbial ecology. Ląstelių apykaita. 20, 769–778 (2014).

      • CAS
      • PubMed
      • Straipsnis
      • „Google Scholar“
  45. 45.

    Hutchison, EA, Miller, DA & Angert, ER Sporulation in bacteria: beyond the standard model. Mikrobiolis. Spectr. 2 TBS-0013, 2012 (2014).

      • „Google Scholar“
  46. 46.

    Roehe, R. et al. Bovine host genetic variation influences rumen microbial methane production with best selection criterion for low methane emitting and efficiently feed converting hosts based on metagenomic gene abundance. „PLoS Genet“. 12, e1005846 (2016).

      • CAS
      • PubMed
      • Straipsnis
      • „Google Scholar“
  47. 47.

    Sasson, G. et al. Heritable bovine rumen bacteria are phylogenetically related and correlated with the cow's capacity to harvest energy from its feed. MBio 8, e00703–e00717 (2017).

      • PubMed
      • Straipsnis
      • „Google Scholar“
  48. 48.

    Nayfach, S., Rodriguez-Mueller, B., Garud, N. & Pollard, KS An integrated metagenomics pipeline for strain profiling reveals novel patterns of bacterial transmission and biogeography. „Genome Res“. 26, 1612–1625 (2016).

      • PubMed
      • Straipsnis
      • „Google Scholar“
  49. 49.

    Solomon, KV et al. Early-branching gut fungi possess a large, comprehensive array of biomass-degrading enzymes. Science 351, 1192–1195 (2016).

      • PubMed
      • Straipsnis
      • „Google Scholar“
  50. 50.

    Ross, EM, Petrovski, S., Moate, PJ & Hayes, BJ Metagenomics of rumen bacteriophage from thirteen lactating dairy cattle. BMC Microbiol. 13, 242 (2013).

      • PubMed
      • Straipsnis
      • „Google Scholar“
  51. 51.

    Brüssow, H. Biome engineering-2020. Microb. Biotechnolis. 9, 553–563 (2016).

      • PubMed
      • Straipsnis
      • „Google Scholar“
  52. 52.

    McAllister, TA et al. Ruminant Nutrition Symposium: use of genomics and transcriptomics to identify strategies to lower ruminal methanogenesis. J. Anim. Mokslas. 93, 1431–1449 (2015).

      • PubMed
      • Straipsnis
      • „Google Scholar“
  53. 53.

    Firkins, JL & Yu, Z. Ruminant Nutrition Symposium: how to use data on the rumen microbiome to improve our understanding of ruminant nutrition. J. Anim. Mokslas. 93, 1450–1470 (2015).

      • PubMed
      • Straipsnis
      • „Google Scholar“
  54. 54.

    Weimer, PJ Cellulose degradation by ruminal microorganisms. Crit. Rev. Biotechnol. 12, 189–223 (1992).

      • Straipsnis
      • „Google Scholar“
  55. 55.

    Letunic, I. & Bork, P. Interactive tree of life (iTOL) v3: an online tool for the display and annotation of phylogenetic and other trees. Nukleorūgštys Res. 44 W1, W242–W245 (2016).

      • „Google Scholar“
  56. 56.

    Mavromatis, K. et al. The fast changing landscape of sequencing technologies and their impact on microbial genome assemblies and annotation. PLoS One 7, e48837 (2012).

      • CAS
      • PubMed
      • Straipsnis
      • „Google Scholar“
  57. 57.

    Eid, J. et al. Real-time DNA sequencing from single polymerase molecules. Science 323, 133–138 (2009).

      • CAS
      • PubMed
      • Straipsnis
      • „Google Scholar“
  58. 58.

    Zerbino, DR & Birney, E. Velvet: algorithms for de novo short read assembly using de Bruijn graphs. „Genome Res“. 18, 821–829 (2008).

      • CAS
      • PubMed
      • Straipsnis
      • „Google Scholar“
  59. 59.

    Butler, J. et al. ALLPATHS: de novo assembly of whole-genome shotgun microreads. „Genome Res“. 18, 810–820 (2008).

      • CAS
      • PubMed
      • Straipsnis
      • „Google Scholar“
  60. 60.

    Chin, C.-S. et al. Nonhybrid, finished microbial genome assemblies from long-read SMRT sequencing data. Nat. Methods 10, 563–569 (2013).

      • CAS
      • PubMed
      • Straipsnis
      • „Google Scholar“
  61. 61.

    Huntemann, M. et al. The standard operating procedure of the DOE-JGI Metagenome Annotation Pipeline (MAP v.4). Stand. Genomic Sci. 11, 17 (2016).

      • PubMed
      • Straipsnis
      • „Google Scholar“
  62. 62.

    Tripp, HJ et al. Toward a standard in structural genome annotation for prokaryotes. Stand. Genomic Sci. 10, 45 (2015).

      • PubMed
      • Straipsnis
      • „Google Scholar“
  63. 63.

    Hyatt, D. et al. Prodigal: prokaryotic gene recognition and translation initiation site identification. BMC Bioinformatics 11, 119 (2010).

      • CAS
      • PubMed
      • Straipsnis
      • „Google Scholar“
  64. 64.

    Pati, A. et al. GenePRIMP: a gene prediction improvement pipeline for prokaryotic genomes. Nat. Methods 7, 455–457 (2010).

      • PubMed
      • Straipsnis
      • „Google Scholar“
  65. 65.

    Li, W., Fu, L., Niu, B., Wu, S. & Wooley, J. Ultrafast clustering algorithms for metagenomic sequence analysis. Brief. Bioinform. 13, 656–668 (2012).

      • PubMed
      • Straipsnis
      • „Google Scholar“
  66. 66.

    Cole, JR et al. Ribosomal Database Project: data and tools for high throughput rRNA analysis. Nukleorūgštys Res. 42, D633–D642 (2014).

      • CAS
      • PubMed
      • Straipsnis
      • „Google Scholar“
  67. 67.

    Clamp, M., Cuff, J., Searle, SM & Barton, GJ The Jalview Java alignment editor. Bioinformatics 20, 426–427 (2004).

      • CAS
      • PubMed
      • Straipsnis
      • „Google Scholar“
  68. 68.

    Price, MN, Dehal, PS & Arkin, AP FastTree 2--approximately maximum-likelihood trees for large alignments. PLoS One 5, e9490 (2010).

      • CAS
      • PubMed
      • Straipsnis
      • „Google Scholar“
  69. 69.

    Eloe-Fadrosh, EA et al. Global metagenomic survey reveals a new bacterial candidate phylum in geothermal springs. Nat. Bendruomenė. 7, 10476 (2016).

      • CAS
      • PubMed
      • Straipsnis
      • „Google Scholar“
  70. 70.

    Mistry, J., Finn, RD, Eddy, SR, Bateman, A. & Punta, M. Challenges in homology search: HMMER3 and convergent evolution of coiled-coil regions. Nukleorūgštys Res. 41, e121 (2013).

      • CAS
      • PubMed
      • Straipsnis
      • „Google Scholar“
  71. 71.

    Darling, AE et al. PhyloSift: phylogenetic analysis of genomes and metagenomes. PeerJ 2, e243 (2014).

      • PubMed
      • Straipsnis
      • „Google Scholar“
  72. 72.

    Weber, T. et al. antiSMASH 3.0-a comprehensive resource for the genome mining of biosynthetic gene clusters. Nukleorūgštys Res. 43 W1, W237–W243 (2015).

      • PubMed
      • Straipsnis
      • „Google Scholar“
  73. 73.

    Paez-Espino, D. et al. IMG/VR: a database of cultured and uncultured DNA viruses and retroviruses. Nukleorūgštys Res. 45 D1, D457–D465 (2017).

      • PubMed
      • Straipsnis
      • „Google Scholar“
  74. 74.

    Altschul, SF et al. Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. Nukleorūgštys Res. 25, 3389–3402 (1997).

      • CAS
      • PubMed
      • Straipsnis
      • „Google Scholar“
  75. 75.

    Edwards, RA, McNair, K., Faust, K., Raes, J. & Dutilh, BE Computational approaches to predict bacteriophage-host relationships. FEMS Microbiol. Rev. 40, 258–272 (2016).

      • PubMed
      • Straipsnis
      • „Google Scholar“
  76. 76.

    Kiełbasa, SM, Wan, R., Sato, K., Horton, P. & Frith, MC Adaptive seeds tame genomic sequence comparison. „Genome Res“. 21, 487–493 (2011).

      • CAS
      • PubMed
      • Straipsnis
      • „Google Scholar“
  77. 77.

    Luo, C., Rodriguez-R, LM & Konstantinidis, KT MyTaxa: an advanced taxonomic classifier for genomic and metagenomic sequences. Nukleorūgštys Res. 42, e73 (2014).

      • CAS
      • PubMed
      • Straipsnis
      • „Google Scholar“
  78. 78.

    Li, H. & Durbin, R. Fast and accurate long-read alignment with Burrows-Wheeler transform. Bioinformatics 26, 589–595 (2010).

      • CAS
      • PubMed
      • Straipsnis
      • „Google Scholar“
  79. 79.

    White, JR, Nagarajan, N. & Pop, M. Statistical methods for detecting differentially abundant features in clinical metagenomic samples. PLOS Comput. Biol. 5, e1000352 (2009).

      • CAS
      • PubMed
      • Straipsnis
      • „Google Scholar“
  80. 80.

    Nurk, S., Meleshko, D., Korobeynikov, A. & Pevzner, PA metaSPAdes: a new versatile metagenomic assembler. „Genome Res“. 27, 824–834 (2017).

      • PubMed
      • Straipsnis
      • „Google Scholar“

Atsisiųskite nuorodas

Padėkos

The Hungate1000 project was funded by the New Zealand Government in support of the Livestock Research Group of the Global Research Alliance on Agricultural Greenhouse Gases (//www.globalresearchalliance.org). The genome sequencing and analysis component of the project was supported by the US Department of Energy Joint Genome Institute (JGI) through their Community Science Program (CSP 612) under Contract No. DE-AC02-05CH11231, and used resources of the National Energy Research Scientific Computing Center, which is supported by the Office of Science of the US Department of Energy. This work was also supported in part by a grant to BH: European Union's Seventh Framework Program (FP/2007/2013)/European Research Council (ERC) Grant Agreement 322820. We thank all the JGI staff that contributed to this project including TBK Reddy, I. Pagani, E. Lobos, S. Mukherjee, A. Thomas, D. Stamatis and J. Bertsch for metadata curation, C.-L. Wei for sequencing, J. Han, A. Clum, B. Bushnell and A. Copeland for assembly, K. Mavromatis, M. Huntemann, G. Ovchinnikova and N. Mikhailova for annotation and submission to IMG, A. Chen, K. Chu, K. Palaniappan, M. Pillay, J. Huang, E. Szeto, D. Wu and V. Markowitz for additional annotation and integration into IMG, A. Schaumberg, E. Andersen, S. Hua, H. Nordberg, I. Dubchak, S. Wilson, A. Shahab for NCBI registrations and submission to INSDC, L. Goodwin, N. Shapiro and T. Tatum for project management, A. Visel for helpful comments on the manuscript and J. Bristow for supporting the project. We are grateful to J. White of Resphera Biosciences for assistance with using Metastats. We thank L. Olthof and G. Peck for isolating cultures that were included in this work. Mention of trade names or commercial products in this publication is solely for the purpose of providing specific information and does not imply recommendation or endorsement by the US Department of Agriculture. The project title refers to the pioneering work in culturing strictly anaerobic rumen bacteria carried out by Robert (Bob) E. Hungate, who trained many of New Zealand's first rumen microbiologists.

Integruota papildoma informacija

Papildomi skaičiai

  1. 1.

    Phylum and genome size distribution of the 501 Hungate catalogue genomes.

  2. 2.

    Carbohydrate degradative capabilities of the 501 Hungate catalogue genomes.

  3. 3.

    The most abundant CAZyme (glycoside hydrolase) families among 501 Hungate catalogue genomes.

  4. 4.

    Genomic view of the PUL for rhamnogalacturonan type II breakdown in B. thetaiotaomicron VPI-5482 and microsyntenic regions in the species studied in this work.

  5. 5.

    Distribution of genes encoding antimicrobial biosynthetic clusters (bacteriocins, lantipeptides and non-ribosomal peptide synthases) in the Hungate catalogue genomes

  6. 6.

    Protein recruitment plot showing amino acid % identity (y-axis) of top hits of Sharpea azabuensis DSM 18934 CDSs against metagenomic sequences from New Zealand sheep rumen samples.

  7. 7

    Recruitment of rumen metagenomes by Hungate catalogue genomes.

Papildoma informacija

PDF failai

  1. 1.

    Papildomas tekstas ir figūros

    Supplementary Figures 1–7

  2. 2.

    Life Sciences Reporting Summary

  3. 3.

    Supplementary Notes 1–4

„Excel“ failai

  1. 1.

    1 papildoma lentelė

    Cultures and their provenance.

  2. 2.

    2 papildoma lentelė

    Genome statistics for the 410 sequenced bacteria and archaea.

  3. 3.

    3 papildoma lentelė

    Genome sequencing projects for rumen microbes.

  4. 4.

    4 papildoma lentelė

    CAZyme analysis. GH, glycoside hydrolases; PL, polysaccharide lyases; ∼ GT, glycosyl transferases; DOC, dockerins, COH, cohesins; CE, carbohydrate esterases; CBM, carbohydrate-binding modules; AA, auxillary activities.

  5. 5.

    5 papildoma lentelė

    Metabolic strategies and metabolic pathways encoded by the Hungate catalogue genomes.

  6. 6.

    6 papildoma lentelė

    List of differentially abundant Pfams in enolase-positive versus enolasenegative strains of Butyrivibrio spp.

  7. 7

    7 papildoma lentelė

    Biosynthetic clusters identified in the Hungate catalogue genomes.

  8. 8.

    8 papildoma lentelė

    Hungate CRISPR spacer search results

  9. 9.

    Supplementary Table 9

    Protein recruitment results of rumen isolate CDS by individual metagenomes in IMG.

  10. 10.

    Supplementary Table 10

    List of 458 rumen isolates and 387 human intestinal isolates used for genome comparisons.

  11. 11.

    Supplementary Table 11

    List of Pfams that are over-represented (green highlight) or underrepresented (pink highlight) in the ruminal compared to the human intestinal isolate genomes.

  12. 12.

    Supplementary Table 12

    Occurrence of vitamin B12 biosynthetic pathway genes in the rumen isolate genomes. Green highlight indicates genomes with predicted de novo biosynthetic capability.

  13. 13.

    Supplementary Table 13

    List of Pfams that are over-represented (green highlight) or underrepresented (pink highlight) in the sheep ruminal metagenomes compared to the human intestinal metagenomes.