Minimali informacija apie genomo sekos (mig) specifikaciją | gamtos biotechnologijos

Minimali informacija apie genomo sekos (mig) specifikaciją | gamtos biotechnologijos

Anonim

Anotacija

Didėjant eksponentiniam genomo duomenų kiekiui, būtina, kad šie duomenys būtų kaupiami elektroniniu būdu, standartiniu formatu. Standartizacijos veikla turi būti vykdoma globojant atviros prieigos ir tarptautinėms darbo organizacijoms. Norėdami išspręsti geresnių genominių tyrimų aprašymų kūrimo problemas, mes sukūrėme Genomikos standartų konsorciumą (TGS). Čia pristatome minimalią informaciją apie genomo sekos (MIGS) specifikaciją, kad būtų skatinamas dalyvavimas jos kūrime ir aptariami ištekliai, kurių reikės tobulinant metaduomenų surinkimo ir mainų mechanizmus. Siekdamas platesnių tikslų, TGS taip pat remia esamose genomo duomenų bazėse esančios informacijos „skaidrumo“ gerinimą.

Pagrindinis

Daugybė genominių ir metagenominių sekų

Iki kitų metų pabaigos bus sukurtos visos genomo sekos, turinčios bent jau grimzlės kokybę daugiau nei 1000 bakterijų ir archajų bei 100 eukariotų 1, 2 ir dar didesniam skaičiui virusų, organelių ir plazmidžių. Sparčiai augant naujoms genomo sekoms, niekada nebuvo reikalo svarstyti, kaip geriausia užtikrinti šių duomenų valdymą ilguoju laikotarpiu.

Mūsų genomo kolekcija: daugiau nei jos dalių suma. Genominės informacijos analizė daro įtaką visoms gyvybės mokslų sritims ir už jos ribų. Genomo seka yra būtina sąlyga norint suprasti fenotipo molekulinius pagrindus, kaip jis vystosi bėgant laikui ir kaip mes galime juo manipuliuoti, kad pateiktume naujus kritinių problemų sprendimus. Tokie sprendimai apima gydymo ir ligų gydymo būdus, pramoninius produktus, ksenobiotinių junginių ir atsinaujinančių energijos šaltinių biologinio skaidymo metodus. Tobulinus sekos sudarymo technologijas, didėjant susidomėjimui metagenominiais metodais ir įrodyta palyginamų susijusių genomų grupių analizės galia, galime įsivaizduoti dieną, kai bus įprasta sekti dešimtis ar šimtus genomų ar daugiau kaip vieno tyrimo dalį. . Apskaičiuota, kad esant dabartiniam genomo sekos nustatymo greičiui netrukus po 2010 m. Bus galima rasti> 4000 bakterijų genomų (1 nuoroda).

Atsižvelgiant į augančios genomo kolekcijos svarbą, kapitalo investicijas į jo sukūrimą ir jos vertės padidinimo naudą atliekant įvairias lyginamąsias analizes, reikėtų dėti visas pastangas, kad būtų kuo tiksliau ir išsamiau aprašyta. Visuomenė vis labiau domisi tai daryti dėl trijų pagrindinių priežasčių. Pirmasis yra susidomėjimas hipotezių apie bromuose pastebėtus bruožus patikrinimu, naudojant lyginamuosius evo- ir ekogenominius metodus 3 . Antrasis yra poreikis papildyti įvairių duomenų bazių turinį aukšto lygio genomų aprašymais, kurie leidžia naudingai sugrupuoti, rūšiuoti ir ieškoti pagrindinių duomenų. Trečiasis yra aplinkos izoliatų ir metagenomų genomo sekos duomenų augimas - didžiuliai DNR fragmentų iš aplinkos mėginių duomenų rinkiniai, 4, 5, 6 . Tokių tyrimų metu sukaupti duomenys panaikins dabartines genominės informacijos saugyklas, todėl patobulinti genomų aprašymai taps dar svarbesni.

Šiuo metu tiek aukščiausio lygio aprašai, tiek genomo aprašymai yra neišsamūs dėl daugelio priežasčių. Visų pirma, pagaliau mes dabar žinome būtiniausią informacijos kokybę ir kiekį, reikalingą, kad kiekvienas aprašymas būtų tikslus, tikslus ir naudingas. Pvz., Net bakterijų ir archeologinių rūšių, turinčių teisingai paskelbtus pavadinimus, padermių pavadinimai nebuvo reguliariai užfiksuojami genomo anotacijos dokumentuose prieš nustatant daugybę genomų iš tos pačios rūšies 7, tačiau tokia informacija dabar laikoma esmine. Atlikdami empirinius stebėjimus, plečiame savo požiūrį į informacijos rūšis, kurios yra svarbios tikrinant tam tikras hipotezes, tiriant naujus modelius ir kiekybiškai įvertinant būdingą imties paklaidą 3, 8 .

Didėjant buveinių ir bendruomenių, atrinktų naudojant metagenominius metodus, skaičiui, mes taip pat esame priversti permąstyti savo supratimą apie būtiniausią informaciją, reikalingą tinkamai apibūdinti genomo seką. Nepakankamai aprašius aplinkos kontekstą ir panaudotus eksperimentinius metodus, tokie duomenų rinkiniai bus mažiau vertingi tyrėjams, norintiems atlikti lyginamuosius genominius tyrimus arba susieti genetinį potencialą su organizmų įvairove ir gausa. Tiesą sakant, atsižvelgiant į daugybę nekultūruotų mikrobų, gali būti, kad į DNR orientuotas metodas, kuriame genai yra susieti su buveinėmis (vietomis), yra naudingesnis nei į rūšis orientuotas vaizdas 9, 10 . Galiausiai, sekos darymo technologija sparčiai tobulėja, ir, priėmus naujus metodus 11, 13, teks priversti priimti papildomus aprašus (pvz., Sekos aprėpties gylį, kokybę ir tai, ar buvo naudojamas „baigimas“), kad būtų galima atskirti juos. metodai.

Dažniausiai genomo sekų metaduomenys randami tik pirminėje literatūroje arba nuorodiniuose darbuose, tokiuose kaip Bergey vadovas 14 dėl bakterijų ir archajų, o ne sekų duomenų bazėse. Pasiskirstytas ir fragmentiškas šios informacijos pobūdis ir sunkumai sukaupti net keletą informacijos apie dabar labai didelius genomų rinkinius daro labai pageidaujamą vieno galutinio turtingo genomo aprašymo šaltinio viziją.

Koordinuotų pastangų poreikis

Palengvinus ir pagreitinus atitinkamų metaduomenų rinkimo procesą, būtų aiškiai sumažintas nuolatinis pastangų kartojimas ir maksimaliai padidintos galimybės keistis duomenimis ir juos integruoti genomikos bendruomenėje. Akivaizdus sprendimas yra sukurti konsensuso principą.

Genominių standartų konsorciumas. TGS yra atviro narystės tarptautinė darbo įstaiga, suformuota 2005 m. Rugsėjo mėn. (Nuoroda 15). Jos tikslas yra skatinti mechanizmus, kurie standartizuoja genomų aprašymą ir keitimąsi genų duomenimis bei jų integraciją. TGS bendruomenė vienija (i) evoliucionistus, ekologus, molekulinius biologus ir kitus tyrinėtojus, analizuojančius genomų kolekcijas, (ii) bioinformatikus, kuriančius genomo duomenų bazes, (iii) tuos, kurie seka genomus, ir (iv) kompiuterių mokslininkus, ontologijos ekspertus ir kitus narius. standartizacijos iniciatyvos, tokios kaip Tarptautinis branduolinių sekų duomenų bazės bendradarbiavimas (INSDC), kuris yra atsakingas už Japonijos DNR duomenų banką (DDBJ), Europos molekulinės biologijos laboratoriją (EMBL) ir „GenBank“ duomenų bazes (//www.insdc.org/). DDBJ, EMBL ir „GenBank“ nurodymai bus labai svarbūs TGS iniciatyvos sėkmei tiek dėl to, kad jie yra oficialūs viešo genomo kolekcijos tvarkytojai, tiek dėl jų pomėgio tenkinti bendruomenės poreikius.

Minimali informacija apie genomus ir metagenomas

TGS siekia apibrėžti genomų ir metagenomų pagrindinių aprašų rinkinį MIGS specifikacijos forma (1 pav.). MIGS išplečia būtiniausią INSDC jau surinktą informaciją. MIGS kontrolinis sąrašas pateiktas 1 langelyje, o naujausią versiją galima rasti konsorciumo svetainėje (//gensc.sf.net). MIGS reikalavimus atitinkančių ataskaitų pavyzdžiai pateikiami 1 papildomoje lentelėje internete. Informacija, kurios reikia, kad būtų laikomasi MIGS, įprastai įtraukiama į pirminius genomo leidinius (arba juose daroma nuoroda). Tačiau norint pagerinti jos prieinamumą 16, ši informacija turi būti įforminta ir prieinama elektronine forma (2 langelis).

Image

MIGS specifikacija leidžia aprašyti visą galimų genomų (eukariotų, bakterijų, archajų, plazmidų, virusų, organelių) ir metagenomų spektrą. Pagrindinius aprašus sudaro informacija apie nukleorūgščių sekos (genomo) kilmę, jos aplinką (platuma ir ilguma, mėginių ėmimo data ir laikas bei buveinė) ir sekų apdorojimą (sekos nustatymo ir surinkimo metodai). Su MIGS suderinamas ataskaitas galima pateikti į elektroninį formatą, naudojant MIGS XML schemą ir kontroliuojamus žodynus, naudojant Tarybos generalinio sekretoriato genomo katalogą (//gensc.sf.net).

Visas dydis

Image

Žemiau atsakome į bendruosius klausimus apie MIGS, jo plėtrą ir kaip juo naudotis.

Kas yra MIGS?

  • MIGS nurodo oficialų būdą aprašyti genomus ir metagenomas išsamiau, nei šiuo metu užfiksuota DDBJ, EMBL ir „GenBank“ dokumentuose.

  • MIGS informacija yra skirta panaudoti lyginamoje genomo analizėje, suteikti geresnį kiekvieno genomo šaltinio supratimą ir sudaryti sąlygas nustatyti genomus ir metagenomas jų geoerdviniuose ir laikiniuose kontekstuose (kai tinka), nurodant geografinę vietą ir imant pavyzdžius. data.

Ar visi genomai ir metagenomos patenka į MIGS taikymo sritį?

  • Taip. MIGS turi elementus, apibūdinančius eukariotinius, bakterinius ir archeologinius, plazmidinius, virusinius ir organelinius genomus, taip pat metagenomas. Kai kurie pagrindiniai elementai sutampa tarp įrašų tipų, o kai kurie yra unikalūs vienai ar kelioms grupėms.

Kas paskatino MIGS plėtrą?

  • MIGS buvo sukurta per keletą TGS seminarų, kuriuose dalyvavo DDBJ, EMBL, JAV nacionalinio biotechnologijų informacijos centro (NCBI), Europos bioinformatikos instituto (EBI), Jungtinio genomo instituto (JGI), Sangerio instituto, J. Craigo Venterio instituto dalyviai. (JCVI, buvęs TIGR), Makso Plancko institutas, Bendruomenės kibernetinės infrastruktūros, skirtos pažengusiems jūrinių mikrobų ekologijos tyrimams ir analizei (CAMERA), projektas ir daugybė kitų mokslinių tyrimų institucijų.

Kas turėtų užpildyti MIGS ataskaitą?

  • Pateikę projekto informaciją DDBJ, EMBL ar „Genbank“, genomo ir metagenomo publikacijų autoriai turėtų pateikti ataskaitą.

Ar MIGS atlikti reikia labai daug laiko?

  • MIGS yra trumpa specifikacija, palyginti su daugeliu kitų „-omic“ kontrolinių sąrašų (žr. //Mibbi.sf.net) dėl trijų priežasčių:

  • MIGS yra duomenų, kuriuos jau užfiksavo DBBJ, EMBL ir Genbank, išplėtimas, kad būtų aprašyti genomai ir metagenomos, ir yra skirtas papildyti šiuos autoritetingus metaduomenų šaltinius. INSDC genomo projekto duomenų bazėje bus esminė administracinė informacija, taksonomijos identifikatoriai (taksidarai) ir genomo projekto identifikatorius (PID).

  • MIGS buvo sąmoningai sukurta kaip „minimali“, kad būtų skatinama ją priimti.

  • Genominės sekos, skirtingai nuo transkriptų, proteomų ar metabolomų, yra „nepriklausomos nuo būklės“ (genomo seka yra stabili ląstelių būklės ir aplinkos veiksnių atžvilgiu). Metagenominiai eksperimentai, priešingai, priklauso nuo mėginių ėmimo strategijos ir konkrečios mikrobų bendrijos buveinės, todėl reikia papildomos specifikacijos (MIMS), kad būtų apibrėžti buveinių parametrai, tokie kaip druskingumas, pH ir temperatūra.

Kaip galiu gauti unikalų identifikatorių, kurį naudodamas pateiksiu savo publikacijai?

  • „Genomų internetinė duomenų bazė“ (//www.genomesonline.org) yra pripažinta institucija, išduodanti „GCat“ identifikatorius eukariotams, bakterijoms ir archajai bei metagenomoms. Genomo katalogas (GCat) išduos kitų genomų identifikatorius.

Ar galiu internetu pateikti MIGS reikalavimus atitinkančią informaciją?

  • Taip. TGS sukūrė portalą, pavadintą „Genomo katalogas“, kuris buvo naudingas kuriant MIGS specifikaciją. Su MIGS suderinamą informaciją galima pateikti patogiose interneto formose su išskleidžiamaisiais meniu, kad būtų galima pasirinkti tinkamas sąlygas; Kuriamos paketinio įkėlimo funkcijos (//gensc.sf.net).

Ar yra ataskaitų pavyzdžių?

  • Taip, „Genomo“ kataloge yra su MIGS suderinamų ataskaitų kolekcija. Pavyzdžiai pateikti 1 papildomoje lentelėje.

Kaip pranešti apie MIGS reikalavimus atitinkančių duomenų egzistavimą savo leidinyje?

  • Informacija, atitinkanti MIGS, gali būti pateikta kaip papildoma leidinio lentelė. Daug naudingiau platesnei bendruomenei būtų pateikti šią informaciją į „Genomo katalogą“ ir pranešti apie „GCat“ identifikatorių bei šios duomenų bazės URL.

Kaip galiu dalyvauti TGS ir pateikti grįžtamąjį ryšį kuriant MIGS?

  • TGS paskelbė atvirą kvietimą dalyvauti. Daugiau informacijos galite rasti svetainėje //gensc.sf.net.

Nuo tada, kai iš pradžių buvo pasiūlyta 16, TGS supaprastino ir pakeitė MIGS specifikaciją atlikdamas pakartotinį pakeitimo procesą, kad apimtų (i) tik kuruojamą informaciją, kurios neįmanoma apskaičiuoti pagal neapdorotą genomo seką, ir (ii) pagrindinius pagrindiniams deskriptoriams būdingus pagrindinius taksonus grupės (eukariotai, bakterijos ir archaja 17, plazmidės, virusai, organelės) ir metagenomos. Remiantis Biologinių tyrimų ataskaitų struktūrų (RSBI) darbo grupės rekomendacija moduliuoti kontrolinius sąrašus 18, 19, MIGS struktūra yra „tyrimas“, kurį sudaro „tyrimas“ ir „tyrimas“. Skyriuje „Tyrimas“ pateikiamos aukščiausio lygio sąvokos „Aplinka“ ir „Nukleorūgščių seka“, o dalyje „Tyrimas“ aprašomas sekos nustatymo technologijos aprašymas.

MIGS siekia remti nenukreiptą prieigą prie genominių reagentų (tokių kaip padermės) 20, visą (meta) genomo kolekciją sudėti į geoerdvinį ir laiko kontekstą (platumą, ilgumą, aukštį ar gylį, mėginių ėmimo datą ir laiką) ir pateikti esminę informaciją apie naudojamas eksperimentinis metodas (pvz., sekos nustatymo metodas). MIGS taip pat suteikia papildomos informacijos, kuri laikoma „minimalia“, kaupimo konkrečioms bendruomenėms sistemą. Svarbiausia, kad MIGS metagenomų aprašymas yra išplėstas pateikiant minimalią informaciją apie metagenomų sekos (MIMS) specifikaciją 21 . MIMS leidžia surinkti kitus matavimus, apibrėžiančius buveinę (pvz., Temperatūrą, druskingumą, pH, ištirpusią organinę anglį) ir išplečiančią pradinę MIGS struktūrą apibūdinant vieną (meta) genominį eksperimentą, kad būtų galima surinkti informaciją iš sujungtų mėginių ir dar daugiau. nei vienas nepriklausomas mėginių ėmimo įvykis (pvz., mėginių ėmimas išilgai 4 transekto).

Tai, kaip aprašomos genomos ir metagenomos viešosiose duomenų bazėse, paaiškėjo, kaip aprašomos trumpos, paprastos DNR sekos, neskiriant ypatingo dėmesio informacijai, pavyzdžiui, sekos geografinei kilmei. INSDC imasi reikšmingų pastangų pritaikyti ir išplėsti genomų aprašymo infrastruktūrą, naudodamasi genomo projekto metaduomenų iniciatyva 22 . INSDC pastangos yra atviros evoliucijai, nors ir konservatyviu tempu 22, ir TGS viliasi, kad daug, jei ne visos, MIGS specifikacijos bus įtrauktos į „Genomo projekto metaduomenų“ iniciatyvą. Buvo sukurtas žemėlapis tarp INSDC funkcijų ir MIGS, skirtas MIGS informacijai patalpinti į INSDC dokumentus, ir ją galima rasti mūsų svetainėje. Bet kuriuos laukus, kurie dar nėra oficialiai apibrėžti INSDC funkcijų lentelės dokumente (//www.insdc.org/files/documents/feature_table.html), galima pavaizduoti struktūrizuotame komentarų bloke INSDC įrašuose 22 .

Genomo katalogas

Bet kurio kontrolinio sąrašo sudarymas turi būti atviras ir pasikartojantis procesas, apimantis subalansuotą dalyvių grupę. Be to, siekiant palengvinti platų kontrolinio sąrašo priėmimą, reikia atitikties užtikrinimo mechanizmų. Tokie mechanizmai apima tinkamą duomenų (failų formatų), programinės įrangos, duomenų bazių fiksavimo ir keitimosi jais ataskaitų teikimo struktūrą, tinkamus kontroliuojamus žodynus ir (arba) ontologijas, siekiant apibrėžti anotuose vartojamus terminus. TGS siekia šių bendrų tikslų ir sukūrė internetinę MIGS reikalavimus atitinkančių ataskaitų fiksavimo sistemą (//gensc.sf.net).

Trumpai tariant, mes įdiegėme kontrolinį sąrašą kaip XML schemą ir sukūrėme laisvai prieinamą Genomo katalogo (GCat) sistemą (//gensc.sf.net). „GCat“ yra sukurtas formoms automatiškai generuoti ir „skristi“ pagal šią schemą duomenų įvedimo tikslais. Tai taip pat leidžia vartotojams peržiūrėti ir ieškoti genomo aprašų, kai jie kaupiasi tobulinant MIGS kontrolinį sąrašą. „GCat“ sistema yra bendro pobūdžio ir galėtų būti taikoma fiksuojant išraiškingesnius genomų pogrupių metaduomenis. Iš tiesų, jis yra pakankamai lankstus, kad palaikytų bet kokio kontrolinio sąrašo, kuris gali būti struktūrizuotas kaip tinkama XML schema, įgyvendinimą (MIGS.xsd, plėtojamą į genominių kontekstinių duomenų žymėjimo kalbą (GCDML)). TGS taip pat dirba kontroliuojamo žodyno ir ontologijos tobulinimo srityje, derindamas kontroliuojamus žodynus, kurie jau naudojami visuomenėje, ir prisidedant prie Ontologijos biomedicininiams tyrimams (OBI, anksčiau žinomo kaip Funkcinių genomikos tyrimų ontologija (FuGO) 23 ) . ) ir Aplinkos ontologijos (EnvO) projektas (//environmentontology.org). Kaip šio proceso dalį „GCat“ naudoja esamus kontroliuojamus žodyno terminus ir priima naujus terminus.

Tobulinti genomo duomenų bazes

Pagal projektą MIGS yra tik pirminė, kuruojama informacija. Taip yra todėl, kad antrinė arba išvestinė informacija, kurią galima apskaičiuoti pagal genomo seką, dažnai keičiasi, ji gali būti sugeneruota naudojant daugiau nei vieną metodą ir turėtų būti gaunama tiesiogiai iš tų, kurie rengia skaičiavimus. Vis dėlto prieiga prie apskaičiuotos informacijos (pvz., Paprasčiausiais atvejais G + C kiekis arba bendras numatomų baltymų skaičius) turėtų būti kuo lengvesnė.

Genominės sekos ir jų pradinės anotacijos turi būti pateiktos INSDC (//www.insdc.org/) (ir paskesnės aukštos kokybės, kuruojamos anotacijos, gautos atlikus empirinius stebėjimus Trečiosios šalies anotacijos duomenų rinkiniui 24 ), tačiau visada yra daugėja genominių duomenų bazių, turinčių daugybę papildomų skaičiavimų. Nors TGS nepatvirtina jokio konkretaus analizės metodo ar duomenų bazės, jis palaiko didesnį tokių išteklių skaidrumą siekiant tikslaus duomenų aiškinimo ir integravimo.

Pirmasis klausimas yra keitimasis apskaičiuota informacija. Tai iš dalies galėtų palengvinti plačiai pritaikytas bendras keitimosi formatas, pavyzdžiui, 3-iojo bendrojo turinio formato (GFF3) failo formatas (//song.sourceforge.net/gff3.shtml). Yra daugybė įrankių, palaikančių įvairių tipų failų formatavimą į GFF3, taigi duomenų bazių teikėjams būtų lengva sukurti tinkamus failus. Galimybė naudotis plačiu rinkinių įrankiu, skirtu GFF3 formato failų paskesnei analizei, taip pat reiškia, kad vartotojai, tirdami tam tikrą genomą, galėjo sujungti daugelio šaltinių įrodymų svarbą. Tai galėtų atskleisti sisteminio šališkumo atvejus ir dėl to būtų geresnės genomo anotacijos, nes būtų daugiau kompozicinių ypatybių ir būtų galima pabrėžti prieštaringus komentarus, kad būtų galima juos išspręsti.

Keitimasis duomenimis taip pat priklauso nuo bendrų skaičiavimo analizės standartų, o nepaisant formato, nepakanka palaikyti duomenų atsisiuntimą. Duomenų šaltiniai taip pat turėtų tikėtis, kad dėl pagrįstų priežasčių bus pateiktos aiškios duomenų generavimo specifikacijos (pavyzdžiui, standartinės darbo procedūros (SOP), apibūdinančios tokius skaičiavimus kaip genų numatymas ir operono bei ortologo identifikavimas). Vienas iš tokio tipo dokumentų pavyzdžių yra „ AboutIMG“ - internetiniame integruotų mikrobų genomų (IMG) sistemos aprašyme 25 .

Ateityje turėtų būti daug paprasčiau derinti įvairius genomo požymius, tikslią informaciją apie tai, kaip jie buvo sukurti, ir pakankamai informacijos apie analizės kilmę (kilmę), kad būtų galima skaidriai keistis duomenimis iš skirtingų šaltinių. Tokia sąveika, ypač kai ji teikiama dalyvaujančiose duomenų bazėse tokiu būdu, kuris leistų automatiškai surinkti duomenis (pvz., Naudojantis interneto paslaugų technologija), daug kartų padidintų individualią šių duomenų bazių vertę ir atvertų naujas galimybes ištirti genomo sekas precedento neturinti detalė.

Ateities kryptys

Reikia daug pastangų, kad būtų pasiektas čia nurodytas skaidrumo laipsnis, tačiau ji teikia didelę ir tiesioginę naudą. Mes tvirtiname, kad tokio standartizavimo išlaidos yra nereikšmingos, palyginti su sumomis, išleistomis duomenims kaupti. MIGS reikalavimus atitinkančios informacijos fiksavimas ne tik palengvins lyginamąją genominę ir metagenominę analizes, bet ir pagerins turimus paskesnių „-ominių“ eksperimentų, pagrįstų genomo duomenimis, aprašymus. Tai taip pat sustiprins žymiai didesnes 16S ribosomų RNR sekų „halos“, kurios dabar prieinamos daugeliui sekvenuotų genomų ir metagenomų. Pavyzdžiui, jūrinės bakterijos Silicibacter pomeroyi 26 genomo seka yra „įterpta“ į daugybę aplinkosauginių 16S rRNR sekų, susijusių su „Roseobacter“ linija, prie kurios pridedama gana plati literatūra, apibūdinanti šios rūšies pasiskirstymą, ekologiją ir kitas savybes. 27 grupė.

Tęsdamas savo pastangas, TGS tikisi paskatinti diskusiją apie MIGS specifikaciją ir paprašyti tolesnių bendruomenės atsiliepimų. Todėl jame skelbiamas atviras kvietimas dalyvauti ir jis nori paprašyti MIGS suderinamų genomo ataskaitų (įskaitant paketų įkėlimą) ir surinkti atitinkamus kontroliuojamus žodyno terminus, naudingus genomų ir metagenomų aprašyme. „GCat“ identifikatoriai buvo įdiegti ir yra prieinami ankstesniems ar būsimiems projektams, o MIGS reikalavimus atitinkančios genomo ataskaitos pradedamos teikti internete (pvz., Nuorodos 28, 29, 30, 31). Mes tikimės, kad MIGS (2.0) versija bus išleista iki 2008 m. Pradžios su tinkamais terminų rinkiniais, įteisintais OBI 19 ir kitose susijusiose atvirosios biomedicininės ontologijos (//obofoundry.org/) ontologijose. Tikimės, kad šį etapą (MIGS 2.0 išleidimą) lydės žurnalų pripažinimas ir įgyvendinimas įvairiose duomenų bazėse. Be to, MIGS specifikacija turėtų išlikti pakankamai lanksti, kad ją būtų galima peržiūrėti atsižvelgiant į technologijos pažangą ir mūsų biologines žinias. Be to, turėtų būti svarstoma galimybė jį naudoti kartu su kitais kontroliniais sąrašais atsižvelgiant į būtiniausios informacijos apie biomedicininių ar biologinių tyrimų (MIBBI) liejyklą (//mibbi.sf.net), kurios TGS yra steigiamoji bendruomenė 19, kontekstą. Naujausią informaciją apie TGS veiklą galima rasti mūsų svetainėje (//gensc.sf.net).

Pastaba: papildomą informaciją galima rasti „Nature Biotechnology“ tinklalapyje .

Atsisakymas

Šiame darbe pateiktos nuomonės, išvados ir išvados ar rekomendacijos yra autorių nuomonės, nebūtinai atspindinčios JAV nacionalinio mokslo fondo nuomonę.

Papildoma informacija

„Word“ dokumentai

  1. 1.

    Papildomas tekstas ir figūros

    1 papildoma lentelė