Cirkadinių ir apskritiminių laiko adaptacijų genomo pagrindas viduryje | gamta

Cirkadinių ir apskritiminių laiko adaptacijų genomo pagrindas viduryje | gamta

Anonim

Dalykai

  • Cirkadinis reguliavimas
  • Ekologinė genetika
  • Evoliucinė genetika
  • Genomas

Anotacija

Organizmai naudoja endogeninius laikrodžius norėdami numatyti įprastus aplinkos ciklus, tokius kaip dienos ir atoslūgiai. Natūralūs variantai, sąlygojantys skirtingą laiko elgesį ar fiziologiją, žmonėms žinomi kaip chronotipai, nebuvo tinkamai apibūdinti molekuliniu lygmeniu. Mes sekvenavome Clunio marinus , jūrinio midgeno , kurio reprodukcijai laikas yra cirkadiniai ir žiediniai laikrodžiai, genomą. Varpeliai iš skirtingų vietų rodo tam tikros padermės genetinę laiko adaptaciją. Mes ištyrėme penkių C. marinus padermių, esančių skirtingose ​​vietose, genetinius pokyčius ir nubrėžėme kiekybinius bruožų lokusus žiediniam ir cirkadiniam chronotipams. Regionas, labiausiai susijęs su cirkadiniais chronotipais, sukuria kamienams būdingus nuo kalcio / kalmodulino priklausomos kinazės II.1 (CaMKII.1) splaisos variantų gausos skirtumus. Kadangi buvo parodyta, kad lygiaverčiai variantai keičia CaMKII aktyvumą Drosophila melanogaster , o C. marinus ( Cma ) - CaMKII.1 padidina cirkadinių baltymų Cma- CLOCK ir Cma- CYCLE dimerų transkripcinį aktyvumą, mes siūlome moduliuoti alternatyvųjį splaisą. yra natūralus prisitaikymo prie paros laiko mechanizmas.

Pagrindinis

Aplink jaunatį ar pilnatį, per kelias konkrečias valandas, kai banga yra atoslūgis, milijonai C. marinus rūšies nesikandžiojančių midges iš jūros iškeliauja atlikdami savo vestuvinį šokį. Suaugusieji gyvena tik keletą valandų, per kurias jie poruojasi ir kiaušinėja. Todėl jie turi atsirasti sinchroniškai ir - atsižvelgiant į tai, kad embrionai, lervos ir vyzdžiai vystosi jūroje - tuo metu, kai kraštutiniai potvyniai patikimai atskleidžia lervos buveinę. Mažiausi atoslūgiai numatomi tam tikromis mėnulio dienomis tam tikru dienos metu. Taigi suaugusiųjų atsiradimą C. marinus kontroliuoja žiediniai ir dieniniai laikrodžiai 1, 2 . Pažymėtina, kad nors mažiausi atoslūgiai tam tikroje vietoje nuolat pasikartoja, jų laikas skirtingose ​​geografinėse vietose skiriasi 3 . Taigi, C. marinus padermės iš skirtingų vietų (išplėstiniai duomenys, 1a pav.) Rodo vietinę adaptaciją per parą ir cirkadinius atsiradimo laikus (išplėstiniai duomenys. 1b, c pav.). Kryžminimai tarp Jean ir Por kamienų parodė, kad cirkadinio ir žiedinio laiko skirtumai yra genetiškai nustatyti 4, 5 ir didžiąja dalimi paaiškinami dviem cirkadinio ir dviejų cirkadunarinių kiekybinių bruožų lokusais (QTL) 6 .

Laiko kitimo ar chronotipų tyrimai su gyvūnais ir žmonėmis dažnai buvo nukreipti į genus kandidatus iš cirkadinio transkripcijos-transliacinio osciliatoriaus. D. melanogasterio polimorfizmai pagrindiniame cirkadinio laikrodžio genų laikotarpyje , nesenstantis ir kriptochromas yra siejami su adaptaciniais temperatūros kompensavimo skirtumais 7, cirkadinio laikrodžio fotojautrumu 8 ir atsiradimo ritmais 9 . Nors šie tyrimai suteikia įžvalgos apie žinomų cirkadinio laikrodžio molekulių evoliuciją, genomo asociacijų tyrimai 10, 11 ir kiti pirmieji genetiniai metodai (apžvelgti 12 nuorodoje ) yra būtini norint pateikti išsamų, nešališką natūralių laiko kitimo vertinimą. pvz., žmogaus miego fazės sutrikimai. Nors žmogaus chronotipų adaptyvusis pobūdis išlieka neaiškus, C. marinus chronotipai rodo evoliucinius prisitaikymus prie jų buveinių. Mūsų tyrimo tikslas buvo nustatyti genetinį C. marinus adaptacijos prie jos specifinės ekologinės „laiko nišos“ pagrindą. Be to, adaptacinių natūralių ne cirkadinių ritmų 13 variantų, kaip ir C. marinus, genetinis išpjaustymas gali padėti patekti į nežinomus jų molekulinius mechanizmus.

Kaip šių analizių išeities tašką mes surikiuoti, surinkti, pažymėti ir pažymėti C. marinus pamatinį genomą.

„ Clunio“ genomas ir QTL pagal laiką

Mūsų etaloniniame „Jean“ laboratorijos štamo CLUMA_1.0 genome buvo 85, 6 Mb sekos (1 lentelė), artimas ankstesniam srauto citometrijos pagrįstu 95 MB 6 įvertinimu, pabrėždamas, kad chironomidai paprastai turi mažus genomus - 14, 15, 16 . Galutinis mazgas N50 turi 1, 9 Mb pastolius. Atlikus genomo mastelį kartografinės šeimos, kuriai būdinga su restrikcijos vieta susijusi DNR seka, genotipas leido nuosekliai įtvirtinti 92% pamatinės sekos išilgai genetinių ryšių žemėlapio (1a pav. Ir išplėstiniai duomenys 2 pav.), Pagerindamas pradinį jungčių žemėlapį (Papildomas 5 metodai). Automatizuota genomo anotacija leido gauti 21 672 genų modelius. Baltymų panašumas ir turimi nuorašai palaiko 14 041 genų modelį (1 papildoma lentelė), atsižvelgiant į D. melanogaster (15 507) ir Anopheles gambiae (13 460) genų skaičių. Taigi labai mažas C. marinus genomas atrodo baigtas (1 lentelė, išplėstiniai duomenys, 3 pav., 1 papildoma pastaba ir 2 papildoma lentelė). C. marinus pamatinis genomas padaro chironomidus trečiuoju dipteranų pošeimiu su anotuotu genomu, rekonstruotu pagal chromosomų skalę (1a pav. Ir išplėstiniai duomenys, 2, 3b – f pav.).

Pilno dydžio lentelė

Image

a . Trys C. marinus jungčių grupės su etaloniniais pastoliais (dešinėje), pritvirtintos genetinių ryšių žemėlapyje (kairėje). Užsakyti ir orientuoti pastoliai, juodos juostos; neorientuoti, pilkos juostos; nei užsakyta, nei orientuota, baltos juostos. Pilki šešėliai, dideli nerekombinuoti regionai. QTL, cirkadinis (oranžinis), žiedinis (cianinis). Vienas cirkadinis ir žiedinis QTL sutampa, todėl susidaro trys fizinės QTL sritys (atitinkamai C1 / L1, C2 ir L2, atitinkamai violetinė, oranžinė ir cianinė). b, QTL C2 populiacijos genominė analizė. Por ir Jean kamienų analizė (atitinkamai mėlynos ir raudonos spalvos viduryje dviejose plokštėse). Viršutinis skydelis, genetinis diferenciacija pavieniams SNP (raudoni taškai) ir 5 kb languose (juoda linija). Antrasis skydas, genetinė įvairovė ( θ ) 20 kb (plona linija) ir 200 kb (stora linija) languose. Trečias skydelis, sujungimo pusiausvyra ( r 2 ) 100 kb langais. Apatinė plokštė, genetinės diferenciacijos koreliacijos balas (CS) su cirkadinio laiko (viršuje), apskritojo laiko nustatymo (viduryje) ir geografinio atstumo (apačioje) vertėmis Vigo, Jean, Por, He ir Ber kamienams. Apatiniai numeriai, pastolių ID. Norėdami gauti daugiau informacijos, įskaitant QTL C1 / L1 ir L2, žiūrėkite išplėstinius duomenis 5a, b pav.

Visas dydis

  • Atsisiųskite „PowerPoint“ skaidrę

Mes atlikome pagrindinį genomo apibūdinimą ir palyginimą su kitais dipteranais. Mes apibrėžėme penkias C. marinus chromosomos dalis (2 papildoma pastaba, išplėstinių duomenų 3c pav. Ir 3 papildoma lentelė) ir homologizavome jas D. melanogaster ir A. gambiae sintezės palyginimais (išplėstiniai duomenys 3 ir 4 pav., 2 papildomoji pastaba ir 2 papildoma pastaba). 3 lentelė). Taip pat mes aptikome į ZW panašų lytį turinčią lokusą C. marinus 6 išorėje, be X chromosomos homologo (2 papildoma pastaba) ir nustatėme padidėjusį chromosomų pertvarkymo greitį (1a pav., 3 papildoma pastaba ir išplėstiniai duomenys 2 pav.), 3b – f, 4). Bendrai kalbant, C. marinus pamatinis genomas atrodo gerai surinktas.

Kitas žingsnis nustatant cirkadinių ir apskritiminių laiko adaptacijų molekulinius pagrindus C. marinus , mes patikslinome anksčiau identifikuotas laiko QTL 6 pozicijas, remdamiesi naujais didelio tankio, su restrikcijos vieta susietais DNR sekos žymekliais (4 ir 4 lentelės papildymai). 4 papildomoji pastaba) ir nustatė etaloninę seką, atitinkančią QTL patikimumo intervalus (1 pav., Oranžinės ir cianinės juostos; 4 papildomoji lentelė). Nei vienas iš pagrindinių cirkadinio laikrodžio genų nebuvo rastas šiuose QTL (1a pav.). QTL yra tik „ timeout / timeless2“ , nesenstantis homologas, turintis nedidelį vaidmenį cirkadinio laikrodžio atkuriant 17 -ą.

Genetinė Clunio laiko padermių variacija

Tada mes dar kartą nustatėme Por ir Jean padermes (išplėstiniai duomenys, 1 pav.), Kuriai buvo atlikta pradinė QTL analizė 6 . Dviejų 300 lauke sugautų individų telkiniai buvo suskaidyti> 240 kartų didesniu mastu (5 papildoma lentelė). Atvaizduojant etaloninį genomą, buvo nustatyti 1 010 052 vieno nukleotido polimorfizmai (SNP), iš kurių 72% buvo tiek Por, tiek Jean padermėse. Remdamiesi visais SNP, nustatėme genetinę diferenciaciją ( F ST ), genetinę įvairovę ( θ ) ir trumpo nuotolio ryšių pusiausvyrą (matuojant kaip r 2 ) (1b pav. Ir išplėstiniai duomenys 3c, 5a, b pav.).

Geno masto genetinė diferenciacija tarp Por ir Jean padermių yra vidutinio sunkumo ( F ST = 0, 11), ir tai yra geras pagrindas tikrinti genomą, atsižvelgiant į genetinį skirtumą, atsižvelgiant į vietinį laiko pritaikymą. Remiantis QTL analize, du cirkadiniai QTL paaiškina 85% dienos laiko skirtumo, o du apskritiminiai QTL paaiškina visą mėnesio laiko skirtumą (papildoma 4 lentelė ir 6 nuoroda). Kadangi kiekvienas lokusas daro stiprų poveikį laiko nustatymui, atranka pagal netinkamai adaptuotus alelius turi būti stipri, o laiko lokusai turi būti stipriai diferencijuoti.

QTL patikimumo intervaluose 158 SNP ir 106 indeliai (įterpimai ar išbraukimai) yra stipriai diferencijuojami ( F ST ≥ 0, 8; 1b pav. Ir išplėstiniai duomenys 5 pav.; SNP, raudoni taškai F ST skydeliuose, visame genome) palyginimą (žr. 5 papildomą pastabą). Remdamiesi jų artumu diferencijuotiems SNP ir indeliams, QTL sudarėme kandidatų genų, galinčių parodyti cirkadinių ir žiedinių laiko planavimo adaptacijų sąrašą (6 papildoma lentelė). Genai kandidatai neturi pagrindinių branduolio Cirkadinio laikrodžio genų ( timeless2 / timeout , maks. F ST ≤ 0, 5; F ST = 0, 07) ir nėra praturtinti tam tikru keliu (geno ontologijos terminų analizė; 7 papildoma lentelė).

Laiko fenotipas su genotipo koreliacija

Darant prielaidą, kad alelius, susijusius su laiko adaptacija, tikriausiai sukėlė nuolatinė genetinė variacija (5 papildomoji pastaba), genetiniai variacijos laiko lokusuose neturėtų laisvai skirtis tarp padermių, o padermės, turinčios panašų laiką, turėtų dalytis funkciškai reikšmingais aleliais. Norėdami identifikuoti tokius lokusus, mes išplėtėme genomo ekraną iki trijų papildomų atmainų: iš Vigo (Vigo), Helgoland (He) ir Bergen (Ber; Išplėstinių duomenų 1 pav. Ir 5 ir 8 papildomos lentelės). Tada mes išbandėme visas penkias paeiliui padermes tarp genetinės diferenciacijos ( F ST ) ir laiko skirtumų arba geografinių atstumų kaip nulio modelį (8 papildoma lentelė).

Apskritai, genomo masto genetinė diferenciacija nebuvo koreliuojama su cirkadinių ( r = 0, 10, P = 0, 31) ar žiedinių ( r = 0, 56, P = 0, 12) laiko skirtumais, bet su geografiniu atstumu („izoliacija pagal atstumą“; r = 0, 88). P = 0, 008). Atsižvelgiant į šį genomo foninį izoliacijos pagal atstumą signalą, mes 5 ekrano slenkamaisiais langais tikrinome genomą, kad būtų nustatyta koreliacijos tarp genetinės diferenciacijos ir laiko smailės vertės, gaudami koreliacijos balą (1b pav. Ir išplėstiniai duomenys 5a, b pav., CS plokštės)., balas nuo 0 iki 5; daugiau informacijos rasite metoduose). Derinant įrodymus, gautus iš F ST ekrano „Por versus Jean“ padermės (6 papildoma lentelė), su šiais laiko ir genetinio skirtumo koreliacijos modeliais, kandidatų genų sąrašas sumažėjo iki 49 genų (9 papildoma lentelė).

Visų pirma, vienas rajonas Cirkadiniame QTL C2 buvo ryškiai diferencijuotas (1b pav.). Šiame regione porų štamo jungties pusiausvyra buvo žymiai padidėjusi (permutacijos testas; P = 0, 002), o genetinė įvairovė reikšmingai sumažėjo kai kuriuose ruožuose (permutacijos testas; P = 0, 037 ir 0, 020), palyginti su Por genomo vidurkiu. Tai gali reikšti neseną atrankos epizodą Por, galimai adaptuojant laiką, nes ši sritis taip pat yra labai praturtinta dėl laiko koreliacijos polimorfizmų (1b pav., CS skydelis). Labiausiai ekstremalios genetinės diferenciacijos, genetinės įvairovės ir laiko koreliacijos reikšmės yra CaMKII.1 lokuse ir geno, kuris yra homologinis didžiojo sprogimo (bbg) genui, priekinėje dalyje.

„CaMKII“ veikia pagrindinį cirkadinį laikrodį

CaMKII.1 lokusas ne tik turi daugiausiai diferencijuotų polimorfizmų (9 papildoma lentelė), bet ir įrodyta, kad CaMKII.1 turi cirkadinį laiką. Pelė CaMKIIα fosforilina CLOCK ir palengvina jos dimerizaciją su BMAL in vivo 18 . Pelėms su neaktyviu, kinaze mirusiu CaMKIIα K42R, slopinamas paros ritmas ir pailgėjęs cirkadinio laisvojo bėgimo periodas 18 . CaMKII taip pat fosforilina CLOCK baltymą 19 D. melanogaster S2 ląstelių linijoje, o in vivo Dme-CaMKII slopinimas jautrintame fone su sumažintu Ca 2+ lygiu pailgina cirkadinį laisvojo ciklo periodą 20, kas rodo, kad CAMKII vaidmuo cirkadinis laikas yra išsaugotas gyvūnams.

Norėdami nustatyti, ar CaMKII taip pat gali paveikti cirkadinį branduolio laikrodį C. marinus , mes išbandėme Cma -CaMKII.1 poveikį ląstelių tyrime, naudodami D. melanogaster S2 19, 21 ląsteles. Mes pakartojome ankstesnius 19 eksperimentus, parodydami, kad cheminis endogeninio Dme -CaMKII slopinimas sumažina generuojamos luciferazės kiekį (išplėstiniai duomenys, 6a pav.), Tuo tarpu pridedant nuo [Ca 2+ ] nepriklausomą, taigi, konstituciškai aktyvų, CaMKII variantą ( pelė, T286D) padidina luciferazės kiekį (išplėstiniai duomenys, 6b pav.). Tada mes sukūrėme C. marinus laikrodžio , C. marinus ciklo ir mutavusių negyvų kinazių (K42R) ir nuo [Ca 2+ ] nepriklausomų (T286D) Cma-CaMKII.1 versijų konstrukcijas . Cma -laikrodžio ir Cma-ciklo transfekcija į D. melanogaster S2 ląsteles lemia luciferazės aktyvumą, kurį lemia 3X69 promotorius, gautas iš Dme periodo promotoriaus (2a pav.). Pridėjus [Ca 2+ ] nepriklausomą Cma-CaMKII.1 T286D, žymiai padidėja luciferazės signalas (2a pav.), Tuo tarpu pridėjus negyvą kinazę Cma - CaMKII.1 K42R, luciferazės aktyvumas nepadidėja ( 2a pav.). Šie duomenys rodo, kad CaMKII kinazės aktyvumas padidina nuo E-dėžutės priklausomą transkripciją, kaip rodo luciferazės gamyba, kurią skatina 3X69 promotorius, per CLOCK – CYCLE dimerą C. marinus .

Image

a, papildomas C. marinus CaMKII.1 padidina C. marinus Clk ir Cyc transkripcinį aktyvumą atliekant D. melanogaster S2 ląstelių luciferazės tyrimą, naudojant 3X69 E dėžutę, kurioje yra stipriklis (3X69 laikotarpis - luc (nuoroda 21)). Duomenys pateikiami kaip vidurkis ± sem; dvipusis Welch dviejų mėginių t- testas; biologiniai pakartojimai, n = 5, išskyrus atvejus, kai nėra CLK kontrolės, n = 3, kiekvienas biologinis pakartojimas žymi trijų paruošimo pakartojimų vidurkį. *** P <0, 0005. b, Pilnų (RA – RD) ir dalinių (RE – RO) Cma-CaMKII.1 nuorašų egzonai . c) SNP (juodos), indelių (oranžinės) ir 125 bp intarpo (raudonas taškas) pasiskirstymas išilgai Cma-CaMKII.1 lokuso, visi, kurių F ST ≥ 0, 8.

Visas dydis

  • Atsisiųskite „PowerPoint“ skaidrę

„CaMKII.1“ sujungimas koreliuoja su laiku

Tada mes ištyrėme, kaip Cma-CaMKII.1 lokuso polimorfizmai veikia fermentą. Mes nustatėme du CaMKII.1 alelius: vieną ankstyvajame besiformuojančiame Por, He ir Ber štamuose , kitą - vėlyvojoje Jean ir Vigo padermėse. Dauguma kamienui būdingų polimorfizmų yra intronuose (2b pav., C ir 9 papildoma lentelė). Jei šie polimorfizmai buvo reikšmingi, tada jie turėtų paveikti CaMKII.1 raišką ir (arba) sujungimą. Cma-CaMKII.1 turi keturis funkcinius domenus 22 (2b pav.). Dauguma diferencijuotų polimorfizmų grupių susideda iš kintamojo linkerio srities (2b, c pav.), Įskaitant 125 bp įterpimą (raudonas taškas 2c pav .; išplėstiniai duomenys 7 pav.). Mes nustatėme keturis alternatyvius sujungtus viso ilgio Cma-CaMKII.1 (RA – RD) nuorašus, kurie skiriasi jungiamojo ilgio atžvilgiu (2b pav.). Didelės aprėpties RNR sekos nustatymas parodė skirtingą egzono panaudojimą tarp Jean ir Por kamienų, taip pat anksčiau nepažymėtiems egzonams kintamojo linkerio srityje (išplėstiniai duomenys, 6c pav.). PGR ir Sangerio sekos patvirtino kelis dalinius papildomų linkerio srities sujungimo variantų nuorašus (RE – RO; 2b pav.). Norėdami išmatuoti visus trečiojo instaro lervų nuorašus, mes panaudojome specifinį nuorašą qPCR. Paprastai nuorašai RE – RO išreiškiami labai žemu lygiu. Iš jų tik RO parodė kiekybinius raiškos skirtumus tarp Jean ir Por kamienų (3a pav. Ir išplėstiniai duomenys 6d pav.). Svarbu tai, kad transkripcijai būdingas qPCR patvirtino reikšmingą pagrindinių transkriptų diferencialinę išraišką Jean ir Por padermėse (3a pav., Išplėstiniai duomenys, 6d pav.), Atitinkančius RNR sekos (RNR seq) duomenis (išplėstinių duomenų 6c pav.). . Nuosekliai variantai su ilgais jungikliais (RA, RB) parodė didesnę ekspresiją Por kamiene, tuo tarpu trumpesni variantai (RD, RO) parodė didesnę ekspresiją Jean kamiene (3a pav. Ir išplėstiniai duomenys 6c, d pav.).

Image

a, qPCR vertės CaMKII.1 splaisingo variantams iš Por ir Jean kamienų, normalizuotoms iki Por (norminamus duomenis žr. išplėstinių duomenų pav. 6d). Duomenys pateikiami kaip vidurkis ± sem; Por, n = 9 biologiniai pakartojimai; Žanas, n = 10; RO, Por, n = 3; Jeanas n = 8; RO nebuvo aptikta šešiuose Por biologiniuose pakartojimuose, kas rodo dar didesnį ekspresijos skirtumą; dvipusis Wilcoxon rankinis sumos testas; * P <0, 05; ** P <0, 005; *** P <0, 0005; NS, nereikšmingas; Holmo korekcija keliems bandymams. Norėdami sužinoti RNA-seq duomenų kiekį, žiūrėkite išplėstinius duomenis 6c pav. b) CaMKII.1 linkerio srities diferencinis splaisingas D. melanogaster S2R + ląstelėse, normalizuotas iki Por, n = 7 biologiniai pakartojimai; dvipusis dviejų imčių t- testas, kitaip kaip a . c, reprezentatyvios fosforo vaizdavimo gelio sekcijos, kiekybiškai įvertintos b, dvi atskiros juostos iš to paties gelio (visą gelį žiūrėkite šaltinio duomenyse). d, laisvas suaugusiųjų pasirodymo ritmas esant neryškiai baltai šviesai (maždaug 100 lx). Jis ir Por turi bendrus CaMKII.1 alelius, tuo tarpu Jean turi kitą alelį. Norėdami apskaičiuoti laisvojo periodo laiką, buvo suskaičiuotas laikas tarp vėlesnių atsiradimo smailių, kiekviena smailė sveriama pagal individų skaičių.

Visas dydis

  • Atsisiųskite „PowerPoint“ skaidrę

Jei nustatyti CaMKII.1 sandūrinių variantų gausos skirtumai yra siejami su laiko skirtumais, juos turėtų tiesiogiai sukelti kamienui būdingi polimorfizmai CaMKII.1 lokuse. Norėdami tai išbandyti, mes sukūrėme minigenes, kuriose yra alternatyviai sujungtas CaMKII.1 lokuso linkerio regionas iš „Jean“ ar „Por“ kamienų. Du minigenai buvo transfekuoti į D. melanogaster S2R + ląstelių linijos ląsteles ir sujungimo variantų raiška buvo analizuota radioaktyviuoju RT – PGR (3b, c pav.). Mes nustatėme keturis variantus, atitinkančius sujungimo variantus RB, RC, RD ir RO. Visi variantai parodė tuos pačius kamienams būdingus gausumo skirtumus S2R + ląstelių tyrime, kaip ir C. marinus padermėse in vivo (3a, b pav.). Kadangi S2R + tyrime ląstelių kontekstas yra vienodas tiek Jean, tiek Por minigenes atžvilgiu, trans- veikiantys elementai gali būti atmesti kaip diferencialo susiuvimo priežastis, reiškiant, kad tai yra tiesioginis genų sekos skirtumų Cma-CaMKII rezultatas. .1 lokusas. Nors suskaidymo variantai RB, RC ir RD ir juos sudarantys egzonai yra išsaugoti D. melanogasteryje (žr. „Flybase“ anotacijas ir nuorodą 23), D. melanogaster RA atitikmens nėra. Tai gali paaiškinti, kodėl šis variantas neaptinkamas S2R + ląstelėse (3b pav.).

Nuo sujungimo variantų iki laiko skirtumų

CaMKII linkerio ilgio variantai ištirti kelioms rūšims. D. melanogasterio CaMKII izoformos, atitinkančios C. marinus RB, RC ir RD variantus, turi skirtingą substrato afinitetą ir tikslinio fosforilinimo greitį 23 . Šie aktyvumo skirtumai paaiškinami tuo, kad CaMKII veikia kaip dodekameras, o jungties ilgis lemia kompaktiškumą ir tokiu būdu holoenzimo prieinamumą substratui - fermentai su ilgais jungikliais turi didesnį aktyvumą. Šis struktūros ir funkcijos santykis gali būti universalus, nes yra išsaugotas tarp žmonių ir C. elegans 22, 24 .

CaMKII inaktyvacija arba slopinimas prailgina pelių ir vaisinių muselių cirkadinius laikotarpius 18, 20 . Ryšys tarp cirkadinio periodo ilgio ir aktyvumo fazės šviesos ir tamsos cikluose yra žinomas iš D. melanogaster 25 laikotarpio mutacijų ir žmogaus chronotipų 26 . Šie duomenys rodo, kad C. marinus aktyvesni ir lengviau suaktyvinami Ca 2+ suaktyvinti ilgaaščiai CaMKII.1 variantai turėtų paspartinti suaugusiųjų atsiradimą sutrumpindami paros laiką. Iš tiesų, mes pastebime, kad anksti atsirandančios Por ir He padermės, turinčios tuos pačius ilgą ryšį turinčius CaMKII.1 alelius, turi trumpesnį laisvo cirkadinio laikrodžio periodą nei vėlai atsirandantis Jean kamienas (3d pav.).

Integruodami savo rezultatus su minėtos literatūros rezultatais, mes siūlome, kad CaMKII.1 sujungimo variantų santykio reguliavimas būtų evoliucinis mechanizmas, pritaikant cirkadinį laiką (išplėstiniai duomenys, 8 pav.): CaMKII.1 genomo sekos skirtumai lemia diferencinis CaMKII.1 sujungimas ir aktyvumas. Tarp daugelio galimų taikinių tai daro įtaką nuo laikrodžio ciklo priklausomai nuo nuo dimerų priklausomai transkripcijai, o tai savo ruožtu daro įtaką cirkadinio laikotarpio trukmei ir galiausiai lemia skirtumus suaugusiųjų atsiradimo metu.

Diskusija

Metiniai, mėnulio ir potvynio ritmai, taip pat natūralus laiko kitimas tarp asmenų yra svarbūs ir plačiai paplitę reiškiniai, kurie mažai suprantami. C. marinus pamatinis genomas ir penkių padermių, turinčių skirtingą cirkadinį ir žiedinį laiką, genetinių variacijų grupė sukuria naujus išteklius tolesniems šių temų tyrimams.

Mes nustatėme C. marinus ortologus visiems pagrindiniams cirkadinio laikrodžio genams, iš kurių nė vienas nėra susijęs su cirkadinio ar cirkadinio laiko adaptacijomis. Apskrities laiko nustatymas palaiko apskritojo laikrodžio molekulinę nepriklausomybę nuo cirkadinio laikrodžio, kaip buvo pranešta Platynereis dumerilii 27 .

Cirkadinio laiko nustatymo metu, kaip galimas natūralaus prisitaikymo mechanizmas, atsiranda kamienui būdinga moduliacija alternatyviu CaMKII.1 sujungimu. Atsižvelgiant į ankstesnius eksperimentus su D. melanogaster ir pelėmis 18, 19, 20, 23, atrodo, kad greičiausiai skirtumai tarp skirtingų sujungimo formų CaMKII aktyvumo sukelia cirkadinio laiko skirtumus fosforilinant CLOCK-CYCLE (išplėstiniai duomenys. 8).

Taip pat įsivaizduojama, kad CaMKII daro įtaką cirkadiniam laiko skaičiavimui per kitus taikinius. Pavyzdžiui, žinoma, kad CaMKII fosforilina cAMP atsako elementą rišantį baltymą (CREB) 28, 29 . CREB yra susietas su cirkadiniu laikrodžiu per periodo promotoriuose esančius cAMP atsako elementus (CRE) ir nesenstančius genus 30, 31, bei fizinę CREB jungiančio baltymo (CBP) sąveiką su CREB, CLOCK ir CYCLE 32, 33 . Be to, vienas iš labiausiai ištirtų CaMKII vaidmenų yra morfologinis neuronų plastiškumo ir sujungiamumo moduliavimas 34, 35, 36 . Tokie ryšio pokyčiai buvo vis labiau įsimenami kaip D. melanogasterio ir žinduolių paros laiko nustatymo mechanizmo dalis37 . Įdomu tai, kad CaMKII vaidmuo formuojant neuronų jungtį taip pat buvo pasiūlytas susieti su keliomis neuropsichiatrinėmis ligomis 38, kurios dažnai būna kartu su chronobiologiniais sutrikimais 39, 40, 41, 42. Norint nustatyti, ar CaMKII aktyvumo moduliacija yra molekulinis ryšys tarp šių reiškinių, reikia papildomų tyrimų.

Metodai

Mėginio dydžiui nustatyti nebuvo naudojami statistiniai metodai. Eksperimentai nebuvo atsitiktinės atrankos būdu ir tyrėjai nebuvo aklai paskirstomi eksperimentų ir rezultatų vertinimo metu.

Gyvūnų kultūra ir šviesos režimai

C. marinus laboratorijos atsargos buvo veisiamos pagal Neumann 1, priežiūra buvo vykdoma MFPL vandens telkinyje. Trumpai tariant, C. marinus buvo laikomas 20 × 20 × 5 cm dydžio plastikinėse talpyklose su smėliu ir natūraliu jūros vandeniu, praskiestu iki 15 des gėlinto vandens, ankstyvosiose lervų stadijose šeriami diatomomis ( Phaeodactylum tricornutum , kamienas UTEX 646), vėlesniuose - dilgėlių milteliais. Temperatūra klimato kamerose buvo nustatyta 20 ° C, o šviesos ir tamsos ciklas buvo 12:12 (išskyrus atvejus, kai pažymima kitaip). Mėnulio šviesa buvo modeliuojama kaitinamąja žibintuvėlio lempute (apie 1 lx), kuri buvo įjungta visą naktį keturias naktis iš eilės kas 30 dienų.

Genomo surinkimas

Genomo surinkimo procesas (išplėstiniai duomenys, 9a pav.) Buvo pagrįstas trimis sekvenavimo bibliotekomis (10 papildoma lentelė): 0, 2 kb intarpų biblioteka buvo paruošta iš vieno suaugusio vyro iš Jean laboratorijos kamieno (nustatyta iš lauko mėginių, paimtų Šv. Jean-de-Luz, Prancūzija, 2007 m.;> 12 kartų laboratorijoje), kuris buvo badaujamas ir laikomas jūros vandenyje su penicilinu (60 vienetų mililitre), streptomicinu (60 μg ml −1 ) ir neomicinu (120 μg ml - 1 ) per paskutines 2 vystymosi savaites. DNR buvo ekstrahuota sūdymo metodu 46, nukirpta „Covaris S2“ ultragarsu (dažnio plovimo režimas; 4 ° C; darbo ciklas, 10%; intensyvumas, 7; ciklai per prapūtimą, 300; „microTUBE AFA“ pluoštas 6 × 16 mm; 30 s) ir paruoštas Iliumina sekos nustatymui naudojant standartinius protokolus. Pagal gamintojo protokolą iš Eurofins MWG Operon (Ebersbergas, Vokietija) buvo pagaminta 2, 2 kb ir 7, 6 kb intarpų biblioteka iš> 300 lauke sugautų Jean suaugusių vyrų polimorfinės DNR fondo. Kiekviena biblioteka buvo seka viena „Illumina HiSeq2000“ juosta su 100 bp suporuotų galų skaitymu Vienos „Biocenter“ pagrindinių įrenginių naujos kartos sekvenavimo skyriuje (//vbcf.ac.at).

Nuskaitytos skaitymo kokybės, adapterio ir tarpinių sekos buvo nufiltruotos naudojant cutadapt 47 (−b −n 3 − 0, 1 0, 1 − O 8 − 20 20 − 13), o dublikatai buvo pašalinti „fastq-mcf“ iš 48 ea-utils (−D 70). ). Skaitytos poros buvo susipynusios su „ngm-utils 49“, paliekant tik suporuotas skaitymas. Užteršimas žmogaus DNR, aptiktu 0, 2 kb bibliotekoje, buvo pašalintas ištrinant žmogaus genomo atitikmenis, kurių kokybės balas buvo ≥ 20 (suderinimas su BWA 50 ).

Surinkimas į „Velvet 51“ kontingesus (pastoliai išjungti; 57 bp kmers, kaip nustatyta „VelvetOptimiser 52“ ) buvo pagrįstas tik mažiau polimorfine 0, 2 kb biblioteka. Apie 600 likusių adapterio sekų surinktų kontigių galuose buvo apipjaustytos cutaptu (−O 8 − e 0, 1 − n 3). Surinkimo statistiką žiūrėkite 11 papildomoje lentelėje.

Pastolių kontinentai buvo grindžiami visomis trimis bibliotekomis ir buvo atliekami su SSPACE 53 dviem kartojimais, tai yra, pastoliai nuo pirmojo turo buvo pastolinami dar kartą. Naudojant skirtingus parametrus iteracijose (12 papildoma lentelė) buvo galima sudaryti skirtingas jungtis ir taip padidinti pastolių jungiamumą (13 papildoma lentelė). Poveikis greičiausiai atsiranda dėl polimorfinio 2, 2 kb ir 7, 6 kb bibliotekų pobūdžio; tai lemia „bendriausią pastolių išdėstymą pagal gyventojų sutikimą“. Pasikartojantis pastolių procesas buvo atliekamas su ribiniu dydžiu ir be jo taikymo, išskyrus kontūrus <1 kb. Rezultatas buvo du nepriklausomi mazgai (CLUMA_0.3 ir CLUMA_0.4; žr. Išplėstinius duomenis 9a pav.), Kurie skyrėsi bendru jungiamumu ir seka. turinį (11 papildoma lentelė), taip pat pagal didelių pastolių tapatumą ir struktūrą. Siekiant sujungti jungiamumą ir sekos turinį bei išspręsti prieštaravimus didžiausių pastolių struktūroje, abu agregatai buvo palyginti ir suderinti rankiniu būdu naudojant pastolius, kaip aprašyta 1 papildomame metode. Trumpai tariant, abiejų mazgų pastolių sutapimas buvo išbandytas atliekant BLAST paieškas ir parodytas grafinėje tinklo struktūroje. Pastoliai su suderintu sekų kiekiu abiejuose mazguose sudarytų linijinį tinklą, tuo tarpu pastoliai, kurių sekų turinys yra prieštaringi, sukeltų tinklus. Tuo pačiu metu abiem agregatams buvo atliktas genetinių ryšių žemėlapių sudarymas remiantis genotipais, gautais iš su restrikcijos vieta susijusios DNR sekos nustatymo (RAD sekos nustatymo) paskelbtoje 6 kartografijos šeimoje (2 papildomas metodas). Gauta genetinio ryšio informacija buvo naudojama išskaidyti tinklus į kuo ilgesnius nedviprasmiškus linijinius potinklius, turinčius nuoseklią informaciją apie genetinius ryšius (žr. A schemą papildomame 1 metode). Galiausiai gautų super pastolių struktūra buvo užkoduota YAML formatu ir perversta į DNR seką naudojant „Scaffolder 54“, gaunant 75 suklijuotus super pastolius.

Likę maži ir nepažymėti pastoliai buvo filtruojami dėl mitochondrijų genomo fragmentų, histono geno klasterio ir 18S / 28S ribosomų rDNR genų klasterio, kurie buvo surinkti atskirai (3 papildomas metodas; išplėstiniai duomenys 10 pav.). Nepasirinkti pastoliai taip pat buvo filtruojami, kad būtų akivaizdžiai užteršti kitomis rūšimis (3 papildomas metodas). Buvo įvertintas, kiek likusių nepanaudotų pastolių yra sukonfigūruotų superpastovių dalių polimorfinių variantų likę polimorfiniai variantai, sprogdinant pirmąjį prieš pastarąjį (3 papildomas metodas ir 14 papildoma lentelė).

Visi pastoliai buvo uždaromi spragomis uždarant „GapFiller 55“ ir pakartoti kraštai, tai yra, tarpai su beveik vienodomis sekomis abiejose pusėse, kurie paprastai nėra uždaryti dėl genetinių polimorfizmų, buvo įvertinti ir, jei įmanoma, pašalinti naudojant pasirinktinį scenarijų (4 papildomas metodas; kodas galimas kaip šaltinio duomenų failas).

Galutinis surinkimas CLUMA_1.0 buvo pateiktas įgyvendinant projektą PRJEB8339 (75 suklijuoti pastoliai; 23 687 nesuderinti pastoliai ≥ 100 bp). Surinkimą ir papildomos informacijos taip pat galite gauti iš „ ClunioBase“ (//cluniobase.cibiv.univie.ac.at).

Chromosomų rekonstravimas ir QTL analizė

Informacija apie paskutinių 75 superpasparų genetinį ryšį buvo gauta pakartojant skaitymo žemėlapius iki genotipo, reikalaujančio RAD sekos nustatymo eksperimento, kaip aprašyta aukščiau (2 papildomas metodas), tačiau dabar kaip atskaitos elementas yra CLUMA_1.0. Tai leido mums išdėstyti ir orientuoti super pastolius palei genetinių ryšių žemėlapį (1a pav. Ir išplėstiniai duomenys 2 pav.). Rekombinacijos įvykių vietos pastoliuose buvo apytiksliai išdėstytos kaip vidurys tarp dviejų RAD žymeklių, tarp kurių žymeklio raštas pasikeitė iš vienos žemėlapio vietos į kitą, padėties. Paskelbtas genetinių ryšių žemėlapis buvo patikslintas ir patikslintas (5 papildomas metodas ir išplėstiniai duomenys 2 pav.). Remiantis patobulintu sąsajų žemėlapiu, pakartota paskelbtos kartografijos šeimos QTL analizė, kaip aprašyta 6 (4 papildoma lentelė ir 5 papildoma pastaba). Naudodamiesi atskaitos rinkinio ir genetinių ryšių žemėlapio atitiktimi, mes sugebėjome tiesiogiai nustatyti genomo sritis, atitinkančias QTL patikimumo intervalus (1 pav. Ir išplėstinių duomenų 5a, b pav.).

Transkripto sekos nustatymas

Iš visų ankstesnių eksperimentų buvo surinkti normalizuotos visų gyvenimo tarpsnių ir įvairių C. marinus padermių cDNR bibliotekos nuorašai (454 sekos), o RNR sekos nustatymo duomenys buvo gauti suaugusiems „Jean“ padermės pacientams („Illumina“ sekvenavimas). Be to, specialiai genomo anotacijai, RNR iš 80 trečiųjų žandikaulių lervų iš „Jean“ ir „Por“ laboratorijų kamienų buvo paruošti RNR sekai nustatyti pagal standartinius protokolus (6 papildomas metodas). Kiekvienas mėginys buvo paeiliui pažymėtas viena „Illumina HiSeq 2000“ juosta. Visi stenogramos tekstai buvo pateikti Europos branduolinių medžiagų archyvui (ENA) pagal projektą PRJEB8339.

Suaugusiųjų ir lervų RNR sekos duomenų neapdoroti rodmenys buvo patikrinti naudojant „fastqc 56“, adaptyvų kokybei sutrumpinti naudojant „cutadapt 47“ ir filtruoti, kad būtų tik skaitytų porų, naudojant „ngm-utils 49“ komandą „interleave“. Reads were assembled separately for larvae and adults with Trinity 57 (path_reinforcement_distance: 25; maximum paired-end insert size: 1, 500 bp; otherwise default parameters).

Genomo anotacija

Automated annotation was performed with MAKER2 58 . Repeats were masked based on all available databases in repeatmasker. MAKER2 combined evidence from assembled transcripts (see above), mapped protein data sets from Culex quinquefasciatus (CpipJ1), Anopheles gambiae (AgamP3), Drosophila melanogaster (BDGP5), Danaus plexippus (DanPle_1.0), Apis mellifera (Amel4.0), Tribolium castaneum (Tcas3), Strigamia maritima (Smar1) and Daphnia pulex (Dappu1) and ab initio gene predictions with AUGUSTUS 59 and SNAP 60 into gene models. AUGUSTUS was trained for C. marinus based on assembled transcripts from the normalized cDNA library. SNAP was run with parameters for A. mellifera , which had the highest congruence with known C. marinus genes in preliminary trials (Supplementary Method 7). MAKER was set to infer gene models from all evidence combined (not transcripts only) and gene predictions without transcript evidence were allowed. Splice variant detection was enabled, single-exon genes had to be larger than 250 bp and intron size was limited to a maximum of 10 kb.

All gene models within the QTL confidence intervals, as well as all putative circadian clock genes and light receptor genes were manually curated: exon–intron boundaries were corrected according to transcript evidence (approximately 500 gene models), chimeric gene models were separated into the underlying individual genes (approximately 100 gene models separated into around 300 gene models) and erroneously split gene models were joined (approximately 15 gene models). Finally, this resulted in 21, 672 gene models, which were given IDs from CLUMA_CG000001 to CLUMA_CG021672 ('CLUMA' for Clunio marinus , following the controlled vocabulary of species from the UniProt Knowledgebase; CG for 'computated gene'). Splice variants of the same gene (detected in 752 gene models) were identified by the suffix '-RA', '-RB' and so on, and the corresponding proteins by the suffix '-PA', '-PB' and so forth.

Gene models were considered as supported if they overlapped with mapped transcripts or protein data (Supplementary Table 1). Gene counts for D. melanogaster were retrieved from BDGP5, version 75.546 and for A. gambiae from AgamP3, version 75.3. The putative identities of the C. marinus gene models were determined in reciprocal BLAST searches, first against UniProtKB/Swiss-Prot (8, 379 gene models assigned) and if no hit was found, second against the non-redundant protein sequences (nr database) at NCBI (1, 802 additional genes assigned). Reciprocal best hits with an e value < 1 × 10 −10 were considered putative orthologues (termed 'putative gene X'), non-reciprocal hits with the same e value were considered paralogues (termed 'similar to'). All remaining gene models were searched against the PFAM database of protein domains (111 gene models assigned; termed 'gene containing domain X'). If still no hit was found, the gene models were left unassigned ('NA').

Synteny comparisons

Genome-wide synteny between the C. marinus , D. melanogaster and A. gambiae genomes was assessed based on reciprocal best BLAST hits ( e value < 10 × 10 -10 ) between the three protein data sets (Ensembl Genomes, Release 22, for D. melanogaster and A. gambiae ). Positions of pairwise orthologous genes were retrieved from the reference genomes (BDGP5, AgamP3 and CLUMA_1.0) and plotted with Circos 61 . C. marinus chromosome arms were delimited based on centromeric and telomeric signatures in genetic diversity and linkage disequilibrium (Extended Data Fig. 3c and Supplementary Table 3; for data source see 'strain re-sequencing' below). Homologues for C. marinus chromosome arms were assigned based on enrichment with putative orthologous genes from specific chromosome arms in D. melanogaster and A. gambiae (Extended Data Figs 3, 4 and Supplementary Table 3). Additionally, for the 5, 388 detected putative 1:1:1 orthologues ( C. marinus : D. melanogaster : A. gambiae ), microsynteny was assessed by testing if all pairs of directly adjacent genes in one species were also directly adjacent in the other species. The degree of microsynteny was then calculated as the fraction of conserved adjacencies among all pairs of adjacent genes. From this fraction the relative levels of chromosomal rearrangements in the evolutionary lineage leading to C. marinus were estimated (Supplementary Note 3 and Extended Data Fig. 4).

Strain re-sequencing

Genetic variation in five C. marinus strains (Extended Data Fig. 1) was assessed based on pooled-sequencing data from field-caught males from the strains of St. Jean-de-Luz (Jean; Basque Coast, France; sampled in 2007; n = 300), Port-en-Bessin (Por; Normandie, France; 2007; n = 300), as well as Vigo (Spain; 2005; n = 100), Helgoland (He; Germany; 2005; n = 300) and Bergen (Ber; Norway; 2005; n = 100). Samples from Vigo and Bergen, were provided by D. Neumann and C. Augustin, respectively. For each strain we chose the largest available number of individuals to obtain the best possible resolution of allele frequencies. Females are not available, because they are virtually invisible in the field. For an overview of the experimental procedure, see Extended Data Fig. 9b. DNA was extracted with a salting-out method 46 from sub-pools of 50 males, the DNA pools were mixed at equal DNA amounts, sheared and prepared as described above and sequenced on four lanes of an Illumina HiSeq2000 with paired-end 100-bp reads (Ber and Vigo combined in one lane, distinguished by index reads). All reads were submitted to the European Nucleotide Archive (ENA) under project PRJEB8339. Sequencing reads were filtered for read quality and adaptor sequences with cutadapt 47 (−b −n 2 −e 0.1 −O 8 −q 13 −m 15), interleaved with ngm-utils 49 and duplicates were removed with fastq-mcf from ea-utils 48 (−D 70). Reads were aligned to the mapped super-scaffolds of assembly CLUMA_1.0 with BWA 50 (aln and sampe; maximal insert size (bp): −a 1500).

Detection of re-arrangements

Based on the unfiltered alignments, the samples from Por and Jean were screened for genomic inversions and indels relative to the reference sequence with the multi-sample version of DELLY 62 . Paired-end information was only considered if the mapping quality was high ( q ≥ 20) (see also Supplementary Note 3).

Population genomic analysis of the timing strains

For population genomic analysis (Extended Data Fig. 9b), the alignments of the pool-sequencing (pool–seq) data from Vigo, Jean, Por, He and Ber were filtered for mapping quality ( q ≥ 20), sorted, merged and indexed with SAMtools 63 . Reads were re-aligned around indels with the RealignerTargetCreator and the IndelRealigner in GATK 64 . The resulting coverage per strain is given in Supplementary Table 5.

For identification of SNPs, a pileup file was created with the mpileup command of SAMtools 63 . Base Alignment Quality computation was disabled (−B); instead, after creating a synchronized file with the mpileup2sync script in PoPoolation2 65, indels that occurred more than ten times were masked (including 3 bp upstream and downstream) with the identify-indel-regions and filter-sync-by-gtf scripts of PoPoolations2. F ST values were determined with the fst-sliding script of PoPoolation2, applying a minimum allele count of 10 (so that any false-positive SNPs resulting from the remaining unmasked indels were effectively excluded) and a minimum coverage of 40× for the comparison between Por and Jean or 10× for the comparison of all five strains. F ST was calculated at a single base resolution, as well as in windows of 5 kb (step size, 1 kb). Individual SNPs were only considered for further analyses or plotted if they were significantly differentiated as assessed by Fisher's exact test (fisher-test in PoPoolation2).

Average genome-wide genetic differentiation between timing strains, as obtained by averaging over 5-kb sliding-windows, was compared to the respective timing differences and geographic distances (see Supplementary Table 8) in Mantel tests (Pearson's product moment correlation; 9, 999 permutations), as implemented in the vegan package in the R statistical programming environment (ref. 66). Geographic distances and circadian timing differences were determined as described previously 67 (see Supplementary Table 8). For determination of lunar timing differences when comparing lunar with semilunar rhythms see Supplementary Note 6. In order to find genomic regions for which genetic differentiation is correlated with the timing differences between strains, the Mantel test was then applied to 5-kb genomic windows every 1 kb along the reference sequence. 5 kb is roughly the average size of a gene locus in C. marinus . Windows with a correlation coefficient of r ≥ 0.5 were tested for significance (999 permutations). For each genomic position the number of overlapping significantly correlated 5-kb windows was enumerated, resulting in a correlation score (CS; ranging from 0 to 5).

Genetic diversity, measured as Watterson's theta ( θ W ), for each strain was assessed with PoPoolation1.1.2 (ref. 68) in 20-kb windows with 10-kb steps. In order to save computing time, the pileup files of Jean, Por and He were linearly downscaled to 100× coverage with the subsample-pileup script ('fraction' option), positions below 100× coverage were discarded. Indel regions were excluded (default in PoPoolation 1.1.2) and a minimum of 66% of a sliding window needed to be covered. SNPs were only considered in θ W calculations if present ≥2 times, leading to slight inconsistencies in θ W estimates between strains due to differing coverage, but not affecting diversity comparisons within strains.

Linkage disequilibrium between the SNPs was determined for the Por and Jean strains with LDx 69, assuming physical linkage between alleles on the same read or read pairs. r 2 was determined by a maximum likelihood estimator, minimum and maximum read depths corresponded to the 2.5% and 97.5% coverage depths for each population (Jean, 111–315; Por, 98–319), total insert distance was limited to 600 bp, minimum phred-scaled base quality was 20, minimum allele frequency was 0.1 and a minimum coverage per pair of SNPs was 11. SNPs were binned by their physical distance for the plots (0–200 bp, 200–400 bp, 400–600 bp), with the mean value plotted.

Finally, small indels (<30 bp) in the Por and Jean strains were detected with the UnifiedGenotyper (−glm INDEL) in GATK 64 for positions with more than 20× coverage. Genetic differentiation for indels was calculated with the classical formula F ST = ( H T − H S )/ H T, where H S is the average expected heterozygosity according to Hardy–Weinberg Equilibrium (HWE) in the two subpopulations and H T is the expected heterozygosity in HWE of the hypothetical combined total population. If more than two alleles were present, only the two most abundant alleles were considered in the calculation of F ST .

Assessment of candidate genes

Gene models from the automated annotation were considered candidate genes, if they fulfilled the following criteria. (1) The gene was located within the reference sequence corresponding to the QTL confidence intervals as determined for the Por and Jean strains. (2) The gene contained a strongly differentiated SNP or small indel or it was directly adjacent to such a SNP or small indel ( F ST ≥ 0.8 for Por versus Jean, that is, the strains used in QTL mapping). This resulted in a preliminary list of 133 genes based on the comparison between Por and Jean (Supplementary Table 6). These candidate genes were narrowed down based on their overlap with genomic 5-kb windows, for which genetic differentiation between five European timing strains correlated with their timing differences (Fig. 1a, Extended Data Fig. 5a, b and Supplementary Table 9).

The location and putative effects of the SNPs and indels relative to the gene models were assessed with SNPeff 70 (−ud 0, otherwise default parameters; Extended Data Fig. 5c, d and Supplementary Tables 6, 9).

For Gene Ontology (GO) term analysis, all C. marinus gene models with putative orthologues in the UniProtKB/Swiss-Prot and non-redundant protein sequences (nr) databases based on reciprocal best BLAST hits (see above) were annotated with the GO terms of their detected orthologues (6, 837 gene models). Paralogues were not annotated. The enrichment of candidate SNPs and indels ( F ST ≥ 0.8 between Por and Jean) in specific GO terms was tested with SNP2GO 71 (min.regions = 1, otherwise default parameters). Hyper-geometric sampling was applied to test if individual genes of a GO term or a whole pathway of genes are enriched for SNPs (Supplementary Table 7).

Molecular characterization of CaMKII.1

RNA-seq data of the Por and Jean strains for CaMKII.1 were obtained from the larval RNA sequencing experiment described above. Besides four assembled full-length transcripts (RA–RD) from RNA-seq and assembled EST libraries, additional partial transcripts (RE–RO) were identified by PCR amplification (for PCR primers see Supplementary Table 15), gel extraction (QIAquick Gel Extraction Kit, Qiagen), cloning with the CloneJET PCR Cloning Kit (Thermo Scientific) and Sanger sequencing with pJET1.2 primers (LGC Genomics & Microsynth). cDNA was prepared from RNA extracted from third instar larvae of the Por and Jean laboratory strains (RNA extraction with RNeasy Plus Mini Kit, Qiagen; reverse transcription with QuantiTect Reverse Transcription Kit, Qiagen).

qPCR was performed with variant-specific primers and actin was used as a control gene (Supplementary Table 16). cDNA was obtained from independent pools of 20 third instar larvae of the Por and Jean strains. Sample size was ten pools per strain to cover different time points during the day and to test for reproducibility (two samples each at zeitgeber times 0, 4, 8, 16 and 20; for one Por sample extraction failed; RNA extraction and reverse transcription as above). qPCR was performed with Power SYBR Green PCR Master Mix on a StepOnePlus Real Time System (both Applied Biosystems). Fold-changes were calculated according to ref. 72 in a custom excel sheet. The assumption of equal variance was violated for the RD comparison ( F -test) and the assumption of normal distribution was violated for the data of RA and RC in the Por strain (Shapiro–Wilk normality test), possibly reflecting circadian effects in the samples from different times of day. Thus, expression differences were assessed for significance in a two-tailed Wilcoxon rank-sum test (wilcox.test in R 66 ). Holm correction 73 was used for multiple testing (default in p.adjust function of R).

CaMKII.1 minigenes

PCR fragments containing the CaMKII.1 linker region (exons 10–15) were amplified from genomic Por or Jean DNA, respectively, with primers CaMKII-Sc61-F-344112 and CaMKII-Sc61-R-351298 (Supplementary Table 15), cloned with the CloneJET PCR Cloning Kit (Thermo Scientific), transferred into the pcDNA3.1+ vector using NotI and XbaI (Thermo Scientific). These constructs were transfected into D. melanogaster S2R+ cells and RNA was prepared 48 h after transfection. After DNase digestion, isoform expression was analysed by radioactive, splicing-sensitive RT–PCR (primers in Supplementary Table 17) and phosphorimager quantification as described 74 . Identity of isoforms is based on size and sequencing of PCR products. To test for reproducibility, there were seven biological replicates (raw data in Supplementary Table 18). As the assumptions of equal variance ( F -test) and normal distribution of data (Shapiro–Wilk normality test) were not violated, the significance of expression differences was assessed in unpaired, two-sided two-sample t -tests. Holm correction 73 was used for multiple testing (default in p.adjust function of R). S2R+ cells were obtained from the laboratory of S. Sigrist, regularly authenticated by morphology and routinely tested for absence of mycoplasma contamination. The entire experiment was reproduced several months later with three biological replicates (raw data in Supplementary Table 18).

S2 cell luciferase assay

Firefly luciferase is driven from a period 3X69 promoter under control of the CLOCK and CYCLE protein 19, 21 . The D. melanogaster pAc–clk construct was obtained from F. Rouyer, pCopia–Renilla luciferase and period 3X69–luc reporter constructs from M. Rosbash, a [Ca 2+ ]-independent mouse CaMKII T286D was provided by M. Mayford. The CaMKII inhibitor KN-93 was purchased from Abcam (#ab120980).

C. marinus Cyc , C. marinus Clk and C. marinus CaMKII.1–RD were cloned into the pAc5.1/V5–His A plasmid (Invitrogen) with stop codons before the tag. The Q5 Site-Directed Mutagenesis Kit (NEB) was used to make kinase-dead and [Ca 2+ ]-independent versions of C. marinus CaMKII.1–RD (for primers, see Supplementary Table 17).

D. melanogaster S2 cells (Invitrogen) were cultured at 25 °C in Schneider's D. melanogaster medium (Lonza) supplemented with fetal bovine serum (FBS, 10%, heat-inactivated), penicillin (100 U ml −1 ), streptomycin (100 μg ml −1 ) and 2 mM l -glutamine; Sigma). Cells were seeded into 24-well plates (800, 000 cells per well) and transfected with Effectene transfection reagent (Qiagen) according to the manufacturer's instructions. Experiment with mouse [Ca 2+ ]-independent CaMKII: 25 ng pCopia–Renilla , 10 ng period 3X69–luc , 0.5 ng D. melanogaster pAc–clk , 200 ng mouse pAc–CaMKII T286D . Experiment with CaMKII inhibitor KN-93: 25 ng pCopia–Renilla , 10 ng period 3X69–luc , 0.5 ng D. melanogaster pAc–clk , various amounts of KN-93. Experiment with C. marinus genes: 25 ng pCopia–Renilla , 10 ng period 3X69–luc , 100 ng C. marinus pAc–cyc , 100 ng C. marinus pAc–clk , 200 ng C. marinus CaMKII.1–RD K42R or 200 ng C. marinus CaMKII.1–RD T286D . In all experiments, the transfection mix was filled up with empty pAc5.1/V5–His A vector to a total of 435 ng DNA per well. After 48 h, cells were washed with PBS and lysed with Passive Lysis Buffer (Promega). Luciferase activities were determined on a Synergy H1 plate reader (Biotek) using a Dual-Luciferase Reporter Assay System (Promega). For each biological replicate three independent cell lysates were measured and their mean value determined. Firefly luciferase activity was normalized to Renilla luciferase activity and values were normalized to controls transfected with D. melanogaster pAc–clk or C. marinus pAc–clk and C. marinus pAc–cyc , respectively. S2 cells (Invitrogen/Life Technologies, Cat.no. R690-07) were regularly authenticated by morphology and routinely tested for absence of mycoplasma contamination (Lonza MycoAlert). Sample size was chosen to test for reproducibility.

Circadian free-run experiments

For circadian free-run experiments, culture boxes of the Por, He and Jean strains were transferred from light–dark cycle (16:8) to constant dim light (light–light cycle, about 100 lx). Emerging adults were collected in 1-h intervals by a custom made C. marinus fraction collector (similar to those described in ref. 75) and counted once a day. Because collection was automated, the experimenter had no influence on the results and blinding was not necessary. As the circalunar clock restricts adult emergence to a few days, the circadian emergence rhythm can only be assessed over a few days. Several culture boxes were transferred to a light–light cycle at different time points. The resulting emergence data were combined for each strain using the switch to a light–light cycle as a common reference point. We used the maximum number of available individuals. Free-running period was calculated as the mean interval between subsequent emergence peaks, weighting each peak by the number of individuals.

Duomenų prieinamumas

All sequence data are deposited in the European Nucleotide Archive (ENA) under PRJEB8339. The reference genome is also on ClunioBase (//cluniobase.cibiv.univie.ac.at). Machine readable super-scaffolding data and the computer source code for the removal of repeated edges are supplied as source data files.

Išplėsti duomenys

Išplėstiniai duomenų skaičiai

  1. 1.

    The biology of Clunio marinus .

  2. 2.

    The reconstructed chromosomes of C. marinus based on the genetic linkage map.

  3. 3.

    C. marinus genome characterization.

  4. 4.

    Synteny analyses of C. marinus chromosome arms.

  5. 5.

    Population genomic analysis of QTLs C1/L1 and C2 and genome-wide analysis of locations and putative effects of SNPs and indels.

  6. 6.

    CaMKII regulates CLK/CYC transcriptional activity and exhibits strain-specific splice variants.

  7. 7

    A differentiated 125-bp insertion in the CaMKII locus.

  8. 8.

    Model of circadian timing adaptation via sequence differences in the CaMKII.1 genomic locus.

  9. 9.

    Analyses overview.

  10. 10.

    Arrangement of the mitochondrial genome and of the histone gene cluster in C. marinus .

Papildoma informacija

PDF failai

  1. 1.

    Papildoma informacija

    This file contains Supplementary Tables 1-19, Supplementary Methods, Supplementary Notes, Supplementary References and a Supplementary Figure – see contents page for details.

ZIP failai

  1. 1.

    Papildomi duomenys

    This zipped file contains .yaml files containing all changes made to the genome assembly during the super-scaffolding process.

  2. 2.

    Papildomi duomenys

    This zipped file contains the source code for the software "Repeated Edge Remover (RE 2 )".

Komentarai

Pateikdami komentarą jūs sutinkate laikytis mūsų taisyklių ir bendruomenės gairių. Jei pastebite ką nors įžeidžiančio ar neatitinkančio mūsų taisyklių ar gairių, pažymėkite, kad tai netinkama.