Integruota masės spektrometrijos topologinė analizė atskleidė kliniškai reikšmingus stemplės plokščiųjų ląstelių karcinomos molekulinius ypatumus | mokslinės ataskaitos

Integruota masės spektrometrijos topologinė analizė atskleidė kliniškai reikšmingus stemplės plokščiųjų ląstelių karcinomos molekulinius ypatumus | mokslinės ataskaitos

Anonim

Dalykai

  • Tinklo topologija
  • Stemplės vėžys

Anotacija

Derinant MS pagrįstus baltymų duomenis su tokio tinklo ir topologinėmis savybėmis būtų galima nustatyti kliniškai reikšmingesnes molekules ir prasmingai išplėsti baltymų, gautų atlikus MS analizę, repertuarą. Integruotieji topologiniai indeksai, atspindintys 95, 96% informacijos apie septynis atskirus mazgo baltymų topologinius matus, buvo apskaičiuoti baltymų ir baltymų sąveikos (PPI) tinkle, sudarytame naudojant 244 diferencijuotai išreikštus baltymus (DEP), identifikuotus „iTRAQ 2D-LC-MS / MS“. Palyginus su DEP, diferencijuotai išreikštais genais (DEG) ir visapusiškomis savybėmis (CF), struktūriškai dominuojantys mazgai (SDN), pagrįsti integruotu topologinio indekso pasiskirstymu, sukūrė palyginamą klasifikavimo efektyvumą trijose skirtingose ​​klinikinėse vietose, naudojant penkias nepriklausomas genų ekspresijos duomenų grupes. Paprastosios SDN klasifikatoriaus molekulės, skirtos atskirti ankstyvas ir vėlyvas klinikines TNM stadijas, buvo praturtintos baltymų sintezės, tarpląstelinės lokalizacijos ir ribosomų biogenezės biologiniais bruožais, o tai rodo, kad ribosomų biogenezė yra perspektyvus terapinis taikinys gydant ESCC. Be to, ITGB1 išraiška, parinkta tik naudojant integruotas topologines priemones, koreliavo su klinikinėmis stadijomis ir prognozėmis, kurios buvo papildomai patvirtintos dviem nepriklausomomis ESCC mėginių grupėmis. Taigi šiame tyrime siūloma PPI tinklų integracinė topologinė analizė pateikia alternatyvų metodą, kaip nustatyti potencialius biomarkerius ir terapinius taikinius iš MS / MS duomenų su ESCC funkcinėmis įžvalgomis.

Įvadas

Dėl spartios proteomikos pažangos ligos progreso metu tuo pačiu metu galima nustatyti šimtus iki tūkstančių molekulinių pokyčių, pateikiant išsamų sutrikimo, palyginti su sveika būkle, vaizdą 1, 2 . Nors potencialių biomarkerių identifikavimui dažniausiai naudojamas kartotinių pokyčių analizė kartu su standartine statistine priemone, jei pakankamas pakankamas pakartojimų skaičius, tačiau būdingi šio metodo suvaržymai paprastai sukuria skirtingai išreikštas molekules su galimai dideliu klaidingų teigiamų teigiamų rezultatų santykinai mažu gausumu ir melagingi neigiami dalykai, turintys daug molekulių, atitinkamai 3, 4, 5, 6 . Dar svarbiau, kad diferenciškai išreikštos molekulės, išgautos iš įvairių nepriklausomų tyrimų, kenčiančios nuo mažos konsistencijos, sukelia sunkumų vėlesniame klinikiniame pritaikyme. Be to, taikant šį metodą galima nepastebėti biologiškai reikšmingų molekulių, nekeičiant didžiausių raukšlės pokyčių, tokių kaip transkripcijos faktoriai 4 . Be to, šie abejotini pokyčiai nesugeba susieti funkcinės svarbos su patogeneze 11 ir kelia sunkumų aiškinant iš biologinės ir sisteminės perspektyvos.

Kita vertus, masinės spektrometrijos (MS) pagrindu sukurta proteomika, šiuo metu plačiai naudojama biomarkerių atradimui, turi nepilną atskirų mėginių proteomų aprėptį (nustatyta ribota baltymų dalis) ir silpną nuoseklumą tarp mėginių 11, 12 . Kadangi genai, kurie, kaip žinoma, yra susieti su tuo pačiu fenotipu, paprastai susilieja į baltymų ir baltymų sąveikos (PPI) tinklus, priskirdami panašias funkcijas 13, 14, 15, 16, 17, 18, tinklais pagrįsti metodai gali palengvinti neišsamų duomenų aprėptį ir nenuoseklumas, taip pat komplemento klasteris, gautas atliekant kartų pokyčių analizę 11, 19 . Be to, tinklo metodai buvo plačiai naudojami nustatant 20 tikslo narkotikų prioritetus ir nustatant daugelio ligų žymenis, įskaitant krūties vėžį 7, 21, 22, 23, storosios žarnos vėžį 9, 24, 25, prostatos vėžį 26, kiaušidžių vėžį 16, skrandžio vėžys 27, uždegiminis atsakas 28, 29 ir tt Tinklo topologinių ypatybių, pvz., 30, 31 laipsnio, 32, 33, k-apvalkalo 34, motyvo centriškumo 35, 36, analizė buvo labai svarbi tema ir buvo naudojami apibrėžti kritinius taškus, atspindinčius esmingumą biologiniuose tinkluose ir ligų biologinius žymenis, taip pat 27, 37 . Palyginus su atskirų baltymų diferencialine išraiška, baltymų tinklo topologija yra labiau išsaugota duomenų rinkiniuose ir turi galimybę kitaip pateikti informaciją37. Todėl, sujungus MS pagrįstus proteominius duomenis su tinklu ir tokiu būdu gaunant tokio tinklo topologinius požymius, būtų galima nustatyti kliniškai svarbesnes molekules ir prasmingai išplėsti baltymų, gautų analizuojant MS, rinkinį.

Stemplės plokščiųjų ląstelių karcinoma (ESCC) išlieka vyraujančiu stemplės karcinomos (EC) 38 histologiniu potipiu ir užima ketvirtą vietą pagal sergamumą ir mirtingumą Kinijoje 39 . Ilgalaikis pažengusio ESCC išgyvenimas po operacijos yra niūrus, 5 metų išgyvenamumas yra <25%, daugiausia dėl pavėluotos diagnozės, agresyvaus pobūdžio ir ribotų gydymo galimybių 40 . Akivaizdu, kad labai svarbu nustatyti tinkamus ankstyvosios diagnozės biologinius žymenis ir terapinius taikinius.

Čia mes panaudojome izobarinius santykinio ir absoliutaus kiekybinio įvertinimo žymenis (iTRAQ) kartu su 2D-LC-MS / MS, kad pasauliniu mastu atpažintume diferenciškai išreikštus baltymus (DEP), susijusius su ESCC. Siekiant palengvinti MS pagrįstos proteomikos trūkumus, buvo sukurtas PPI tinklas, nurodant 244 DEP kaip sėklas į internetinę PPI duomenų bazę. Mes nustatėme struktūriškai dominuojančius mazgus (SDN) atlikdami integruotą septynių atskirų priemonių topologinę analizę kaip galimus ESCC molekulinius parašus ir nustatėme šių SDN klinikinę svarbą, palyginti su DEP ir diferencijuotai išreikštais genais (DEG).

Rezultatai

Baltymų ir baltymų sąveikos tinklo kūrimas naudojant DEP ESCC

ESCC baltymų fondai ir atitinkamas navikinis epitelio audinys (N) po iTRAQ žymėjimo buvo įvertinti kiekybiškai. Naudojant 1, 5 karto vidutinio skirtumo ribą ir du unikalius kiekvieno baltymo peptidus, iš viso buvo nustatyti 244 DEP, įskaitant atitinkamai 119 aukštyn reguliuojamus ir 125 žemyn reguliuojamus baltymus (papildoma S1 lentelė).

Šiame tyrime išplėstas 244 DEP sėklų sukurtas PPI tinklas sukėlė 22 604 sąveiką tarp 6392 mazgų (1 pav. A). Statistinės PPI tinklų charakteristikos išsamiai aprašytos papildomoje S2 lentelėje. PPI tinklas yra nedidelis, jo ryšio tankis yra 0, 0011%, o vidutinis laipsnis - 7, 0726. Be to, tinklo laipsnių pasiskirstymas nėra pagrįstas skalėmis (1 pav. B), o galios įstatymų eksponentas yra maždaug –1, 7770, o tai primena kitą tyrimą dėl plataus masto žmonių PPI tinklų, pateiktame 41 nuorodoje. Be to, PPI tinklas yra mažo pasaulio, turintis labai trumpą vidutinį kelio ilgį ir aukštą grupavimo koeficientą, o mažo pasaulio SW indeksas prilygsta 221.1198, o tai rodo mažą tinklo pasauliškumą 41 .

Image

( A ) 244 DEP sėklos buvo surinktos į HAPPI duomenų bazę ir išplėstos iki jų pirmojo laipsnio kaimynų, todėl buvo sukurtas išplėstas tinklas su 22 604 sąveikomis tarp 6392 mazgų. Skirtingos spalvos žymi mazgus, turinčius skirtingą laipsnį ir k-apvalkalą. ( B ) PPI tinklo laipsnių pasiskirstymas. C ) Dviejų veiksnių indėlis į faktorių balus

Image
prieš
Image
yra atitinkamai 52, 25% ir 43, 71%.

Visas dydis

Svarbių mazgų identifikavimas integracinėmis topologinėmis priemonėmis

Siūloma daugybė topologinių priemonių, kad būtų galima įvertinti mazgų svarbą sudėtiniuose tinkluose iš skirtingų perspektyvų. Panašu į vienmolekulinius biomarkerius, viena priemonė PPI tinkluose neišskiria mirtinų baltymų iš kitų. Todėl, norint nuodugniai nustatyti svarbius PPI tinklo mazgus, susijusius su ESCC, šiame tyrime buvo integruotos septynios skirtingos topologinės priemonės, kurias sudarė laipsnis, tarpas, pusiau lokalumas, klasterio koeficientas, k-apvalkalas, PageRank ir savivektoriaus centriškumas. Po normalizavimo septyni topologiniai matavimai buvo sujungti į du kintamuosius, ty pagrindinio komponento faktorių 1 ir 2 (F1 ir F2), kurie palaiko 95, 96% informacijos apie pirminį septynių topologinių matavimų kiekį (1 pav. C). Pagal F1 ir F2 reikšmes, 50 geriausių mazgų buvo atrinkti kaip potencialios ESCC parašo molekulės, pavadintos SDN, tolimesnei analizei.

Skirtingo baltymo ir genų ekspresijos atitiktis ESCC

Iš penkių nepriklausomų genų ekspresijos duomenų rinkinių iš viso 8 498 bendrieji genai, esantys visuose masyvuose, buvo profiliuoti 186 ESCC pacientams, iš dalies įskaitant 87 ESCC ir N poras ir išskirtinius 99 skirtingų klinikinių TNM stadijų ESCC (1 lentelė). Norėdami priminti klinikinę praktiką, DEG identifikavimui panaudojome duomenų rinkinį GSE 23400, naudodamiesi dviejų mėginių T tyrimu. Iš viso 1218 genų, tenkinančių P reikšmę <0, 0001 ir q reikšmę (FDR) <0, 0001, buvo sukurti tolesnei analizei (papildoma lentelė) S3).

Pilno dydžio lentelė

Tarp 244 DEP ir 1218 DEG buvo 67 bendrosios molekulės, aptiktos tiek proteominėmis, tiek transkriptominėmis platformomis iš nepriklausomų tyrimų. Tarp įprastų molekulių 59 rodė tą pačią pokyčių kryptį, apimančią atitinkamai 22 aukštyn reguliuojamas ir 37 žemyn reguliuojamas molekules, o kitos 8 rodė priešingą reguliavimo panaikinimo kryptį (S4 lentelė). Tikslus Fišerio testas parodė, kad tarp 67 persidengiančių molekulių padidėjusios ir sumažėjusios ekspresijos buvo reikšminga nuoseklumas ( P = 1 × 10 –12, Fišerio tikslus testas, S5 lentelė).

Klinikinis SDN klasifikatoriaus veikimas lyginant su DEP, DEG ir CF klasifikatoriais

Palyginimui, SDN, DEP ir DEG 50 populiariausių pagal statistinę P vertę buvo atrinkti kaip potencialios parašo molekulės ESCC klasifikatoriams kurti, o šių molekulių sutapimas yra gana mažas, ty keturių (PPP2R1A, RPS15A, RPLP2 ir RPSA) SDN ir DEP, viena (RUVBL1), esanti SDN ir DEG, nesutampa tarp DEP ir DEG (2 lentelė). Nepaisant to, 23 molekulės iš 50 pasirinktų DEP (46%) iš esmės buvo įtrauktos į DEG, 20 iš 50 SDN į DEP (40%) ir tik 6 iš SDN DEG (12%) pagal ribinę vertę, apibrėžtą mūsų tyrime .

Pilno dydžio lentelė

Kadangi įvairiais būdais parinktos ESCC potencialios signalo molekulės gali atspindėti skirtingus naviko biologijos aspektus, išsamios savybės (CF), jungiančios DEP, DEG ir SDN (iš viso 150 potencialių molekulių), padėtų mums sukurti tinkamiausią klinikiniam klasifikatoriui klasifikatorių. . Šiame tyrime SDN klinikinė svarba, palyginti su DEP, DEG ir CF, buvo įvertinta pagal klasifikavimo rezultatus trijose skirtingose ​​klinikinėse situacijose, ty ESCC prieš N, ankstyvosios TNM stadijos (I – II) ir vėlyvosios TNM stadijos ( III – IV) ir nereaguojantis į neoadjuvantinę chemoterapiją (neo-CRT).

ESCC ir N diskriminacija Atlikus SVM analizę mokymo rinkinyje GSE 23400, apimančiame 53 ESCC ir gretimų NS poras, optimaliam klasifikatoriui sukurti buvo naudojamas kryžminis LOO patvirtinimas. Tarp keturių skirtingų klasifikatorių reikšmingų treniruočių duomenų tikslumo skirtumų nepastebėta (tikslumas svyravo nuo 91, 5% iki 94, 3%). Be to, reikšmingų skirtumų, susijusių su tikslumu, jautrumu, specifiškumu ir AUC ( P > 0, 05, T-testas), nebuvo, kai atitinkami klasifikatoriai buvo atlikti keturioms nepriklausomoms bandymo grupėms ir atliekant metaanalizę (2 pav.). . Atrodo, kad klasifikatorius, kurio pagrindą sudaro SDN, dažniausiai buvo mažesnis, palyginti su kitais trim klasifikatoriais, o CF klasifikatoriaus veikimas pralenkė kitus. Prie optimalaus SDN signalo prisidedančios molekulės (3 lentelė) buvo didžiausios (9 molekulės), po jų sekė DEP klasifikatoriaus (7 molekulės), o DEG ir CF klasifikatorių molekulės buvo vienodos (3 molekulės). 1000 atsitiktinių molekulių rinkinių permutacijos testas parodė, kad visi keturi mūsų tyrime sukurti klasifikatoriai pasižymėjo žymiai geresniais metaanalizės rezultatais (atitinkamai P = 0, 041 SDN, P <0, 001 DEP, DEG ir CF klasifikatoriams). 2A – D paveiksluose pateiktas vidutinis kiekvienos bandomosios grupės kohortos tikslumas, jautrumas, specifiškumas ir AUC bei permutacijos bandymų meta duomenų rinkiniai. Išskyrus keturias duomenų rinkinio GSE 70409 reikšmes, pažymėtas žvaigždute 2 pav., Kitos vertės yra pranašesnės už permutacijos bandymo rezultatus. Tačiau visos keturios klasifikatorių vertės, sugeneruotos mūsų tyrime, yra didesnės nei atitinkamos permutacijos testo vertės meta analizės metu. Tai rodo, kad mažas imties dydis yra pagrindinis tam tikrų individualių testų grupių mažesnių balų faktorius.

Image

( A – D ) parodo SDN, DEP, DEG ir CF klasifikatorių tikslumą, jautrumą, specifiškumą ir AUC, palyginti su 1000 atsitiktinių klasifikatorių iš kiekvieno duomenų rinkinio, kad būtų galima atitinkamai atskirti ESCC ir N. Pastaba: * nurodo aukštesnes permutavusių klasifikatorių vertes nei SVM klasifikatoriai duomenų rinkinyje GSE 70409; SDN-, DEP-, DEG- ir CF-Per rodo permutacijos bandymų vidutines vertes.

Visas dydis

Pilno dydžio lentelė

Ankstyvų ir vėlyvų TNM stadijų diskriminacija Duomenų rinkinys GSE 23400 su 68 informatyviais ESCC buvo naudojamas kaip treniruočių grupė, o 28 ESSK, gauti iš duomenų rinkinio GSE 45670, kaip bandymo kohorta. Treniruočių grupėje CF pagrindu sukurto optimalaus klasifikatoriaus efektyvumas (75, 0% tikslumas) aplenkė kitus klasifikatorius su mažiausiai prisidedančiomis molekulėmis (8 molekulės, 3 lentelė). Duomenų rinkinio GSE 45670 bandymo kohortoje SDN pagrįsto klasifikatoriaus tikslumas padidėjo nuo 64, 7% iki 71, 4%, o kitų trijų klasifikatorių našumas sumažėjo labiausiai sumažėjus (nuo 75, 0% iki 67, 9%), vidutinio sunkumo (nuo 72, 1% - 67, 9%) ir šiek tiek sumažėjo (nuo 73, 5% iki 71, 4%) atitinkamai CF-, DEG- ir DEP-klasifikatoriuje (3 pav.). Informacija apie jautrumą, specifiškumą ir AUC parodyta 3 pav. Optimalus DEG pagrįstas klasifikatorius, susidedantis iš 15 parašų genų, buvo didžiausias, po kurio seka SDN ir DEP klasifikatoriai (3 lentelė). Panašiai, permutacijos testas parodė geresnius mūsų keturių SVM klasifikatorių efektyvumą, atsižvelgiant į tikslumą ir jautrumą nepriklausomoje bandymo grupėje, bet ne pagal specifiškumą ir AUC (3 pav. A). Permutacijos bandymo P vertės buvo atitinkamai 0, 1, 0, 038, 0, 007 ir 0, 364 SDN, DEP, DEG ir CF klasifikatoriams.

Image

( A ) parodo SDN, DEP, DEG ir CF pagrįstų klasifikatorių ir permutuotų klasifikatorių tikslumą, jautrumą, specifiškumą ir AUC, kad būtų galima atskirti ankstyvuosius ir vėlyvuosius TNM etapus. ( B ) rodo praturtintus biologinius procesus SDN klasifikatoriaus parašų molekulėms. Pastaba: SDN-, DEP-, DEG- ir CF-Per rodo permutacijos bandymų vidutines vertes.

Visas dydis

Neoadjuvantinio chemoteradioterapinio atsako numatymas Tik vienas duomenų rinkinys GSE 45670, apimantis 28 ESCC pacientus, apibūdino visuotinę genų raišką prieš ir po neoadjuvantinio chemoterapinio gydymo (neo-CRT). Dėl nedidelio imties dydžio keturių tipų klasifikatorių našumui įvertinti panaudojome penkis kartus kryžminį patvirtinimą. Didžiausią numatymo tikslumą (92, 9%) pasiekė CF pagrindu pagamintas klasifikatorius su didžiausiomis prisidedančiomis molekulėmis (12 molekulių), o paskui - SDN klasifikatorius (82, 1%), turintis mažiausiai komponentų (5 molekulės). DEP ir DEC pagrįstų klasifikatorių patologinio atsako numatymo tikslumas buvo toks pats (78, 6%) su panašiomis prisidedančiomis molekulėmis (3 lentelė). Permutacijos testas parodė žymiai geresnius keturių tirtų klasifikatorių rezultatus mūsų tyrime po SVM pagrįsto klasifikatoriaus, sukurto naudojant 1000 atitinkamų atsitiktinių molekulių rinkinius ( P <0, 001).

GO biologinių procesų ir KEGG būdų praturtinimo analizė

Norint suprasti biologinius molekulinių klasifikatorių, gautų iš skirtingų požiūrių, reikšmes, buvo tiriamos kiekvieno klasifikatoriaus sudedamosios molekulės, siekiant praturtinti genų ontologijos (GO) biologinius procesus ir Kyoto genų ir genomų enciklopediją (KEGG). Tik SDN pagrįsto klasifikatoriaus, skirto TNM stadijoms atskirti, molekulės (15 molekulių) buvo praturtintos ribosomų KEGG keliu ir 10 biologinių procesų, daugiausia atsakingų už mRNR perdirbimą, baltymų transliaciją ir baltymų lokalizaciją organelėse (papildoma S6 lentelė). 3 paveiksle pavaizduotos 10 prisodrintų biologinių procesų, į kuriuos įeina šešios labai paplitusios RPL12, RPL3, RPL7, RPLP2, RPS18 ir RPS6, molekulės. Nors ribosomoje vykstanti baltymų biogenezė nėra specifinė vėžiui, šios biologinės funkcijos yra netiesiogiai susijusios su apoptozė, DNR atstatymu ir onkogeneze. Tačiau kitų klasifikatorių parašų molekulių funkcinės konvergencijos kitoje klinikinėje aplinkoje nepastebėta.

Eksperimentinis ITGB1 patvirtinimas ESCC su skirtingomis klinikinėmis stadijomis ir prognozėmis

Tikslus klinikinės stadijos įvertinimas yra būtinas dabartiniam EK valdymui ir išgyvenimo prognozei, nors dabartinė TNM pakopinė sistema turi kritinių apribojimų. Mūsų rezultatai parodė, kad ITGB1 užėmė 17 vietą pagal integracinę topologinę analizę ir 3 vietą SDN klasifikatoriaus sudedamųjų dalių molekulėse už ankstyvųjų ir vėlyvųjų TNM stadijų atskyrimą. Be to, ITGB1 nebuvo tarp 50 geriausių DEP ir DEG molekulių, skirtų sukurti optimalius SVM pagrįstus klasifikatorius. Todėl ITGB1 klinikinė svarba buvo įvertinta atliekant Western blot ir imunohistochemijos (IHC) analizę dviejose nepriklausomose ESCC mėginių grupėse. Progresuojant klinikiniams etapams, ITGB1 baltymo ekspresija laipsniškai didėjo, tai patvirtina Western blot ir IHC (4A – C pav.). Be to, aukšta ITGB1 išraiška buvo koreliuojama su vėlyvomis klinikinėmis stadijomis abiejose kohortose (atitinkamai P = 0, 019, P = 0, 016) ir su limfmazgių metastazėmis, tačiau su ribine reikšme (atitinkamai P = 0, 057, P = 0, 062). Tarp ITGB1 raiškos ir kitų klinikopatologinių charakteristikų reikšmingų koreliacijų nenustatyta (4 lentelė). 1 kohortos ir išgyvenamumo duomenų po gydomosios operacijos metu Kaplan-Meier išgyvenimo analizė atskleidė, kad ESCC, turinčio didelę ITGB1 ekspresiją, prognozė buvo žymiai blogesnė nei ESCC, kurio ekspresija buvo maža ( P <0, 001, 4 pav. D). ESCC sergančių pacientų, kurių ITGB1 ekspresija buvo maža, išgyvenimo mediana buvo 43, 26 mėnesio, tuo tarpu dėl aukšto ITGB1 ekspresijos vidutinis išgyvenimo laikas sutrumpėjo maždaug 13, 86 mėnesio.

Image

( A ) ITGB1 baltymo ekspresijos lygio reprezentaciniai Vakarų blotai ESCC ir suderinti N su skirtingais TNM etapais. ( B ) ITGB1 baltymo ekspresijos kiekybinis įvertinimas TNM I – IV ESCC ir atitinkamuose N. ( C ) Reprezentatyvus neigiamas ir teigiamas ITGB1 imunoreaktyvumas blogai diferencijuotame ESCC. ( D ) 5 metų bendro išgyvenamumo kreivės ESCC pacientams, kurių baltymų ekspresija yra maža (n = 65) ir aukšta ITGB1 (n = 35) ( P <0, 001).

Visas dydis

Pilno dydžio lentelė

Diskusija

Išskyrus būdingus raukšlių kaitos ir statistinių priemonių, skirtų potencialiems vėžio biomarkeriams tirti, apribojimus, dideli diferencijuotai reguliuojamų molekulių, sukuriamų didelio našumo technologijomis, ilgi sąrašai nepateikia informacijos biologiškai funkciniu lygiu 11 . Derinant MS / MS profiliuotus duomenis su biologiniais tinklais, buvo galima pagerinti proteomų aprėptį, atskleidžiant ryšius tarp funkciškai susijusių baltymų 11, 19 . Remiantis šiuo požiūriu, išplėstas 244 DEP PPI tinklas, apimantis 6392 mazgus / molekules, buvo kur kas daugiau nei originalūs 1567 baltymai, pranešė iTRAQ MS / MS analizė. Biologinių tinklų topologiniai požymiai yra labiau konservuoti nei diferencijuotai ekspresuojamos molekulės ir suteikia tinkamesnių įdomių molekulių, turinčių diskriminacinį potencialą 37, kas rodo, kad topologiniai matavimai galėtų nustatyti atskiras dominančias molekules, turinčias klinikinę reikšmę.

Mūsų rezultatai parodė, kad integraciniai topologiniai indeksai, apimantys septynias topologines priemones, užtikrino tinkamą klinikinį veiksmingumą trijose skirtingose ​​klinikinėse situacijose, nors tarp trijų įdomių molekulių, gautų iš skirtingų matavimų, trijų rinkinių buvo mažai sutapimų. Palyginti su DEP ir DEG pagrįstu SVM klasifikatoriumi, SDN pagrįstas klasifikatorius rodė didesnius skirtumus ESCC diferenciacijai iš N įvairiuose transkriptiniuose profiliavimo duomenų rinkiniuose, atsižvelgiant į tikslumą, jautrumą, specifiškumą ir AUC. Klasifikuojant klinikinius TNM etapus, SDN klasifikatoriaus veikimas parodė didžiausią pokytį tarp treniruočių grupės ir tiriamosios grupės. Galima priežastis gali būti blogas genų ekspresijos profiliavimo atkuriamumas ir mažas mėginio dydis, nes SVM klasifikatorius naudojo įdomias molekules, gautas iš DEG, tarp ankstyvųjų ir vėlyvųjų TNM stadijų, geriausiai atliktų treniruočių grupėje (88, 2% tikslumas), bet blogiausias bandymo grupėje (25, 0% tikslumas, duomenys dabar parodyti). Norint prognozuoti patologinį atsaką į neo-CRT, SDN pagrįstas SVM klasifikatorius pateikė aukščiausią tikslumą, palyginti su DEP ir DEG klasifikatoriais. Nors konstruodami neo-CRT atsako prognozuojamąjį modelį 42 kiekvienam klasifikatoriui prisidedančios molekulės nepersidengė su trimis molekulėmis (MMP1, LIMCH1 ir c1orf226), mūsų trijų modelių, sukurtų naudojant įdomias molekules iš trijų skirtingų metodų, tikslumas buvo 78, 5%. iki 82, 1%, o CF pagrindu sukurtas SVM klasifikatorius padidino tikslumą (92, 9%) nei jų pirminis modelis (86% treniruočių grupėje ir 81% bandymo grupėje). Mūsų rezultatai rodo, kad SDN ir CF pagrįstas klasifikatorius, susidedantis iš biologiškai funkcinių molekulių, veikia geriau nei kitos potencialiai pasižyminčios molekulės, parinktos tik statistiniais metodais ir neturinčios funkcinio svarbos sudėtingesnėse klinikinėse situacijose, tokiose kaip klinikinis TNM nustatymas, gydymo atsakas ir prognozė.

50 didžiausių DEG ir DEP sutapimų buvo tik tas, kuris kelia didelį susirūpinimą dėl šių skirtingai išreikštų molekulių klinikinės svarbos ir taikymo. Be to, skirtingas molekulinis profilis, parodytas skirtingais būdais, gali pavaizduoti naviko panoramos dalis, o integraciniai indeksai, gauti iš abiejų platformų, padėtų geriau suprasti naviko biologiją ir klinikinį šių atskirų molekulių efektyvumą. Todėl biomarkeriai, apimantys kelis genus, identifikuotus skirtingais algoritmais, atspindinčius daugialypio funkcinio disreguliavimo sudėtingumą, suteiktų daugiau įžvalgos apie piktybinės ligos biologiją ir nuosekliai aplenktų atskirus genus skirtingose ​​populiacijose 5, 7, 8, 9, 10, 16, 22, 23, 24, 25, 28, 29, 43, 44 . Kadangi šiame tyrime apibrėžtas SDN buvo integruotas septynių žmogaus PPI tinklo topologinių rodiklių indeksas, mazgai, turintys dideles absoliučias SDN reikšmes, gali gerai atspindėti jų bendrą svarbą PPI tinkle. Be to, mūsų ankstesni kai kurių žmogaus PPI tinklų funkcinių genų topologinių savybių tyrimai parodė, kad funkciniai genai iš tikrųjų buvo būdingi topologiniai požymiai45. Mūsų tyrimas parodė, kad topologiniai matavimai ir diferencijuotai reguliuojamos molekulės atspindi skirtingus ir papildomus ESCC biologijos bruožus, o dar svarbiau yra tai, kad integruoti skirtingų platformų ar priemonių skirtingų bruožų indeksai duotų geriausią rezultatą, jei ne visi, tam tikrose klinikinėse situacijose, SVM. visų atskirų molekulių analizė.

Funkcinio praturtinimo analizė pateikė biologinius paaiškinimus apie SDN pagrįsto TNM klasifikatoriaus klinikinius rezultatus. SDN pagrįsto TNM klasifikatoriaus molekulės buvo praturtintos ribosomų keliu ir biologiniais baltymų sintezės bei tarpląstelinės lokalizacijos procesais. Ribosomos, esančios visose gyvose ląstelėse, yra ląstelių organelės baltymų sintezei ir eukariotinėse ribosomose yra vienodi ribosomų baltymų ir rRNR kiekiai. Ribosominiai baltymai palaiko baltymų ir pačios RNR pusiausvyrą, o ribosomų sintezės nukrypimas gali sukelti ląstelių ciklo sustojimą ar apoptozę. Cai ir kt . pranešė, kad sumažėjusi RUNX1 sukelta ribosomų biogenezė lėmė mažą metabolinį profilį ir lėtą ląstelių ciklą, o tai suteikė konkurencinį pranašumą preleukemijos kamieninėms ląstelėms dėl padidėjusio atsparumo stresui 46 . Dėl ribosominio baltymo ekspresijos reguliavimo į cisplatinos atsparumą piktybinėms ląstelėms Hela 47, EC109 48 ir EC9706 49 . Todėl ribosomų baltymai yra galimi terapiniai taikiniai, kuriuos parodo priešnavikinis aktyvumas, kurį daro ribosomas inaktyvuojantys baltymai įvairiuose vėžiuose 50 . Ryškiai priešingai, kitų klasifikatorių parašo molekulės nepasižymėjo praturtintomis biologinėmis savybėmis. Kitaip nei SDN pagrindu sukurtos TNM parašo molekulės, identifikuotos atliekant tinklo topologinę analizę, kitų klinikinių klasifikatorių sudedamosios molekulės žymi atskirų molekulių derinį be būdingo funkcinio ryšio, turinčių daugybę skirtingų molekulių funkcijų ir trukdančių identifikuoti bendras biologines temas. Tačiau bendrųjų DEP ir DEG funkcinio ir praturtėjimo analizė atskleidė labiau su vėžiu susijusius biologinius bruožus, tokius kaip p53 signalizacijos kelias, ląstelių ciklas, keratinocitų diferenciacija, židinio adhezija, adreno jungtis, kasos vėžys, endometriumo vėžys, ūminė mieloidinė leukemija ir kt. Nepaisant to, 50 geriausių SDN molekulių rodė maksimaliai praturtintus terminus, susijusius su GO biologiniais procesais ir KEGG keliais, po kurių seka DEG, o DEP buvo praturtinti tik peptidų kryžminio sujungimo ir epidermio ląstelių diferenciacijos biologiniuose procesuose (papildoma S6 lentelė).

Kadangi TNM inscenizavimas teikia naudingos informacijos, kuri padeda numatyti sergančiųjų vėžiu prognozes, taip pat pritaikyti terapinę intervenciją, mes pasirinkome ITGB1 - vieną iš SDN pagrįstų TNM klasifikatoriaus molekulių, kitaip praleistų diferencinėmis priemonėmis potencialiems biomarkeriams, kad patvirtintume jo klinikinę stadiją ir prognozinis aktualumas. Tiek Western blot, tiek IHC rezultatai parodė, kad ITGB1 baltymo ekspresijos padidėjimas yra koreliuojamas su vėlyvomis TNM stadijomis, o tai patvirtina, kad topologinė tinklo analizė yra naudingas metodas potencialiems biomarkeriams nustatyti. Integrinų tarpininkaujama sąveika ir ląstelių-ląstelių ir tarpląstelinės matricos (ECM) signalizavimas yra nepaprastai svarbūs palaikant audinių homeostazę, ląstelių dauginimąsi ir išgyvenimą 51 . Atsižvelgiant į daugybines jų biologines funkcijas, pakitusi integrino raiška ar ekspresijos modelis koreliuoja su naviko progresavimu ir prognoze. Padidėjusi ITGB1 ekspresija buvo pastebėta 52 viršutiniuose aerodigeminiuose traktuose, gimdos kaklelio SCC 53 ir vulvos SCC 54 . ITGB1 ekspresijos pašalinimas VSCC ląstelių linijoje A431 arba antagonizuojantis ITBG1 antikūnas gali slopinti invazinį gebėjimą tiek in vitro, tiek in vivo 54 . Naujas makrolidų analogas F806 efektyviau slopino ESCC ląstelių augimą in vitro ir in vivo inicijuodamas anoikį ir vėlesnę apoptozę, blokuodamas ITGB1 aktyvaciją, palyginti su siRNR tarpininkaujamu ITGB1 numušimu 55 . Atvirkščiai, kituose tyrimuose nustatyta, kad sumažėjęs ekspozicija geriamajame SCC 56 . Patobulinta ITGB1 raiška naviko invazijos fronte koreliuoja su regioninių limfmazgių metastazių nebuvimu, o ITGB1 fiziologiškai poliarizuotos ekspresijos išlikimas buvo reikšmingai susijęs su palankia prognoze 57 . Tačiau mūsų ESCC pacientų išgyvenimo analizė atskleidė, kad padidėjusi ITGB1 ekspresija buvo reikšmingai susijusi su vėlyvu TNM sustojimu, blogesne prognoze ir limfmazgių metastazėmis, tačiau turėjo reikšmingą ribą. ITGB1 biologinės funkcijos ir klinikinės svarbos neatitikimas skirtingų tipų navikams gali būti susijęs su antikūnų variacijomis, etnine kilme, stadijų skirtumais, audinių specifiškumu ir kt., Todėl paaiškinti reikia tolesnių tyrimų.

Išvados

Šis tyrimas rodo, kad integraciniai topologiniai indeksai, gauti iš septynių atskirų topologinių požymių, turinčių būdingą funkcinį ryšį, sukuria palyginamą klasifikavimo efektyvumą trijose skirtingose ​​klinikinėse situacijose. Paprastosios SDN klasifikatoriaus molekulės, skirtos atskirti ankstyvas ir vėlyvas klinikines TNM stadijas, buvo praturtintos baltymų sintezės, tarpląstelinės lokalizacijos ir ribosomų biogenezės biologiniais bruožais, o tai rodo, kad ribosomų biogenezė yra perspektyvus terapinis taikinys gydant ESCC. Be to, viena iš ITGB1 parašų molekulių, parinktų topologinėmis priemonėmis, koreliavo su klinikinėmis TNM stadijomis ir ESCC prognoze. Taigi šiame tyrime siūloma PPI tinklų integracinė topologinė analizė pateikia alternatyvų metodą, kaip nustatyti potencialius biomarkerius ir terapinius taikinius iš MS / MS duomenų su ESCC funkcinėmis įžvalgomis. Pasinaudojus laisvai prieinamais žmonių PPI tinklais, SDN, priklausantys tik nuo topologinių ypatybių, tam tikru mastu sutaupytų brangių ir daug laiko užimančių laboratorinių eksperimentų, palyginti su kitais biologinių žymenų atradimo metodais.

Metodai

Audinių mėginiai

ESCC audinių mėginiai baltymų kiekybiniam nustatymui buvo gauti iš Linzhou vėžio ligoninės Henane, Kinijoje, nuo 2010 iki 2011 m. Visi pacientai prieš imdami mėginius davė informuotą sutikimą. Nė vienas iš ESCC pacientų prieš operaciją negavo radioterapijos ar chemoterapijos. Šį tyrimą patvirtino Medicinos mokyklos, Henano universiteto (Kinija) Etikos komitetas, ir visi šio tyrimo metodai buvo atlikti laikantis patvirtintų gairių.

Audinių mėginio paruošimas

Audinių mėginiai buvo sumalti ir homogenizuoti ant ledo, naudojant lizės buferį, kuriame yra 8 M karbamido, 4% CHAPS, 40 mM DTT ir viso proteinazės inhibitoriaus kokteilio (Roche). Audinių homogenizatoriai 15 minučių buvo centrifuguojami 13, 2 x 1000 aps./min. Esant 4 ° C temperatūrai, kad būtų pašalintos visos netirpios atliekos, o supernatantas iki naudojimo buvo laikomas –80 ° C.

„iTRAQ“ žymėjimas po baltymų tripsinizacijos

ESCC ir suderinto N baltymų junginiai buvo pagaminti sumaišant lygius atskirų baltymų kiekius atitinkamai iš 10 ESCC ir N ir po to nusodinami -20 ° C acetonu, po to suspensija. Ištirpinti baltymai buvo redukuoti, alkilinti ir atlikti tripsiną. Tryptiniai ESCC ir N peptidai buvo sujungti po „iTRAQ“ ženklinimo, nudruskinami C18 SepPak kolonėle ir išdžiovinti „SpeedVac“ iki visiško išdžiūvimo.

MALDI-TOF / TOF analizė

Pažymėti peptidai buvo padalinti į 12 frakcijų, naudojant mišraus režimo anijonų mainų / atvirkštinės fazės chromatografiją, naudojant 2, 1 × 150 mm „Acclaim Mixed-mode WAX-1“ HPLC koloną (Dionex, Camberley, UK) ir 0–40% B gradientą. per 40 minučių (A: 20 mM amonio formato, pH 6, 5, 3% acetonitrilo, B: 2 mM amonio formato, pH 3, 0, 80% acetonitrilo), esant srautui 250 μL / min. Kiekviena frakcija buvo išdžiovinta, ištirpinta 0, 1% TFA ir peptidai frakcionuojami ant 384 taškinio x 800 μm anchorchipo, naudojant 75 μm x 25 cm „Acclaim PepMap 100 C18“ HPLC koloną (Dionex, Camberley, JK), 0–40% acetonitrilo gradientą. 0, 1% TFA, esant 300 nl / min., įdedant matricą (5 mg / ml α-ciano-4-hidroksicinamiko rūgšties 90% acetonitrilo, 0, 1% TFA, 1 mM NH4H2PO4) naudojant „Proteineer fc II“ sklidimo robotą ( „BrukerDaltonics“, Brėmenas, Vokietija). Spektrai buvo sukalibruoti naudojant Peptide Calibration Standard II (BrukerDaltonics, Brėmenas, Vokietija). Automatizuotas duomenų gavimas buvo atliktas naudojant „BrukerUltraflextreme MALDI-TOF / TOF“ instrumentą, valdomą naudojant „Warp-LC“ programinę įrangą (BrukerDaltonics, Brėmenas, Vokietija). Duomenys buvo ieškomi naudojant „MASCOT“ per „Proteinscape“ („BrukerDaltonics“, Brėmenas, Vokietija), palyginti su „SwissProt“ žmonių sekų duomenų baze (ir atsitiktine jos versija), naudojant 20 ppm toleranciją pirmtakų jonams, 0, 7 Da fragmentų jonams ir minimalų peptido Mowse rezultatą 30. Priimti buvo tik tie baltymai, kuriuos identifikavo du ar daugiau unikalių peptidų. Šie kriterijai sukūrė nulinį paspaudimą apgaulės duomenų bazėje.

Skirtingai išreikštų baltymų ir baltymų-baltymų sąveikos tinklo konstrukcija

DEP identifikavimui buvo naudojami mažiausiai 2 unikalūs peptidai ir 1, 5 karto skirtumas. DEP buvo naudojami kaip sėkliniai baltymai PPI tinklui sukurti. Sėklos baltymai buvo surinkti į internetinę žmogaus anotuotų ir numatytų baltymų sąveikos (HAPPI) duomenų bazę (//bio.informatics.iupui.edu/HAPPI/) 58 . Sėklos buvo išplėstos jų pirmojo laipsnio kaimynams, esant 5 patikimumo laipsniui, kad būtų sukurtas išplėstas ir aukštos kokybės PPI tinklas. PPI tinklas buvo vizualizuotas naudojant „Pajek“ programinę įrangą.

Svarbių mazgų identifikavimas integracine septynių topologinių ypatybių analize

Mes apibrėžėme SDN pagal septynis topologinius indeksus. Į septynis topologinius rodiklius buvo įtrauktas laipsnis, pusiau lokalumas, tarpas, k-apvalkalas, PageRank, klasterio koeficientas ir savivektoriaus centriškumas - 34, 45, 59, 60 . Patogumui septynis tinklo indeksų vektorius žymime kaip

Image

Norėdami gauti SDN, mes panaudojome faktorinės analizės teoriją, kuri yra klasikinė matmenų mažinimo technologija. Šis modelis apibūdina stebimų, koreliuotų kintamųjų kintamumą galimai mažesniu neprižiūrimų kintamųjų, vadinamų veiksniais, skaičiumi. Stebimi kintamieji gali būti modeliuojami kaip linijiniai bendrųjų veiksnių ir klaidų terminų deriniai. Apskritai, keletas bendrų veiksnių gali atskleisti didžiąją dalį informacijos, esančios stebimuose kintamuosiuose. Taigi, keletas bendrų veiksnių gali būti naudojami vėliau kintamiesiems sumažinti.

Tarkime

Image
topologiniai tinklų indeksai, atitinkantys stochastinį vektorių
Image
, yra
Image
bendrieji veiksniai
Image
ir
Image
specifiniai veiksniai
Image
. Rodyklės vektoriai
Image
yra
Image
. Stačiakampio faktoriaus modelį galima sudaryti taip:
Image
kur
Image
ir
Image

Remiantis stebėjimo duomenimis

Image
, pagrindinis faktorinės analizės žingsnis yra bendrų veiksnių suradimas
Image
ir tada pakeiskite originalą
Image
kintamieji pagal
Image
bendrieji veiksniai
Image
.

Faktorinį modelį galima pasukti, kad būtų lengviau paaiškinti bendruosius veiksnius. Bendri veiksniai

Image
iš tikrųjų yra linijiniai originalių kintamųjų deriniai.

Šiame tyrime nagrinėjamam tinklui mes nustatome du bendrus veiksnius, kurie gali atskleisti daugiau kaip 95% informacijos apie septynis originalius topologinius indeksus. Du bendri septynių PPI tinklo topologinių rodiklių veiksniai yra šie:

Image

Remdamiesi dviem bendrais veiksniais ir septyniais PPI tinklo topologiniais vektoriais, mes nustatome, kad

Image
kaip faktorių balai
Image
. Faktorių balų vertės atspindi santykinę kiekvieno mazgo svarbą. Faktorių balai
Image
prieš
Image
parodyta 1C pav. Dviejų veiksnių indėlis yra atitinkamai 52, 25% ir 43, 71%. Bendras dviejų veiksnių indėlis gali siekti 95, 96%, o tai rodo, kad šie du veiksniai gali atskleisti didžiąją dalį informacijos, esančios septyniuose indeksuose. Remdamiesi faktorių balais, mes atrinkome 50 geriausių reitinguotų mazgų, kaip parodyta 2 lentelėje.

Genų ekspresijos duomenų rinkiniai

Klinikinės svarbos įvertinimui šiame tyrime buvo naudojami penki viešai prieinami ir nepriklausomi genų ekspresijos duomenų rinkiniai, kuriuos galima atsisiųsti iš „Gene Expression Omnibus“ (GEO) svetainės (//www.ncbi.nlm.nih.gov/gov, 1 lentelė).

Kiekvienas duomenų rinkinys buvo gautas kaip CEL failas, o analizės buvo atliktos naudojant „BRB-ArrayTools“. Zondų rinkiniai, kurių trūko daugiau kaip 20% visuose duomenų rinkiniuose, buvo pašalinti iš vėlesnių analizių. Normalizavus pamatiniu matricu ir sujungus kelis zondo rinkinius į vieną kiekvieno geno simbolį, iš viso buvo išrinkti 8 498 unikalūs genai iš penkių genų ekspresijos duomenų rinkinių, kad būtų galima toliau įvertinti klinikinę svarbą. DEG buvo parinkti naudojant T testą, kurio vandens vertės riba buvo 0, 0001.

Klinikinės svarbos įvertinimas

Be DEP, DEG ir SDN gautų ESCC potencialių parašų molekulių, mes įsitikinome, kad visų aukščiau išvardytų dominančių molekulių, pavadintų visapusiškomis savybėmis (CF), derinys padėtų mums sukurti tinkamiausią klinikiniam klasifikatoriui klasifikatorių. Norėdami įvertinti keturių skirtingų tipų įdomių molekulių klinikinę svarbą, pasirinkome tris skirtingus klinikinius parametrus. In clinical setting 1, classifiers were used to distinguish ESCC from adjacent N; in clinical setting 2, classification of early and late TNM stages was performed; in clinical setting 3, we used four different sets of molecules to predict the response to neo-CRT for ESCC.

To compare the clinical relevance of different types of interesting molecules, a radial basis functional support vector machine (SVM), which adopted a recursive feature elimination algorithm to select useful features, was used for building SDN-, DEP-, DEG- and CF-based classifier. The performance of SVM was estimated using five-fold cross validation error. Leave-one-out (LOO) cross validation was used to determine the optimal values of the kernel parameters and regularization parameter C, and the test error was obtained using the tuned parameters. The top 50 molecules according to statistical score were used as the feature vector for building the optimal classifier. Receiver operating characteristic (ROC) curves were plotted using sensitivity versus 1-specificity, and the areas under the curves (AUCs) were computed to evaluate the classification accuracies of three different classifiers with regards to ESCC and N, early and advanced TNM stages. Permutation test was used to compare the performances of optimal SVM-based classifiers with 1000 classifiers comprising molecule sets of the same size randomly selected from 8498 common genes present on all arrays.

Funkcinio praturtinimo analizė

A Cytoscape plug-in ClueGo that visualizes the selected terms in a functionally grouped network was used to estimate the biological relevance of each optimal classifier. The enrichment analyses of GO biological processes and KEGG pathways were performed using GO annotations for the complete human proteome as a reference set and the constituent molecules of each optimal classifier as a test dataset. The hyper-geometric test was used for enrichment analysis and the terms with a significance level of P < 0.0001 were regarded as over-represented after multiple testing correction method Benjamini and Hochberg for false discovery calculation.

Western blot and immunohistochemistry

Western blot and IHC analyses of ITGB1 protein expression in ESCC were performed as previously described. The ESCC tissue microarray of cohort 1 (HEso-Squ180Sur-04) purchased from Shanghai Outdo Biotech Co., Ltd. comprised 100 ESCC patients undergoing surgery between 2006 and 2008. Cohort 2 included 91 ESCC patients undergoing esophagectomy surgery from 2010 to 2014 at the First Affiliated Hospital of Henan University of Science and Technology and Anyang people's hospital. The composite immunostaining scores were calculated by multiplying the staining intensity and positivity.

Statistika

All statistical analyses were performed using SPSS 16.0 software (SPSS, Chicago, IL, USA). Wilcoxon signed-rank test was used to evaluate the significance of the differences in ITGB1 expression normalized to β-actin. ROC curve analysis was used to determine the cutoff score of immunostaining. The chi-square test or Fisher's exact test were used to evaluate the correlations between DEPs and DEGs, ITGB1 expression and clinicopathological features.

Papildoma informacija

How to cite this article : Liu, R.-M. et al . Integrative topological analysis of mass spectrometry data reveals molecular features with clinical relevance in esophageal squamous cell carcinoma. Mokslas. Rep. 6, 21586; doi: 10.1038/srep21586 (2016).

Papildoma informacija

PDF failai

  1. 1.

    Papildoma informacija

Komentarai

Pateikdami komentarą jūs sutinkate laikytis mūsų taisyklių ir bendruomenės gairių. Jei pastebite ką nors įžeidžiančio ar neatitinkančio mūsų taisyklių ar gairių, pažymėkite, kad tai netinkama.