Įvairių šaltinių klinikinių tyrimų duomenų analizė, siekiant numatyti amiotrofinę šoninės sklerozės progresavimą | gamtos biotechnologijos

Įvairių šaltinių klinikinių tyrimų duomenų analizė, siekiant numatyti amiotrofinę šoninės sklerozės progresavimą | gamtos biotechnologijos

Anonim

Dalykai

  • Kompiuterinė biologija ir bioinformatika
  • Fotosintezė
  • Augalų mokslai

Anotacija

Amiotrofinė šoninė sklerozė (ALS) yra mirtina neurodegeneracinė liga, kurios klinikinis vaizdas yra labai heterogeniškas. Dėl to sunku diagnozuoti ir veiksmingai gydyti, todėl reikia geresnių priemonių ligos progresavimui įvertinti. Čia pateikiame „DREAM-Phil Bowen ALS Prediction Prize4Life“ iššūkio rezultatus. Šiame viešojo pirkimo konkurse konkurentai sukūrė algoritmus, numatančius 1 822 ALS sergančių pacientų ligos progresavimą iš standartizuotų, anoniminių 2/3 fazės klinikinių tyrimų. Du geriausi algoritmai pralenkė iššūkio organizatorių sukurtą metodą ir ALS klinikų gydytojų prognozes. Manome, kad panaudodami abu laimėtus algoritmus būsimuose bandymų projektuose, reikiamą pacientų skaičių sumažinsite bent 20%. DREAM-Phil Boweno ALS prognozavimo prizo4Life iššūkis taip pat nustatė kelis galimus nestandartinius ligos progresavimo prognozuotojus, įskaitant šlapimo rūgštį, kreatininą ir, stebėtinai, kraujospūdį, atskleidžiantį ALS patobiologiją. Ši analizė atskleidžia viešojo pirkimo konkurso, kuriame naudojami klinikinių tyrimų duomenys, siekiant paspartinti ALS tyrimus ir plėtrą, galimybes.

Pagrindinis

ALS, dar vadinama Lou Gehrig liga, yra progresuojantis neurodegeneracinis sutrikimas, paveikiantis viršutinį ir apatinį motorinius neuronus. Simptomai yra raumenų silpnumas, paralyžius ir galiausiai mirtis, paprastai per 3–5 metus nuo ligos pradžios. Maždaug 1 iš 400 žmonių bus diagnozuotas ir miršta nuo ALS 1, 2, o šiuolaikinė medicina susiduria su dideliu iššūkiu ieškant veiksmingo gydymo 2, 3 . Riluzolis (Rilutek) yra vienintelis patvirtintas vaistas nuo ALS ir jo poveikis išgyvenimui yra ribotas 4 .

Viena esminių kliūčių suprasti ir plėtoti veiksmingą ALS gydymą yra ligos eigos nevienalytiškumas - nuo mažiau nei metų iki daugiau nei 10 metų. Kuo heterogeniškesnė liga, tuo sunkiau numatyti, kaip progresuos konkretaus paciento liga, ir tokiu būdu parodyti galimos terapijos poveikį, todėl klinikiniai tyrimai tampa ypač sunkūs. Be to, netikrumas dėl prognozės yra didžiulė našta pacientams ir jų šeimoms. Taigi tikslesnis ligos progresavimo numatymo būdas, išmatuotas klinikine skale (ALS funkcijų įvertinimo skalė: ALSFRS 5 arba pataisyta versija, ALSFRS-R 6 ), gali reikšmingai pagerinti klinikinę praktiką ir klinikinių tyrimų valdymą, ir padidinti tikimybę, kad ateityje rinkoje bus pateiktas gydymas 7, 8 .

Stengdamiesi išspręsti svarbų ALS ligos progresavimo kintamumo klausimą, pasinaudojome dviem įrankiais: dideliu klinikinės, išilginės informacijos apie pacientą duomenų rinkiniu ir didžiulėmis žiniomis bei naujais skaičiavimo metodais, kuriuos galima gauti pasinaudojant minėtų šaltinių paslaugomis.

Sukaupti klinikinių tyrimų duomenų rinkiniai pasirodė neįkainojami tyrinėtojams, siekiantiems išsiaiškinti sudėtingas ligas, tokias kaip išsėtinė sklerozė, Alzheimerio liga ir kitos. 9, 10, 11, 12 . Atsižvelgdami į tai, „Prize4Life“ ir Masačusetso bendrosios ligoninės neurologinių klinikinių tyrimų institutas (NCRI) sukūrė „Pooled Resource“ atviros prieigos ALS klinikinių tyrimų (PRO-ACT, www.ALSdatabase.org/) platformą, kurią finansavo ALS terapijos aljansas ir bendradarbiaujant su šiaurės rytų ALS konsorciumu. Projekto PRO-ACT vizija buvo paspartinti ir patobulinti pereinamuosius ALS tyrimus, suprojektuojant ir sukuriant duomenų rinkinį, kuriame būtų kuo daugiau baigtų ALS klinikinių tyrimų sujungtų duomenų. 2012 m. Gruodžio mėn. „PRO-ACT“, kaip tyrėjų atvira prieiga, buvo paleista daugiau kaip 8 600 pacientų.

Mes kreipėmės į informacijos rinkimą 13, kad palengvintume nešališką įvairių prognozavimo metodų efektyvumo vertinimą ir padidintume supratimą apie šio naujo duomenų šaltinio tyrimų galimybes. Norint išspręsti ALS progresavimo kintamumo klausimą, prieš viešai paskelbiant tarptautinę minios rinkimo iniciatyvą „DREAM-Phil Bowen ALS Prediction Prize4Life“ buvo naudojamas PRO-ACT duomenų pogrupis. Prizas už iššūkį buvo 50 000 USD, kuris bus skirtas už tiksliausius metodus numatyti ALS progresą. Šis iššūkis buvo parengtas ir įgyvendintas bendradarbiaujant iniciatyvai „Dialogas dėl atvirkštinio inžinerijos įvertinimo ir metodų“ (DREAM) ir „Prize4Life“, naudojant „InnoCentive“ platformą. Siekdami nuspėti, kad paciento liga progresuos per ateinančius 9 mėnesius, sprendėjų buvo paprašyta panaudoti 3 mėnesių individualios paciento lygio klinikinių tyrimų informaciją.

Dėl iššūkio buvo pateikti 37 unikalūs algoritmai, iš kurių buvo nustatyti du laimėti įrašai. Apskritai, geriausiai veikiantys algoritmai prognozavo ligos progresavimą geriau nei pradinis modelis ir gydytojai, naudojantys tuos pačius duomenis. Klinikinio tyrimo modeliavimas rodo, kad naudojant algoritmus turėtų būti įmanoma žymiai sumažinti klinikinio tyrimo dydį, reikalingą įrodyti vaisto poveikį. Galiausiai, uždavinys atskleidė kelis klinikinius matavimus, kurie anksčiau nebuvo žinomi kaip numatantys ligos progresavimą, o tai gali parodyti naują informaciją apie ALS biologiją.

Rezultatai

Iššūkių planavimo ir dalyvavimo statistika

Kaip 7-osios DREAM iniciatyvos dalis „DREAM-Phil Bowen ALS Prediction Prize4Life“ (nuo šiol vadinama ALS Prediction Prize) pasiūlė skaičiavimo metodus ALS pacientų progresavimo įvertinimui, naudojant klinikinių tyrimų duomenis iš PRO-ACT duomenų rinkinio ( Internetiniai metodai ir papildoma pastaba 1). Šis iššūkis pasiūlė 50 000 USD apdovanojimą už patikimiausius ir prognozuojančius sprendimus.

Tyrėjų buvo paprašyta naudoti 3 mėnesių ALS klinikinių tyrimų informaciją (0–3 mėnesius) numatyti būsimą ligos progresavimą (3–12 mėnesius). Ligos progresavimas buvo vertinamas pagal ALSFRS pokyčių nuolydį (funkcinė skalė nuo 0 iki 40). Sprendėjams buvo duoti 12 mėnesių išilginiai duomenys algoritmų kūrimui ir mokymui, ir jie buvo paprašyti pateikti savo algoritmą įvertinti atskirame duomenų rinkinyje, kurio nėra algoritmų kūrimui ar mokymui.

Įvertinimui algoritmus „InnoCentive“ paleido „InnoCentive“ serveriuose. Algoritmai buvo pateikti per pirmuosius 3 paciento dalyvavimo klinikiniame tyrime mėnesius. Kiti 9 mėnesių duomenys nepateikti. Veiklos rezultatai, palyginti su testo duomenų rinkiniu, buvo pateikti rezultatų suvestinėje. Galiausiai dalyviai buvo įvertinti trečiuoju, visiškai aklu ir anksčiau nematytu patvirtinimo rinkiniu, kad būtų išvengta perpildymo. Prizas buvo įteiktas atsižvelgiant į šio patvirtinimo rinkinio atlikimą (1 pav.).

Image

a ) Iššūkio duomenis sudarė 1822 pacientai iš ALS klinikinių tyrimų iš PRO-ACT duomenų rinkinio. Duomenų tipai buvo demografiniai duomenys, informacija apie klinikinę ir šeimos istoriją, laboratoriniai tyrimai ir gyvybiniai požymiai. ( b ) Duomenis padalijome į tris pogrupius: mokymo dalyviams pateiktus duomenis apie mokymus, lyderių lentelę ir patvirtinimo duomenis, skirtus užduoties įvertinimui. Lyderių lentelė ir patvirtinimo duomenys buvo prieinami tik iššūkių valdytojams, norint išbandyti sprendėjų pateiktus algoritmus. Algoritmai buvo aprūpinti pirmųjų 3 mėnesių duomenimis, kad būtų galima atlikti prognozes, ir buvo vertinami remiantis sekančių 9 mėnesių duomenimis. ( c ) Pasibaigus iššūkiui, solistai pateikė savo algoritmus, kuriuos išbandys iššūkio organizatoriai, naudodamiesi patvirtinimo duomenų rinkiniu. ( d ) Tada teisėjai įvertino c punkte gautas prognozes dėl tikslumo.

Visas dydis

Iššūkis truko 3 mėnesius, nuo 2012 m. Liepos 13 d. Iki spalio 15 d. Jame dalyvavo 1 073 registruotojai iš> 60 šalių. Po iššūkio buvo atlikta registruotojų apklausa. Tyrimas atskleidė, kad auditorija yra įvairi, apimanti akademinius (58%) ir pramonės (30%) specialistus, taip pat kitus (12%). Pažymėtina, kad 80% tiriamųjų beveik neturėjo žinių apie ALS. Ne mažiau kaip 93% išreiškė susidomėjimą dalyvauti būsimame iššūkyje (išsamūs apklausos rezultatai pateikiami 2 papildomoje pastaboje ir 1 ir 2 lentelėse). Tačiau, kaip būdinga viešojo pirkimo iššūkiams, tik nedidelė dalis registruotojų pateikė testavimo algoritmą. Iššūkio metu iš viso 37 komandos pateikė algoritmą, kurį reikia išbandyti per lyderių lentelę, o 10 komandų pateikė pagrįstas galutines pastabas. Kad pateiktas R 14 kodas būtų teisingas, jis turėjo būti vykdomas „InnoCentive“ sistemoje ir visiems pacientams numatyti ALSFRS nuolydį.

Metodo atlikimas ir vertinimas

Įvertinome ir palyginome dešimt galutinių sprendimų, kuriuos pateikė sprendėjai, taip pat vienuoliktą metodą, kurį sukūrė iššūkio organizatoriai. Pastarasis metodas yra vadinamas pradiniu metodu, nes jis buvo naudojamas norint nustatyti pradinius rezultatus, kuriuos geriausiai atliks komandos. Sprendimo metodai ir pradinis algoritmas aprašyti 3 papildomoje pastaboje, 1 papildomame paveiksle ir 2–8 papildomose lentelėse; visi numatymo rinkiniai pateikiami papildomose prognozėse. Kaip atskirą archyvą (papildomą programinę įrangą) pateikiame šešių komandų, kurios gali būti naudojamos laikantis pačių algoritmų autorių teisių pareiškimų, pirminius kodus. Metodo efektyvumas buvo įvertintas atsižvelgiant į kvadratinio vidurkio nuokrypį (vidutinį kvadratinį nuokrypį) ir Pearsono koreliaciją (PC), kad būtų galima palyginti ALSFRS nuolydžio prognozes su faktiniu nuolydžiu, gautu iš duomenų. Nors vidutinį kvadratinį nuokrypį galima tiesiogiai interpretuoti kaip įvertinimo paklaidą ALSFRS vienetais, kompiuteris yra naudingas norint įvertinti teisingą tendencijų numatymą. Norėdami vizualiai patikrinti eksploatacines savybes, žiūrėkite 1 papildomus rezultatus ir 2 ir 3 papildomus paveikslus.

Sprendėjų grupės ir jų metodai buvo įvertinti remiantis jų atskirų patikimumo duomenų rinkinio (2 pav.) Vidutinių rezultatų nuokrypio balais, kurie buvo nepaprastai svarbūs užtikrinant patikimumą (apie skirtumus tarp patvirtinimo ir lyderių lentelės rezultatų žiūrėkite 2 papildomuose rezultatuose, papildomus 4 pav.). 5, 6, 7, 8 ir 9 papildoma lentelė). Šešių geriausių komandų (užimtų 1–6 pozicijose) vidutinis kvadratinis nuokrypis buvo mažesnis nei pradinis metodas. Dešimt sprendėjų taikė įvairius metodinius metodus, tačiau įdomu pastebėti, kad keturios iš šešių aukščiausio rango komandų naudojo atsitiktinio miško mašinų mokymosi metodus. Kiti du požiūriai, užimti 1 ir 6 padėtyse, buvo pagrįsti atitinkamai Bajeso medžių ir neparametrine regresija. Paprasti regresijos metodai (nuo 8 iki 10 kategorijų) buvo atlikti žymiai prasčiau nei pradinis metodas. 7 metodas yra naivus prognozatorius, kuris apskaičiuoja vidutinį treniruočių grupės pacientų nuolydį ir prognozuoja šio nuolydžio vertę kitiems pacientams. Gautą nuokrypį mes vadinsime bazinio kvadratinio vidurkio nuokrypiu, nes jis gerai parodo, koks yra sunkumas numatyti tam tikro paciento rinkinį, tokiu būdu gaunant PK 0. Išskyrus šį metodą, efektyvumo reitingai, nustatyti naudojant vidutinį kvadratinį nuokrypį, ir tie, kurie nustatyti kompiuterio naudojimas buvo gana nuoseklus.

Image

( a, b ) Palyginome dešimties komandų, pateikusių vykdomąjį R kodą paskutiniame iššūkio etape, požiūrį ir pradinį požiūrį, kurį sukūrė iššūkio organizatoriai. Visi sprendėjų algoritmai turėjo būti suderinami su R versija 2.13.1. Komandos yra sunumeruotos pagal jų reitingą pagal rms nuokrypio rodiklį ( a ) arba Pearsono koreliaciją ( b ). Jie yra mėlynos spalvos, jei jie buvo geresni už pradinį, ir pilkos spalvos, jei jie buvo blogesni už pradinį lygį. Be to, parodytas 1 ir 2 komandų prognozių suvestinis rodiklis. Šluotelės nurodo įkrovos apimtą SD (įdėklą). Įvairių pacientų mėginių įkrovos mėginių dažnis įvertinamas pirmą kartą. 1 ir 2 komandos užėmė pirmąją vietą atitinkamai 71% ir 26% bagažinės pavyzdžių (procentai suapvalinti iki artimiausio sveikojo skaičiaus). d ) Modeliavimu mes įvertinome, kokiu mastu klinikinių tyrimų dydį galima sumažinti kiekvienu iš dalyvaujančių metodų, atsižvelgiant į geresnį ligos progresavimo numatymą.

Visas dydis

Be to, mes panaudojome įkrovos virpėjimą, kad įvertintume efektyvumo patikimumą (internetiniai metodai). Čia mes įvertinome tikimybę, kad tam tikru metodu bus pasiektas geriausias bendras efektyvumas skirtinguose pacientų pogrupiuose. 1 ir 2 komandos pasiekė geriausią vidutinį kvadratinį nuokrypį - atitinkamai 71% ir 26% pacientų mėginių, sugeneruotų įkrovos metu (2b pav.). Taigi padarėme išvadą, kad šių dviejų komandų algoritmai pateikia tiek patikimiausias, tiek patikimiausias prognozes. Todėl 1 ir 2 komandos buvo paskelbtos geriausiomis iššūkio dalyvėmis ir kiekvienai buvo įteiktas po 20 000 USD apdovanojimas. 3 komanda (nuoroda 15) laimėjo 10 000 USD vertės trečiosios vietos prizą. Kaip ir ankstesnėse DREAM iššūkių 16 dalyse, sudedant prognozes 1 ir 2 komandoms, prognozės klaida dar labiau sumažėjo. Įkrovos paleidimas leido mums įvertinti, kad statistiškai reikšmingas pradinio algoritmo pagerėjimas atitiktų kvadratinio vidurkio nuokrypį 0, 5, kurio nebuvo pasiekta jokiu būdu.

Tada buvo naudojami du geriausius rezultatus atliekantys metodai ir bazinis algoritmas, kad būtų galima numatyti pacientų ligos progresavimą pagal visą PRO-ACT duomenų rinkinį. Algoritmai išlaikė savo sugebėjimą patikimai numatyti ligos progresavimą (vidutiniai kvadratiniai skirtumai: 1 komanda, 0, 544; 2 komanda, 0, 559; pradinė, 0, 559; 3 papildomi rezultatai ir papildomi 9 ir 10 pav.). Tas našumas buvo šiek tiek mažesnis nei iššūkio metu. Tai galima paaiškinti didesniu duomenų kintamumu per didesnį skaičių bandymų, kurie taip pat padidino bazinio kvadratinio koeficiento nuokrypį nuo 0, 566 iki 0, 610.

Be tinkamo nuspėjamojo metodo pasirinkimo, rezultatams taip pat turėjo įtakos klinikinių matavimų apdorojimas. Statinės savybės (turinčios vieną vertę vienam pacientui, pvz., Lytis ar amžius) galėtų būti išnaudotos. Priešingai, likusios savybės buvo „išspręstos laiko“ ir todėl negalėjo būti tiesiogiai įtrauktos į standartines mašininio mokymosi sistemas, nes pacientų laiko taškai ir matavimų skaičius skyrėsi. Paprastai komandos pritaikydavo įvairius statistinius duomenis kiekvieno tipo paciento laiku nustatytus duomenis į pastovų statinių požymių skaičių. Pavyzdžiui, tiesinė regresija buvo taikoma norint pavaizduoti matavimų rinkinį pagal nuolydį ir kirtį (pvz., Pradinis metodas). Kitas metodas buvo pasirinkti paskirtus matavimus kaip savybes, tokias kaip mažiausios ir didžiausios verčių vertės. Pastarąjį metodą sėkmingai pritaikė geriausiai pasirodžiusi komanda 1. Pažymėtina, kad šis min / max metodas rodė laiko atžvilgiu išspręstus duomenis tvirčiau nei tiesinis regresijos metodas, kuriam, matyt, trūko palyginti nedaug duomenų. Požymių traktavimas taip pat išskyrė keturis metodus, pagrįstus atsitiktiniais miško variantais, tai yra, jie naudojo specifinius bruožų pasirinkimo, trūkstamos vertės įtraukimo ar bruožų suvestinės statistikos metodus.

Kad algoritmai būtų naudingi kliniškai, jie turėtų išlaikyti nuspėjamumą, turėdami ribotų duomenų, turinčių (i) mažiau funkcijų (ii) arba apimančių mažiau nei 3 mėnesius. Todėl mes išanalizavome (i) poveikį naudodamiesi tik penkiomis prognozuojamiausiomis savybėmis ir (ii) apribodami informacijos apie algoritmus laikotarpį iki pirmojo duomenų mėnesio. Tiek geriausiai veikiančių algoritmų, tiek pradinių metodų veikimas iš esmės nepablogėjo (3 papildomi rezultatai ir papildomi 9 ir 10 pav.).

Prognozės palengvina klinikinio tyrimo dydžio sumažėjimą

ALS klinikiniai tyrimai skirti įvertinti tam tikro gydymo vaistais poveikį ligos progresavimui, o ALSFRS ir ALSFRS-R balai naudojami kaip bendros baigties priemonės. Didelis ALS ligos progresavimo kintamumas trukdo nustatyti nustatyto gydymo poveikį, todėl reikalingi didesni ir brangesni klinikiniai tyrimai. Todėl galimybė tiksliau nuspėti numatomą konkretaus paciento ligos progresavimą (be gydymo intervencijos) gali sumažinti reikalingų pacientų skaičių padidinant gebėjimą nustatyti vaisto poveikį ligai (mažiau užtemdytam būdingu ligos kintamumu). Norėdami kiekybiškai įvertinti galimą bandymo dydžio sumažinimą, atsirandantį naudojant algoritmus, modeliuodavome bandymus (internetinius metodus). Mes apskaičiavome, kad bandymų apimtį galima sumažinti iki 20, 4%, naudojant apibendrintas 1 ir 2 komandų prognozes (2d pav.). Kadangi vidutinės paciento išlaidos ALS klinikiniame tyrime yra 30 000 USD (LA White'as ir D. Kerr, asmeninė komunikacija), 3 fazės, 1 000 pacientų tyrime, tai reikštų, kad išlaidos sumažės 6 mln. USD.

Algoritmų ir gydytojų palyginimas

ALS prognozė yra sudėtinga. Gydytojai dažnai jaučia, kad jiems trūksta būtinų priemonių, kad pacientams būtų suteikta tiksli prognozinė informacija. Taigi mes siekėme įvertinti, ar ALS prognozavimo algoritmai galėtų padėti gydytojams, palygindami jų numatomą našumą.

Todėl mes pasirinkome palyginti nedidelį, bet tipišką pacientų pogrupį. Naudodamiesi „k“ priemonių grupavimu, 1822 pacientus suskirstėme į 14 grupių, atspindinčių dažniausiai pasitaikančius ALSFRS laiko kursus. Klasteriai išsiskyrė tiek susikirtimais (ALSFRS balas 0 metu), tiek jų progresijos kreivių forma (3a pav.). Remdamiesi šiais 14 skirtingais ligos progresavimo modeliais, atrinkome 14 reprezentatyvių pacientų, tai yra kiekvieno klasterio centroidą.

Image

( a ) ALSFRS nuolydis buvo padalintas į 14 grupių, dažniausiai pasitaikančių ligos progresavimo profilių, naudojant k-priemones. Klasteriuose daugiausia yra lėtų (juodų), vidutinių (pilkų) ar greitų (raudonų) pacientų. Pacientai, kurie buvo arčiausiai kiekvieno klasterio centro, buvo atrinkti 14 reprezentatyvių pacientų. ( b ) 12 klinikų gydytojų (raudona, „A“ rodo jų apibendrintų prognozių atlikimą) rodikliai ir du algoritmai (mėlyna spalva) yra įvertinti remiantis rms nuokrypiu (ordinatu) ir Pearsono koreliacija (abscisiu). Čia apskaičiuojamas rms nuokrypis ir koreliacija, remiantis 14 tipinių pacientų. ( c, d ) Nuokrypio prognozės (abscisės), gautos pagal 1 ( c ) algoritmą ir mediko mediko, atsižvelgiant į vidinį kvadratinį nukrypimą ( d ). Atskiri pacientai buvo klasifikuojami kaip lėtas (-), vidutinis (o) arba greitas (+) pagal tikrąją progresiją (ordinatė). Numatomos klasifikacijos buvo įvertintos atsižvelgiant į slenkstį (punktyrine linija). Manoma, kad pacientams, esantiems kairėje arba dešinėje nuo slenksčio, prognozuojama atitinkamai greitai arba lėtai. Apskritimai pabrėžia neteisingai klasifikuotus pacientus ( d ).

Visas dydis

Vėliau 12 gydytojų iš aukščiausių ALS klinikų iš septynių šalių buvo paprašyta įvertinti šių reprezentatyvių pacientų ligos progresavimą ateityje (papildomi rezultatai 4, papildomas 11 pav., 10 papildoma lentelė ir papildomi duomenys 1), naudojant tikslius tuos pačius duomenis, pateiktus pacientams. algoritmai. Du geriausius rezultatus atlikę algoritmai iš esmės pranoko visas klinikų prognozes, parodydami ir didesnį PC, ir mažesnį vidinį kvadratinį nukrypimą (3b pav.). Be to, algoritmai taip pat pralenkė visas klinikų gydytojų prognozes. Progreso laipsnis, numatytas geriausiai veikiančio algoritmo (1 grupės), priešingai nei medikų numatytas greitis, ir faktinis ligos progresavimo laipsnis 14 atvejų buvo gerai koreliuojami (3c pav.). Šie rezultatai rodo, kad numatymo algoritmai gali būti naudingi padedant gydytojams įvertinti paciento ligos progresavimą.

Be numatomo algoritmo tikslumo, labai svarbu, kad būtų pateiktas platus paciento progresavimo įvertinimas, tai yra, kad jis galėtų teisingai klasifikuoti tam tikrą pacientą kaip vidutinį ligos progresavimą arba turintį neįprastai lėtą ar greitą ligos eigą. Todėl mes išanalizavome tiek algoritmų, tiek klinikomis pagrįstas prognozes, kad nustatytume, kiek lėtai ir greitai progresuojantys pacientai buvo teisingai klasifikuojami. Trys pacientai, kurių ALSFRS nuolydis buvo mažesnis kaip –1, 1 balo per mėnesį, buvo laikomi greitais, septyni pacientai, kurių nuolydis buvo didesnis nei –0, 5 balo per mėnesį, buvo laikomi lėtai, o likę keturi pacientai buvo laikomi vidutiniais.

Šiame ribotame pacientų pogrupyje geriausias algoritmas (1 komanda) puikiai išskyrė lėtai ir greitai progresuojančius pacientus (3c pav., D). Atvirkščiai, tipinio gydytojo numatytas progresavimo laipsnis parodė žymiai mažiau koreliacijos su tikru greičiu ir daugelis pacientų buvo klasifikuoti neteisingai. Vidutiniškai gydytojai suklasifikavo 35% pacientų atvejų (papildomi rezultatai 4, papildomas 11 pav. Ir 10 papildoma lentelė).

Nuspėjamos savybės

Norėdami įvertinti kiekvienos funkcijos svarbą skirtingiems algoritmams, mes pažvelgėme į nuspėjamąsias savybes, nes jos buvo įvertintos pagal šešis geriausius algoritmus. Mes sutelkėme dėmesį į ypatybes, kurias mažiausiai du sprendėjai įtraukė į 30 geriausių nuspėjamųjų funkcijų. Buvo nustatyta šešiolika tokių požymių (4a pav.). Į sąrašą įtraukta keletas funkcijų, apie kurias anksčiau pranešta, kad būtų galima numatyti ALS progresavimą, įskaitant laiką nuo pradžios, amžių, priverstinį gyvybinį pajėgumą (FVC), atsiradimo vietą, lytį, svorį 17, 18, 19, 20, taip pat šlapimo rūgšties koncentraciją kraujyje, funkcija, kuri tik neseniai buvo pasiūlyta kaip prognozuotoja 20 . Be to, iššūkis buvo sėkmingas nustatant nestandartinius nuspėjamuosius požymius, atveriant duris į naujas įžvalgas apie ALS ligos mechanizmus. Tai buvo pulsas, kraujospūdis, taip pat kreatinkinazės, kreatinino ir fosforo koncentracija.

Image

a ) Šilumos žemėlapyje pavaizduoti bruožai, kurie buvo atpažįstami (nuo 1 iki 30, parodyta spalvomis nuo mėlynos iki geltonos) bent iš dviejų algoritmų iš jų 30 prognozuojamiausių. Stulpelio vidurkis yra šešių geriausių tirpiklių vidurkis. ALSFRS_Q reiškia bent vieno iš atskirų ALSFRS klausimų naudojimą, priešingai nei tik jų sumos, ALSFRS, vartojimas. Likusiose plokštėse analizuojamos trys savybės, apie kurias anksčiau nebuvo pranešta literatūroje: fosforas, kreatininas ir pulsas. b ) požymio ir ALSFRS koreliacijos tikimybė paskirstyta pacientams. ( c, d ) Dviejų pavyzdžių pacientams - šių nuspėjamųjų požymių laiko progresas. Pastaba: norėdami parodyti skirtingus išmatavimus vienoje diagramoje, normalizavome juos pagal santykines vertes, pagrįstas kvartiliais (internetiniai metodai).

Visas dydis

Toliau įvertinome šias savybes, nustatydami koreliaciją tarp atitinkamo požymio ir ALSFRS balų kiekvienam tiriamajam laikui bėgant (4b – d pav.). Pažymėtina, kad kreatinino atžvilgiu koreliacijų pasiskirstymas tarp pacientų buvo nukreiptas į aukštesnę koreliaciją, o tai rodo pacientų pogrupį, pasižymintį neįprastai aukšta koreliacija tarp kreatinino ir ALSFRS balų pokyčių. Tai mažesniu mastu taip pat nustatyta kreatinkinazei, koreliuojamai su kreatininu. Tai rodo, kad šie požymiai gali būti ypač nuspėjami konkretiems pacientų pogrupiams, todėl gali būti naudingi ligos biologiniai žymekliai. Panaši tendencija nebuvo nustatyta pulso, fosforo ar kraujospūdžio srityje (5 papildomi rezultatai ir papildomi 12 ir 13 pav.), Kuriems reikalinga tolesnė išsami analizė, neapsiribojant šiuo tyrimu, norint ištirti jų galimas numatomas savybes.

Diskusija

Dabartinis ALS sergančių pacientų ligos progresavimo įvertinimo metodų trūkumas yra pagrindinė kliūtis išbandyti naujus terapinius metodus klinikinių tyrimų metu ir suprasti ligos mechanizmus. Kadangi ALS yra greitai progresuojanti liga, tikslus ligos progresavimo įvertinimas yra labai svarbus rūpinantis pacientais ir priimant sprendimus dėl klinikinės intervencijos bei pagalbinių technologijų.

Čia pristatytas unikalus globalus iššūkis sutelkė 37 dalyvaujančių komandų pastangas sukurti įrankius ligos progresavimui numatyti taip, kad būtų naudinga ALS klinikiniams tyrimams ir gydytojams, ir nustatyti naujas prognozavimo savybes, kurios gali suteikti naujos įžvalgos apie ligos procesus ir suteikti svarbių žinių biomarkeriai.

„PRO-ACT“ platforma, didžiausias turimas ALS klinikinių tyrimų duomenų rinkinys, suteikė precedento neturinčią galimybę pagerinti mūsų supratimą apie ALS sergančių pacientų populiaciją ir natūralią ligos istoriją 21 .

Miniatiūrinis požiūris turėjo keletą pranašumų. Pirma, iššūkis pritraukė naujų minčių ir naujų perspektyvų problemai, kuri beveik nežinoma už ALS tyrimų bendruomenės ribų 22 . Antra, uždavinio formatas leido aklai palyginti skirtingus numatymo metodus, išbandytus duomenų rinkinyje, kurio niekada nematė sprendėjai, ir kuriems algoritmai niekada nebuvo pateikti. Tai leido geriau įvertinti sprendimų tvirtumą.

Pabrėžtina, kad algoritmus buvo galima suskirstyti į dvi grupes pagal jų atlikimą: komandos, naudojančios medžių ansamblių regresijos metodus, tokius kaip atsitiktinė miško ar Bajeso adresinė regresija, beveik visada pralenkė komandas, naudodamos paprastą regresiją. Šie rezultatai rodo, kad medžių ansamblių regresijos metodai, tikėtina, yra tinkami klinikiniams duomenims apskritai, netaikant ALS, todėl jie turi didelę bendrą reikšmę klinikinių tyrimų informacijos analizei atliekant klinikinius tyrimus ir klinikinius sveikatos įrašus. Be to, patikimas laiku nustatytų klinikinių matavimų apdorojimas buvo esminis dalykas siekiant bendriausių labiausiai prognozuojančių rezultatų, kai geriausia buvo pateikti statistikos suvestinę. Tai gali nutikti dėl riboto laiko taškų skaičiaus ir vidinio triukšmo, kurie vyrauja medicinos duomenyse.

Atlikdami modeliavimą, mes apskaičiavome, kad remiantis laimėjusių algoritmų numatytais duomenimis, ALS klinikinio tyrimo metu populiacijos dydis gali sumažėti 20%. Šis sumažėjimas atsiranda dėl bandymų projekto pakeitimų. Planuojant klinikinius tyrimus, manoma, kad kintamumas tarp pacientų planuoja pakankamą tyrimo dydį, kad būtų galima nustatyti vaisto poveikį, kuris viršija šį kintamumą. Algoritmas, kuris suteikia daugiau informacijos apie pacientus ir taip sumažina kintamumą tarp pacientų, gali padėti sumažinti tyrimo dydį. Be to, numatomo dydžio sumažinimas taip pat galėtų paveikti medicininių vietų, kurioms reikalingas tyrimas, skaičių, o tai leistų dar labiau taupyti išlaidas. Prognostiniai metodai taip pat gali pagerinti tyrimų veiksmingumą, todėl įvertinti prognozavimo algoritmų įtraukimo į klinikinio tyrimo planą finansinius padarinius nėra paprasta. Jei apsiribosime kiekybinio supratimo apie ligos nevienalytiškumą tik apskaičiuodami reikalingų pacientų skaičių, mes manome, kad prognozės sudaro galimybę 20% sumažinti populiacijos dydį 3 fazės tyrime, todėl išlaidos sumažės 6 mln. USD. . Šią finansinę naudą reikia įvertinti atsižvelgiant į galimas įvedimo laikotarpio, per kurį pacientai stebimi prieš pradedant tyrimą, sąnaudas, kad būtų galima nustatyti jų tikėtiną progresą ir kitus tyrimui įtaką turinčius veiksnius, tokius kaip paciento iškritimas ar ribotas išgyvenimas. . Išvada, kad algoritmai išlaiko savo nuspėjamumą, naudodamiesi tik 1 mėnesio informacija (3 papildomi rezultatai), ir tai, kad algoritmų našumas išliko tvirtas, kai buvo testuojamas didesnis ir įvairesnis pilnas „PRO-ACT“ duomenų rinkinys, parodo, kad minios šaltiniai gali naudotis, kur iššūkis, į kurį įeina 50 000 USD piniginė premija, gali potencialiai sumažinti kelių būsimų klinikinių tyrimų išlaidas milijonais dolerių. Šiuo metu algoritmai yra toliau tikrinami ir patvirtinami naudojant patentuotus ALS bandymų duomenis. Be to, dedamos pastangos, kad algoritmai būtų paversti paruoštu naudoti programinės įrangos įrankiu, skirtu įvertinti ir ateityje pritaikyti klinikose bei klinikiniuose tyrimuose.

Norėdami toliau įvertinti laimėjusių algoritmų galimybę padėti gydytojams tiksliai nustatyti savo pacientų prognozę, mes tiesiogiai palygėjome algoritmų prognozes su 12 pagrindinių ALS klinikų gydytojų įvertinimais. Visų 14 ištirtų pacientų atvejų algoritmai žymiai padidino visų gydytojų ir visų gydytojų skaičių. Aišku, prognozuojant ligos prognozę remiantis tik anoniminiais duomenų rinkiniais, jei nėra klinikinių įvykių, tikrai negalima tiksliai atspindėti informacijos, kurią patyręs gydytojas gali surinkti atlikdamas klinikinius stebėjimus, gausos. Tačiau šie rezultatai rodo, kaip nuspėjamasis algoritmas gali būti naudingas gydytojams, patariant pacientams. Kadangi klinikiniuose tyrimuose dalyvaujančių pacientų populiacija nevisiškai atspindi klinikoje 23 matomą pacientų populiaciją, imamasi priemonių tiesiogiai patikrinti šių algoritmų naudingumą klinikinėje aplinkoje.

Kitas svarbus ALS prognozavimo premijos iššūkio tikslas buvo patvirtinti bruožus, kurie anksčiau buvo siūlomi kaip nuspėjami atliekant mažus tyrimus, ir nustatyti naujus numatomus požymius. Iš viso daugiau nei vienas sprendėjas nustatė 15 skirtingų ypatybių. Keli iš jų buvo aprašyti literatūroje 17, 18, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, įskaitant amžių, ligos pradžios vietą, lytį, ligšiolinį ligos progresavimo nuolydį, praeitį ALSFRS nuolydis ir ankstesnis FVC nuolydis, taigi naudojami kaip funkcijų ir algoritmų patvirtinimas. Deja, daugeliui PRO-ACT sergančių pacientų FVC informacijos nebuvo arba trūko kitų pagrindinių funkcijų, reikalingų apskaičiuoti FVC. Svoris, kuris buvo ginčijamas kaip prognozuotojas ALS literatūroje 19, 34, 35, buvo nustatytas kaip nuspėjamasis. Skirtingos komandos nustatė, kad konkretūs ALSFRS klausimai yra nuspėjami, tačiau nepritarę tam tikriems klausimams, jie labiau prognozuoja bendrą balą nei kiti. Visų pirma, iššūkis taip pat patvirtina numatomą šlapimo rūgšties 20 vertę. Nustatyta, kad aukštesnės nei vidutinės šlapimo rūgšties koncentracijos koreliuoja su lėtesne Parkinsono ligos, demencijos ir Huntingtono ligos progresavimu 36, 37, 38, 39, kas rodo bendrą patologinį mechanizmą ar šalutinį produktą neurodegeneracinių procesų metu ir klinikinius tyrimus, pagrįstus padidėjusia šlapimo rūgštis jau buvo pradėta sergant keliomis su centrine nervų sistema susijusiomis ligomis. Faktas, kad algoritmai vis dar nustatė šlapimo rūgštį kaip prognozuotoją, patvirtina ankstesnius duomenis 20 . Panašiai iššūkis sugebėjo paremti prognozuojamą kreatinino 40, 41 galią, kuri buvo ne tik nustatyta keliais skirtingais algoritmais, bet ir buvo nustatyta, kad ji labai koreliuoja su ALSFRS pokyčiais, nes laikui bėgant liga progresuoja. Kiti dominantys bruožai yra kreatinkinazės, kurios lygis labai koreliuoja su kreatinino lygiu, siūloma prognozuoti ALS 42, 43 prognozę . Pulsas ir kraujospūdis, kurie iš pirmo žvilgsnio gali nustebinti nuspėjamais ALS požymiais, palaikomi literatūros šaltiniuose, kuriuose siūloma simpatinė disfunkcija esant ALS 44, 45, 46, 47 . Norint įvertinti šių savybių galimybes ir išsiaiškinti jų įsitraukimą į ALS patofiziologiją, reikia papildomų tyrimų ir tyrimų.

Apibendrinant galima pasakyti, kad ALS numatymo prizas pritraukė naujų minčių į ALS sritį ir pademonstravo minios išteklių naudą skatinant naujus ALS tyrimų metodus. Geriausiai atliekant šį iššūkį algoritmai gali 20% sumažinti populiacijos dydį, reikalingą vaisto poveikiui išmatuoti, ir jie leido nustatyti keletą nestandartinių, galimų prognozuoti požymių, kurie galėtų parodyti naują kelią ligos keliuose. Galiausiai algoritmai galėtų padėti gydytojams įvertinti pacientų vertinimus ir taip pagerinti ALS sergančių pacientų priežiūrą. Dabar algoritmai yra išbandomi klinikinėje aplinkoje.

Metodai

Bendra sąranka.

Iššūkio tikslas buvo numatyti ligos progresavimą ALS. Dalyviams buvo pavesta naudoti pirmuosius 3 klinikinės informacijos mėnesius (0–3 mėnesius nuo tyrimo pradžios), numatyti ALSFRS pokyčius per 3–12 mėnesius (nepersidengiant dviem laikotarpiams). Vidutiniškai pacientams ALSFRS sumažėja vienu punktu per mėnesį. Mes nusprendėme sutelkti dėmesį į ALSFRS, nes tai yra įprastas pirminis ALS klinikinių tyrimų rezultatas ir priemonė, atspindinti įvairias paciento kasdienes funkcijas. Kiti svarbūs veiksniai, tokie kaip paciento išgyvenimas, nebuvo pasirinkti, nes išgyvenimas yra esminis matas ir atspindi ligos progresijos ribas (pvz., Paciento sprendimas dėl tracheotomijos ir gastrostomijos bei paciento fono ligos).

Dalis klinikinių duomenų išnyko laiku (pvz., ALSFRS, funkcinis gyvybinis pajėgumas, gyvybiniai požymiai ir laboratoriniai tyrimai), o dalis buvo statiška (pvz., Lytis, demografiniai duomenys ir ALS šeimos istorija). Užduoties metu buvo naudojamas PRO-ACT duomenų rinkinio, apimančio 1 822 pacientus, pogrupis, sudarytas iš keturių klinikinių tyrimų, atliktų per pastaruosius 15 metų. Įrodyta, kad ALSFRS nepriklauso nuo įsigaliojimo dienos 48 . Visi tiriamojoje veikloje naudoti dalyko įrašai apėmė 12 mėnesių baigtą vertinimą ir apėmė arba ALSFRS, arba ALSFRS-R balus. Atassi ir kt . apskaičiuota pagrindinė duomenų bazės statistika 49 .

Duomenų įrašai buvo suskirstyti į mokymą ( n = 918), testą ( n = 279) ir patvirtinimo rinkinį ( n = 625 unikalūs paciento įrašai). Kuriant ir mokant skaičiavimo metodus, sprendėjams buvo suteikta visa prieiga prie mokymo duomenų rinkinio (1 iššūkio etapas). Kad būtų galima įvertinti tiriamųjų ir patvirtinimo rinkinių algoritmų našumą, komandos turėjo pateikti R 14 kodą iššūkių valdytojui, kuris tada vedė kodą duomenų rinkinyje, kurį sudarė tik 3 mėnesių informacija. Uždavinio metu, savo nuožiūra, sprendėjai galėjo įkelti savo algoritmus, kad jie „InnoCentive“ įvertintų aklinai ir automatiškai, testo duomenis, o rezultatai buvo parodyti lyderių lentoje (2 iššūkio fazė). Nors pasirodymas testų komplekte neturėjo jokios įtakos galutiniam geriausios atlikėjos apsisprendimui, iškabos padėjo pateikti svarbius atsiliepimus sprendėjams. Paskutiniame iššūkio etape (3 iššūkio fazė) tiriamiesiems buvo pateiktas bandymo rinkinys. Tada jie turėjo pateikti savo galutinį kodą, kuris vėl buvo aklai ir automatiškai įvertintas atsižvelgiant į dar niekad nematytą tiriamųjų įrašų rinkinį, apimantį atskirą patvirtinimo rinkinį.

Įvertinimas.

Tikrojo nuolydžio skaičiavimas . Iššūkio tikslas buvo numatyti numatomą ALSFRS vertės (nuolydžio) sumažėjimą per 3–12 mėnesius. ALSFRS yra balas, susidedantis iš dešimties klausimų, kurių kiekvieno reikšmė yra nuo 0 iki 4. Pacientams, kuriems tik ALSFRS - R (12 klausimų) buvo, mes atsisakėme dviejų klausimų, kurių nebuvo ALSFRS. Tai buvo padaryta siekiant supaprastinti numatymo užduotį, nors ji gali pašalinti tam tikrą informaciją. Norėdami gauti daugiau informacijos, žiūrėkite 1 papildomą pastabą. Vėliau pašalinome ALSFRS ir ALSFRS-R reikšmes matavimams, kai nebuvo visų 10 reikalaujamų klausimų, todėl galutinė skalė buvo nuo 0 iki 40.

Norėdami pasirinkti dalykus, kurie gali būti numatyti, per pirmuosius 3 mėnesius pašalinome visus dalykų įrašus su mažiau nei dviem apsilankymais. Norėdami nustatyti nuolydį, pirmąjį apsilankymą po trečio mėnesio po dalyvavimo klinikiniame tyrime priskyrėme m1 . Jei buvo vizitų per 12 mėnesį, pirmąjį tokį vizitą po 12 mėnesių priskyrėme m2 . Priešingu atveju, jei buvo tik apsilankymai per vienuoliktą mėnesį, mes naudojame paskutinįjį apsilankymą kaip m2 . Jei tokio vizito nebuvo, tema buvo pašalinta iš svarstymo. Tada nuolydis apskaičiuojamas taip:

Image

Veiklos įvertinimas . Kiekvienam pacientui buvo prieinamos dvi ALSFRS vertės, ty s i nuo tikrojo nuolydžio ir p i pagal prognozuojamą nuolydį. Prognozavimo našumui įvertinti apskaičiuotų šlaitų S ir numatytų šlaitų P rinkiniai buvo lyginami tarp pacientų, naudojant rms nuokrypį ir Pearsono koreliaciją. Vidutinis kvadratinis nuokrypis matuoja absoliučius nuokrypius tarp N atitinkamų nuolydžio porų, kad mažesnės vertės atitiktų mažesnę prognozės paklaidą

Image

Priešingai, Pearsono koreliacija ρ yra santykinis matas, įvertinantis, kaip prognozės metodas gali atkurti ALSFRS tendencijas tarp pacientų. Geresnės prognozės lemia didesnę koreliacijos vertę, iki 1, 0, kad būtų galima tobulesnė prognozė. Jis apskaičiuojamas

Image

kur cov yra S ir P kovariancija, o σ S ir σ P yra atitinkamai S ir P sd.

Prognozių apibendrinimas. Atsižvelgiant į daugybę skirtingų nuspėjimo metodų, apibendrinant siekiama sujungti skirtingas jų prognozes, gaunant vieną prognozę, kuri dažnai yra tikslesnė nei bet kuris iš pagrindinių atskirų. Čia mes apibendrinome prognozių skaičių komandoje, dalyvaujančioje iššūkyje. Tam tikram pacientui kiekviena prognozė sudaro būsimo ALSFRS nuolydžio įvertį. Tada paciento suvestinis ALSFRS nuolydis apskaičiuojamas kaip ALSFRS verčių, numatytų agreguojamų algoritmų vidurkis.

Batų tvirtinimas.

Vykdant šį iššūkį iš kiekvienos dalyvaujančios komandos buvo gautas vienas prognozių rinkinys, taigi, pritaikius vieną iš aukščiau paminėtų taškų sudarymo schemų, gaunamas vienas komandos rezultatų įvertinimas. Norėdami apytiksliai apibūdinti kiekvienos komandos empirinį atlikimo pasiskirstymą ir taip gauti tikėtiną spektaklio dispersiją, mes pritaikėme „bootstrapping“. Kiekvienai komandai skirtoje įkrovos terapijoje buvo sugeneruota 100 įkrovos mėginių (imant iš patvirtinimo rinkinio, n = 625 pacientai) su pakaitalais, kad kai kurie pacientai kelis kartus pasirodytų kaip numatymo taikiniai, o kiti gali būti praleisti. Vėliau buvo apskaičiuotas kiekvieno bagažinės mėginio našumo balo metrinis kvadratinis nuokrypis, norint įvertinti įkrovos vidurkį μ ir sd σ . Taigi mes aprašėme pradinio požiūrio bazės patobulinimus z balo vienetais. Laikome, kad kvadratinio vidurkio nuokrypio riba, kai z taškas yra z = 2 (atitinkantis 0, 02 P vertę), yra reikšmingas našumo pagerėjimas.

Image

Reprezentatyvių pacientų grupavimas ir atranka.

Siekėme atrinkti nedidelį skaičių nuo 10 iki 20 tipiškų pacientų, kad gydytojai galėtų rankiniu būdu įvertinti ligos progresavimą. Todėl mes padalijome ALS pacientų profilius, atlikdami k reikšmes klasterizuodami 100 kartų, naudodami k = 25, Euklido atstumo metriką ir atsitiktinai išdėstytus pradinius centroidus. Iš 100 k-bėgimų buvo pasirinktas tas, kurio vidutinis pacientų atstumas iki centroidų buvo mažesnis, o klasteriai, kuriuose yra mažiau nei dešimt narių, buvo išmesti. Iš kiekvieno klasterio, kuris buvo arčiausiai klasterio centroido, buvo pasirinktas vienas pacientas. K vidurkis buvo pritaikytas matricai C, kurią sudarė 1822 pacientai, per 20 mėnesių, kad elementas c i, j nurodytų paciento i ALSFRS reikšmę j mėnesį. Kadangi ALSFRS verčių nustatymo laiko taškai nesiskyrė tarp pacientų, kiekvieno mėnesio pradžioje ALSFRS reikšmes mes tiesiškai interpoliavome apskaičiuodami C.

Pacientų klasifikacija.

Norėdami įvertinti prognozavimo algoritmo naudingumą, jis turėtų sugebėti teisingai klasifikuoti pacientus, kurių ligos eiga neįprastai lėta ar greita. Taikydami šį metodą, palyginome apskaičiuotus nuolydžius su algoritmų ar gydytojų numatytais nuolydžiais, kad įvertintume jų efektyvumą pacientų klasifikavimo atžvilgiu. Pirmame etape mes apibrėžėme pacientus, kurių apskaičiuotas ALSFRS nuolydis mažesnis kaip −1, 1 ALSFRS taškų / mėn., O greitesnis ir didesnis kaip –0, 5 ALSFRS taškų / mėnesių, kaip lėtas. Tarp šių kraštutinumų pacientai buvo apibrėžti kaip vidutiniai. Antrame etape mes apskaičiavome vidutinių pacientų numatytų nuolydžių vidurkį. Buvo manoma, kad pacientai, kurių ALSFRS yra mažesnis ar didesnis nei šis vidutinis nuolydis, klasifikuojami kaip greiti arba lėti. Vėliau gavome klasifikavimo klaidų skaičių, tai yra, lėti pacientai suklasifikuoti kaip greiti, arba greitieji pacientai suklasifikuoti kaip lėti.

Funkcijų koreliacijų šiluminis žemėlapis.

Funkcijų rangą pateikė pateikiantys sprendėjai. Toliau buvo analizuojamos tik tos savybės, kurias mažiausiai du sprendėjai nustatė iš 30 numatomiausių požymių. Skirtingi laiko atžvilgiu išspręstų savybių apdorojimo variantai (pvz., Vidutinis, nuolydis) buvo sugrupuoti. Norint įvertinti bendrą skirtumų bruožų svarbą, buvo suskirstytas visų tiriamųjų reitingas.

Santykinių verčių apskaičiavimas.

Įvairūs klinikiniai matavimai, gauti tyrimų metu, rodo labai skirtingus diapazonus ir vienetus. Normalizuojame skirtingas matavimo vertes pagal bendrą skalę, kad kelios iš jų galėtų būti parodytos vienoje schemoje. Normalizuoti matai yra vadinami santykinėmis vertėmis. Matas normalizuojamas atimant jo kvartilę Q1 ir padalijant iš kvartilių Q3 – Q1 skirtumo, kad būtų gautos santykinės vertės. Tokiu būdu vidutiniai 50% kiekvienos savybės matavimų yra keičiami į bendrą diapazoną.

Klinikinio tyrimo dydžio sumažinimo įvertinimas.

Pagal du svarbius parametrus gali būti nuspręsta, ar gali būti įrodytas gydymo vaistais veiksmingumas: i) pacientų, įtrauktų į klinikinį tyrimą, skaičius ir ii) įvertintos ligos progresavimo tikslumas, palyginti su ligos progresavimu, stebėtu gydant narkotikus. Dėl sumažėjusio tyrimo dydžio padidėja gydymo efekto kiekybinis pokytis ir dėl to sumažėja tyrimų, naudojamų įrodant vaistų veiksmingumą, statistinė galia. Čia mes nustatėme konkretų tyrimo dydžio sumažėjimą tokiu būdu, kad padidėjęs dispersija buvo kompensuota mažesniu variantu, atsirandančiu dėl būsimos ligos progresavimo prognozių. Taigi reikiamą klinikinių tyrimų dydį galima sumažinti proporcingai šių prognozių tikslumui.

Šiuo tikslu mes modeliavome kiekvieno metodo klinikinius tyrimus, pirmiausia naudodamiesi metodo nuolydžio prognozėmis kaip kovariacines reikšmes duomenų analizėje ir ignoruodami prognozes antrame modeliavime. Modeliavimas buvo atliktas pritaikant tiesinius atsitiktinių efektų modelius, kurie dažniausiai naudojami apibūdinant gydymo poveikį ALSFRS nuolydžio progresijai daugumoje dabartinių klinikinių tyrimų. Imitacija buvo atlikta placebu kontroliuojamu tyrimu, kai gydymas, kurio klinikinis poveikis nežinomas, buvo lyginamas su placebo grupe.

Modelis buvo parametruojamas 3–12 mėnesių laikotarpiui, taip modeliuojant būsimą ligos progresavimą po 3 mėnesių įvedimo laikotarpio, kaip buvo manoma varžybų metu. Tarkime, kad nuolydis i buvo modelio prognozuojamas nuolydis, o gydymas i buvo kintamasis, kuris kontrolinei grupei lygus nuliui, o gydymo grupei - vienas. Tada modeliavome ALSFRS reikšmę aj, nustatytą pacientui i klinikinio tyrimo metu j laiku

Image

su koeficientais β 1 … β 4 , sveriant terminus, atitinkančius vidutinį nuolydį, gydymo efektą, pertraukimo dalį, priklausančią nuo nuolydžio, taip pat atitinkamai numatomą ligos progresavimą ateityje, taip pat atsitiktinį β 1 , b i , kuris buvo įtrauktas siekiant sumažinti bendrą paklaidą e ij, poveikis . Mes taip pat įvertinome tą patį modelį, išskyrus tai, kad pašalinome visus terminus, kuriuose yra nuolydis i . Tegul s 1 yra standartinė apdorojimo efekto β 2 paklaida modelyje su nuolydžiu i, o s 2 yra β 2 standartinė paklaida be jo. Tada mėginio dydžio procentinis sumažėjimas yra proporcingas dispersijos sumažėjimui, kurį sukelia

Image

Gydymo kodai buvo imituojami atsitiktine tvarka. Dėl didelio imties pacientų skaičiaus skirtingas gydymo kodų pasirinkimas turėjo nereikšmingą poveikį.

Etikos pareiškimas.

Visų tyrimų, įtrauktų į „PRO-ACT“ duomenų rinkinį, tyrimo protokolus patvirtino dalyvaujantys medicinos centrai ir visi dalyvaujantys pacientai davė informuotą sutikimą. Neidentifikuoti šių tyrimų duomenys buvo paaukoti „PRO-ACT“ duomenų rinkiniui tik mokslinių tyrimų tikslais ir tokiomis aiškiomis sąlygomis, kad „Prize4Life“ ir visi duomenų vartotojai išlaikytų tiriamųjų anonimiškumą ir nebandytų atrasti nė vieno subjekto tapatybės. Tais retais atvejais, kai paaukoti duomenys dar nebuvo visiškai anonimiški, paaukoti duomenys buvo toliau anonimiški pagal HIPAA asmens tapatybės informacijos identifikavimo konvencijas: buvo pašalinti galimi paciento inicialai ir (arba) gimimo datos, sukurti nauji atsitiktinių imčių asmenų numeriai, ir kur įmanoma, su bandymais susijusi informacija buvo pašalinta sujungiant duomenų rinkinius, įskaitant bandymų centro tapatybę ir vietą, bandymo datas ar kitą identifikavimo informaciją.

Papildoma informacija

PDF failai

  1. 1.

    Papildomas tekstas ir figūros

    Papildomi 1–13 paveikslai, 1–10 papildomos lentelės, 1–3 papildomos pastabos, 1–5 papildomi rezultatai ir 1 papildomi duomenys

ZIP failai

  1. 1.

    Papildoma programinė įranga

    Dalyvaujantys algoritmai

  2. 2.

    Papildomos prognozės

    Prognozės, kurias sudaro dalyvaujantys algoritmai