Lielo datu avoti medicīnā

Lielo datu avoti medicīnā

Vienkārša lielu medicīnas datu definīcija ir "ar pacientu veselības aprūpi un labklājību saistīto datu kopums" (Raghupathi 2014). Bet ko tieši šie datu veidi ir, un no kurienes tie nāk?

Tālāk ir sniegts plašs pārskats par veselības aprūpes pakalpojumu sniedzēju, pētnieku, maksātāju, politikas veidotāju un nozares ieinteresēto personu lielo datu veidiem un avotiem.

Šīs kategorijas nav savstarpēji izslēdzošas, jo vieni un tie paši dati var rasties no dažādiem avotiem.

Šis saraksts arī nav izsmeļošs, jo lielu datu analītikas praktiskais pielietojums noteikti turpināsies.

Klīniskās informācijas sistēmas

Tie ir tradicionālie klīnisko datu avoti, kurus veselības aprūpes pakalpojumu sniedzēji ir pieraduši skatīties.

Prasījumu dati no maksātājiem

Sabiedrības maksātājiem (piemēram, Medicare) un privātajiem maksātājiem ir lieli prasījumu datu repozitoriji par to saņēmējiem. Daži veselības apdrošinātāji tagad piedāvā arī stimulus dalīties ar jūsu veselības datiem.

Pētījumu pētījumi

Pētījumu datu bāzēs ir iekļauta informācija par pētījuma dalībniekiem, eksperimentālajiem ārstēšanas veidiem un klīniskajiem rezultātiem. Lielu pētījumu parasti sponsorē farmācijas uzņēmumi vai valsts aģentūras. Individuālu zāļu lietošana ir atbilstoša atsevišķu pacientu ārstēšanai, izmantojot efektīvas ārstēšanas metodes, pamatojoties uz klīnisko pētījumu datiem.

Šī pieeja pārsniedz pierādījumu balstītu zāļu principu pielietošanu, saskaņā ar kuriem veselības aprūpes sniedzējs nosaka, vai pacientam ir kopīgas īpašības (piemēram, vecums, dzimums, rase, klīniskais stāvoklis) ar izmēģinājuma dalībniekiem. Ar lielu datu analīzi, ir iespējams izvēlēties ārstēšanu, pamatojoties uz daudz detalizētāku informāciju, piemēram, pacienta vēža ģenētisko profilu (skatīt zemāk).

Arī klīniskās lēmumu atbalsta sistēmas (CDSS) ir strauji attīstījušās, un tagad tās veido lielu daļu mākslīgā intelekta (AI) medicīnā.

Viņi izmanto pacienta datus, lai palīdzētu klīnicistiem pieņemt lēmumus, un tos bieži vien apvieno ar EHR.

Ģenētiskās datu bāzes

Cilvēka ģenētiskās informācijas krātuve turpina strauji uzkrāties. Kopš cilvēka genoma projekta pabeigšanas 2003. gadā, cilvēka DNS sekvences izmaksas ir samazinātas par miljonu reizes. Hārvardas medicīnas skolas 2005. gadā uzsāktā personīgā genoma projekta (PGP) mērķis ir secināt un reklamēt 100 000 brīvprātīgo pilnu genomu no visas pasaules. PGP pati par sevi ir nozīmīgs lielu datu projektu piemērs, ņemot vērā lielo datu apjomu un daudzveidību.

Personīgais genoms satur aptuveni 100 gigabaitu datu. Papildus secību genomiem PGP arī apkopo datus no EHR, apsekojumiem un mikrobioloģijas profiliem.

Vairāki uzņēmumi piedāvā komerciālu pamatu veselībai, personiskām iezīmēm un farmakogenetikai, kas ir tieša patērētāja ģenētiskā secība .

Šī personiskā informācija var tikt pakļauta lieliem datu analīzes datiem. Piemēram, 23andMe pārtrauca piedāvāt ar veselību saistītus ģenētiskus pārskatus jaunajiem klientiem 2013. gada 22. novembrī, lai tie atbilstu ASV Pārtikas un zāļu pārvaldei. Tomēr 2015. gadā uzņēmums sāka piedāvāt noteiktas veselības sastāvdaļas no viņu ģenētiskās siekalu pārbaudes vēlreiz, šoreiz ar FDA apstiprinājumu.

Publiskie ieraksti

Valdība detalizēti uzskaita ar veselību saistītus notikumus, piemēram, imigrāciju, laulību, dzimšanu un nāvi. ASV tautas skaitīšana ir apkopojusi milzīgu informācijas apjomu ik pēc 10 gadiem kopš 1790. gada. Censusa statistikas tīmekļa vietnē kopš 2013. gada bija 370 miljardi šūnu, katru gadu pieskaitot apmēram 11 miljardus.

Tīmekļa meklēšanas vaicājumi

Tīmekļa meklēšanas informācija, ko apkopojis Google un citi tīmekļa meklēšanas pakalpojumu sniedzēji, var sniegt reāllaika ieskatu saistībā ar iedzīvotāju veselību. Tomēr lielo datu vērtība no tīmekļa meklēšanas modeļiem var tikt uzlabota, apvienojot to ar tradicionālajiem veselības datu avotiem.

Sociālie mēdiji

Facebook, Twitter un citi sociālās mediju platformas rada daudz dažādus datus visu diennakti, sniedzot pārskatu par atrašanās vietām, uzvedību uz veselību, emocijām un lietotāju sociālo mijiedarbību. Sociālo plašsaziņas līdzekļu lielo datu izmantošana sabiedrības veselībai tiek dēvēta par digitālo slimību atklāšanu vai digitālo epidemioloģiju. Piemēram, Twitter ir izmantots, lai analizētu gripas epidēmijas starp iedzīvotājiem.

Pasaules labklājības projekts, kas tika uzsākts Pensilvānijas universitātē, ir vēl viens piemērs sociālās plašsaziņas līdzekļu izpētei, lai labāk izprastu cilvēku pieredzi un veselību. Projekts apvieno psihologus, statistiķus un datoru zinātniekus, kuri analizē valodu, ko izmanto, mijiedarbojoties tiešsaistē, piemēram, rakstot statusa atjauninājumus Facebook un Twitter. Zinātnieki novēro, kā lietotāju valoda attiecas uz viņu veselību un laimi. Valstu valodas apstrādes un mašīntulkēšanas attīstība palīdz viņu centieniem. Neseno publikāciju no Pensilvānijas universitātes pētīja veidus, kā prognozēt garīgās slimības, analizējot sociālo mediju. Šķiet, ka depresijas un citu garīgās veselības stāvokļa simptomus var konstatēt, pētot mūsu interneta izmantošanu. Zinātnieki cer, ka nākotnē šīs metodes spēs labāk identificēt un palīdzēt riskantām personām.

Lietiskais internets (IoT)

Arī ar veselību saistītas informācijas apjomi tiek vākti un uzglabāti mobilajās un mājas ierīcēs .

Finanšu darījumi

Pacientu kredītkartes darījumi ir iekļauti prognozēšanas modeļos, kurus izmanto Carolinas HealthCare sistēma, lai identificētu pacientus, kuri ir pakļauti augsta riska pakāpei, ka viņus uzņem atpakaļ slimnīcā. Šarlotes veselības aprūpes sniedzējs izmanto lielus datus, lai sadalītu pacientus dažādās grupās, piemēram, pamatojoties uz slimību un ģeogrāfisko atrašanās vietu.

Ētikas un privātuma sekas

Jāuzsver, ka dažos gadījumos, apkopojot un piekļūstot veselības aprūpes datiem, var būt būtiska ētiska un privātuma ietekme. Jauni lielu datu avoti var uzlabot mūsu izpratni par to, kas ietekmē indivīdus un iedzīvotāju veselību, tomēr rūpīgi jāapsver un jāuzrauga dažādi riski. Tagad ir arī atzīts, ka dati, kurus iepriekš uzskatīja par anonīmiem, var atkārtoti identificēt. Piemēram, profesors Latanya Sweeney no Harvardas Datu Privātuma Laba pārskatīja 1130 brīvprātīgos, kas iesaistīti Personal Genome projektā. Viņa un viņas komanda varēja pareizi nosaukt 42 procentus dalībnieku, pamatojoties uz informāciju, kuru viņi kopīgi (pasta indekss, dzimšanas datums, dzimums). Šīs zināšanas var palielināt mūsu izpratni par iespējamiem riskiem un palīdzēs mums labāk kopīgot datus.

> Avoti:

> Conway M, O'Connor D. Sociālie mediji, lielie dati un garīgā veselība: pašreizējie sasniegumi un ētiskas sekas. Pašreizējais viedoklis psiholoģijā 2016; 9: 77-82.

> Fernandes L, O'Connor M, Weaver V. Lielie dati, lielāki rezultāti. American Health Information Management Association 2012. gada žurnāls, 83 (10): 38-43

> Guntuku S, Yaden D, Kern M, Ungar L, Eichstaedt J. Depresijas un garīgās slimības noteikšana sociālajos tīklos: integrējošs pārskats . Pašreizējais atzinums par uzvedības zinātnēm 2017. gadā; 18: 43-49.

> Lazer D, Kennedy R, King G, Vespignani A. Piemērs par Google gripu: lamatas lielo datu analīzē . Zinātne 2014; 343 (6176): 1203-1205.

> Raghupathi W, Raghupathi V. Liela datu analīze veselības aprūpē: solījums un potenci al. Veselības informācijas zinātne un sistēmas 2014; 2: 3.

> Sweeney L, Abu A, Winn J. Personīgā genoma projekta dalībnieku identificēšana pēc nosaukuma . Harvardas Universitāte. Datu aizsardzības privātums. Baltā grāmata 1021-1. 2013. gada 24. aprīlis.