Od osnivanja IBM Watson sistema 2007. godine, ljudi kontinuirano teže razvoju medicinske umjetne inteligencije (AI). Upotrebljiv i moćan medicinski AI sistem ima ogroman potencijal da preoblikuje sve aspekte moderne medicine, omogućavajući pametniju, precizniju, efikasniju i inkluzivniju njegu, donoseći dobrobit medicinskim radnicima i pacijentima, te time značajno poboljšavajući ljudsko zdravlje. U proteklih 16 godina, iako su se istraživači medicinske umjetne inteligencije akumulirali u raznim malim oblastima, u ovoj fazi još uvijek nisu bili u stanju da naučnu fantastiku pretvore u stvarnost.
Ove godine, s revolucionarnim razvojem AI tehnologije kao što je ChatGPT, medicinska AI je ostvarila veliki napredak u mnogim aspektima. Neviđeni proboj u mogućnostima medicinske AI: Časopis Nature kontinuirano je pokretao istraživanje modela velikih medicinskih jezika i osnovnog modela medicinskih slika; Google je objavio Med-PaLM i njegovog nasljednika, dostigavši ekspertski nivo u pitanjima ispita za američke ljekare. Veliki akademski časopisi će se fokusirati na medicinsku AI: Nature objavljuje pogled na osnovni model opće medicinske AI; Nakon serije pregleda AI u medicini ranije ove godine, New England Journal of Medicine (NEJM) je 30. novembra objavio svoj prvi digitalni zdravstveni pregled i 12. decembra pokrenuo prvo izdanje NEJM podčasopisa NEJM AI. Tlo za slijetanje medicinske AI je dodatno sazrelo: Podčasopis JAMA objavio je globalnu inicijativu za dijeljenje podataka medicinskih slika; Američka Uprava za hranu i lijekove (FDA) razvija nacrt smjernica za regulaciju medicinske AI.
U nastavku donosimo pregled značajnog napretka koji su istraživači širom svijeta postigli u smjeru upotrebljive medicinske umjetne inteligencije u 2023. godini.
Osnovni model medicinske umjetne inteligencije
Izgradnja osnovnog modela medicinske umjetne inteligencije nesumnjivo je najpopularniji istraživački fokus ove godine. Časopisi Nature su tokom godine objavili pregledne članke o Univerzalnom osnovnom modelu zdravstvene zaštite i modelu zdravstvene zaštite zasnovanom na velikim jezicima. Medical Image Analysis, vodeći časopis u industriji, pregledao je i iščekuje izazove i prilike istraživanja osnovnih modela u analizi medicinskih slika, te predložio koncept "pedigrea osnovnog modela" kako bi sumirao i usmjerio razvoj istraživanja osnovnih modela medicinske umjetne inteligencije. Budućnost osnovnih modela umjetne inteligencije za zdravstvo postaje jasnija. Oslanjajući se na uspješne primjere modela zasnovanih na velikim jezicima kao što je ChatGPT, koristeći naprednije metode samonadgledanja predobuke i ogromnu akumulaciju podataka o obuci, istraživači u oblasti medicinske umjetne inteligencije pokušavaju izgraditi 1) osnovne modele specifične za bolesti, 2) opće osnovne modele i 3) multimodalne velike modele koji integriraju širok raspon načina rada s masivnim parametrima i superiornim mogućnostima.
Model umjetne inteligencije za akviziciju medicinskih podataka
Pored velikih AI modela koji igraju veliku ulogu u nizvodnim zadacima analize kliničkih podataka, u uzvodnom prikupljanju kliničkih podataka pojavila se i tehnologija koju predstavljaju generativni AI modeli. Proces, brzina i kvalitet prikupljanja podataka mogu se značajno poboljšati AI algoritmima.
Ranije ove godine, Nature Biomedical Engineering je objavio studiju turskog Univerziteta Straits koja se fokusirala na korištenje generativne umjetne inteligencije za rješavanje problema patološke dijagnoze uz pomoć slike u kliničkim primjenama. Artefakti u tkivu smrznutih presjeka tokom operacije predstavljaju prepreku brzoj dijagnostičkoj evaluaciji. Iako tkivo ugrađeno u formalin i parafin (FFPE) pruža uzorak višeg kvaliteta, njegov proces proizvodnje je dugotrajan i često traje 12-48 sati, što ga čini neprikladnim za upotrebu u hirurgiji. Istraživački tim je stoga predložio algoritam pod nazivom AI-FFPE, koji može učiniti izgled tkiva u smrznutom presjeku sličnim FFPE-u. Algoritam je uspješno ispravio artefakte smrznutih presjeka, poboljšao kvalitet slike i istovremeno zadržao klinički relevantne karakteristike. U kliničkoj validaciji, AI-FFPE algoritam značajno poboljšava dijagnostičku tačnost patologa za podtipove tumora, a istovremeno znatno skraćuje vrijeme kliničke dijagnoze.
Cell Reports Medicine izvještava o istraživačkom radu tima sa Trećeg kliničkog fakulteta Univerziteta Jilin, Odsjeka za radiologiju, Bolnice Zhongshan pri Univerzitetu Fudan i Univerziteta za nauku i tehnologiju u Šangaju [25]. Ova studija predlaže općeniti okvir za fuziju dubokog učenja i iterativnu rekonstrukciju (Hybrid DL-IR) sa visokom svestranošću i fleksibilnošću, pokazujući odlične performanse rekonstrukcije slike u brzoj MRI, CT-u niske doze i brzom PET-u. Algoritam može postići MR skeniranje jednog organa u više sekvenci za 100 sekundi, smanjiti dozu zračenja na samo 10% CT slike i eliminisati šum, te može rekonstruisati male lezije iz PET akvizicije sa 2 do 4 puta ubrzanjem, uz smanjenje efekta artefakata kretanja.
Medicinska umjetna inteligencija u saradnji s medicinskim radnicima
Brzi razvoj medicinske umjetne inteligencije također je naveo medicinske stručnjake da ozbiljno razmotre i istraže načine saradnje s umjetnom inteligencijom kako bi poboljšali kliničke procese. U julu ove godine, DeepMind i multiinstitucionalni istraživački tim zajednički su predložili sistem umjetne inteligencije pod nazivom Komplementarno vođeno odlaganje kliničkog radnog toka (CoDoC). Dijagnostički proces prvo dijagnosticira prediktivni sistem umjetne inteligencije, zatim ga drugi sistem umjetne inteligencije procjenjuje na osnovu prethodnog rezultata, a ako postoji sumnja, dijagnozu konačno postavlja kliničar kako bi se poboljšala tačnost dijagnostike i uravnotežila efikasnost. Kada je u pitanju skrining raka dojke, CoDoC je smanjio stope lažno pozitivnih rezultata za 25% uz istu stopu lažno negativnih rezultata, dok je istovremeno smanjio opterećenje kliničara za 66%, u poređenju sa trenutnim procesom "arbitraže dvostrukog čitanja" u Velikoj Britaniji. Što se tiče klasifikacije tuberkuloze, stope lažno pozitivnih rezultata smanjene su za 5 do 15 posto uz istu stopu lažno negativnih rezultata u poređenju sa nezavisnom umjetnom inteligencijom i kliničkim radnim tokovima.
Slično tome, Annie Y. Ng i saradnici iz kompanije Kheiron u Londonu, Velika Britanija, uveli su dodatne AI čitače (u saradnji s ljudskim ispitivačima) kako bi ponovo pregledali rezultate kada nije bilo rezultata opoziva u procesu arbitraže dvostrukog čitanja, što je poboljšalo problem propuštenog otkrivanja u ranom skriningu raka dojke, a proces gotovo da nije imao lažno pozitivnih rezultata. Druga studija, koju je vodio tim sa Medicinskog fakulteta McGovern Univerziteta u Teksasu i završena je u četiri centra za moždani udar, primijenila je AI tehnologiju zasnovanu na kompjuterizovanoj tomografskoj angiografiji (CTA) za automatizaciju otkrivanja velikog vaskularnog okluzivnog ishemijskog moždanog udara (LVO). Kliničari i radiolozi primaju upozorenja u realnom vremenu na svoje mobilne telefone u roku od nekoliko minuta nakon završetka CT snimanja, obavještavajući ih o mogućem prisustvu LVO. Ovaj AI proces poboljšava tokove rada u bolnici za akutni ishemijski moždani udar, smanjujući vrijeme od vrata do prepona od prijema do liječenja i pružajući mogućnosti za uspješno spašavanje. Nalazi su objavljeni u JAMA Neurology.
Model zdravstvene zaštite zasnovan na umjetnoj inteligenciji za univerzalnu korist
U 2023. godini također će biti mnogo dobrih radova koji koriste medicinsku umjetnu inteligenciju za pronalaženje karakteristika koje su nevidljive ljudskom oku iz lakše dostupnih podataka, omogućavajući univerzalnu dijagnozu i rani skrining u velikim razmjerima. Početkom godine, Nature Medicine je objavio studije koje su proveli Zhongshan Eye Center Univerziteta Sun Yat-sen i Druga pridružena bolnica Medicinskog univerziteta Fujian. Koristeći pametne telefone kao aplikacijske terminale, koristili su video slike slične crtanim filmovima kako bi izazvali dječji pogled i snimili ponašanje dječjeg pogleda i crte lica, te dodatno analizirali abnormalne modele koristeći modele dubokog učenja kako bi uspješno identificirali 16 očnih bolesti, uključujući kongenitalne katarakte, kongenitalnu ptozu i kongenitalni glaukom, s prosječnom tačnošću skrininga većom od 85%. Ovo pruža efikasna i lako popularizirajuća tehnička sredstva za rani skrining oštećenja vidne funkcije kod dojenčadi i srodnih očnih bolesti velikih razmjera.
Krajem godine, časopis Nature Medicine je objavio rezultate rada više od 10 medicinskih i istraživačkih institucija širom svijeta, uključujući Šangajski institut za bolesti pankreasa i Prvu pridruženu bolnicu Univerziteta Zhejiang. Autor je primijenio vještačku inteligenciju na skrining raka pankreasa kod asimptomatskih osoba u centrima za fizički pregled, bolnicama itd., kako bi otkrio karakteristike lezija na CT snimcima koje je teško otkriti golim okom, a s ciljem postizanja efikasnog i neinvazivnog ranog otkrivanja raka pankreasa. Pregledom podataka više od 20.000 pacijenata, model je također identificirao 31 slučaj klinički prepuštenih lezija, što je značajno poboljšalo kliničke ishode.
Dijeljenje medicinskih podataka
U 2023. godini, širom svijeta se pojavilo mnogo više savršenih mehanizama za dijeljenje podataka i uspješnih slučajeva, osiguravajući saradnju više centara i otvorenost podataka pod pretpostavkom zaštite privatnosti i sigurnosti podataka.
Prvo, uz pomoć same AI tehnologije, istraživači AI-a doprinijeli su dijeljenju medicinskih podataka. Qi Chang i drugi sa Univerziteta Rutgers u Sjedinjenim Američkim Državama objavili su članak u Nature Communications, predlažući federalni okvir za učenje DSL zasnovan na distribuiranim sintetičkim adverzarnim mrežama, koji koristi generativnu AI za obuku specifičnih generiranih podataka multicentara, a zatim zamjenjuje stvarne podatke multicentara generiranim podacima. Osigurati obuku AI-a zasnovanu na velikim podacima multicentra, uz zaštitu privatnosti podataka. Isti tim je također dao otvoreni kod skupu podataka generiranih patoloških slika i njihovih odgovarajućih napomena. Model segmentacije obučen na generiranom skupu podataka može postići slične rezultate kao i stvarni podaci.
Tim Dai Qionghaija sa Univerziteta Tsinghua objavio je rad o npj Digital Health, predlažući Relay Learning, koji koristi velike količine podataka s više lokacija za obuku AI modela pod pretpostavkom lokalnog suvereniteta podataka i nepostojanja mrežnih veza između lokacija. To balansira zabrinutost oko sigurnosti podataka i privatnosti s težnjom za performansama AI. Isti tim je potom zajednički razvio i validirao CAIMEN, sistem za dijagnostiku pan-medijastinalnih tumora grudnog koša zasnovan na federalnom učenju, u saradnji s Prvom pridruženom bolnicom Medicinskog univerziteta Guangzhou i 24 bolnice širom zemlje. Sistem, koji se može primijeniti na 12 uobičajenih medijastinalnih tumora, postigao je 44,9 posto bolju tačnost kada se koristi samostalno nego kada ga koriste samo ljudski stručnjaci, i 19 posto bolju tačnost dijagnoze kada su mu pomagali ljudski stručnjaci.
S druge strane, u toku je nekoliko inicijativa za izgradnju sigurnih, globalnih, velikih skupova medicinskih podataka. U novembru 2023. godine, Agustina Saenz i drugi sa Odsjeka za biomedicinsku informatiku na Medicinskom fakultetu Harvard objavili su online u časopisu Lancet Digital Health globalni okvir za dijeljenje podataka medicinskih slika pod nazivom Podaci o vještačkoj inteligenciji za svu zdravstvenu zaštitu (MAIDA). Oni sarađuju sa zdravstvenim organizacijama širom svijeta kako bi pružili sveobuhvatne smjernice o prikupljanju podataka i deidentifikaciji, koristeći predložak američkog Federalnog demonstracionog partnera (FDP) za standardizaciju dijeljenja podataka. Planiraju postepeno objavljivati skupove podataka prikupljene u različitim regijama i kliničkim okruženjima širom svijeta. Očekuje se da će prvi skup podataka biti objavljen početkom 2024. godine, a još će ih biti objavljeno kako se partnerstvo bude širilo. Projekat je važan pokušaj izgradnje globalnog, velikog i raznolikog skupa javno dostupnih podataka o vještačkoj inteligenciji.
Nakon ovog prijedloga, UK Biobank je postavila primjer. UK Biobank je 30. novembra objavila nove podatke iz sekvenciranja cijelog genoma svojih 500.000 učesnika. Baza podataka, koja objavljuje kompletnu sekvencu genoma svakog od 500.000 britanskih volontera, najveća je kompletna baza podataka ljudskog genoma na svijetu. Istraživači širom svijeta mogu zatražiti pristup ovim anonimiziranim podacima i koristiti ih za ispitivanje genetske osnove zdravlja i bolesti. Genetski podaci su u prošlosti oduvijek bili vrlo osjetljivi za provjeru, a ovo historijsko dostignuće UK Biobank dokazuje da je moguće izgraditi otvorenu, globalnu bazu podataka velikih razmjera, bez privatnosti. S ovom tehnologijom i bazom podataka, medicinska umjetna inteligencija će sigurno uvesti sljedeći skok.
Verifikacija i evaluacija medicinske umjetne inteligencije
U poređenju sa brzim razvojem same tehnologije medicinske umjetne inteligencije, razvoj verifikacije i evaluacije medicinske umjetne inteligencije je nešto sporiji. Validacija i evaluacija u općem području umjetne inteligencije često zanemaruju stvarne potrebe kliničara i pacijenata za umjetnom inteligencijom. Tradicionalna randomizirana kontrolirana klinička ispitivanja su previše mukotrpna da bi se nosila s brzom iteracijom alata umjetne inteligencije. Poboljšanje sistema verifikacije i evaluacije pogodnog za alate medicinske umjetne inteligencije što je prije moguće najvažnije je za promociju medicinske umjetne inteligencije da zaista preskoči istraživanje i razvoj do kliničke primjene.
U istraživačkom radu kompanije Google o Med-PaLM, objavljenom u časopisu Nature, tim je također objavio MultiMedQA evaluacijski kriterij, koji se koristi za procjenu sposobnosti modela velikih jezika za sticanje kliničkog znanja. Kriterijum kombinuje šest postojećih skupova podataka o profesionalnim medicinskim pitanjima i odgovorima, koji pokrivaju profesionalno medicinsko znanje, istraživanje i druge aspekte, kao i online skup podataka o medicinskim pitanjima za pretraživanje, razmatrajući online pitanja i odgovore između doktora i pacijenta, pokušavajući obučiti vještačku inteligenciju u kvalifikovanog doktora iz mnogih aspekata. Pored toga, tim predlaže okvir zasnovan na ljudskoj procjeni koji uzima u obzir više dimenzija činjenica, razumijevanja, rasuđivanja i moguće pristranosti. Ovo je jedan od najreprezentativnijih istraživačkih napora za procjenu vještačke inteligencije u zdravstvu objavljen ove godine.
Međutim, da li činjenica da modeli velikih jezika pokazuju visok nivo kodiranja kliničkog znanja znači da su modeli velikih jezika kompetentni za kliničke zadatke iz stvarnog svijeta? Baš kao što je student medicine koji položi stručni ispit za ljekara sa savršenim rezultatom još uvijek daleko od samostalnog glavnog ljekara, kriteriji za evaluaciju koje predlaže Google možda nisu savršen odgovor na temu evaluacije medicinske umjetne inteligencije za modele umjetne inteligencije. Još 2021. i 2022. godine, istraživači su predložili smjernice za izvještavanje kao što su Decid-AI, SPIRIT-AI i INTRPRT, nadajući se da će voditi rani razvoj i validaciju medicinske umjetne inteligencije pod uslovom da se uzmu u obzir faktori kao što su klinička praktičnost, sigurnost, ljudski faktori i transparentnost/interpretacija. Nedavno je časopis Nature Medicine objavio studiju istraživača sa Univerziteta Oxford i Univerziteta Stanford o tome da li koristiti „vanjsku validaciju“ ili „ponavljajuću lokalnu validaciju“. Za validaciju alata umjetne inteligencije.
Nepristrasna priroda AI alata također je važan smjer evaluacije koji je ove godine privukao pažnju i od strane članaka u časopisima Science i NEJM. AI često pokazuje pristrasnost jer je ograničena na podatke za obuku. Ova pristrasnost može odražavati društvenu nejednakost, koja se dalje razvija u algoritamsku diskriminaciju. Nacionalni institut za zdravlje nedavno je pokrenuo inicijativu Bridge2AI, za koju se procjenjuje da će koštati 130 miliona dolara, za izgradnju raznolikih skupova podataka (u skladu s ciljevima gore spomenute MAIDA inicijative) koji se mogu koristiti za validaciju nepristrasnosti medicinskih AI alata. MultiMedQA ne razmatra ove aspekte. Pitanje kako mjeriti i validirati medicinske AI modele još uvijek zahtijeva opsežnu i dubinsku diskusiju.
U januaru je časopis Nature Medicine objavio članak pod nazivom „Sljedeća generacija medicine zasnovane na dokazima“ autora Viveka Subbiaha sa Univerziteta u Teksasu, MD Anderson Cancer Center, u kojem se razmatraju ograničenja kliničkih ispitivanja otkrivena u kontekstu pandemije COVID-19 i ukazuje na kontradikciju između inovacije i pridržavanja procesa kliničkog istraživanja. Konačno, ističe se budućnost restrukturiranja kliničkih ispitivanja – sljedeća generacija kliničkih ispitivanja koja koriste vještačku inteligenciju, odnosno korištenje vještačke inteligencije iz velikog broja historijskih istraživačkih podataka, podataka iz stvarnog svijeta, multimodalnih kliničkih podataka, podataka o nosivim uređajima kako bi se pronašli ključni dokazi. Da li to znači da bi se tehnologija vještačke inteligencije i procesi kliničke validacije vještačke inteligencije mogli međusobno pojačavati i koevoluirati u budućnosti? Ovo je otvoreno i podsticajno pitanje 2023. godine.
Regulacija medicinske umjetne inteligencije
Napredak AI tehnologije također predstavlja izazove za regulaciju AI-a, a kreatori politika širom svijeta pažljivo i pažljivo reaguju. FDA je 2019. godine prvi put objavila Prijedlog regulatornog okvira za promjene softvera medicinskih uređaja s umjetnom inteligencijom (Nacrt za diskusiju), u kojem je detaljno opisala svoj potencijalni pristup pregledu prije stavljanja na tržište AI-a i modifikacija softvera vođenih mašinskim učenjem. FDA je 2021. godine predložila „Akcioni plan za softver zasnovan na umjetnoj inteligenciji/mašinskom učenju kao medicinski uređaj“, koji je pojasnio pet specifičnih regulatornih mjera za AI u medicini. Ove godine, FDA je ponovo izdala Prijedlog zahtjeva za karakteristike softvera uređaja kako bi pružila informacije o preporukama za prijedlog zahtjeva za FDA-inu procjenu sigurnosti i efikasnosti karakteristika softvera uređaja, uključujući neke karakteristike softvera uređaja koji koriste modele mašinskog učenja obučene metodama mašinskog učenja. Regulatorna politika FDA-e evoluirala je od početnog prijedloga do praktičnih smjernica.
Nakon objavljivanja Evropskog prostora zdravstvenih podataka u julu prošle godine, EU je ponovo usvojila Zakon o vještačkoj inteligenciji. Prvi ima za cilj da najbolje iskoristi zdravstvene podatke za pružanje visokokvalitetne zdravstvene zaštite, smanjenje nejednakosti i podršku podacima za prevenciju, dijagnozu, liječenje, naučne inovacije, donošenje odluka i zakonodavstvo, istovremeno osiguravajući da građani EU imaju veću kontrolu nad svojim ličnim zdravstvenim podacima. Drugi jasno stavlja do znanja da je sistem medicinske dijagnoze visokorizični sistem vještačke inteligencije i da mora usvojiti ciljani snažan nadzor, nadzor cijelog životnog ciklusa i nadzor prije evaluacije. Evropska agencija za lijekove (EMA) objavila je Nacrt dokumenta o refleksiji o upotrebi vještačke inteligencije za podršku razvoju, regulaciji i upotrebi lijekova, s naglaskom na poboljšanje kredibiliteta vještačke inteligencije kako bi se osigurala sigurnost pacijenata i integritet rezultata kliničkih istraživanja. Sveukupno, regulatorni pristup EU postepeno se oblikuje, a konačni detalji implementacije mogu biti detaljniji i stroži. U oštroj suprotnosti sa strogom regulacijom EU, britanski regulatorni plan za vještačku inteligenciju jasno daje do znanja da vlada planira zauzeti blagi pristup i za sada neće donositi nove zakone niti osnivati nove regulatore.
U Kini, Centar za tehnički pregled medicinskih uređaja (NMPA) Nacionalne uprave za medicinske proizvode prethodno je izdao dokumente kao što su „Tačke pregleda softvera za potpomognuto odlučivanje dubokog učenja“, „Vodeći principi za pregled registracije medicinskih uređaja s vještačkom inteligencijom (Nacrt za komentar)“ i „Cirkular o vodećim principima za klasifikaciju i definiciju softverskih proizvoda medicinske tehnologije s vještačkom inteligencijom (br. 47 u 2021.)“. Ove godine ponovo je objavljen „Sažetak rezultata prve klasifikacije medicinskih proizvoda u 2023. godini“. Ova serija dokumenata čini definiciju, klasifikaciju i regulaciju softverskih proizvoda medicinske inteligencije jasnijom i lakšom za korištenje, te pruža jasne smjernice za strategije pozicioniranja i registracije proizvoda različitih preduzeća u industriji. Ovi dokumenti pružaju okvir i upravljačke odluke za naučnu regulaciju medicinskih uređaja umjetne inteligencije. Vrijedi očekivati da će dnevni red Kineske konferencije o medicinskoj umjetnoj inteligenciji, održane u Hangzhouu od 21. do 23. decembra, uspostaviti poseban forum o digitalnom medicinskom upravljanju i visokokvalitetnom razvoju javnih bolnica i forum za razvoj industrije standardizacije tehnologije testiranja i evaluacije medicinskih uređaja umjetne inteligencije. U to vrijeme, zvaničnici Nacionalne komisije za razvoj i reforme i NMPA će prisustvovati sastanku i mogu objaviti nove informacije.
Zaključak
U 2023. godini, medicinska umjetna inteligencija počela se integrirati u cjelokupni medicinski uzvodni i nizvodni proces, obuhvatajući prikupljanje bolničkih podataka, fuziju, analizu, dijagnozu i liječenje, te skrining zajednice, te organski surađujući s medicinskim/radnicima za kontrolu bolesti, pokazujući potencijal za donošenje dobrobiti ljudskom zdravlju. Upotrebljiva istraživanja medicinske umjetne inteligencije počinju se pojavljivati. U budućnosti, napredak medicinske umjetne inteligencije ne ovisi samo o samom tehnološkom razvoju, već je potrebna i puna saradnja industrije, univerziteta i medicinskih istraživanja te podrška kreatora politika i regulatora. Ova međudomenska saradnja ključna je za postizanje medicinskih usluga integriranih s umjetnom inteligencijom i sigurno će promovirati razvoj ljudskog zdravlja.
Vrijeme objave: 30. decembar 2023.




