Ovogodišnja nagrada Lasker za osnovna medicinska istraživanja dodijeljena je Demisu Hassabisu i Johnu Jumperu za njihov doprinos stvaranju sistema umjetne inteligencije AlphaFold koji predviđa trodimenzionalnu strukturu proteina na osnovu prvog reda sekvence aminokiselina.
Njihovi rezultati rješavaju problem koji dugo muči naučnu zajednicu i otvaraju vrata ubrzanju istraživanja u biomedicinskom polju. Proteini igraju ključnu ulogu u razvoju bolesti: kod Alzheimerove bolesti, oni se savijaju i skupljaju; kod raka, njihova regulatorna funkcija se gubi; kod urođenih metaboličkih poremećaja, oni su disfunkcionalni; kod cistične fibroze, oni ulaze u pogrešan prostor u ćeliji. Ovo su samo neki od mnogih mehanizama koji uzrokuju bolest. Detaljni modeli strukture proteina mogu pružiti atomske konfiguracije, pokrenuti dizajn ili odabir molekula visokog afiniteta i ubrzati otkrivanje lijekova.
Strukture proteina se uglavnom određuju rendgenskom kristalografijom, nuklearnom magnetnom rezonancijom i krioelektronskom mikroskopijom. Ove metode su skupe i dugotrajne. To rezultira postojećim 3D bazama podataka o strukturama proteina sa samo oko 200.000 strukturnih podataka, dok je tehnologija sekvenciranja DNK proizvela više od 8 miliona proteinskih sekvenci. Šezdesetih godina prošlog stoljeća, Anfinsen i saradnici su otkrili da se 1D sekvenca aminokiselina može spontano i ponovljeno savijati u funkcionalnu trodimenzionalnu konformaciju (Slika 1A), te da molekularni "šaperoni" mogu ubrzati i olakšati ovaj proces. Ova zapažanja dovode do 60-godišnjeg izazova u molekularnoj biologiji: predviđanja 3D strukture proteina iz 1D sekvence aminokiselina. S uspjehom Projekta ljudskog genoma, naša sposobnost dobijanja 1D sekvenci aminokiselina se znatno poboljšala, a ovaj izazov je postao još hitniji.
Predviđanje proteinskih struktura je teško iz nekoliko razloga. Prvo, svi mogući trodimenzionalni položaji svakog atoma u svakoj aminokiselini zahtijevaju mnogo istraživanja. Drugo, proteini maksimalno koriste komplementarnost u svojoj hemijskoj strukturi kako bi efikasno konfigurisali atome. Budući da proteini obično imaju stotine "donora" vodoničnih veza (obično kisik) koji bi trebali biti blizu "akceptora" vodonične veze (obično dušik vezan za vodik), može biti vrlo teško pronaći konformacije gdje je gotovo svaki donor blizu akceptora. Treće, postoje ograničeni primjeri za obuku eksperimentalnih metoda, tako da je potrebno razumjeti potencijalne trodimenzionalne interakcije između aminokiselina na osnovu 1D sekvenci koristeći informacije o evoluciji relevantnih proteina.
Fizika je prvi put korištena za modeliranje interakcije atoma u potrazi za najboljom konformacijom, a razvijena je i metoda za predviđanje strukture proteina. Karplus, Levitt i Warshel dobili su Nobelovu nagradu za hemiju 2013. godine za svoj rad na računarskoj simulaciji proteina. Međutim, metode zasnovane na fizici su računski skupe i zahtijevaju približnu obradu, tako da se precizne trodimenzionalne strukture ne mogu predvidjeti. Drugi pristup, "zasnovan na znanju", je korištenje baza podataka poznatih struktura i sekvenci za obuku modela putem vještačke inteligencije i mašinskog učenja (AI-ML). Hassabis i Jumper primjenjuju elemente i fizike i AI-ML, ali inovacija i skok u performansama pristupa proizlaze prvenstveno iz AI-ML. Dva istraživača su kreativno kombinovala velike javne baze podataka sa računarskim resursima industrijskog nivoa kako bi stvorili AlphaFold.
Kako znamo da su "riješili" zagonetku strukturnog predviđanja? Godine 1994. osnovano je takmičenje Kritička procjena strukturnog predviđanja (CASP), koje se održava svake dvije godine kako bi se pratio napredak strukturnog predviđanja. Istraživači će podijeliti 1D sekvencu proteina čiju su strukturu nedavno riješili, ali čiji rezultati još nisu objavljeni. Prediktor predviđa trodimenzionalnu strukturu koristeći ovu 1D sekvencu, a evaluator nezavisno ocjenjuje kvalitet predviđenih rezultata upoređujući ih sa trodimenzionalnom strukturom koju je dao eksperimentalac (koja se daje samo evaluatoru). CASP provodi prave slijepe preglede i bilježi periodične skokove performansi povezane s metodološkim inovacijama. Na 14. CASP konferenciji 2020. godine, rezultati predviđanja AlphaFolda pokazali su takav skok u performansama da su organizatori objavili da je problem 3D predviđanja strukture riješen: tačnost većine predviđanja bila je blizu onoj eksperimentalnih mjerenja.
Širi značaj je u tome što rad Hassabisa i Jumpera uvjerljivo pokazuje kako bi AI-ML mogao transformirati nauku. Njihovo istraživanje pokazuje da AI-ML može izgraditi složene naučne hipoteze iz više izvora podataka, da mehanizmi pažnje (slični onima u ChatGPT-u) mogu otkriti ključne zavisnosti i korelacije u izvorima podataka, te da AI-ML može samostalno procijeniti kvalitet svojih izlaznih rezultata. AI-ML se u suštini bavi naukom.
Vrijeme objave: 23. septembar 2023.




