Tämän vuoden Lasker Basic Medical Research Award -palkinto myönnettiin Demis Hassabisille ja John Jumperille heidän panoksestaan AlphaFold-tekoälyjärjestelmän luomiseen. Järjestelmä ennustaa proteiinien kolmiulotteisen rakenteen aminohappojen ensimmäisen asteen sekvenssin perusteella.
Heidän tuloksensa ratkaisevat tiedeyhteisöä pitkään vaivanneen ongelman ja avaavat oven tutkimuksen nopeuttamiselle biolääketieteen alalla. Proteiineilla on keskeinen rooli sairauksien kehittymisessä: Alzheimerin taudissa ne laskostuvat ja kasaantuvat yhteen; syövässä niiden säätelytehtävä menetetään; synnynnäisissä aineenvaihduntahäiriöissä ne ovat toimintahäiriöisiä; kystisessä fibroosissa ne menevät väärään paikkaan solussa. Nämä ovat vain muutamia monista mekanismeista, jotka aiheuttavat sairauksia. Yksityiskohtaiset proteiinirakennemallit voivat tarjota atomikonfiguraatioita, ohjata suuren affiniteetin omaavien molekyylien suunnittelua tai valintaa ja nopeuttaa lääkekehitystä.
Proteiinien rakenteet määritetään yleensä röntgenkristallografialla, ydinmagneettisella resonanssilla ja kryoelektronimikroskopialla. Nämä menetelmät ovat kalliita ja aikaa vieviä. Tämän seurauksena olemassa olevissa 3D-proteiinirakennetietokannoissa on vain noin 200 000 rakennetietoa, kun taas DNA-sekvensointiteknologialla on tuotettu yli 8 miljoonaa proteiinisekvenssiä. 1960-luvulla Anfinsen ym. havaitsivat, että aminohappojen yksiulotteinen sekvenssi voi spontaanisti ja toistuvasti laskostua toiminnalliseen kolmiulotteiseen konformaatioon (kuva 1A), ja että molekyyli-"chaperonit" voivat nopeuttaa ja helpottaa tätä prosessia. Nämä havainnot johtavat 60 vuotta kestävään haasteeseen molekyylibiologiassa: proteiinien 3D-rakenteen ennustamiseen aminohappojen yksiulotteisesta sekvenssistä. Human Genome Projectin menestyksen myötä kykymme saada yksiulotteisia aminohapposekvenssejä on parantunut huomattavasti, ja tästä haasteesta on tullut entistä kiireellisempi.
Proteiinirakenteiden ennustaminen on vaikeaa useista syistä. Ensinnäkin jokaisen atomin kaikki mahdolliset kolmiulotteiset sijainnit jokaisessa aminohapossa vaativat paljon tutkimusta. Toiseksi proteiinit hyödyntävät kemiallisessa rakenteessaan maksimaalisesti komplementaarisuutta atomien tehokkaaseen konfigurointiin. Koska proteiineilla on tyypillisesti satoja vetysidos"donoreita" (yleensä happea), joiden tulisi olla lähellä vetysidos"akseptoria" (yleensä typpi sitoutuneena vetyyn), voi olla erittäin vaikeaa löytää konformaatioita, joissa lähes jokainen donori on lähellä akseptoria. Kolmanneksi kokeellisten menetelmien kouluttamiseen on rajoitetusti esimerkkejä, joten on välttämätöntä ymmärtää aminohappojen mahdolliset kolmiulotteiset vuorovaikutukset yksiulotteisten sekvenssien perusteella käyttämällä tietoa asiaankuuluvien proteiinien evoluutiosta.
Fysiikkaa käytettiin ensimmäisen kerran atomien vuorovaikutuksen mallintamiseen parhaan konformaation etsimiseksi, ja kehitettiin menetelmä proteiinien rakenteen ennustamiseksi. Karplus, Levitt ja Warshel saivat vuoden 2013 Nobelin kemianpalkinnon työstään proteiinien laskennallisen simuloinnin parissa. Fysiikkaan perustuvat menetelmät ovat kuitenkin laskennallisesti kalliita ja vaativat likimääräistä prosessointia, joten tarkkoja kolmiulotteisia rakenteita ei voida ennustaa. Toinen "tietoon perustuva" lähestymistapa on käyttää tunnettujen rakenteiden ja sekvenssien tietokantoja mallien kouluttamiseen tekoälyn ja koneoppimisen (AI-ML) avulla. Hassabis ja Jumper soveltavat sekä fysiikan että AI-ML:n elementtejä, mutta lähestymistavan innovaatio ja suorituskyvyn harppaus johtuvat pääasiassa AI-ML:stä. Nämä kaksi tutkijaa yhdistivät luovasti suuria julkisia tietokantoja teollisuusluokan laskentaresursseihin luodakseen AlphaFoldin.
Mistä tiedämme, että he ovat "ratkaisseet" rakenneennusteiden ongelman? Vuonna 1994 perustettiin Critical Assessment of Structure Prediction (CASP) -kilpailu, joka kokoontuu kahden vuoden välein seuraamaan rakenneennusteiden edistymistä. Tutkijat jakavat sen proteiinin yksiulotteisen sekvenssin, jonka rakenteen he ovat äskettäin ratkaisseet, mutta jonka tuloksia ei ole vielä julkaistu. Ennustaja ennustaa kolmiulotteisen rakenteen tämän yksiulotteisen sekvenssin avulla, ja arvioija arvioi itsenäisesti ennustettujen tulosten laatua vertaamalla niitä kokeen suorittajan toimittamaan kolmiulotteiseen rakenteeseen (joka toimitetaan vain arvioijalle). CASP suorittaa todellisia sokkotarkastuksia ja tallentaa säännöllisiä suorituskyvyn hyppyjä, jotka liittyvät metodologiseen innovaatioon. 14. CASP-konferenssissa vuonna 2020 AlphaFoldin ennustustulokset osoittivat niin suuren suorituskyvyn, että järjestäjät ilmoittivat 3D-rakenneennusteiden ongelman ratkaistuksi: useimpien ennusteiden tarkkuus oli lähellä kokeellisten mittausten tarkkuutta.
Laajempi merkitys on siinä, että Hassabisin ja Jumperin työ osoittaa vakuuttavasti, kuinka tekoäly-koneopetus voisi mullistaa tiedettä. Sen tutkimus osoittaa, että tekoäly-koneopetus voi rakentaa monimutkaisia tieteellisiä hypoteeseja useista tietolähteistä, että tarkkaavaisuusmekanismit (samanlaisia kuin ChatGPT:ssä) voivat löytää keskeisiä riippuvuuksia ja korrelaatioita tietolähteissä ja että tekoäly-koneopetus voi itse arvioida tulostensa laatua. Tekoäly-koneopetus on pohjimmiltaan tiedettä.
Julkaisun aika: 23. syyskuuta 2023




