MIT
AI model precizno predviđa strukture antitijela
Koristeći ovaj model, istraživači bi mogli identificirati lijekove s antitijelima koji mogu ciljati na razne zarazne bolesti.
Prilagodbom modela umjetne inteligencije poznatih kao veliki jezični modeli (LLM), istraživači su postigli veliki napredak u sposobnosti predviđanja strukture proteina na temelju njegove sekvence. Međutim, ovaj pristup nije bio toliko uspješan za antitijela, dijelom zbog hipervarijabilnosti koja se vidi u toj vrsti proteina.
Kako bi prevladali to ograničenje, istraživači MIT-a razvili su računsku tehniku koja omogućuje velikim jezičnim modelima točnije predviđanje struktura antitijela. Njihov bi rad mogao omogućiti istraživačima da probiju milijune mogućih antitijela kako bi identificirali ona koja bi se mogla koristiti za liječenje SARS-CoV-2 i drugih zaraznih bolesti.
Tehnika, koja se usredotočuje na modeliranje hipervarijabilnih regija antitijela, također ima potencijal za analizu cijelog repertoara antitijela kod pojedinačnih ljudi. Ovo bi moglo biti korisno za proučavanje imunološkog odgovora ljudi koji super reagiraju na bolesti kao što je HIV, kako bi se pomoglo u otkrivanju zašto se njihova antitijela tako učinkovito brane od virusa.
Hipervarijabilne regije variraju u duljini, ali obično sadrže manje od 40 aminokiselina. Procijenjeno je da ljudski imunološki sustav može proizvesti do 1 kvintilijuna različitih antitijela mijenjajući sekvencu ovih aminokiselina, pomažući da se osigura da tijelo može odgovoriti na veliki izbor potencijalnih antigena. Te sekvence nisu evolucijski ograničene na isti način kao druge proteinske sekvence, tako da je velikim jezičnim modelima teško naučiti točno predvidjeti njihove strukture.
Kako bi modelirali te hipervarijabilne regije, istraživači su stvorili dva modula koji se nadograđuju na postojeće modele jezika proteina. Jedan od tih modula bio je obučen na hipervarijabilnim sekvencama iz oko 3000 struktura antitijela pronađenih u Protein Data Bank (PDB), što mu je omogućilo da nauči koje sekvence imaju tendenciju generiranja sličnih struktura. Drugi modul obučen je na podacima koji povezuju oko 3700 sekvenci antitijela s tim koliko snažno vežu tri različita antigena.
Rezultirajući računalni model, poznat kao AbMap, može predvidjeti strukture antitijela i snagu vezanja na temelju njihovih aminokiselinskih sekvenci. Kako bi pokazali korisnost ovog modela, istraživači su ga upotrijebili za predviđanje struktura protutijela koja bi snažno neutralizirala šiljasti protein virusa SARS-CoV-2.
Istraživači su započeli s nizom protutijela za koje je bilo predviđeno da se vežu na ovu metu, a zatim su generirali milijune varijanti mijenjajući hipervarijabilna područja. Njihov model uspio je identificirati strukture antitijela koje bi bile najuspješnije, mnogo točnije od tradicionalnih modela strukture proteina temeljenih na velikim jezičnim modelima.
Zatim su istraživači poduzeli dodatni korak grupiranja antitijela u skupine koje su imale slične strukture. Odabrali su antitijela iz svakog od ovih klastera za eksperimentalno testiranje. Ti eksperimenti su otkrili da je 82 posto tih antitijela imalo bolju snagu vezanja od originalnih antitijela koja su ušla u model.
Identificiranje niza dobrih kandidata rano u procesu razvoja moglo bi pomoći farmaceutskim kompanijama da izbjegnu trošenje puno novca na testiranje kandidata koji kasnije završe neuspješno.
Koristeći ovu tehniku, istraživači bi također mogli pokušati odgovoriti na neka dugogodišnja pitanja o tome zašto različiti ljudi različito reagiraju na infekciju. Na primjer, zašto neki ljudi razviju mnogo teže oblike Covida i zašto se neki ljudi koji su bili izloženi HIV-u nikad ne zaraze?
U ovoj studiji, istraživači su pokazali da kada se struktura uzme u obzir, postoji mnogo više preklapanja između pojedinaca od 10 posto viđenih u usporedbi sekvenci. Sada planiraju dodatno istražiti kako te strukture mogu doprinijeti ukupnom imunološkom odgovoru tijela protiv određenog patogena.
Rad objavljen u časopisu PNAS možete pronaći na ovoj poveznici.
Učitavam komentare ...