University of Illinois Urbana-Champaign
Nova slova u DNK udvostručuju gustoću pohrane podataka
Istraživači su nukleobazama A, G, C i T, dodali 7 novih "slova" i udvostručili gustoću pohrane podataka u DNK.
Kao i kod većine stvari, prirodni sustav za pohranu podataka, DNK, daleko nadmašuje sve što smo stvorili. Sada su istraživači na Sveučilištu Illinois Urbana-Champaign udvostručili njegov ionako nevjerojatan kapacitet pohrane dodavanjem dodatnih slova njegovoj "abecedi" i razvili novi način za njihovo čitanje.
DNK se prirodno sastoji od kombinacija četiriju nukleobaza: adenina, gvanina, citozina i timina. Predstavljene slovima A, G, C i T, te se baze grupiraju u različite sekvence kako bi tvorile nacrte za svaki živi organizam. Taj sustav za pohranu informacija je nevjerojatno gust, s jednim gramom DNK koji može pohraniti do 215 petabajta (215 milijuna GB) podataka.
To ga naravno čini vrlo atraktivnim potencijalnim rješenjem za pohranu golemih količina podataka koje moderno društvo proizvodi svakodnevno. Primjerice, cijeli sadržaj interneta mogao bi stati u kutiju za cipele punu DNK. I kao da to "skladište" nije dovoljno gusto, istraživači su u novoj studiji pronašli način da ga udvostruče.
Uz uobičajene A, G, C i T, tim je zapravo dodao dodatnih sedam "slova" DNK abecedi. Oni imaju oblik kemijski modificiranih nukleotida, otvarajući više različitih kombinacija koje omogućuju pohranjivanje više informacija unutar iste količine fizičkog prostora.
"Zamislite englesku abecedu", rekla je Kasra Tabatabaei, koautorica studije. "Kad biste imali samo četiri slova za korištenje, mogli biste stvoriti samo toliko riječi. Da imate punu abecedu, mogli biste proizvesti neograničene kombinacije riječi. Isto je i s DNK. Umjesto pretvaranja nula i jedinica u A, G, C i T, možemo pretvoriti nule i jedinice u A, G, C, T i sedam novih slova u abecedi za pohranu."
Naravno, dodavanje dodatnih nukleotida znači da ih postojeći sustavi za čitanje podataka neće prepoznati, pa je tim također razvio novi sustav koji to može. DNK lanac prolazi kroz nanopore u posebno dizajniranom proteinu, koji može otkriti pojedinačne jedinice bez obzira na to jesu li prirodne ili sintetske. Algoritmi strojnog učenja zatim dekodiraju informacije pohranjene u njima.
"Pokušali smo 77 različitih kombinacija od 11 nukleotida, a naša metoda je uspjela savršeno razlikovati svaki od njih", rekao je Chao Pan, koautor studije. "Okvir dubokog učenja kao dio naše metode za identifikaciju različitih nukleotida je univerzalan, što omogućuje generalizaciju našeg pristupa mnogim drugim aplikacijama."
Osim gustoće, nova metoda također poboljšava brzinu zapisivanja podataka, što je inače prilično spor proces za DNK. Ovaj sustav je otprilike prepolovio količinu vremena potrebnog za pisanje informacija u DNK.
Ovaj bi rad mogao pomoći da DNK postane održiv sustav za pohranu podataka.
Istraživanje objavljeno u časopisu Nano Letters možete pronaći na ovoj poveznici.
Učitavam komentare ...