Alexey Milovidov
Osnivač tvrtke vrijedne 2 milijarde dolara govori za VIDI
Osnivač tvrtke ClickHouse otkriva nam detalje o biznisu vezanom uz obradu podataka u stvarnom vremenu.
Da grad Zagreb postaje sve važnije mjesto na globalnoj karti „druženja“ (meetupa) govori i činjenica da je u organizaciji domaće IT tvrtke Sofascore u njihovom prostoru 30.01.2025. godine održan skup trenutnih (i budućih) korisnika baze podataka ClickHouse.
Ovaj značajan događaj okupio je stručnjake iz područja podatkovnog inženjerstva, analitike i entuzijaste, koji su imali priliku saznati nešto novo o najnovijim tehnologijama i inovacijama u svijetu baze podataka ClickHouse.
Američka tvrtka ClickHouse, čija se vrijednost procjenjuje na 2 milijarde dolara, stoji iza jedne je od najboljih (i u zadnje vrijeme najbrže rastućih) baza podataka otvorenog koda. Koristi se u brojnim industrijama za obradu velikih količina podataka, s iznimnom učinkovitošću obrade u stvarnom vremenu. Među kompanijama koje se oslanjaju na ClickHouseova rješenja nalaze se eBay, Spotify, Netflix, Cloudflare, Microsoft a odnedavno ih koristi i kineski start-up DeepSeek.
Tvrtka Sofascore kao globalno popularna platforma za sportske analitike, koristi upravo ClickHouse za obradu podataka u stvarnom vremenu, čime osigurava brze i precizne uvide važne za donošenje poslovnih odluka.
Ono što je događaju dalo dodatno na važnosti bila je prisutnost jednog od osnivača i CTO-a tvrtke ClickHouse. Gospodin Alexey Milovidov održao je zanimljivo predavanje pod nazivom „My Favorite ClickHouse Features 2024“, a mi smo iskoristili priliku te mu direktno postavili nekoliko pitanja o bazi podataka ClickHouse.
VIDI: Gospodine Milovidov kako ste uopće došli na ideju, pa čak možemo reći i skupili hrabrost, da krenete s razvojem novog proizvoda na području s tako brojnom i kvalitetnom konkurencijom, kao što su baze podataka?
Alexey: U stvari na samom početku uopće nije postojala ideja da se napravi nova baza podataka, nego je to prije bila vrsta eksperimenta. Za jednu veliku tvrtku trebalo je riješiti problem obrade velike količine podataka za analizu weba.
Zato sam napravio prototip rješenja za postavljanje upita na fiksnu shemu podataka te vraćanje sadržaja iz točno određenih kolona uz mogućnost filtriranja i sortiranja podataka. Prototip čak nije ni podržavao ni standardne SQL naredbe, ali je zato koristio spremanje podataka u obliku kolona umjesto redova. I takav prototip razvijen u svega nekoliko tjedana riješio je zadani problem.
Budući da je to bio samo prototip, a pokazao je vrlo dobre rezultate, došao sam na ideju da bi iz toga moglo ispasti nešto veće. Također, tijekom razvoja u 2008 godini usporedio sam prototip s nekoliko postojećih baza podataka. I pokazalo se da radi bolje to što radi. Zapravo nisam bio ni svjestan da ću uspjeti napraviti nešto tako dobro. Rezultati su premašili sve moja očekivanja, pa sam zato nastavio razvoj.
VIDI: Danas kad je ClickHouse kao baza podataka već u fazi zrelosti, na koji način se razvojni alati mogu povezati na nju kako bi se osiguralo korištenje u praksi?
Alexey: ClickHouse baza je u potpunosti razvijena u C++ jeziku, kao i klijent za pristup bazi i izvođenje svih operacija nad podacima. Oba dijela su u javnom vlasništu pa se klijent može izmijeniti na bilo koji način potreban za pristup bazi iz nekog razvojnog alata.
Također je podržan REST API pristup bazi podataka, a mogu se iskoristiti i moduli za povezivanje s bazom podataka drugih proizvođača.
VIDI: U današnje vrijeme kad velika većina tvrtki već ima spremljene podatke u sustavima drugih proizvođača (na primjer Microsoft ili Oracle), može li se ClickHouse integrirati u takvo okruženje tako da koristi i/ili razmjenjuje podatke s bazama podataka drugih proizvođača?
Alexey: Da, odgovor je definitivno Da. Pretpostavimo da već koristite neku bazu podataka kao što je PostgreSQL ili MySQL. Za direktno povezivanje s njima možete iskoristiti tehnologiju pod naziv „Table function“ koja izravno čita podatke iz drugih baza podataka i predstavlja dio ClickHouse sustava.
Također postoji mogućnost inkrementalnog učitavanja podataka iz drugih baza podataka i tu je riječ o modulima koji su izravno uključeni u sam ClickHouse sustav.
Preostala dva predavanja na skupu održali su domaći stručnjaci koji intenzivno koriste navedenu bazu podataka. To su bila predavanja: „ClickHouse on Data Lakes“, Antonio Anđelić - Software Engineer @ ClickHouse te „Scoring Big and Breaking Limits: ClickHouse at Sofascore“, Jakov Vidulić - Data Engineer @ Sofascore
Prema najavama organizatora slična druženja trebala bi se ponoviti i u budućnosti, a cilj im je osigurati jačanje zajednice oko ClickHouse tehnologije u regiji.
Učitavam komentare ...