XAI
Grok AI sada može obrađivati slike
Generativni AI model Grok-1.5V dobio je mogućnost obrade vizualnih informacija iz dokumenata, skica i fotografija.
Muskov xAI je najavio novu generaciju multimodalnog AI modela pod nazivom Grok-1.5V, koji sada može obraditi širok izbor vizualnih informacija, uključujući dokumente, dijagrame, screenshotovbe i fotografije.
Tvrtka kaže da je Grok-1.5V konkurentan postojećim multimodalnim modelima u nizu domena, od multidisciplinarnog razmišljanja do razumijevanja dokumenata, znanstvenih dijagrama, grafikona, snimki zaslona i fotografija i posebno naglašavaju sposobnosti u razumijevanju našeg fizičkog svijeta.
Također ističu da Grok nadmašuje svoje konkurente u novom RealWorldQA benchmarku koji mjeri razumijevanje prostora u stvarnom svijetu.
Između ostaloga Grok može iz dijagrama koji opisuje jednostavnu igru pogađanja u kojoj računalo generira nasumični broj koji korisnik mora pogoditi, napraviti Python kod kojim se pokreće igra kao što je opisano u dijagramu toka.
Pored toga, ako vam netko pošalje meme koji zbog nekog razloga ne možete razumjeti, možete ga pokazati Groku, koji će ga detaljno analizirati i izbaciti vam poantu u tekstualnom obliku.
I na kraju, možete mu unijeti svoj jednostavni crtež i zatražite ga da na temelju njega napiše čitavu priču.
xAI navodi da će novu inačicu Groka uskoro testirati postojeći korisnici, no zasad još nije poznato kada će to biti, a također najavljuju da će model u budućnosti unaprijediti zvukom i videom.
Učitavam komentare ...