NVIDIA
Blackwell je nova Nvidijina AI platforma
Novi Blackwell GPU čipovi opremaju modele umjetne inteligencije s bilijunima parametara.
Nvidia je objavila dolazak platforme Blackwell, koja omogućuje izgradnju i pokretanje generativne umjetne inteligencije u stvarnom vremenu na velikim jezičnim modelima s bilijunima parametara uz do 25 puta manju cijenu i potrošnju energije od svojeg prethodnika.
Zahvaljujući procesorima H100, koje danas koristi gotovo svaka AI tvrtka na svijetu za obuku velikih jezičnih modela koji pokreću usluge poput ChatGPT-a, učinili su Nvidiju jednom od najvrjednijih tvrtki na svijetu, a sada dolazi nova generacija, koja će umjetnoj inteligenciji pružiti nove iskorake.
Nvidia kaže da Blackwell GPU arhitektura sadrži šest transformativnih tehnologija za ubrzano računalstvo, koje će pomoći u otključavanju otkrića u obradi podataka, inženjerskoj simulaciji, automatizaciji elektroničkog dizajna, računalno potpomognutom dizajnu lijekova, kvantnom računalstvu i generativnoj umjetnoj inteligenciji.
Među brojnim organizacijama i tvrtkama za koje se očekuje da će usvojiti Blackwell su Amazon Web Services, Dell Technologies, Google, Meta, Microsoft, OpenAI, Oracle, Tesla i xAI.
Nova arhitektura je nazvana u čast Davida Harolda Blackwella, matematičara koji se specijalizirao za teoriju igara i statistiku te prvog tamnoputog učenjaka primljenog u Nacionalnu akademiju znanosti i nasljeđuje arhitekturu Hopper, lansiranu prije dvije godine.
Blackwellovih šest revolucionarnih tehnologija, koje zajedno omogućuju obuku umjetne inteligencije i LLM zaključivanje u stvarnom vremenu za modele koji skaliraju do 10 trilijuna parametara, uključuju:
Najmoćniji čip na svijetu: Opremljen s 208 milijardi tranzistora, proizveden korištenjem posebno izrađenog 4NP TSMC procesa i povezivanjem dva čipa od 10 TB/sekundi u jedan jedinstveni GPU.
Transformer Engine druge generacije: Potaknut novom podrškom za skaliranje mikro-tenzora i NVIDIA naprednim algoritmima za upravljanje dinamičkim rasponom integriranim u okvire NVIDIA Tensor-LLM i NeMo Megatron, Blackwell će podržati dvostruko veće veličine izračuna i modela s novom 4-bitnom umjetnom inteligencijom s pomičnim zarezom sposobnosti zaključivanja.
NVLink pete generacije: Za ubrzavanje performansi za modele umjetne inteligencije s više trilijuna parametara, najnovija iteracija NVIDIA NVLink donosi revolucionarni dvosmjerni protok od 1,8 TB/s po GPU-u, osiguravajući besprijekornu komunikaciju velike brzine između do 576 GPU-a za najsloženije LLM modele.
RAS Engine: GPU-ovi koje pokreće Blackwell uključuju namjenski mehanizam za pouzdanost, dostupnost i mogućnost servisiranja. Osim toga, arhitektura Blackwell dodaje mogućnosti na razini čipa za korištenje preventivnog održavanja temeljenog na umjetnoj inteligenciji za pokretanje dijagnostike i predviđanje problema s pouzdanošću. Ovo maksimizira vrijeme neprekidnog rada sustava i poboljšava otpornost za masovne implementacije AI-a kako bi radile bez prekida tjednima ili čak mjesecima i smanjile operativne troškove.
Sigurna umjetna inteligencija: Napredne sigurnosne mogućnosti štite modele umjetne inteligencije i korisničke podatke bez ugrožavanja performansi, uz podršku za nove izvorne protokole za šifriranje sučelja, koji su ključni za industrije osjetljive na privatnost kao što su zdravstvene i financijske usluge.
Engine za dekompresiju: Namjenski mehanizam za dekompresiju podržava najnovije formate, ubrzavajući upite baze podataka kako bi pružio najviše performanse u analizi podataka i znanosti o podacima. U nadolazećim godinama obrada podataka, na koju tvrtke troše desetke milijardi dolara godišnje, bit će sve više GPU-ubrzana.
Nvidia GB200 Grace Blackwell Superčip povezuje dva Nvidia B200 Tensor Core GPU-a s Nvidi Grace CPU-om preko 900GB/s NVLink međukonekcije ultra male snage.
Za najviše performanse umjetne inteligencije, sustavi koje pokreće GB200 mogu se povezati s NVIDIA Quantum-X800 InfiniBand i Spectrum-X800 Ethernet platformama, također najavljenim danas, koje pružaju napredno umrežavanje pri brzinama do 800Gb/s.
GB200 je ključna komponenta NVIDIA GB200 NVL72, sustava s više čvorova, tekućinom hlađenog, rack-scale sustava za radna opterećenja koja zahtijevaju najviše računala. Kombinira 36 Grace Blackwell Superchipova, koji uključuju 72 Blackwell GPU-a i 36 Grace CPU-a međusobno povezanih NVLinkom pete generacije.
GB200 NVL72 pruža do 30x povećanje performansi u usporedbi s istim brojem NvidiaH100 Tensor Core GPU-ova za radna opterećenja zaključivanja LLM-a i smanjuje troškove i potrošnju energije do 25x.
Platforma djeluje kao jedan GPU s 1,4 exaflopsa AI performansi i 30 TB brze memorije, te je građevni blok za najnoviji DGX SuperPOD.
NVIDIA nudi HGX B200, poslužiteljsku ploču koja povezuje osam B200 GPU-ova putem NVLinka za podršku generativnih AI platformi temeljenih na x86. HGX B200 podržava mrežne brzine do 400 Gb/s putem NVIDIA Quantum-2 InfiniBand i Spectrum-X Ethernet mrežnih platformi.
Zasad još nije poznato koja će tvrtka ili organizacija prva nadograditi svoje „AI servere“ Nvidijinim Blackwellom, ali je za očekivati da će to učiniti svi veliki igrači.
Učitavam komentare ...