Skip to content
Menej ako minútu min.
Najvýkonnejší superpočítač od Google má 1,77 PB pamäte – nový svetový rekord.

Google Ironwood TPU škáluje na 9216 čipov s rekordnou zdieľanou pamäťou 1,77PB
Architektúra s dvoma čipmi poskytuje 4614 TFLOPs FP8 a 192GB HBM3e na čip
Vylepšené chladenie pre spoľahlivosť a funkcie návrhu s podporou AI umožňujú efektívne rozsiahle inferenčné pracovné zaťaženia


Google ukončil sekcie zamerané na strojové učenie na nedávnom podujatí Hot Chips 2025 podrobným pohľadom na svoju najnovšiu jednotku na spracovanie tenzorov, Ironwood.

Čip, ktorý bol prvýkrát predstavený na Google Cloud Next 25 v apríli 2025, je prvou TPU spoločnosti navrhnutou primárne pre rozsiahle inferenčné pracovné zaťaženia, a nie pre trénovanie, a prichádza ako jej siedma generácia hardvéru TPU.

Každý čip Ironwood integruje dva výpočtové čipy, ktoré poskytujú výkon 4 614 TFLOPs FP8 – a osem blokov HBM3e poskytuje 192 GB pamäte na čip, spárované s šírkou pásma 7,3 TB/s.

Google zabudoval 1,2 TBps I/O šírky pásma, aby umožnil systému rozšíriť sa až na 9 216 čipov na jeden pod bez lepiacej logiky. Táto konfigurácia dosahuje neuveriteľných 42,5 exaflopsov výkonu.

Pamäťová kapacita sa tiež pôsobivo škáluje. Naprieč podom Ironwood ponúka 1,77 PB priamo adresovateľnej HBM. Táto úroveň stanovuje nový rekord pre superpočítače so zdieľanou pamäťou a je umožnená optickými obvodovými prepínačmi spájajúcimi racky.

Hardvér sa dokáže prekonfigurovať okolo zlyhaných uzlov, čím obnovuje pracovné zaťaženia z kontrolných bodov.

Čip integruje viacero funkcií zameraných na stabilitu a odolnosť. Tie zahŕňajú on-chip root of trust, vstavané funkcie autotestu a opatrenia na zmiernenie tichej korupcie dát.

Funkcie logickej opravy sú zahrnuté na zlepšenie výťažnosti výroby. Dôraz na RAS, alebo spoľahlivosť, dostupnosť a servisovateľnosť, je viditeľný v celej architektúre.

Chladenie je riešené pomocou riešenia s chladiacou platňou podporovaného treťou generáciou infraštruktúry kvapalinového chladenia od spoločnosti Google.

Google tvrdí, že dosiahol dvojnásobné zlepšenie výkonu na watt v porovnaní s Trilliumom. Dynamické škálovanie napätia a frekvencie ďalej zlepšuje efektivitu počas rôznych pracovných zaťažení.

Ironwood tiež integruje techniky AI do svojho vlastného návrhu. Používal sa na optimalizáciu ALU obvodov a pôdorysu.

Bola pridaná štvrtá generácia SparseCore na zrýchlenie vkladania a kolektívnych operácií, podporujúca pracovné zaťaženia, ako sú odporúčacie motory.

Nasadenie už prebieha v hyperškále v dátových centrách Google Cloud, hoci TPU zostáva internou platformou, ktorá nie je priamo dostupná zákazníkom.

Ryan Smith zo ServeTheHome povedal: „Toto bola úžasná prezentácia. Google videl potrebu vytvoriť špičkový AI výpočet pred mnohými generáciami. Teraz spoločnosť inovuje na každej úrovni od čipov, cez prepojenia až po fyzickú infraštruktúru. Aj ako posledná prezentácia Hot Chips 2025 mala publikum prikované k pódiu pri tom, čo Google ukazoval.“

waynewilliams@onmail.com (Wayne Williams)

Staňte sa súčasťou našich čitateľov, ktorí nás podporujú!

Vaša podpora nám pomáha udržiavať nezávislé správy zdarma pre všetkých.

Please enter a valid amount.
Ďakujeme za Vašu podporu.
Vašu platbu nebolo možné spracovať.
Redakcia

Google Ironwood TPU škáluje na 9216 čipov s rekordnou zdieľanou pamäťou 1,77PB
Architektúra s dvoma čipmi poskytuje 4614 TFLOPs FP8 a 192GB HBM3e na čip
Vylepšené chladenie pre spoľahlivosť a funkcie návrhu s podporou AI umožňujú efektívne rozsiahle inferenčné pracovné zaťaženia


Google ukončil sekcie zamerané na strojové učenie na nedávnom podujatí Hot Chips 2025 podrobným pohľadom na svoju najnovšiu jednotku na spracovanie tenzorov, Ironwood.

Čip, ktorý bol prvýkrát predstavený na Google Cloud Next 25 v apríli 2025, je prvou TPU spoločnosti navrhnutou primárne pre rozsiahle inferenčné pracovné zaťaženia, a nie pre trénovanie, a prichádza ako jej siedma generácia hardvéru TPU.

Každý čip Ironwood integruje dva výpočtové čipy, ktoré poskytujú výkon 4 614 TFLOPs FP8 – a osem blokov HBM3e poskytuje 192 GB pamäte na čip, spárované s šírkou pásma 7,3 TB/s.

Google zabudoval 1,2 TBps I/O šírky pásma, aby umožnil systému rozšíriť sa až na 9 216 čipov na jeden pod bez lepiacej logiky. Táto konfigurácia dosahuje neuveriteľných 42,5 exaflopsov výkonu.

Pamäťová kapacita sa tiež pôsobivo škáluje. Naprieč podom Ironwood ponúka 1,77 PB priamo adresovateľnej HBM. Táto úroveň stanovuje nový rekord pre superpočítače so zdieľanou pamäťou a je umožnená optickými obvodovými prepínačmi spájajúcimi racky.

Hardvér sa dokáže prekonfigurovať okolo zlyhaných uzlov, čím obnovuje pracovné zaťaženia z kontrolných bodov.

Čip integruje viacero funkcií zameraných na stabilitu a odolnosť. Tie zahŕňajú on-chip root of trust, vstavané funkcie autotestu a opatrenia na zmiernenie tichej korupcie dát.

Funkcie logickej opravy sú zahrnuté na zlepšenie výťažnosti výroby. Dôraz na RAS, alebo spoľahlivosť, dostupnosť a servisovateľnosť, je viditeľný v celej architektúre.

Chladenie je riešené pomocou riešenia s chladiacou platňou podporovaného treťou generáciou infraštruktúry kvapalinového chladenia od spoločnosti Google.

Google tvrdí, že dosiahol dvojnásobné zlepšenie výkonu na watt v porovnaní s Trilliumom. Dynamické škálovanie napätia a frekvencie ďalej zlepšuje efektivitu počas rôznych pracovných zaťažení.

Ironwood tiež integruje techniky AI do svojho vlastného návrhu. Používal sa na optimalizáciu ALU obvodov a pôdorysu.

Bola pridaná štvrtá generácia SparseCore na zrýchlenie vkladania a kolektívnych operácií, podporujúca pracovné zaťaženia, ako sú odporúčacie motory.

Nasadenie už prebieha v hyperškále v dátových centrách Google Cloud, hoci TPU zostáva internou platformou, ktorá nie je priamo dostupná zákazníkom.

Ryan Smith zo ServeTheHome povedal: „Toto bola úžasná prezentácia. Google videl potrebu vytvoriť špičkový AI výpočet pred mnohými generáciami. Teraz spoločnosť inovuje na každej úrovni od čipov, cez prepojenia až po fyzickú infraštruktúru. Aj ako posledná prezentácia Hot Chips 2025 mala publikum prikované k pódiu pri tom, čo Google ukazoval.“

waynewilliams@onmail.com (Wayne Williams)

Staňte sa súčasťou našich čitateľov, ktorí nás podporujú!

Vaša podpora nám pomáha udržiavať nezávislé správy zdarma pre všetkých.

Please enter a valid amount.
Ďakujeme za Vašu podporu.
Vašu platbu nebolo možné spracovať.
Translate »