Kampuni ya Google imeimarisha kwa kiasi kikubwa mfumo wake mkuu wa kompyuta (supercomputing system) kwa ajili ya kufunza na kufanya utabiri wa haraka (inference) wa mifumo ya Akili Bandia (AI). Kwa kuzindua chipu zake za Tensor Processing Units (TPU) zilizobuniwa kwa ndani na Central Processing Units (CPU), Google imetuma ujumbe mzito kwa NVIDIA kwamba sasa inaingia rasmi kwenye ushindani wa soko la miundombinu ya AI.
Mnamo Novemba 6, Google Cloud ilifichua toleo jipya la mashine zake za AI, zikiendeshwa na TPU mpya iitwayo 'Ironwood' na CPU iitwayo 'Axion'. Mashine hizi zimeundwa kusaidia ufunzaji wa mifumo mikubwa ya AI na utabiri wa haraka (low-latency inference) kwa wakati mmoja.
TPU Ironwood: Mfalme Mpya wa Utendaji
Ironwood ni kichakataji cha Google cha kizazi cha saba (7th generation Tensor Processor). Utendaji wake unazidi ule wa kizazi kilichotangulia kwa mara nne (4x) zaidi katika ufuzaji wa mfumo na utoaji wa huduma.
- Uwezo wa Hesabu: Ironwood ina uwezo wa kukokotoa wa 4,614 FP8 TFLOPS (TeraFLOPS).
- Kumbukumbu na Kasi: Ina 192GB ya kumbukumbu ya HBM3E na kasi ya upitishaji data (bandwidth) ya 7.37 TB/s.
Google imezindua 'Ironwood Pod' ambayo inajumuisha Ironwood 9,216. Pod hii hutoa utendaji wa kilele cha hadi 42.5 FP8 EFLOPS (ExaFLOPS). Thamani hii inazidi uwezo wa mfumo wa GB300 NVL72 wa NVIDIA (ambao hutoa 0.36 EFLOPS) kwa kiasi kikubwa.
Mfumo wa Ironwood umewekwa kuwa kiini cha mfumo mpya wa Google, 'AI Hypercomputer'. Jukwaa hili linaunganisha rasilimali za kompyuta, hifadhi, na mtandao katika mfumo mmoja wa usimamizi. Ili kuhakikisha utulivu, AI Hypercomputer inatumia teknolojia ya Optical Circuit Switching (kubadilisha njia za mzunguko wa mwanga) ambayo inaruhusu mfumo kujirekebisha mara moja na kuendelea kufanya kazi hata kama vifaa vingine vitaharibika.
Kampuni ya Anthropic ilitangaza mwezi uliopita kuwa inapanga kutumia hadi Ironwood milioni 1 kufuatia upanuzi wa ushirikiano wake na Google.
CPU Axion: Ushindani wa CPU
Wakati huo huo, Google ilizindua kichakataji chake cha seva kiitwacho 'Axion', kinachotumia usanifu wa ARMv9. Hii inakamilisha teknolojia yake ya ndani katika sekta ya CPU.
- Utendaji: Axion inatoa utendaji ulio juu kwa hadi 50% na ufanisi bora wa nishati kwa 60% ikilinganishwa na CPU za kisasa za x86. Pia inazidi instansi za sasa za ARM kwa 30% kwa utendaji.
- Usanifu: Inajengwa juu ya usanifu wa ARM 'Neoverse V2' na inajumuisha 2MB L2 cache kwa kila core na 80MB L3 cache.
Google inatumia kidhibiti chake cha 'Titanium' katika seva zinazotumia Axion na Ironwood. Kidhibiti hiki hushughulikia mitandao, usalama, na uendeshaji wa I/O, na hivyo kupunguza mzigo kwenye CPU kuu na kuongeza utendaji na ufanisi wa usimamizi.
Kwa hatua hii, Google imekamilisha safu yake ya chipu zilizobuniwa kwa ndani—ikijumuisha TPU, VCU, chipu za simu za Tensor, miundombinu ya Titanium, na sasa CPU. Hii ni njia kuu ya Google ya kubadilisha mtazamo wa cloud computing kutoka kwa seva za kawaida hadi kwenye supercomputer maalum za AI, ikilenga moja kwa moja NVIDIA na AMD.