Google新一代TPU揭曉 2款AI晶片分攻訓練、推論

（中央社記者張欣瑜拉斯維加斯22日專電）AI代理時代來臨，看準推論成為未來最大運算需求，Google今天發布第8代AI晶片TPU，有別於上一代晶片，新一代共有2款產品，TPU 8t專攻訓練，大幅縮短模型訓練時間，而TPU 8i專攻推論，可減少資料存取延遲。

人工智慧（AI）從對話時代走入代理時代（Agentic Era），推論（Inference）市場需求不斷擴大。AI領導者Google今天在拉斯維加斯雲端技術大會（Google Cloud Next），一如市場預期，發布新一代自研晶片TPU（Tensor Processing Unit，張量處理單元）。

新一代TPU共有「2款」，包括專門用於訓練的TPU 8t與專門用於推論的TPU 8i。

相較前一代的Ironwood TPU，2款晶片在每瓦效能上最高提升達2倍。

會議正式開始前，Google在開放給媒體的專場活動上展示歷代TPU。從2015年推出的第一代晶片，到今年揭曉的2款、在AI代理時代打造的客製化晶片，現場鎂光燈閃不停。

Google的AI與基礎設施首席技術長瓦達特（Amin Vahdat）表示，Google創新速度不斷加快，從3年一代、2年一代、到1年一代。他也指出：「Google團隊在2年前就意識到，1年1顆晶片是不夠的；這是我們第一次嘗試推出2顆高性能、專門化的AI晶片」。

用於訓練的TPU 8t在大規模訓練下，性價比提升達2.8倍；記憶體配置方面，它採用216GB高頻寬記憶體（HBM），並搭載128MB靜態隨機存取記憶體（SRAM）。

單一TPU 8t超級運算叢集（Superpod）可擴展至9600顆晶片。

Google同時發布名為Virgo的網路架構，對於使用TPU 8t訓練超大型模型至關重要。

推論用的TPU 8i擁有更高的記憶體頻寬，能顯著降低推論延遲，它配備288 GB HBM 、搭載384 MB SRAM，突破因資料頻繁搬移而導致延遲與高能耗的「記憶體牆」瓶頸。

值得注意的是，TPU 8i採用名為Boardfly的全新網路拓撲設計，提升晶片間通訊效率。

瓦達特指出，Google的2款新晶片今年稍晚將開放給雲端客戶使用。

Google TPU過往多與博通（Broadcom）合作開發，外傳聯發科拿下新一代推論晶片大單。Google回應中央社提問表示，不便對外公開討論供應鏈合作夥伴的相關細節。（編輯：張芷瑄）1150422