
(中央社記者張欣瑜拉斯維加斯22日專電)AI代理時代來臨,看準推論成為未來最大運算需求,Google今天發布第8代AI晶片TPU,有別於上一代晶片,新一代共有2款產品,TPU 8t專攻訓練,大幅縮短模型訓練時間,而TPU 8i專攻推論,可減少資料存取延遲。
(中央社記者張欣瑜拉斯維加斯22日專電)AI代理時代來臨,看準推論成為未來最大運算需求,Google今天發布第8代AI晶片TPU,有別於上一代晶片,新一代共有2款產品,TPU 8t專攻訓練,大幅縮短模型訓練時間,而TPU 8i專攻推論,可減少資料存取延遲。
人工智慧(AI)從對話時代走入代理時代(Agentic Era),推論(Inference)市場需求不斷擴大。AI領導者Google今天在拉斯維加斯雲端技術大會(Google Cloud Next),一如市場預期,發布新一代自研晶片TPU(Tensor Processing Unit,張量處理單元)。
新一代TPU共有「2款」,包括專門用於訓練的TPU 8t與專門用於推論的TPU 8i。
相較前一代的Ironwood TPU,2款晶片在每瓦效能上最高提升達2倍。
會議正式開始前,Google在開放給媒體的專場活動上展示歷代TPU。從2015年推出的第一代晶片,到今年揭曉的2款、在AI代理時代打造的客製化晶片,現場鎂光燈閃不停。
Google的AI與基礎設施首席技術長瓦達特(Amin Vahdat)表示,Google創新速度不斷加快,從3年一代、2年一代、到1年一代。他也指出:「Google團隊在2年前就意識到,1年1顆晶片是不夠的;這是我們第一次嘗試推出2顆高性能、專門化的AI晶片」。
用於訓練的TPU 8t在大規模訓練下,性價比提升達2.8倍;記憶體配置方面,它採用216GB高頻寬記憶體(HBM),並搭載128MB靜態隨機存取記憶體(SRAM)。
單一TPU 8t超級運算叢集(Superpod)可擴展至9600顆晶片。
Google同時發布名為Virgo的網路架構,對於使用TPU 8t訓練超大型模型至關重要。
推論用的TPU 8i擁有更高的記憶體頻寬,能顯著降低推論延遲,它配備288 GB HBM 、搭載384 MB SRAM,突破因資料頻繁搬移而導致延遲與高能耗的「記憶體牆」瓶頸。
值得注意的是,TPU 8i採用名為Boardfly的全新網路拓撲設計,提升晶片間通訊效率。
瓦達特指出,Google的2款新晶片今年稍晚將開放給雲端客戶使用。
Google TPU過往多與博通(Broadcom)合作開發,外傳聯發科拿下新一代推論晶片大單。Google回應中央社提問表示,不便對外公開討論供應鏈合作夥伴的相關細節。(編輯:張芷瑄)1150422

