Physical Address

304 North Cardinal St.
Dorchester Center, MA 02124

谷歌第七代TPU Ironwood亮相,推理效能飆升3600倍,對標輝達B200。

谷歌第七代TPU挑戰輝達霸權 Ironwood推理效能引爆AI新戰局

TMN 科技編輯部報導

Ironwood震撼登場,專為推理設計

在2025年4月9日的Google Cloud Next大會上,谷歌(GOOGL-US)正式發布第七代TPU——Ironwood,這款客製化AI加速器不僅是谷歌迄今性能最強、可擴展性最高的產品,也是首款專為推理(Inference)打造的晶片,直接對標輝達(NVDA-US)的Blackwell B200。Ironwood的推出標誌著谷歌在AI硬體領域的又一里程碑,相較於2018年的初代TPU,其推理性能提升驚人的3600倍,功耗效率更是提高近30倍。谷歌計畫於今年稍晚推出這款TPU v7,準備在AI基礎設施市場掀起波瀾。

效能超越超算,挑戰輝達B200

Ironwood的硬體規格令人矚目。相較於第六代TPU Trillium,其每瓦效能(perf/watt)提升2倍,並採用先進液冷技術,即使在高負載下也能維持比標準風冷高出兩倍的穩定性能。谷歌宣稱,Ironwood集群(9,216個晶片)的總運算能力達到42.5 Exaflops,是當前世界最強超算El Capitan(1.74 Exaflops)的24倍以上。市場分析指出,Ironwood與輝達B200在推理任務上的效能不相上下,甚至在特定場景略勝一籌,這得益於其針對「生成式AI」優化的設計,實現更低的延遲與更高的成本效益。

從被動到主動,AI推理時代來臨

Ironwood不僅是硬體升級,更代表AI基礎設施的轉型方向。谷歌認為,傳統「響應式」AI模型正逐步被「生成式」智能體取代,後者能主動檢索資料並生成洞見,而非僅提供原始數據。這種「推理時代」的核心需求,正是Ironwood設計的出發點。其配備192GB高頻寬記憶體(HBM),較Trillium增加6倍,並以7.2TBps的頻寬確保數據快速存取,完美支援大型語言模型(LLM)與混合專家模型(MoE)的推理需求。谷歌強調,這款TPU將推動AI更聰明、更具協作性的未來。

生成式AI平台升級,Code Assist進化

此次大會不僅聚焦硬體,谷歌還展示了一系列AI技術突破。生成式AI平台Vertex AI推出全新迭代,包括Veo 2(視訊生成)、Imagen 3(影像生成)、Chirp 3(語音生成)與Lyria(文字轉音樂),成為業界唯一涵蓋視訊、影像、語音與音樂的綜合平台。此外,AI編碼助理Gemini Code Assist新增「智能體」功能,能執行多步驟任務,例如從Google Docs規格生成應用程式,或將程式碼跨語言轉換。然而,業界研究顯示,當前AI生成程式碼仍存邏輯漏洞與安全隱患,其實際能力尚待市場驗證。

TMN 編輯部解析

Ironwood的問世不僅是谷歌對輝達的一次技術狙擊,更反映了AI產業從訓練轉向推理的趨勢。根據市場趨勢分析,全球AI推理市場預計在2025-2030年間年複合成長率達20%以上(來源:國際數據公司IDC,2024年報告),而高效能、低功耗的晶片正是關鍵競爭場域。Ironwood的3600倍效能飛躍並非空話,其背後是谷歌十餘年TPU技術積累與對生成式AI需求的精準把握。相比輝達B200主打訓練與推理兼顧,Ironwood專注推理的定位或許更能搶佔雲端服務與邊緣運算市場。

對投資者而言,這場硬體大戰值得關注。建議追蹤谷歌雲端業務Q2財報中的AI基礎設施收入成長率,若超過20%,將顯示Ironwood的市場潛力。同時,輝達B200的出貨進度與定價策略也需密切留意,若其推理性能未達預期,谷歌可能在雲端AI服務中搶得先機。短期內,Ironwood的低功耗優勢將吸引企業客戶轉向谷歌雲,長期則可能重塑AI硬體競爭格局,投資人可考慮適度增持谷歌相關供應鏈股票。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *