谷歌第七代TPU挑戰輝達霸權 Ironwood推理效能引爆AI新戰局 - TMN 想想市場新聞網Think Markets News TMN 想想市場新聞網Think Markets News

TMN 科技編輯部報導

Ironwood震撼登場，專為推理設計

在2025年4月9日的Google Cloud Next大會上，谷歌（GOOGL-US）正式發布第七代TPU——Ironwood，這款客製化AI加速器不僅是谷歌迄今性能最強、可擴展性最高的產品，也是首款專為推理（Inference）打造的晶片，直接對標輝達（NVDA-US）的Blackwell B200。Ironwood的推出標誌著谷歌在AI硬體領域的又一里程碑，相較於2018年的初代TPU，其推理性能提升驚人的3600倍，功耗效率更是提高近30倍。谷歌計畫於今年稍晚推出這款TPU v7，準備在AI基礎設施市場掀起波瀾。

效能超越超算，挑戰輝達B200

Ironwood的硬體規格令人矚目。相較於第六代TPU Trillium，其每瓦效能（perf/watt）提升2倍，並採用先進液冷技術，即使在高負載下也能維持比標準風冷高出兩倍的穩定性能。谷歌宣稱，Ironwood集群（9,216個晶片）的總運算能力達到42.5 Exaflops，是當前世界最強超算El Capitan（1.74 Exaflops）的24倍以上。市場分析指出，Ironwood與輝達B200在推理任務上的效能不相上下，甚至在特定場景略勝一籌，這得益於其針對「生成式AI」優化的設計，實現更低的延遲與更高的成本效益。

從被動到主動，AI推理時代來臨

Ironwood不僅是硬體升級，更代表AI基礎設施的轉型方向。谷歌認為，傳統「響應式」AI模型正逐步被「生成式」智能體取代，後者能主動檢索資料並生成洞見，而非僅提供原始數據。這種「推理時代」的核心需求，正是Ironwood設計的出發點。其配備192GB高頻寬記憶體（HBM），較Trillium增加6倍，並以7.2TBps的頻寬確保數據快速存取，完美支援大型語言模型（LLM）與混合專家模型（MoE）的推理需求。谷歌強調，這款TPU將推動AI更聰明、更具協作性的未來。

生成式AI平台升級，Code Assist進化

此次大會不僅聚焦硬體，谷歌還展示了一系列AI技術突破。生成式AI平台Vertex AI推出全新迭代，包括Veo 2（視訊生成）、Imagen 3（影像生成）、Chirp 3（語音生成）與Lyria（文字轉音樂），成為業界唯一涵蓋視訊、影像、語音與音樂的綜合平台。此外，AI編碼助理Gemini Code Assist新增「智能體」功能，能執行多步驟任務，例如從Google Docs規格生成應用程式，或將程式碼跨語言轉換。然而，業界研究顯示，當前AI生成程式碼仍存邏輯漏洞與安全隱患，其實際能力尚待市場驗證。

TMN 編輯部解析

Ironwood的問世不僅是谷歌對輝達的一次技術狙擊，更反映了AI產業從訓練轉向推理的趨勢。根據市場趨勢分析，全球AI推理市場預計在2025-2030年間年複合成長率達20%以上（來源：國際數據公司IDC，2024年報告），而高效能、低功耗的晶片正是關鍵競爭場域。Ironwood的3600倍效能飛躍並非空話，其背後是谷歌十餘年TPU技術積累與對生成式AI需求的精準把握。相比輝達B200主打訓練與推理兼顧，Ironwood專注推理的定位或許更能搶佔雲端服務與邊緣運算市場。

對投資者而言，這場硬體大戰值得關注。建議追蹤谷歌雲端業務Q2財報中的AI基礎設施收入成長率，若超過20%，將顯示Ironwood的市場潛力。同時，輝達B200的出貨進度與定價策略也需密切留意，若其推理性能未達預期，谷歌可能在雲端AI服務中搶得先機。短期內，Ironwood的低功耗優勢將吸引企業客戶轉向谷歌雲，長期則可能重塑AI硬體競爭格局，投資人可考慮適度增持谷歌相關供應鏈股票。