科技媒體《The Information》周一 (2 日) 報導指出,蘋果近期已允許谷歌在其資料中心部署伺服器,用於運行未來由 Google Gemini 驅動的新版 Siri。這項決定標誌著蘋果在 AI 基礎設施策略上的重大轉變。
長期以來,蘋果主要依靠自研的私有雲端運算 (PCC) 系統處理複雜 AI 查詢,該系統運行在搭載蘋果晶片的伺服器上。
然而,由於公司文化更側重硬體與消費者功能,對雲端基礎設施投入不足,導致 PCC 系統平均利用率僅約 10%,部分專用伺服器甚至閒置。這種策略失衡也引發了包括雲端技術專家派 Patrick Gates 在內的核心人才流失,後者曾主導將蘋果晶片引入資料中心的構想。
隨著 AI 需求激增,蘋果原有基礎設施逐漸老化,加上淘汰舊款輝達伺服器帶來的算力缺口,因此不得不增加對亞馬遜等第三方雲端服務商的依賴。
儘管蘋果曾因隱私顧慮多年拒絕谷歌雲端技術,但谷歌在 2023 年調整安全系統後消除了相關擔憂,促使蘋果轉向合作。
然而,蘋果 PCC 系統存在技術瓶頸,更新周期長且其晶片原用於消費級設備,未針對 AI 工作流程優化,難以高效運行 Gemini 等大型語言模型。
面對今年稍晚發布的 Gemini 版 Siri 可能引發的算力高點,蘋果最終選擇讓谷歌直接在自家伺服器上託管相關服務,以確保用戶體驗。
新聞來源 (不包括新聞圖片): 鉅亨網