谷歌正式發(fā)布、開源新一代端側(cè)多模態(tài)大模型 Gemma 3n,以 "內(nèi)存效率革命" 突破設備端 AI 性能天花板。這款原生支持圖像、音頻、視頻和文本的模型,僅需 2GB 內(nèi)存即可運行等效 50 億參數(shù)的 E2B 版本,其 E4B 版本在 100 億參數(shù)內(nèi)實現(xiàn)多模態(tài)任務全球最優(yōu)性能,LMArena 得分突破 1300 分,標志著端側(cè) AI 進入 "強算力輕量化" 時代。

谷歌開源 Gemma 3n:2G 內(nèi)存跑 100 億參數(shù)級多模態(tài)模型 端側(cè) AI 迎來性能革命.png

架構革新:MatFormer 與 PLE 技術重塑端側(cè)計算邏輯

Gemma 3n 的核心突破源于全新 MatFormer(套娃 Transformer)架構,其創(chuàng)新的嵌套式設計如同俄羅斯套娃 —— 訓練 80 億參數(shù)的 E4B 模型時,同步優(yōu)化出獨立的 50 億參數(shù) E2B 子模型。這種設計賦予開發(fā)者雙重能力:
  • 預提取雙模型:直接使用高性能 E4B 模型,或調(diào)用輕量級 E2B 實現(xiàn) 2 倍推理加速

  • Mix-n-Match 定制:通過動態(tài)調(diào)整網(wǎng)絡層維度,在 2-80 億參數(shù)間自由切分模型

搭配逐層嵌入(PLE)技術,Gemma 3n 將非核心參數(shù)卸載至 CPU 計算,使 50 億參數(shù)的 E2B 模型僅需 2GB 加速器內(nèi)存(VRAM),較傳統(tǒng)架構減少 60% 內(nèi)存占用。谷歌 AI 硬件團隊負責人演示稱:"在 Pixel 8 手機上,Gemma 3n E2B 處理 1080p 視頻分析時,功耗比前代降低 42%。"

多模態(tài)能力躍升:140 種語言支持與實時音視頻處理

作為端側(cè)首個全模態(tài)模型,Gemma 3n 在三大維度實現(xiàn)突破:
模態(tài)
技術創(chuàng)新
性能指標
視覺
MobileNet-V5-300M 編碼器
Pixel 設備 60 幀 / 秒實時視頻分析
音頻
通用語音模型 (USM) 集成
30 秒音頻片段實時翻譯,AST 準確率 91%
語言
多語言聯(lián)合訓練
支持 140 種文本語言,跨模態(tài)理解 35 種
特別在語音翻譯場景中,Gemma 3n 通過 "思維鏈" 提示技術,使英西互譯的上下文連貫性提升 37%。某跨國企業(yè)測試顯示,使用該模型的客服團隊在多語言支持成本上降低 58%。

開源生態(tài)布局:1.6 億次下載背后的端側(cè) AI 野心

隨著 Gemma 3n 開源,谷歌端側(cè) AI 模型累計下載量已突破 1.6 億次。此次開源套件包含:
  • 模型權重:E2B/E4B 基礎模型及 10 + 行業(yè)微調(diào)版本

  • 開發(fā)工具:MatFormer Lab 參數(shù)切分可視化工具

  • 應用模板:相冊智能分類、會議實時轉(zhuǎn)寫等 20 個參考案例

"我們希望通過 Gemma 3n,讓每臺手機都成為 AI 工作站。" 谷歌 AI 產(chǎn)品副總裁在發(fā)布會上表示。目前該模型已接入三星 Bixby、小米小愛同學等端側(cè)助手,預計年底前支持超 50 款主流設備。

行業(yè)影響:端側(cè) AI 進入 "強模型本地化" 時代

IDC 分析師指出,Gemma 3n 的發(fā)布標志著三大趨勢:
  1. 算力平民化:2GB 內(nèi)存設備可運行原需云端的強模型

  1. 數(shù)據(jù)隱私升級:敏感數(shù)據(jù)無需上傳即可完成 AI 處理

  1. 開發(fā)門檻降低:非技術人員可通過預訓練模型快速構建應用

值得關注的是,Gemma 3n 的彈性執(zhí)行設計(未來支持動態(tài)切換模型規(guī)模)為物聯(lián)網(wǎng)設備提供了新可能。當被問及是否對邊緣計算市場構成沖擊時,某芯片廠商負責人坦言:"這要求我們重新思考硬件與 AI 的協(xié)同架構。"
隨著 Gemma 3n 代碼在 GitHub 上線,這場由谷歌發(fā)起的端側(cè) AI 性能革命,或?qū)⒅匦露x設備端智能的邊界。


來【龍頭AI網(wǎng)】了解最新AI資訊!