谷歌正式發(fā)布、開源新一代端側(cè)多模態(tài)大模型 Gemma 3n,以 "內(nèi)存效率革命" 突破設備端 AI 性能天花板。這款原生支持圖像、音頻、視頻和文本的模型,僅需 2GB 內(nèi)存即可運行等效 50 億參數(shù)的 E2B 版本,其 E4B 版本在 100 億參數(shù)內(nèi)實現(xiàn)多模態(tài)任務全球最優(yōu)性能,LMArena 得分突破 1300 分,標志著端側(cè) AI 進入 "強算力輕量化" 時代。
架構革新:MatFormer 與 PLE 技術重塑端側(cè)計算邏輯
預提取雙模型:直接使用高性能 E4B 模型,或調(diào)用輕量級 E2B 實現(xiàn) 2 倍推理加速
Mix-n-Match 定制:通過動態(tài)調(diào)整網(wǎng)絡層維度,在 2-80 億參數(shù)間自由切分模型
多模態(tài)能力躍升:140 種語言支持與實時音視頻處理
開源生態(tài)布局:1.6 億次下載背后的端側(cè) AI 野心
模型權重:E2B/E4B 基礎模型及 10 + 行業(yè)微調(diào)版本
開發(fā)工具:MatFormer Lab 參數(shù)切分可視化工具
應用模板:相冊智能分類、會議實時轉(zhuǎn)寫等 20 個參考案例
行業(yè)影響:端側(cè) AI 進入 "強模型本地化" 時代
算力平民化:2GB 內(nèi)存設備可運行原需云端的強模型
數(shù)據(jù)隱私升級:敏感數(shù)據(jù)無需上傳即可完成 AI 處理
開發(fā)門檻降低:非技術人員可通過預訓練模型快速構建應用
暫無評論
發(fā)表評論