zhen 第4頁
-
谷歌推出端側 VLA 模型 Gemini Robotics On-Device,開啟 "機器人安卓" 時代
【2025年6月25日訊】谷歌正式推出旗下首款端側視覺語言動作(VLA)模型GeminiRoboticsOn-Device,首次將Gemini2.0的多模態(tài)推理能力延伸至機器人設備端,引發(fā)科技圈高度關注。這款被業(yè)內稱為"機...
-
Krea Video AI視頻生成工具:快速生成多風格視頻
在AI視頻創(chuàng)作領域,關鍵幀控制與文本驅動的結合正掀起新一輪效率革命。2024年5月,KreaAI正式開放其視頻生成工具KreaVideo的公測,用戶可通過關鍵幀圖像與文本提示的協(xié)同控制,在10秒內快速生成膠片、實驗、迷幻等多風格視頻。這款工具將傳統(tǒng)復雜...
-
Lumiere AI視頻生成模型:如何生成電影級動畫短片?
當導演輸入“賽博都市雨中追逐,霓虹倒影在濕漉路面拖出流光”,AI在5秒內生成鏡頭——動態(tài)雨絲、飛濺水花、連貫的車身翻轉軌跡,甚至霓虹反射的色調漸變。傳統(tǒng)CG動畫制作中,一段5秒鏡頭需團隊耗時數周建模渲染;而谷歌Lumiere憑借時空擴散革命性架構,正將電影...
-
教育Agent爆發(fā):AI助教24小時答疑,傳統(tǒng)家教會被取代嗎?
凌晨2點,北京高三學生陳林對著平板電腦提問:“如何理解電磁感應中的楞次定律?”10秒后,AI助教用動畫演示+分步推演給出解答,并推送3道變式題鞏固——這一幕正成為全球超5000萬學生的日常學習場景。AI教育Agent的“超能力”:重塑學習效率邊界1.個性化...
-
AI 教育+元宇宙:沉浸式學習場景的技術突破與未來展望
高雄市九如國小的學生戴上VR設備,瞬間“穿越”到日本課堂。通過AI實時翻譯,他們正與東京的學生熱烈討論神社文化與臺灣民間信仰——這場由高雄大學“EWova元宇宙平臺”驅動的跨國共學課程,讓語言和地理的壁壘在虛擬教室中徹底消失。技術突破:三大支柱重構學習體驗...
-
三星計劃第三季度公布Galaxy AI定價,視頻生成等高級功能或收費
6月24日消息,三星在AI領域持續(xù)發(fā)力,GalaxyAI已成為其旗艦Galaxy手機的重要亮點。盡管三星曾承諾今年內GalaxyAI功能免費,但未來是否收費仍存懸念。據外媒wccftech報道,三星可能于今年第三季度公布Gal...
-
微軟推出Win11專屬設備端模型Mu,開啟系統(tǒng)設置自然語言搜索新時代
微軟今日揭曉專為Windows11打造的全新設備端小型語言模型——Mu。這款模型將深度集成于系統(tǒng)之中,核心使命是徹底革新用戶在系統(tǒng)設置應用內的搜索體驗,使其能夠真正理解并響應自然語言指令。Mu的推出標志著微軟構建人工智能智能代理戰(zhàn)略的關鍵一步。它被...
-
谷歌Veo視頻模型:一鍵生成1分鐘1080P大片
無需攝像機、演員或后期團隊,一段文字輸入即可生成好萊塢級動態(tài)畫面——谷歌Veo視頻模型正將這一科幻場景變?yōu)楝F(xiàn)實,并悄然重塑內容創(chuàng)作行業(yè)的成本結構。2025年最新進展顯示,Veo已升級至Veo2版本,支持生成2分鐘4K視頻(理論值),并在Gemini和Ca...
-
Boximator AI視頻工具,精準控制每一幀動作!
在OpenAI的Sora掀起文生視頻革命之際,中國科技巨頭字節(jié)跳動悄然亮出了一張王牌——Boximator。這款創(chuàng)新性AI視頻生成模型通過獨特的“框選控制”技術,解決了當前AI視頻生成領域的關鍵痛點:精準動作控制。它讓用戶能夠像導演一樣指揮視頻中的每個元素...
-
騰訊 AI Lab 開源音樂生成大模型 SongGeneration:破解音質、音樂性與速度三大難題
近日,騰訊AILab推出并開源了一款名為SongGeneration的音樂生成大模型,旨在解決音樂生成領域長期存在的音質、音樂性和生成速度三大核心難題。該模型基于創(chuàng)新的LLM-DiT融合架構,通過對海量中英文歌曲的深度預訓練,展現(xiàn)出了卓越的音...