近日,谷歌旗下的 Gemini 2.5 Pro 模型迎來(lái)重要更新,新版本「Gemini 2.5 Pro (0605)」正式亮相。此次更新后,Gemini 2.5 Pro 在性能表現(xiàn)上取得顯著突破,尤其在代碼、推理等關(guān)鍵任務(wù)領(lǐng)域展現(xiàn)出更強(qiáng)實(shí)力。

在極具挑戰(zhàn)性的 Humanity’s Last Exam(人類最后的考試)測(cè)試中,Gemini 2.5 Pro 新版以 21.6% 的成績(jī)超越 OpenAI o3,彰顯其在復(fù)雜知識(shí)與推理應(yīng)用方面的卓越能力。在 GPQA 測(cè)試?yán)铮且?86.4% 的高分位居榜首,凸顯了強(qiáng)大的問(wèn)題解答與分析水平。
大模型競(jìng)技場(chǎng)的 Elo 評(píng)分結(jié)果也十分亮眼。相較于 (0506) 版本,Gemini 2.5 Pro 新版的 Elo 評(píng)分提升了 24 分,達(dá)到 1470 分,持續(xù)在眾多模型中占據(jù)領(lǐng)先地位,進(jìn)一步鞏固了其在大模型領(lǐng)域的優(yōu)勢(shì)。
據(jù)谷歌介紹,本次 (0605) 版本是基于今年 I/O 大會(huì)上公布的 (0506) 版本構(gòu)建而成,并且新版極有可能作為 Gemini 2.5 Pro 的正式穩(wěn)定版與大眾見(jiàn)面。此外,谷歌針對(duì)新版 2.5 Pro 的回答進(jìn)行了優(yōu)化改進(jìn),現(xiàn)在它能夠?yàn)橛脩籼峁└邉?chuàng)意、格式更為優(yōu)化的答復(fù),極大提升了用戶與模型交互時(shí)的體驗(yàn)。隨著 Gemini 2.5 Pro 新版的推出,其在大模型競(jìng)爭(zhēng)中優(yōu)勢(shì)愈發(fā)明顯,有望為用戶帶來(lái)更多高效、智能的服務(wù)與體驗(yàn) 。
來(lái)【龍頭AI網(wǎng)】了解最新AI資訊!
暫無(wú)評(píng)論
發(fā)表評(píng)論