反擊OpenAI,谷歌多模態(tài)大模型Gemini上線,碾壓GPT4
當(dāng)?shù)貢r(shí)間12月6日,谷歌CEO桑達(dá)爾·皮查伊官宣 Gemini 1.0 版正式上線。據(jù)悉,這是迄今為止規(guī)模最大,能力最強(qiáng)的谷歌大模型。
桑達(dá)爾·皮查伊在一篇博文中寫道:“這個(gè)新模型代表了我們作為一家科技公司所做的最大的科學(xué)和工程努力之一,它也是一個(gè)多模態(tài)基礎(chǔ)模型,可以概括和理解不同類型的信息,包括文本、代碼、音頻、圖像和視頻?!?
據(jù)悉,Gemini 1.0在谷歌內(nèi)部籌備了一年之久,以應(yīng)對(duì)當(dāng)時(shí)引起巨大轟動(dòng)的GPT4。目前,Gemini 1.0包括三種不同套件,分別是Gemini Ultra,、Gemini Pro以及Gemini Nano,不同量級(jí)的Gemini,可以觸達(dá)到不同范圍,能夠高效地運(yùn)行在數(shù)據(jù)中心和移動(dòng)設(shè)備等多類型平臺(tái)上。。
其中,Ultra的能力最強(qiáng),復(fù)雜度最高,能夠處理最為困難的多模態(tài)任務(wù);Pro能力稍弱,是一個(gè)可擴(kuò)展至多任務(wù)的模型;Nano則是一款可以在手機(jī)端側(cè)運(yùn)行的模型。
谷歌對(duì) Gemini 模型進(jìn)行了嚴(yán)格的測(cè)試,并評(píng)估了它們?cè)诟鞣N任務(wù)中的表現(xiàn),從表現(xiàn)來看,Gemini被稱為當(dāng)下能力最強(qiáng)的大模型。據(jù)了解,從自然圖像、音頻和視頻理解,到數(shù)學(xué)推理等任務(wù),Gemini Ultra 在大型語言模型研發(fā)被廣泛使用的 32 個(gè)學(xué)術(shù)基準(zhǔn)測(cè)試集中,在其中 30 個(gè)測(cè)試集的性能超過當(dāng)前 SOTA 結(jié)果。
此外,Gemini Ultra 在 MMLU(大規(guī)模多任務(wù)語言理解數(shù)據(jù)集)中的得分率高達(dá) 90.0%,首次超越了人類專家,更是超過了GPT4的86.4%的得分率。
在應(yīng)用規(guī)劃方面,谷歌將在其產(chǎn)品中添加 Gemini,進(jìn)行全線升級(jí)。谷歌的類 ChatGPT 應(yīng)用 Bard 已經(jīng)升級(jí)到了Gemini Pro版本,實(shí)現(xiàn)了更為高級(jí)的推理、規(guī)劃、理解等能力,同時(shí)繼續(xù)保持免費(fèi)。而谷歌預(yù)計(jì)在明年初將推出Bard Advanced,將使用 Gemini Ultra。
在硬件上,谷歌還將 Gemini 引入了 Pixel。Pixel 8 Pro 將是第一款運(yùn)行 Gemini Nano 的智能手機(jī)。接下來,Gemini 將陸續(xù)出現(xiàn)在谷歌其他的產(chǎn)品和服務(wù)中。