ITBear旗下自媒體矩陣:

谷歌發(fā)言人確認(rèn):Gemini AI視頻展示并非實(shí)時(shí)完成

   時(shí)間:2023-12-09 14:12:31 來(lái)源:ITBEAR編輯:茹茹 發(fā)表評(píng)論無(wú)障礙通道

【ITBEAR科技資訊】12月9日消息,谷歌近日在一次采訪中向媒體透露,他們之前發(fā)布的大型語(yǔ)言模型Gemini的演示視頻實(shí)際上并非實(shí)時(shí)錄制。這一消息引發(fā)了業(yè)界的關(guān)注,因?yàn)橐曨l看起來(lái)極其先進(jìn),顯示了Gemini模型在處理各種任務(wù)時(shí)的能力。

視頻中展示了一系列引人注目的場(chǎng)景,例如Gemini模型能夠在一個(gè)塑料杯中發(fā)現(xiàn)藏著的紙團(tuán),甚至能夠識(shí)別出一幅“點(diǎn)線相連”的圖畫(huà)中描繪的是一只螃蟹。然而,據(jù)谷歌發(fā)言人向外媒透露,這些都是通過(guò)鏡頭捕捉的靜止圖像幀和文本提示來(lái)“拼湊”而成的。換句話說(shuō),Gemini模型只能對(duì)輸入的提示和靜態(tài)圖像做出反應(yīng),而非實(shí)時(shí)處理。同樣,視頻中展示的用戶與Gemini之間的語(yǔ)音互動(dòng)實(shí)際上也是后期配音完成的。

據(jù)ITBEAR科技資訊了解,視頻中的其他元素,比如人物的對(duì)話、繪畫(huà)、展示物品,甚至魔術(shù)表演,似乎都是為了制作這段演示視頻而特別安排的。谷歌在其官方Y(jié)ouTube頻道上的視頻描述中也提到,為了演示的目的,視頻中的延遲已經(jīng)被減少,而Gemini的輸出也被縮短,以使內(nèi)容更加簡(jiǎn)潔。這暗示了在現(xiàn)實(shí)應(yīng)用中,Gemini模型響應(yīng)用戶輸入的時(shí)間可能會(huì)比演示視頻中看起來(lái)的要長(zhǎng)。

谷歌DeepMind的研究副總裁兼深度學(xué)習(xí)負(fù)責(zé)人Oriol Vinyals對(duì)視頻的目的做了進(jìn)一步闡述。他指出,視頻展示了使用Gemini模型構(gòu)建的多模態(tài)用戶體驗(yàn)可能的樣子,并旨在激發(fā)開(kāi)發(fā)者的創(chuàng)新思維。Vinyals強(qiáng)調(diào),視頻中的所有用戶提示和輸出都是真實(shí)的,但為了簡(jiǎn)潔起見(jiàn),進(jìn)行了縮短處理。此外,他還提到,視頻中展示的是更高級(jí)的Gemini Ultra模型。

此前有報(bào)道稱,谷歌宣稱Gemini Ultra在32個(gè)廣泛使用的學(xué)術(shù)基準(zhǔn)測(cè)試中,在30個(gè)測(cè)試中都展現(xiàn)了超越當(dāng)代的領(lǐng)先表現(xiàn)。這些基準(zhǔn)測(cè)試被認(rèn)為是大型語(yǔ)言模型領(lǐng)域最常用、最廣泛的測(cè)試之一。其中,Gemini Ultra在大規(guī)模多任務(wù)語(yǔ)言理解(MMLU)測(cè)試中以90.0%的高分超越了人類專家。這一測(cè)試涵蓋了包括數(shù)學(xué)、物理、歷史、法律、醫(yī)學(xué)和倫理等多達(dá)57個(gè)學(xué)科。

除此之外,Gemini Ultra還在新的MMMU基準(zhǔn)測(cè)試中展示出了59.4%的領(lǐng)先水平。MMMU基準(zhǔn)測(cè)試覆蓋了一系列需要深入思考的多模態(tài)任務(wù),涵蓋了多個(gè)不同的領(lǐng)域。這一表現(xiàn)再次證明了Gemini Ultra在大型語(yǔ)言模型領(lǐng)域的先進(jìn)性和多功能性。

谷歌還計(jì)劃在明年初推出全新升級(jí)的 Bard Advanced,這將使用戶能夠更好地體驗(yàn)到Gemini Ultra的最佳模型和功能。

舉報(bào) 0 收藏 0 打賞 0評(píng)論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁(yè)  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  網(wǎng)站留言  |  RSS訂閱  |  違規(guī)舉報(bào)  |  開(kāi)放轉(zhuǎn)載  |  滾動(dòng)資訊  |  English Version