ITBear旗下自媒體矩陣:

蘋果發(fā)布開源多模態(tài)LLM Ferret,意外加入人工智能社區(qū)

   時(shí)間:2023-12-25 11:42:48 來源:ITBEAR編輯:瑞雪 發(fā)表評論無障礙通道

【ITBEAR科技資訊】12月25日消息,蘋果公司與哥倫比亞大學(xué)的研究團(tuán)隊(duì)于2023年10月發(fā)布了一款名為Ferret(雪貂)的多模態(tài)開源LLM,然而,當(dāng)時(shí)這一新聞并未引起廣泛的注意。

許多人工智能領(lǐng)域的從業(yè)者錯(cuò)過了Ferret的發(fā)布,他們對蘋果進(jìn)入開源LLM領(lǐng)域感到意外,尤其考慮到蘋果一直被視為一個(gè)"封閉花園"的公司。

今天早上,歐洲一家專注于醫(yī)學(xué)領(lǐng)域開源人工智能的非營利組織的Bart de Witte在社交平臺(tái)X上發(fā)帖:“我不知道怎么錯(cuò)過了這個(gè),但蘋果在10月份加入了開源人工智能社區(qū)。Ferret的發(fā)布證明了蘋果在深度影響人工智能研究方面的承諾,鞏固了其在多模態(tài)人工智能領(lǐng)域的領(lǐng)導(dǎo)地位......ps:我期待有一天,本地大型語言模型(LLLMs)會(huì)成為重新設(shè)計(jì)的iOS的一部分,運(yùn)行在我的iPhone上?!?/p>

科技博客作者和VentureBeat的撰稿人Ben Dickson在LinkedIn上寫道:“2023年最令人意外的人工智能發(fā)展是什么?對我來說,就是蘋果發(fā)布了開源LLM(盡管是非商業(yè)許可)?!?/p>

Ferret是以非商業(yè)許可證開源的,這意味著當(dāng)前版本不能用于商業(yè)用途。然而,它有可能被應(yīng)用于蘋果未來的產(chǎn)品或服務(wù)中。蘋果AI/ML研究科學(xué)家Zhe Gan在去年10月的一條推文中解釋了Ferret的用途,稱它可以"在圖像中的任何位置、粒度上引用和定位任何物體",并能夠使用圖像中的任何形狀的區(qū)域來實(shí)現(xiàn)這一功能。

簡而言之,F(xiàn)erret可以檢查圖像上繪制的區(qū)域,識(shí)別其中的元素,并將其標(biāo)識(shí)出來。然后,它可以將這些識(shí)別到的元素作為查詢的一部分,并以通常的方式進(jìn)行響應(yīng)。例如,用戶可以在圖像中突出顯示一只動(dòng)物并詢問其種類,F(xiàn)erret可以識(shí)別出這只動(dòng)物的種類,并了解用戶指的是圖像中的特定動(dòng)物。它還可以利用圖像中其他元素的上下文提供更多的信息。

Ferret的發(fā)布對于研究人員來說具有重要意義,表明蘋果正在逐步開放其人工智能研究,這與其過去神秘封閉的形象形成了鮮明對比。此外,蘋果還面臨著基礎(chǔ)設(shè)施方面的挑戰(zhàn)。盡管蘋果正在努力擴(kuò)大其擁有的AI服務(wù)器數(shù)量,但與像ChatGPT等模型相比,其規(guī)??赡苋匀徊蛔?。除了與其他公司合作擴(kuò)展其能力之外,開源模型也是蘋果正在探索的另一條途徑。

一個(gè)有趣的細(xì)節(jié)是,Reddit的r/Apple版塊發(fā)現(xiàn)Ferret "使用了8個(gè)帶有80GB顯存的A100 GPU進(jìn)行訓(xùn)練"??紤]到蘋果過去與英偉達(dá)GPU的支持關(guān)系,這被視為對英偉達(dá)的罕見認(rèn)可。

標(biāo)簽: 蘋果
舉報(bào) 0 收藏 0 打賞 0評論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  網(wǎng)站留言  |  RSS訂閱  |  違規(guī)舉報(bào)  |  開放轉(zhuǎn)載  |  滾動(dòng)資訊  |  English Version