在國內(nèi)AI技術(shù)日新月異的當(dāng)下,AI大模型應(yīng)用的多元化趨勢愈發(fā)明顯。近日,字節(jié)跳動旗下的豆包應(yīng)用推出了一個引人注目的新功能——圖片理解,這一功能不僅豐富了用戶的交互體驗,也標(biāo)志著AI技術(shù)在實用性方面邁出了新的一步。
用戶現(xiàn)在可以在豆包APP及PC端通過新增的照片和相機按鈕上傳圖片,系統(tǒng)將自動識別并理解圖片內(nèi)容。與傳統(tǒng)的OCR技術(shù)僅識別文字不同,豆包的圖片理解功能能夠識別并解析圖片中的各類信息。例如,用戶詢問某個景點的位置或動漫人物的名稱,豆包都能迅速給出答復(fù)。
豆包的這一功能不僅限于簡單的信息提取,它還能理解并解釋圖片中的幽默元素。以一幅四格漫畫為例,漫畫描述了兩個物理學(xué)家在戰(zhàn)場上發(fā)現(xiàn)士兵倒地后,不是考慮士兵的生死,而是開始思考科學(xué)原理,并最終得出結(jié)論:艾薩克·牛頓發(fā)明了重力,士兵因此倒地。豆包在接收到這幅漫畫后,能夠準(zhǔn)確解析出其中的笑話含義,展示了其強大的圖片理解能力。
豆包的圖片理解功能并非孤例。此前,馬斯克的人工智能公司xAI也為其Grok平臺增加了圖像理解功能,并展示了Grok理解并解釋笑話的能力。這一系列的創(chuàng)新表明,AI大模型正在逐步走向更實用、更貼近用戶需求的場景。
隨著AI技術(shù)的不斷發(fā)展,越來越多的企業(yè)開始瞄準(zhǔn)實用的落地場景,圖片理解就是其中之一。這一功能不僅能夠提升搜索、查找評估、文本寫作等場景的效率,還能讓AI大模型更加貼近用戶的實際需求。據(jù)QuestMobile最新數(shù)據(jù)顯示,2024年10月,AI原生應(yīng)用行業(yè)的月活躍用戶規(guī)模已達(dá)到8976萬,同比增長373%,涵蓋了情感陪伴、職場辦公、趣味休閑、文案寫作、教育學(xué)習(xí)、生活助手、圖像生成、行業(yè)顧問等多個場景。
在眾多的AI大模型產(chǎn)品中,字節(jié)跳動的豆包App憑借其強大的功能和豐富的應(yīng)用場景,已成為中國日活用戶最高的AI大模型產(chǎn)品。數(shù)據(jù)顯示,截止到2024年10月,豆包在移動端和網(wǎng)頁端的訪問量均位居前列,其中移動端月活躍用戶達(dá)到4839萬,顯示出其強大的市場影響力和用戶基礎(chǔ)。
隨著AI浪潮的興起,各大廠商都在積極探索與AI大模型的融合發(fā)展之路。AI技術(shù)作為新一輪科技創(chuàng)新的重要驅(qū)動力,有望引領(lǐng)全球科技產(chǎn)業(yè)的變革和發(fā)展,推動效率的進(jìn)一步提升。據(jù)Statista預(yù)測,到2030年,全球AI領(lǐng)域的市場規(guī)模將超過1.8萬億美元,展現(xiàn)出巨大的市場潛力和發(fā)展前景。