ITBear旗下自媒體矩陣:

中美大廠競(jìng)逐AI智能體,萬(wàn)億賽道誰(shuí)將領(lǐng)跑?

   時(shí)間:2025-01-26 13:43:06 來(lái)源:ITBEAR編輯:快訊團(tuán)隊(duì) 發(fā)表評(píng)論無(wú)障礙通道

在AI技術(shù)日新月異的今天,國(guó)內(nèi)大廠字節(jié)跳動(dòng)緊跟國(guó)際步伐,于近日在GitHub平臺(tái)推出了一款面向圖形化用戶(hù)界面(GUI)的全新自動(dòng)化操作模型——UI-TARS。這款模型擁有高達(dá)70億參數(shù),巧妙地將視覺(jué)理解、文本處理、操作規(guī)劃及記憶管理等核心組件融為一體,能夠在跨平臺(tái)環(huán)境下完成復(fù)雜任務(wù),其能力堪比人類(lèi),能夠感知界面信息、推理操作步驟并精準(zhǔn)執(zhí)行交互指令。

UI-TARS的推出,標(biāo)志著字節(jié)跳動(dòng)在AI智能體領(lǐng)域邁出了堅(jiān)實(shí)的一步。通過(guò)官方公布的一段演示視頻,我們可以看到UI-TARS如何自動(dòng)完成發(fā)布推文的全過(guò)程,展現(xiàn)了其強(qiáng)大的自動(dòng)化處理能力。盡管目前仍處于預(yù)覽及迭代階段,需要人工輔助完成部分點(diǎn)擊及文案撰寫(xiě),但UI-TARS已在MacOS與Windows系統(tǒng)上線,為用戶(hù)提供了全新的自動(dòng)化體驗(yàn)。

無(wú)獨(dú)有偶,就在兩天前的1月24日,美國(guó)OpenAI公司正式推出了其首款A(yù)I智能體功能應(yīng)用“Operator”。這款應(yīng)用能夠模擬人類(lèi)操作瀏覽器,完成購(gòu)物、訂餐、論文整理等一系列復(fù)雜任務(wù),通過(guò)融合視覺(jué)識(shí)別與高級(jí)推理的CUA模型,實(shí)現(xiàn)了復(fù)雜步驟的精準(zhǔn)規(guī)劃。目前,“Operator”已向每月200美元訂閱的美國(guó)ChatGPT Pro用戶(hù)開(kāi)放測(cè)試,標(biāo)志著AI智能體技術(shù)正逐步走向成熟。

近年來(lái),“AI智能體”概念持續(xù)升溫,吸引了眾多企業(yè)和研究團(tuán)隊(duì)的關(guān)注。智譜推出了AutoGLM、GLM-PC等多個(gè)AI智能體應(yīng)用產(chǎn)品;字節(jié)跳動(dòng)的AI應(yīng)用開(kāi)發(fā)平臺(tái)扣子已發(fā)布超過(guò)200萬(wàn)個(gè)智能體,引領(lǐng)國(guó)內(nèi)AI智能體技術(shù)的發(fā)展潮流。在今年的CES展會(huì)上,英偉達(dá)CEO黃仁勛更是預(yù)言,AI智能體應(yīng)用或?qū)⒊蔀橄乱粋€(gè)價(jià)值數(shù)萬(wàn)億美元的機(jī)器人產(chǎn)業(yè)。

AI智能體,作為一個(gè)具有智能的實(shí)體,能夠自主感知環(huán)境、做出決策并執(zhí)行行動(dòng)。它可以是程序、系統(tǒng),也可以是機(jī)器人,能夠像有智商、有情商的“小助手”一樣,協(xié)助用戶(hù)高效完成各類(lèi)任務(wù)。隨著AI技術(shù)的不斷進(jìn)步,AI智能體已具備類(lèi)似人類(lèi)的思考和規(guī)劃能力,能夠與人類(lèi)及環(huán)境進(jìn)行高效交互,完成特定任務(wù)。

自2022年底ChatGPT風(fēng)靡全球以來(lái),生成式AI應(yīng)用的發(fā)展便成為業(yè)界熱議的話題。斯坦福大學(xué)和谷歌的聯(lián)合研究團(tuán)隊(duì)更是通過(guò)一項(xiàng)研究,展示了接入ChatGPT的虛擬人在虛擬小鎮(zhèn)Smallville中表現(xiàn)出的各種人類(lèi)行為,進(jìn)一步帶火了AI智能體概念。如今,AI智能體已在客服、編程、內(nèi)容創(chuàng)作、知識(shí)獲取、財(cái)務(wù)、手機(jī)助手、工業(yè)制造等多個(gè)領(lǐng)域得到廣泛應(yīng)用,展現(xiàn)出巨大的市場(chǎng)潛力和商業(yè)價(jià)值。

以O(shè)penAI的“Operator”為例,它不僅能夠根據(jù)用戶(hù)需求捕獲屏幕畫(huà)面,制定下一步計(jì)劃,還能使用虛擬鼠標(biāo)和鍵盤(pán)精確執(zhí)行操作,直到任務(wù)完成或需要用戶(hù)輸入。這種能力使得AI智能體能夠成為用戶(hù)的得力助手,幫助用戶(hù)高效完成各類(lèi)任務(wù)。

隨著AI智能體技術(shù)的不斷發(fā)展,越來(lái)越多的企業(yè)開(kāi)始認(rèn)識(shí)到AI智能體在降本增效方面的重要作用?;鹕揭娓笨偛脧?chǎng)伪硎荆磥?lái)企業(yè)需要通過(guò)0代碼方式快速、廣泛實(shí)現(xiàn)創(chuàng)新應(yīng)用,構(gòu)建自己的AI能力中心。這將有助于企業(yè)在復(fù)雜多變的數(shù)字環(huán)境中實(shí)現(xiàn)更高效、更智能的運(yùn)營(yíng)。

同時(shí),AI技術(shù)的深度融合也正加速推動(dòng)企業(yè)AI事項(xiàng)的落地與實(shí)踐。F5作為全球領(lǐng)先的多云應(yīng)用交付網(wǎng)絡(luò)和應(yīng)用安全解決方案提供商,正通過(guò)其豐富的AI和機(jī)器學(xué)習(xí)技術(shù)經(jīng)驗(yàn),全面賦能企業(yè)客戶(hù)。F5亞太區(qū)首席技術(shù)官M(fèi)ohan Veloo表示,未來(lái)AI應(yīng)用將更加依賴(lài)于API,相關(guān)API接口也將呈現(xiàn)爆炸式增長(zhǎng)。因此,如何有效利用AI大模型能力實(shí)現(xiàn)應(yīng)用方向的創(chuàng)新部署,將成為企業(yè)發(fā)展的關(guān)鍵。

舉報(bào) 0 收藏 0 打賞 0評(píng)論 0
 
 
更多>同類(lèi)資訊
全站最新
熱門(mén)內(nèi)容
網(wǎng)站首頁(yè)  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  RSS訂閱  |  開(kāi)放轉(zhuǎn)載  |  滾動(dòng)資訊  |  爭(zhēng)議稿件處理  |  English Version