ITBear旗下自媒體矩陣:

英偉達(dá)揭秘:推動(dòng)人形機(jī)器人崛起的三大“秘籍”是什么?

   時(shí)間:2025-01-21 20:42:16 來源:ITBEAR編輯:快訊團(tuán)隊(duì) 發(fā)表評(píng)論無障礙通道

在科技日新月異的當(dāng)下,NVIDIA與銀河通用攜手,在機(jī)器人技術(shù)領(lǐng)域掀起了一場(chǎng)創(chuàng)新風(fēng)暴。近日,NVIDIA機(jī)器人與邊緣計(jì)算領(lǐng)域的副總裁Deepu Talla,在北京辦公室分享了機(jī)器人發(fā)展的最新趨勢(shì)、面臨的挑戰(zhàn)以及NVIDIA的戰(zhàn)略布局。同時(shí),銀河通用的創(chuàng)始人兼CTO王鶴,也披露了他們?cè)诶?0億級(jí)合成數(shù)據(jù)訓(xùn)練全球首個(gè)端到端具身抓取基礎(chǔ)大模型GraspVLA方面的突破。

NVIDIA近期推出的世界基礎(chǔ)模型平臺(tái)Cosmos,為機(jī)器人訓(xùn)練開辟了新天地。該平臺(tái)能夠構(gòu)建高度逼真的虛擬環(huán)境,類似于視頻游戲場(chǎng)景,但這里的“世界”是指機(jī)器人交互的外部環(huán)境,如操作房間內(nèi)的可視區(qū)域。Deepu Talla表示,NVIDIA Isaac GR00T計(jì)劃是一項(xiàng)全面的舉措,旨在開發(fā)人形機(jī)器人的通用基礎(chǔ)模型,涵蓋了從數(shù)據(jù)生成到部署的全過程。Cosmos平臺(tái)提供的預(yù)訓(xùn)練世界基礎(chǔ)模型,專為生成物理感知視頻和物理AI開發(fā)所需的世界狀態(tài)而設(shè)計(jì),與GR00T計(jì)劃相結(jié)合,為機(jī)器人開發(fā)提供了完整的解決方案。

NVIDIA還在開發(fā)名為Mega的技術(shù),用于模擬大規(guī)模機(jī)器人隊(duì)伍。Mega是一個(gè)集成機(jī)器人、環(huán)境和傳感器的參考架構(gòu),支持在大規(guī)模場(chǎng)景下進(jìn)行實(shí)驗(yàn)和優(yōu)化。與NVIDIA緊密合作的銀河通用,在NVIDIA CES 2025發(fā)布會(huì)上展示了輪式人形機(jī)器人,該機(jī)器人成功托舉起了NVIDIA最新的顯卡產(chǎn)品RTX 5090,引起了廣泛關(guān)注。NVIDIA創(chuàng)始人兼CEO黃仁勛在會(huì)后參觀了銀河通用的展臺(tái),并體驗(yàn)了機(jī)器人下單取貨的全過程。

王鶴認(rèn)為,采用合成數(shù)據(jù)是快速實(shí)現(xiàn)具身智能突破的有效途徑。他透露,銀河通用將在2025年上半年展示真正的人形機(jī)器人成果,并表示這些機(jī)器人在技能基礎(chǔ)上所能拓展的空間“想象力非常大”。在Deepu Talla看來,有三大核心因素驅(qū)動(dòng)著機(jī)器人技術(shù)的發(fā)展:危險(xiǎn)工作的替代、勞動(dòng)力短缺以及養(yǎng)老需求。特別是過去兩年,中美企業(yè)在人形機(jī)器人的開發(fā)上更加活躍,這主要得益于技術(shù)進(jìn)步和仿真環(huán)境的改進(jìn)。

Deepu Talla預(yù)測(cè),未來5到10年,機(jī)器人領(lǐng)域?qū)l(fā)生顯著變化。他強(qiáng)調(diào),為了真正解決機(jī)器人領(lǐng)域的挑戰(zhàn),需要三臺(tái)計(jì)算機(jī):用于訓(xùn)練的計(jì)算機(jī)、用于仿真的計(jì)算機(jī)以及用于部署的計(jì)算機(jī)。這三臺(tái)計(jì)算機(jī)分別承擔(dān)著構(gòu)建機(jī)器人“大腦”、在虛擬環(huán)境中進(jìn)行測(cè)試以及在物理環(huán)境中執(zhí)行操作的任務(wù)。通過這三臺(tái)計(jì)算機(jī)的整合,可以顯著縮短機(jī)器人開發(fā)的時(shí)間,加速技術(shù)進(jìn)步。

在機(jī)器人開發(fā)過程中,主要挑戰(zhàn)之一是“仿真與現(xiàn)實(shí)的差距”。NVIDIA通過Omniverse等技術(shù)顯著縮小了這一差距。NVIDIA并不直接制造機(jī)器人,而是與所有從事機(jī)器人制造或解決方案開發(fā)的人員合作,構(gòu)建一個(gè)包含三種計(jì)算系統(tǒng)及相關(guān)軟件工具和工作流程的平臺(tái),以簡(jiǎn)化機(jī)器人解決方案的開發(fā)過程。然而,機(jī)器人模型訓(xùn)練面臨現(xiàn)實(shí)世界數(shù)據(jù)量不足的問題。采集機(jī)器人數(shù)據(jù)的難度遠(yuǎn)大于采集自動(dòng)駕駛數(shù)據(jù),因?yàn)槿诵螜C(jī)器人數(shù)據(jù)采集難以復(fù)制且成本高昂。

銀河通用是合成數(shù)據(jù)推動(dòng)智能發(fā)展的先驅(qū)。他們使用NVIDIA Isaac系列及Omniverse等平臺(tái),通過仿真器合成大量機(jī)器人操作數(shù)據(jù),并將其轉(zhuǎn)化為機(jī)器人模型。他們將各種3D資產(chǎn)、環(huán)境以及材質(zhì)和紋理素材相結(jié)合,模擬機(jī)器人的運(yùn)行場(chǎng)景,探索機(jī)器人的操作方式。通過合成數(shù)據(jù)生成,銀河通用成功訓(xùn)練出了全球首個(gè)端到端具身抓取基礎(chǔ)大模型GraspVLA。這一模型能夠滿足七大泛化“金標(biāo)準(zhǔn)”,并能夠根據(jù)輸入的語言指令執(zhí)行特定任務(wù),如抓取物品。

銀河通用利用大數(shù)據(jù)實(shí)現(xiàn)了對(duì)10億級(jí)別的零售數(shù)據(jù)進(jìn)行精準(zhǔn)抓取,靈巧抓取的成功率超過90%。他們還將模型與足式機(jī)器人相結(jié)合,在Isaac引擎中進(jìn)行了大規(guī)模應(yīng)用。例如,宇樹科技的四足機(jī)器人能夠繞著未名湖撿垃圾,基于強(qiáng)化學(xué)習(xí)精準(zhǔn)識(shí)別垃圾,整個(gè)過程完全不依賴真實(shí)數(shù)據(jù)。銀河通用的具身大模型已成功應(yīng)用于零售、酒店、接待、養(yǎng)老以及工業(yè)制造等多個(gè)領(lǐng)域。在北京奔馳工廠,銀河通用的人形機(jī)器人在裝載和轉(zhuǎn)運(yùn)天窗玻璃過程中發(fā)揮了重要作用,能夠基于視覺閉環(huán)和從仿真中學(xué)到的操作技能,快速發(fā)現(xiàn)錯(cuò)誤并進(jìn)行糾正。

舉報(bào) 0 收藏 0 打賞 0評(píng)論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  RSS訂閱  |  開放轉(zhuǎn)載  |  滾動(dòng)資訊  |  爭(zhēng)議稿件處理  |  English Version