滾動(dòng)資訊

當(dāng)前位置：首頁 > 資訊 > 業(yè)界動(dòng)態(tài) > 正文內(nèi)容

星動(dòng)紀(jì)元端到端原生機(jī)器人大模型ERA-42正式亮相，引領(lǐng)具身大模型進(jìn)入靈巧操作時(shí)代

時(shí)間：2024-12-23 15:02:32 來源：互聯(lián)網(wǎng)編輯：茹茹 發(fā)表評論無障礙通道

導(dǎo)語：近期，星動(dòng)紀(jì)元端到端原生機(jī)器人大模型ERA-42正式亮相，即“紀(jì)元原生機(jī)器人大模型”,寓意著不斷探索宇宙萬物的終極答案，展示了其與自研五指靈巧手星動(dòng)XHAND1結(jié)合后的靈巧操作能力，已學(xué)會(huì)了使用不同工具完成100多種復(fù)雜靈巧的操作任務(wù)，并且持續(xù)在同一個(gè)模型下學(xué)習(xí)新的技能。例如，拿起桌上螺釘鉆鉆緊螺釘、用錘子敲打釘子、將水杯扶正后再往水杯中倒水等任務(wù)。

基于ERA-42，星動(dòng)XHAND1能用不同工具完成多種靈巧操作新任務(wù)

這是業(yè)界首次僅通過同一個(gè)具身大模型就實(shí)現(xiàn)了五指靈巧手像人手一樣使用多種工具完成上百種靈巧復(fù)雜操作任務(wù)，展現(xiàn)了ERA-42行業(yè)領(lǐng)先的通用、靈巧操作能力。模型不需要任何預(yù)編程技能，完全基于其強(qiáng)大的泛化和自適應(yīng)力，能在不到2小時(shí)內(nèi)通過收集少量數(shù)據(jù)就學(xué)會(huì)執(zhí)行新的任務(wù)。同時(shí)，ERA-42還在快速不斷學(xué)習(xí)更多新技能中。

基于ERA-42，星動(dòng)XHAND1可完成100多種精細(xì)化、智能化的五指靈巧手操作任務(wù)

ERA-42也是世界范圍內(nèi)首個(gè)真正的五指靈巧手具身大模型，開啟了具身大模型的通用靈巧操作時(shí)代。

1.“真正”的具身大模型才是開啟通用具身智能體的密鑰，需要具備以下三個(gè)要素：

一是統(tǒng)一一個(gè)模型泛化多種任務(wù)和環(huán)境：通過構(gòu)建一個(gè)統(tǒng)一的原生模型，融合視覺、語言、觸覺和身體姿態(tài)等全模態(tài)信息，實(shí)現(xiàn)對不同任務(wù)和環(huán)境的泛化能力。

二是端到端：從接收全模態(tài)數(shù)據(jù)，到生成最終輸出(如決策、動(dòng)作等)，通過一個(gè)簡潔的神經(jīng)網(wǎng)絡(luò)鏈路完成。該過程無需人為設(shè)計(jì)特征、預(yù)編程或干預(yù)處理步驟，使得具身智能體能夠?qū)崟r(shí)適應(yīng)不同任務(wù)和環(huán)境，顯著提升靈活性與開發(fā)效率。

三是Scaling up(規(guī)?；?：真正的統(tǒng)一的端到端算法才允許模型通過持續(xù)的數(shù)據(jù)積累實(shí)現(xiàn)自我完善，使得具身大模型在數(shù)據(jù)量指數(shù)級(jí)增長的同時(shí)，不僅提升性能，還能在未知任務(wù)中展現(xiàn)卓越的自適應(yīng)和泛化能力。

例如，被行業(yè)廣泛熟知的Physical Intelligence (簡稱PI)發(fā)布的π0模型就具備上述要素，是典型的真正意義上的端到端具身大模型。

2.星動(dòng)紀(jì)元ERA-42是國內(nèi)首個(gè)真正意義上的端到端原生機(jī)器人大模型，比肩世界領(lǐng)先水平

早期，星動(dòng)紀(jì)元和PI幾乎同期采用了端到端算法來提升其原生機(jī)器人大模型性能，PI推出的π0模型，通過結(jié)合互聯(lián)網(wǎng)規(guī)模的視覺-語言預(yù)訓(xùn)練與機(jī)器人操作數(shù)據(jù)集后訓(xùn)練，使得機(jī)器人能夠在人類環(huán)境中自主執(zhí)行多種復(fù)雜任務(wù)，這是機(jī)器人從特定任務(wù)的“專家”向多任務(wù)的“通才”發(fā)展歷程上的重要一步，也是具身大模型領(lǐng)域的一個(gè)里程碑。

星動(dòng)紀(jì)元早期發(fā)布的研究成果和Physical Intelligence (PI)幾乎不謀而合

星動(dòng)論文HiRT: Enhancing Robotic Control with Hierarchical Robot Transformers發(fā)表在CoRL2024

而后，星動(dòng)紀(jì)元又探索了另一條訓(xùn)練道路，采用大規(guī)模視頻數(shù)據(jù)學(xué)習(xí)策略，涵蓋無標(biāo)注的視頻數(shù)據(jù)、公開各類形態(tài)機(jī)器人的數(shù)據(jù)、人類活動(dòng)數(shù)據(jù)以及遙操作數(shù)據(jù)等。并且，在上述數(shù)據(jù)的使用上，星動(dòng)紀(jì)元不是直接模仿視頻里的人怎么去做，而是學(xué)習(xí)行動(dòng)之后會(huì)產(chǎn)生什么樣的結(jié)果。這種方式使得學(xué)習(xí)效果不受限于數(shù)據(jù)質(zhì)量，能大大降低數(shù)據(jù)收集成本，解決了數(shù)據(jù)消耗量巨大、需要大量高質(zhì)量數(shù)據(jù)的行業(yè)難題。

此外，星動(dòng)紀(jì)元的技術(shù)團(tuán)隊(duì)已將世界模型融入原生機(jī)器人大模型中，使得模型不僅具備行動(dòng)能力，還具備了對物理世界的理解能力，能夠?qū)ξ磥硇袆?dòng)軌跡進(jìn)行預(yù)測，

后期，星動(dòng)紀(jì)元探索了融合世界模型的原生機(jī)器人大模型

星動(dòng)論文Prediction with Action: Visual Policy Learning via Joint Denoising Process發(fā)表在NeurIPS 2024

還能迅速響應(yīng)外部干擾，并在任務(wù)執(zhí)行過程中持續(xù)自適應(yīng)優(yōu)化行為，直至任務(wù)完成。提升了機(jī)器人執(zhí)行任務(wù)的高效性和準(zhǔn)確性。

星動(dòng)紀(jì)元打造的端到端原生機(jī)器人大模型ERA-42憑借其預(yù)測能力，模型具備強(qiáng)大的泛化、自適應(yīng)和規(guī)模化能力。結(jié)合星動(dòng)紀(jì)元為AI打造的全新硬件平臺(tái)，可快速實(shí)現(xiàn)具身智能體軟硬件協(xié)同進(jìn)化和商業(yè)化落地。

3.星動(dòng)紀(jì)元端到端原生機(jī)器人大模型ERA-42引領(lǐng)具身大模型進(jìn)入通用靈巧操作時(shí)代

1)相比夾爪，星動(dòng)XHAND1已經(jīng)可以完成100多種精細(xì)化、智能化的復(fù)雜靈巧操作任務(wù)

相比夾爪，基于ERA-42能力,五指靈巧手能夠真正像人手一樣使用更多種多樣的工具，完成更通用、靈巧性更強(qiáng)、復(fù)雜度更高的百種以上操作任務(wù)。

基于ERA-42,五指靈巧手星動(dòng)XHAND1相比夾爪能使用更多不同工具執(zhí)行更靈巧操作

2)星動(dòng)紀(jì)元原生機(jī)器人大模型ERA-42能理解物理世界和預(yù)測未來

融合世界模型后，ERA-42具備對物理世界的理解以及對未來的預(yù)測的能力，從而大幅提升了泛化能力和任務(wù)成功率。

例如，下圖中上方的圖片展示了真實(shí)物理世界中打開冰箱的逐幀操作，下方的圖片則為ERA-42生成的環(huán)境建模與對打開冰箱任務(wù)的逐幀預(yù)測?？梢钥吹絻蓮垐D片非常接近，說明模型預(yù)測非常準(zhǔn)確。這與其他機(jī)器人大模型直接學(xué)習(xí)行動(dòng)、而忽視對世界本身理解的方式，或者僅將世界模型用于生成仿真數(shù)據(jù)的方式，存在本質(zhì)的區(qū)別。

真實(shí)世界執(zhí)行任務(wù)和ERA-42預(yù)測執(zhí)行任務(wù)對比圖

3)星動(dòng)紀(jì)元原生機(jī)器人大模型ERA-42具備更強(qiáng)泛化能力

基于大規(guī)模視頻數(shù)據(jù)的預(yù)訓(xùn)練，只需采集少部分?jǐn)?shù)據(jù)，基于ERA-42的泛化能力，短時(shí)間內(nèi)通過單一的策略靈巧手就能學(xué)會(huì)執(zhí)行新的操作任務(wù)。此前，星動(dòng)紀(jì)元技術(shù)團(tuán)隊(duì)就通過這種訓(xùn)練方式采集簡單的紅黃藍(lán)方塊抓取數(shù)據(jù)，成功實(shí)現(xiàn)了從未見過的多樣化物體(如胡蘿卜、茄子等)的抓取泛化，并相對其他模型算法在泛化任務(wù)上顯著提升了成功率。

通過簡單彩色方塊的抓取數(shù)據(jù)實(shí)現(xiàn)多樣化物體的泛化抓取操作

4)星動(dòng)紀(jì)元原生機(jī)器人大模型ERA-42具備更強(qiáng)自適應(yīng)性

由于融合了世界模型，ERA-42不管在單任務(wù)上，還是長序列任務(wù)上都展現(xiàn)出了業(yè)內(nèi)領(lǐng)先的強(qiáng)大抗干擾能力。

5)星動(dòng)紀(jì)元原生機(jī)器人大模型ERA-42初步體現(xiàn)“Scaling效應(yīng)”

并且研究結(jié)果表明，隨著模型規(guī)模的擴(kuò)大，任務(wù)成功率也明顯提升，初步體現(xiàn)了和大語言模型訓(xùn)練中類似的“Scaling效應(yīng)”，即模型規(guī)模與性能之間的正相關(guān)性。

“Scaling效應(yīng)”顯示模型與機(jī)器人性能呈現(xiàn)正相關(guān)性

4.星動(dòng)紀(jì)元端到端原生機(jī)器人大模型ERA-42和為AI打造的全新硬件平臺(tái)協(xié)同進(jìn)化，共建原生具身智能體

構(gòu)建通用具身智能體需要軟硬件協(xié)同迭代，就像人類的腦和身體是從小到大同步協(xié)同成長的一樣。

構(gòu)建原生通用具身智能體=原生機(jī)器人大模型+為AI定義的硬件平臺(tái)協(xié)同進(jìn)化

因此，星動(dòng)紀(jì)元打造了為AI定義的全新硬件平臺(tái)。以星動(dòng)自研推出的五指靈巧手星動(dòng)XHAND1為例，共有12個(gè)主動(dòng)自由度，并采用純電驅(qū)方式，且每個(gè)自由度都有對應(yīng)的驅(qū)動(dòng)源，實(shí)現(xiàn)全自主五指關(guān)節(jié)驅(qū)動(dòng)，能執(zhí)行高精度任務(wù)。星動(dòng)XHAND1每個(gè)手指配備一個(gè)高分辨率(>100點(diǎn))觸覺陣列傳感器，提供精確的三維力觸覺和溫度信息。單手最大握力能達(dá)80N，負(fù)載可達(dá)25kg。

星動(dòng)XHAND1 —— 全自驅(qū) 真自由

星動(dòng)XHAND1在作業(yè)能力上展現(xiàn)出的高性能在協(xié)同ERA-42后，為實(shí)現(xiàn)復(fù)雜靈巧操作任務(wù)奠定了基礎(chǔ)。

依托ERA-42，星動(dòng)紀(jì)元通用人形機(jī)器人執(zhí)行任務(wù)的通用性和泛化性將大幅提升，結(jié)合此前發(fā)布的在復(fù)雜多樣的地形上穩(wěn)定行走和奔跑的運(yùn)動(dòng)性能，配合上下肢協(xié)同作業(yè)能力，潛在應(yīng)用場景也將更加多元化，真正實(shí)現(xiàn)原生的通用具身智能體的產(chǎn)業(yè)化落地。

舉報(bào) 0 收藏 0 打賞 0評論 0

更多>同類資訊

*ST東園新動(dòng)作！北京成立全資子公司潤宇海元企管

12-23

領(lǐng)克Z20來襲，加速超極氪X，性價(jià)比出眾，能否成銷量新星？

12-23

FF宣布再獲3000萬美元新融資首筆750萬美金已到賬將加速FX戰(zhàn)略等業(yè)務(wù)

12月23日，總部位于美國加州、致力于推出人工智能電動(dòng)車(AIEV)的科技公司Faraday Future(納斯達(dá)克：FFIE，簡稱FF)今天宣布，繼9月份完成3000萬美元融資之后，F(xiàn)F又完成了新一輪3000萬美元的現(xiàn)金融資，加速助力FX戰(zhàn)略推進(jìn)。公司還將于1月5號(hào)-7號(hào)在拉斯維加斯舉辦FX戰(zhàn)略最

12-23

星動(dòng)紀(jì)元端到端原生機(jī)器人大模型ERA-42正式亮相，引領(lǐng)具身大模型進(jìn)入靈巧操作時(shí)代

導(dǎo)語：近期，星動(dòng)紀(jì)元端到端原生機(jī)器人大模型ERA-42正式亮相，即“紀(jì)元原生機(jī)器人大模型”,寓意著不斷探索宇宙萬物的終極答案，并展示了其與自研五指靈巧手星動(dòng)XHAND1結(jié)合后的靈巧操作能力，已學(xué)會(huì)了使用不同工具完成100多種復(fù)雜靈巧的操作任務(wù)，并且持續(xù)在同一個(gè)模型下

12-23

美贊臣藍(lán)臻：寶寶成長路上的堅(jiān)實(shí)盾牌

在寶寶成長的黃金時(shí)期，健康與抵抗力始終是父母關(guān)注的焦點(diǎn)。面對多變的環(huán)境和潛在的病菌侵襲，如何為寶寶構(gòu)建一個(gè)強(qiáng)大的防御體系，成為每位新手父母必須面對的課題。美贊臣藍(lán)臻，作為一款專為提升寶寶抵抗力而設(shè)計(jì)的奶粉，憑借其科學(xué)配方和卓越品質(zhì)，成為寶寶成長路上的

12-23

春運(yùn)機(jī)票預(yù)訂開啟，為何大片座位被鎖定？旅客選座難在哪里？

12-23

華為WATCH D2血壓記錄儀手表禮盒款上市預(yù)售，配氟橡膠表帶售2988元

12-23

小紅書WILL商業(yè)大會(huì)：詳解種草度量新方案，助力品牌生意增長

12-23

REDMI Turbo 4 Pro或?qū)?月發(fā)布：驍龍8s Elite加持，續(xù)航再升級(jí)？

12-23

極空間私有云Q4榮獲GG100大獎(jiǎng)，科技家居融合新典范！

12-23

抖音上線“驗(yàn)證助手”，守護(hù)用戶安全遠(yuǎn)離詐騙

12-23

維信諾喊出“非凡中國屏” 底氣何在？

近期，在2024年維信諾屏幕技術(shù)發(fā)布會(huì)上，一系列新材料、新技術(shù)的發(fā)布展現(xiàn)了維信諾在顯示技術(shù)與產(chǎn)業(yè)創(chuàng)新方面的引領(lǐng)和推動(dòng)作用。但更引人注意的是，在發(fā)布會(huì)上，敢于喊出“非凡中國屏”的口號(hào)，維信諾的底氣何在?底氣源自不斷超越經(jīng)過20多年的發(fā)展，我國的新興顯示產(chǎn)業(yè)，

12-23

正道輪胎柬埔寨工廠加速建設(shè)，年產(chǎn)能將達(dá)720萬條輪胎！

12-23

抖音推“驗(yàn)證助手”，一鍵識(shí)別來電短信網(wǎng)址真?zhèn)?/a>

12-23

黑鯊GS3 Sport智能手表上架：50米防水+120種運(yùn)動(dòng)模式，僅售499元！

12-23

點(diǎn)擊查看更多 +

全站最新

量子糾纏：平行宇宙存在的微妙線索？

智能制造新紀(jì)元：火箭3D打印、無人裝載機(jī)與刀片電池引領(lǐng)變革

月球真實(shí)年齡曝光：或達(dá)45.1億歲，比想象更古老？

閃極AI拍拍鏡首秀告捷！5萬臺(tái)共創(chuàng)版一天售罄，智能拍攝新潮流來襲

春運(yùn)機(jī)票預(yù)訂開啟，為何大片座位被鎖定？旅客選座難在哪里？

FF再獲3000萬美金融資，F(xiàn)X戰(zhàn)略加速推進(jìn)中

熱門內(nèi)容

本欄最新

春運(yùn)機(jī)票預(yù)訂開啟，為何大片座位被鎖定？旅客選座難在哪里？

華為WATCH D2血壓記錄儀手表禮盒款上市預(yù)售，配氟橡膠表帶售2988元

極空間私有云Q4榮獲GG100大獎(jiǎng)，科技家居融合新典范！

正道輪胎柬埔寨工廠加速建設(shè)，年產(chǎn)能將達(dá)720萬條輪胎！

抖音推“驗(yàn)證助手”，一鍵識(shí)別來電短信網(wǎng)址真?zhèn)?/a>

黑鯊GS3 Sport智能手表上架：50米防水+120種運(yùn)動(dòng)模式，僅售499元！

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號(hào)：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時(shí)刪除。
中國（山東）自由貿(mào)易試驗(yàn)區(qū) · 齊魯軟件園魯ICP備11015305號(hào)-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.