雖然具身智能還未迎來(lái)GPT時(shí)代,但國(guó)內(nèi)外人形機(jī)器人企業(yè)紛紛加速應(yīng)用落地,探索核心技術(shù)突破。
5月29日,在2025張江具身智能開(kāi)發(fā)者大會(huì)上,國(guó)家地方共建人形機(jī)器人創(chuàng)新中心(下稱(chēng)“國(guó)地中心”)聯(lián)合復(fù)旦大學(xué)正式發(fā)布全球首款生成式人形機(jī)器人運(yùn)動(dòng)大模型—— “龍躍”(MindLoongGPT)。此舉將標(biāo)志著我國(guó)在智能體運(yùn)動(dòng)控制領(lǐng)域邁入全球領(lǐng)先行列。
首款生成式人形機(jī)器人運(yùn)動(dòng)大模型有何意義
龍躍大模型以“自然語(yǔ)言驅(qū)動(dòng)”為核心,構(gòu)建了從多模態(tài)輸入到高保真動(dòng)作生成的完整閉環(huán),顛覆傳統(tǒng)運(yùn)動(dòng)控制范式。
國(guó)地中心首席科學(xué)家江磊接受第一財(cái)經(jīng)記者采訪時(shí)說(shuō),人形機(jī)器人是一個(gè)全身具有移動(dòng)性的整體,雙臂在動(dòng),腰部也會(huì)配合,然后雙足也會(huì)配合移動(dòng)保持平衡。“我們認(rèn)為應(yīng)該要有一個(gè)全身運(yùn)動(dòng)的大模型解決最后端到端問(wèn)題。這次首發(fā)了針對(duì)移動(dòng)能力和操作能力的大模型,可以幫助人們?cè)趯?shí)際采集數(shù)據(jù)非常困難的情況下,通過(guò)這個(gè)大模型生成更多的仿真級(jí)的動(dòng)作,來(lái)構(gòu)成更完整的具身智能數(shù)據(jù)集。它也是實(shí)體訓(xùn)練場(chǎng)一個(gè)非常重要的補(bǔ)充。”
上述他提到的訓(xùn)練場(chǎng),是今年1月21日啟用的全國(guó)首個(gè)異構(gòu)人形機(jī)器人訓(xùn)練場(chǎng),首期部署了超100臺(tái)異構(gòu)人形機(jī)器人,以10余種人形機(jī)器人典型應(yīng)用場(chǎng)景的建設(shè),牽引形成上海人形機(jī)器人超級(jí)中心。作為一個(gè)數(shù)據(jù)生產(chǎn)的工廠,能產(chǎn)生更多數(shù)據(jù)提供給具身智能大模型的企業(yè)去使用,幫助行業(yè)加速發(fā)展。
龍躍大模型聯(lián)合發(fā)布方——復(fù)旦大學(xué)信息科學(xué)與工程學(xué)院教授陳濤在2025張江具身智能開(kāi)發(fā)者大會(huì)上的“張江論劍”科創(chuàng)沙龍上表示,具身智能距離GPT時(shí)刻還有距離,而這次和國(guó)地中心聯(lián)合發(fā)布的龍躍,它的特點(diǎn)是可以根據(jù)用戶(hù)的輸入產(chǎn)生動(dòng)作,比如說(shuō)用戶(hù)只需說(shuō)出“揮手致意”或上傳一段參考視頻,模型即可自動(dòng)解析語(yǔ)義并生成連貫動(dòng)作。傳統(tǒng)方法依賴(lài)專(zhuān)業(yè)參數(shù)調(diào)整的桎梏被打破,實(shí)現(xiàn)“人人可用”。
他補(bǔ)充解釋?zhuān)ㄟ^(guò)“龍躍”MindLoongGPT生成特技動(dòng)作運(yùn)動(dòng)軌跡,作為部署的全身跟蹤小模型的輸入目標(biāo)觀測(cè),可以在青龍上實(shí)現(xiàn)豐富的全身動(dòng)作。“目前我們?cè)谇帻垯C(jī)器人上做了一些demo的驗(yàn)證,在仿真平臺(tái)上針對(duì)全尺寸人形機(jī)器人也做了一些數(shù)據(jù)生成。”
數(shù)據(jù)為何重要
具身智能所依賴(lài)的數(shù)據(jù),不僅來(lái)源廣泛、形式多樣,而且對(duì)模型訓(xùn)練和技能獲取起著至關(guān)重要的作用。當(dāng)前,國(guó)內(nèi)外企業(yè)紛紛投入資源,加快數(shù)據(jù)集構(gòu)建和訓(xùn)練場(chǎng)建設(shè)的步伐,但如何在保證數(shù)據(jù)數(shù)量的同時(shí)確保其高質(zhì)量,依然是擺在各方面前的一大難題。
中國(guó)信通院人工智能研究所安全與具身智能部副主任顏媚在“張江論劍”上表示,數(shù)據(jù)資源主要包括三大類(lèi)型:真機(jī)數(shù)據(jù)、合成數(shù)據(jù)和互聯(lián)網(wǎng)中的多模態(tài)數(shù)據(jù)。然而,盡管多種數(shù)據(jù)來(lái)源為具身智能的發(fā)展提供了豐富資源,應(yīng)用推廣仍面臨兩大主要挑戰(zhàn):數(shù)據(jù)需求量巨大、數(shù)據(jù)質(zhì)量的把控問(wèn)題更為突出。
她說(shuō),相比無(wú)人駕駛領(lǐng)域,具身智能所涉及的環(huán)境復(fù)雜性更高,空間不確定性往往是無(wú)人車(chē)的幾十倍。以無(wú)人駕駛為例,產(chǎn)業(yè)界已用三年時(shí)間采集約十萬(wàn)輛車(chē)輛的真實(shí)數(shù)據(jù)和大量高質(zhì)量仿真數(shù)據(jù),才勉強(qiáng)達(dá)到可用標(biāo)準(zhǔn),而具身智能機(jī)器人所需的數(shù)據(jù)量則更加龐大。因此,如何短時(shí)間內(nèi)構(gòu)建大規(guī)模、可用性強(qiáng)的數(shù)據(jù)集,成為當(dāng)前亟待突破的難題。
基于上述挑戰(zhàn),中國(guó)信通院和國(guó)地中心聯(lián)合推進(jìn)了具身智能數(shù)據(jù)質(zhì)量及評(píng)估標(biāo)準(zhǔn)的制定工作。該標(biāo)準(zhǔn)主要從三個(gè)方面展開(kāi):圍繞數(shù)據(jù)全生命周期的管理,明確提出從數(shù)據(jù)采集、清洗、標(biāo)注到最終使用過(guò)程中各關(guān)鍵環(huán)節(jié)的質(zhì)量控制要求;建立了包括完整性、一致性、多樣性、真實(shí)性、易用性、實(shí)用性及可擴(kuò)展性在內(nèi)的七大質(zhì)量評(píng)價(jià)指標(biāo);從組織管理角度構(gòu)建制度保障,明確將持續(xù)推動(dòng)具身智能標(biāo)準(zhǔn)體系不斷完善,以期形成一個(gè)定量和定性兼?zhèn)涞娜鏀?shù)據(jù)生態(tài)體系。
江磊也對(duì)記者說(shuō),今年國(guó)地中心自己的訓(xùn)練場(chǎng)會(huì)完成高質(zhì)量實(shí)體數(shù)據(jù)集,成為國(guó)際上最大的一個(gè)數(shù)據(jù)聚集地。同時(shí)他們還聯(lián)合了企業(yè)和省市一級(jí)的創(chuàng)新中心聯(lián)合打造出將近2500萬(wàn)條的數(shù)據(jù)來(lái)發(fā)展更智能的大模型。
他說(shuō),今年年底會(huì)把他們具身智能大模型的操作精度從約70%~80%繼續(xù)優(yōu)化提升到90%,基本達(dá)到相當(dāng)于ChatGPT-3的水平。“接下去我們要采集更多數(shù)據(jù),上千萬(wàn)條還不夠,達(dá)到PB級(jí)(1PB=1000TB=1000000GB)的量級(jí)才是符合具身智能數(shù)據(jù)體量的要求。”
會(huì)議當(dāng)天,在前期與上海大學(xué)聯(lián)合發(fā)布的“格物”具身智能仿真平臺(tái)相關(guān)工作基礎(chǔ)上,國(guó)地中心還正式發(fā)布“致知”具身應(yīng)用開(kāi)發(fā)平臺(tái)。
據(jù)國(guó)地中心介紹,“格物-致知”通用具身智能開(kāi)發(fā)平臺(tái)深度融合OpenLoong(人形機(jī)器人開(kāi)源社區(qū))核心軟件框架,形成具身智能應(yīng)用一站式 向?qū)降目焖匍_(kāi)發(fā)管道,同時(shí)以開(kāi)源開(kāi)放的機(jī)制持續(xù)推動(dòng)人形機(jī)器人開(kāi)發(fā)范式從“單點(diǎn)突破”邁向“生態(tài)共建”,并依托麒麟具身智能訓(xùn)練場(chǎng)規(guī)模化數(shù)據(jù)采集與白虎百萬(wàn)開(kāi)源數(shù)據(jù)集快速形成具身基礎(chǔ)大模型庫(kù),加速人形機(jī)器人在實(shí)際場(chǎng)景的應(yīng)用落地。
國(guó)地中心研發(fā)總監(jiān)邢伯陽(yáng)分享稱(chēng),目前中心的麒麟訓(xùn)練場(chǎng)已成功搭建起從具身數(shù)據(jù)到大模型的一站式開(kāi)發(fā)基礎(chǔ)設(shè)施,整合了一百多家異構(gòu)機(jī)器人同步進(jìn)行數(shù)據(jù)采集,為后續(xù)模型訓(xùn)練提供了堅(jiān)實(shí)的數(shù)據(jù)支撐。
在刑伯陽(yáng)看來(lái),人形機(jī)器人賽道正迎來(lái)量產(chǎn)元年的重要時(shí)刻。從數(shù)據(jù)采集、模型訓(xùn)練到技能整合的全鏈路探索正成為推動(dòng)整個(gè)行業(yè)突破的重要因素。未來(lái)應(yīng)用場(chǎng)景的快速形成不僅依賴(lài)于龐大的數(shù)據(jù)和高精度模型,更需要通過(guò)集成開(kāi)發(fā)平臺(tái)將各個(gè)技術(shù)模塊高效融合,實(shí)現(xiàn)從底層操作系統(tǒng)中間件、芯片適配到上層生態(tài)開(kāi)發(fā)的無(wú)縫對(duì)接。只有解決好模型技能組合為可落地應(yīng)用這一核心問(wèn)題,才能真正實(shí)現(xiàn)全套端到端應(yīng)用的突破。
幫企客致力于為您提供最新最全的財(cái)經(jīng)資訊,想了解更多行業(yè)動(dòng)態(tài),歡迎關(guān)注本站。鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如作者信息標(biāo)記有誤,請(qǐng)第一時(shí)間聯(lián)系我們修改或刪除,多謝。