最近,由中國(guó)移動(dòng)具身智能產(chǎn)業(yè)創(chuàng)新中心打造的機(jī)器人大家族在各大展會(huì)成為了萬(wàn)眾矚目的焦點(diǎn),吸引眾多科技愛(ài)好者駐足圍觀。這些充滿未來(lái)科技感的造物背后,是中國(guó)移動(dòng)具身智能產(chǎn)業(yè)創(chuàng)新中心在機(jī)器人大腦技術(shù)上的突破,在交互、移動(dòng)、操作、學(xué)習(xí)等領(lǐng)域提升自主化水平,將機(jī)器人從重復(fù)操作的機(jī)械工具搖身一變成貼心的智能伙伴。
自主交互:機(jī)器人的 “聊天進(jìn)化史”
機(jī)器人聊天,你能想象嗎?自主交互給予了機(jī)器人這項(xiàng)神奇技能。
基礎(chǔ)交互階段(L0-L2):僅能理解并執(zhí)行結(jié)構(gòu)化的簡(jiǎn)單指令,例如"開(kāi)燈"、"播放音樂(lè)"等明確指令。它們的行為完全依賴于預(yù)設(shè)程序,缺乏靈活應(yīng)對(duì)能力。
智能交互階段(L3):具備更強(qiáng)大的理解能力。當(dāng)被詢問(wèn)"昨天的快遞放在哪里"時(shí),機(jī)器人能夠自主檢索記憶系統(tǒng),快速給出準(zhǔn)確回答。更值得注意的是,它們開(kāi)始具備初步的情感識(shí)別能力,可以通過(guò)分析用戶的語(yǔ)氣和表情來(lái)判斷情緒狀態(tài)并主動(dòng)提供相應(yīng)反饋。
高級(jí)交互階段(L4-L5):這是機(jī)器人交互技術(shù)的未來(lái)發(fā)展方向。處于這個(gè)階段的機(jī)器人將成為真正的"對(duì)話專家",不僅能夠主動(dòng)發(fā)起話題,還能與其他機(jī)器人進(jìn)行默契配合,實(shí)現(xiàn)群體智能。
當(dāng)前,得益于大語(yǔ)言模型技術(shù)的突破性進(jìn)展,多數(shù)家用機(jī)器人的交互能力在智商方已達(dá)到L3水平,具備基礎(chǔ)的世界知識(shí)理解和信息檢索生成能力。然而在情感智能方面仍處于L1-L2的初級(jí)階段,對(duì)于人類復(fù)雜情感和潛臺(tái)詞的理解能力仍有待提升,這是未來(lái)技術(shù)突破的重點(diǎn)方向。
中國(guó)移動(dòng)具身智能產(chǎn)業(yè)創(chuàng)新中心研發(fā)的機(jī)器人目前已具備較強(qiáng)的多模態(tài)交互能力,能夠理解復(fù)雜指令并識(shí)別人類手勢(shì)動(dòng)作,然而,在更高級(jí)的人機(jī)對(duì)話自然度和復(fù)雜場(chǎng)景適應(yīng)能力方面,仍存在進(jìn)一步優(yōu)化的空間。對(duì)比國(guó)際前沿技術(shù),美國(guó)Figure公司開(kāi)發(fā)的機(jī)器人已經(jīng)實(shí)現(xiàn)了通過(guò)自然語(yǔ)言指令完成物品分揀等精細(xì)操作;國(guó)內(nèi)創(chuàng)新企業(yè)如宇樹(shù)科技、蔚藍(lán)科技等也在積極推進(jìn)自主交互技術(shù)的研發(fā),通過(guò)深度學(xué)習(xí)和大語(yǔ)言模型的應(yīng)用,不斷提升機(jī)器人的交互智能水平。
手眼腦協(xié)同泛化操作:機(jī)器人的 “職場(chǎng)蛻變記”
手眼腦協(xié)同泛化操作指的是機(jī)器人在沒(méi)有人類直接操控的情況下,獨(dú)立感知、理解并完成任務(wù)的能力。這項(xiàng)能力的演進(jìn)可以分為三個(gè)重要發(fā)展階段:
程序控制階段(L0-L1):完全依賴預(yù)設(shè)程序運(yùn)行,其行為模式固定且缺乏應(yīng)變能力。工業(yè)流水線的清潔機(jī)器人,它們只能按照既定程序完成重復(fù)性工作,一旦作業(yè)環(huán)境發(fā)生變化或出現(xiàn)意外情況,便容易陷入操作困境。
環(huán)境適應(yīng)階段(L2-L3):獲得環(huán)境感知能力和初步學(xué)習(xí)能力,能夠通過(guò)視覺(jué)系統(tǒng)識(shí)別周圍物體,自主調(diào)整操作策略以適應(yīng)物品位置的變化。在家庭場(chǎng)景中,它們已經(jīng)可以完成諸如傾倒液體、物品分類等需要一定靈活性的任務(wù)。
泛化自主階段(L4):這是機(jī)器人泛化操作的最高發(fā)展階段。達(dá)到該水平的機(jī)器人具備強(qiáng)大的環(huán)境理解和任務(wù)遷移能力,能夠應(yīng)對(duì)開(kāi)放環(huán)境中的各種復(fù)雜情況。無(wú)論是處理陌生對(duì)象還是適應(yīng)全新場(chǎng)景,都能游刃有余。想象一下,未來(lái)的家庭機(jī)器人可以像專業(yè)管家一樣,獨(dú)立完成烹飪、清潔等系列家務(wù),真正實(shí)現(xiàn)智能化服務(wù)。
當(dāng)前,多模態(tài)大模型的技術(shù)突破正在加速具身智能的發(fā)展。Physical Intelligence公司推出的PI-0機(jī)器人已接近L3水平,能夠執(zhí)行廚房清潔等任務(wù),但在處理遮擋物和特殊物品時(shí)仍需人工輔助。中國(guó)移動(dòng)具身智能創(chuàng)新中心的家庭服務(wù)機(jī)器人已實(shí)現(xiàn)多項(xiàng)突破:具備家居任務(wù)智能規(guī)劃能力、標(biāo)準(zhǔn)物品識(shí)別抓取功能、1cm級(jí)精密操作技術(shù),并通過(guò)模仿學(xué)習(xí)掌握了"倒牛奶"等精細(xì)動(dòng)作,整體達(dá)到L2.4水平。中心正集中力量研發(fā)新一代具身智能大模型,計(jì)劃在2025年實(shí)現(xiàn)L3.0級(jí)別的操作能力,以應(yīng)對(duì)更復(fù)雜的服務(wù)場(chǎng)景和更具挑戰(zhàn)性的任務(wù)需求。
自主移動(dòng):機(jī)器人的 “自由行走夢(mèng)”
自主移動(dòng)對(duì)于機(jī)器人來(lái)說(shuō),就如同人類的 “腿腳”,從 “需要牽著走” 到 “想去哪就去哪”。
基礎(chǔ)移動(dòng)階段(L0-L1):機(jī)器人完全依賴人工遠(yuǎn)程操控,其移動(dòng)能力相當(dāng)于"學(xué)步兒童"。一旦脫離操作者的實(shí)時(shí)控制,就會(huì)立即失去方向感和行動(dòng)能力,無(wú)法自主應(yīng)對(duì)環(huán)境變化。
自主移動(dòng)階段(L2 - L3):機(jī)器人有了點(diǎn) “獨(dú)立意識(shí)”,能自主跟隨主人、避開(kāi)障礙物。以中心自研的四足機(jī)器狗為例,能夠?qū)崿F(xiàn)室內(nèi)自主導(dǎo)航、跟隨主人以及避障等功能。但在樓梯、戶外復(fù)雜地形等更具挑戰(zhàn)性的環(huán)境中,仍需人工監(jiān)督確保安全。
完全自主階段(L4-L5):這是機(jī)器人移動(dòng)技術(shù)的終極目標(biāo)。達(dá)到此階段的機(jī)器人行動(dòng)自如,能在開(kāi)放環(huán)境中自主規(guī)劃路線,甚至能根據(jù)天氣變化等復(fù)雜因素自主調(diào)整移動(dòng)策略,真正實(shí)現(xiàn)全自動(dòng)移動(dòng)。
中國(guó)移動(dòng)具身智能產(chǎn)業(yè)創(chuàng)新中心研發(fā)的四足機(jī)器人已實(shí)現(xiàn)室內(nèi)自主導(dǎo)航(L2產(chǎn)品級(jí),L3演示級(jí))。國(guó)內(nèi)領(lǐng)先企業(yè)如宇樹(shù)科技、云深處開(kāi)發(fā)的機(jī)器狗也已在室內(nèi)環(huán)境中展現(xiàn)出良好的移動(dòng)能力,但在戶外復(fù)雜場(chǎng)景的應(yīng)用仍處于測(cè)試優(yōu)化階段。這標(biāo)志著我國(guó)在機(jī)器人自主移動(dòng)技術(shù)領(lǐng)域已取得重要進(jìn)展,但距離完全自主的終極目標(biāo)仍有提升空間。
自主學(xué)習(xí):機(jī)器人的 “大腦升級(jí)之路”
自主學(xué)習(xí)是機(jī)器人不斷提升自我的 “大腦訓(xùn)練”,其發(fā)展過(guò)程展現(xiàn)了從程序控制到自主決策的質(zhì)變。
基礎(chǔ)學(xué)習(xí)階段(L0-L2):只能按照人類編寫的程序做事,缺乏靈活性。比如掃地機(jī)器人按固定路線清掃,遇到新的障礙物無(wú)法調(diào)整路線。
優(yōu)化學(xué)習(xí)階段(L3):開(kāi)始具備通過(guò)實(shí)踐經(jīng)驗(yàn)優(yōu)化行為的能力。就能通過(guò) “練習(xí)” 優(yōu)化動(dòng)作的能力。比如,四足機(jī)器人在摔倒后可以自主調(diào)整姿態(tài)恢復(fù)平衡,輪式機(jī)器人能夠根據(jù)用戶的使用習(xí)慣不斷優(yōu)化移動(dòng)路徑。
高級(jí)認(rèn)知階段(L4-L5):這是機(jī)器人學(xué)習(xí)能力的最高發(fā)展階段。達(dá)到此階段的機(jī)器人將擁有人類般的類比推理能力,可以通過(guò)環(huán)境觀察自主掌握新技能,甚至可能發(fā)現(xiàn)超出人類預(yù)設(shè)的創(chuàng)新解決方案。
現(xiàn)在,除了在仿真環(huán)境和大模型微調(diào)訓(xùn)練中的用到的強(qiáng)化學(xué)習(xí),針對(duì)實(shí)體機(jī)器人的自主學(xué)習(xí)技術(shù)仍處于探索階段,大多數(shù)機(jī)器人處于 L0 - L1 階段,中國(guó)移動(dòng)具身智能產(chǎn)業(yè)創(chuàng)新中心的機(jī)器人能通過(guò)模仿學(xué)習(xí)抓取不同物品,工業(yè)機(jī)器人能根據(jù)產(chǎn)線變化調(diào)整動(dòng)作,但在復(fù)雜場(chǎng)景下的自主決策能力仍在研發(fā)中。
四個(gè)自主“小伙伴”的默契大作戰(zhàn)
想象一下,你家里有個(gè)超厲害的機(jī)器人小伙伴。你跟它說(shuō) “倒杯牛奶”,它憑借自主交互(L3)聽(tīng)懂了你的話;接著用自主移動(dòng)(L2)開(kāi)開(kāi)心心地走到廚房;到了廚房,靠自主作業(yè)(L2.4)精準(zhǔn)地拿起杯子,倒入牛奶;未來(lái)它還通過(guò)自主學(xué)習(xí)記住了你喜歡喝溫牛奶的習(xí)慣,下次再給你倒牛奶的時(shí)候,就能做得又快又好,它們緊密配合,才讓機(jī)器人從 “笨手笨腳的機(jī)器” 變成了超貼心的 “生活小助手”。
結(jié)語(yǔ)
中國(guó)移動(dòng)具身智能產(chǎn)業(yè)創(chuàng)新中心用“四個(gè)自主”技術(shù)定義機(jī)器人的邊界——智能機(jī)器人不再是冷冰冰的機(jī)器,而是能思考、會(huì)學(xué)習(xí)、懂情感的“生活伙伴”。從技術(shù)發(fā)展路徑來(lái)看,當(dāng)前全球機(jī)器人技術(shù)正處于關(guān)鍵轉(zhuǎn)折期:國(guó)際領(lǐng)先企業(yè)已實(shí)現(xiàn)L3級(jí)自主能力的商業(yè)化落地,但距離真正意義上的L4-L5級(jí)完全自主仍有約十年的技術(shù)突破期。值得關(guān)注的是,中國(guó)企業(yè)在特定場(chǎng)景應(yīng)用方面已實(shí)現(xiàn)與國(guó)際并跑,但在核心算法、關(guān)鍵硬件等基礎(chǔ)領(lǐng)域仍需持續(xù)突破。展望未來(lái),隨著"四個(gè)自主"技術(shù)的持續(xù)演進(jìn),機(jī)器人會(huì)成為生活、工作中的 “超級(jí)助手”,在更多領(lǐng)域發(fā)揮作用,為人類社會(huì)創(chuàng)造更多意想不到的價(jià)值和可能。
作者:
程耀 中國(guó)移動(dòng)智慧家庭運(yùn)營(yíng)中心具身智能產(chǎn)業(yè)創(chuàng)新中心技術(shù)管理經(jīng)理
趙永生 中國(guó)移動(dòng)智慧家庭運(yùn)營(yíng)中心具身智能產(chǎn)業(yè)創(chuàng)新中心技術(shù)管理經(jīng)理
黃雨祺 中國(guó)移動(dòng)智慧家庭運(yùn)營(yíng)中心具身智能產(chǎn)業(yè)創(chuàng)新中心用戶運(yùn)營(yíng)經(jīng)理
張馨心 中國(guó)移動(dòng)智慧家庭運(yùn)營(yíng)中心具身智能產(chǎn)業(yè)創(chuàng)新中心運(yùn)營(yíng)支撐經(jīng)理
高晗 中國(guó)移動(dòng)智慧家庭運(yùn)營(yíng)中心具身智能產(chǎn)業(yè)創(chuàng)新中心算法研發(fā)
審核:
程寶平,中國(guó)移動(dòng)首席專家、中國(guó)移動(dòng)智慧家庭運(yùn)營(yíng)中心具身智能產(chǎn)業(yè)創(chuàng)新中心總經(jīng)理
鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如作者信息標(biāo)記有誤,請(qǐng)第一時(shí)間聯(lián)系我們修改或刪除,多謝。