蕪湖2025年7月29日 /美通社/ -- 近日 AiMOGA墨甲機(jī)器人墨茵(Mornine)在真實(shí)4S店環(huán)境中成功完成"自主開車門"操作,成為業(yè)內(nèi)首個(gè)實(shí)現(xiàn)此項(xiàng)復(fù)雜物理交互任務(wù)的具身智能機(jī)器人。這一突破不僅標(biāo)志著具身智能從實(shí)驗(yàn)室走向真實(shí)世界,更為服務(wù)型人形機(jī)器人的商業(yè)化部署奠定了關(guān)鍵技術(shù)基礎(chǔ)。
在機(jī)器人行業(yè)中,看似簡(jiǎn)單的"開車門"動(dòng)作,實(shí)則對(duì)機(jī)器人感知、規(guī)劃與控制能力提出了極高要求。墨甲團(tuán)隊(duì)在不斷的工程試錯(cuò)與算法迭代中,攻克了感知融合、全身控制、上下肢協(xié)同等多個(gè)技術(shù)難點(diǎn),最終讓墨茵具備了在非結(jié)構(gòu)化場(chǎng)景中,自主識(shí)別車門、調(diào)整站位、協(xié)調(diào)動(dòng)作、拉開車門的能力。
打破"預(yù)設(shè)指令"邊界,實(shí)現(xiàn)端到端閉環(huán)控制
傳統(tǒng)機(jī)器人執(zhí)行任務(wù)常需依賴分步驟指令或遠(yuǎn)程操控,而墨茵采用端到端閉環(huán)控制架構(gòu),實(shí)現(xiàn)了隱空間層面的"感知-規(guī)劃-執(zhí)行"的流暢融合。以3D激光雷達(dá)、深度相機(jī)、廣角相機(jī)等多模態(tài)傳感器為基礎(chǔ),輔以視覺(jué)基礎(chǔ)模型(Visual Foundation Model),構(gòu)建起完整的環(huán)境與自身狀態(tài)感知模型,并借助Chery大模型進(jìn)行語(yǔ)義理解與任務(wù)生成。
當(dāng)面對(duì)不同車型門把手或突發(fā)阻力時(shí),墨茵能實(shí)時(shí)調(diào)整路徑、姿態(tài)和發(fā)力方式。這種仿佛"本能反應(yīng)(System 1)"的執(zhí)行機(jī)制,使機(jī)器人真正具備了面對(duì)動(dòng)態(tài)環(huán)境的即刻決策與動(dòng)作調(diào)控能力。
強(qiáng)化學(xué)習(xí)賦能,自主識(shí)別"門把手"目標(biāo)
此次"開車門"能力并非靠人工示教,而是通過(guò)數(shù)百萬(wàn)次虛擬訓(xùn)練迭代完成。在訓(xùn)練中,機(jī)器人僅接收到"成功抓住門把手"這一獎(jiǎng)勵(lì)信號(hào),卻在反復(fù)試驗(yàn)過(guò)程中自主聚焦了門把手區(qū)域。
"我們其實(shí)從未明確告訴機(jī)器人‘門把手'是什么,但它最終靠自己學(xué)會(huì)了抓住目標(biāo)。"研發(fā)人員表示。這種能力,正是端到端強(qiáng)化學(xué)習(xí)在真實(shí)世界中的落地體現(xiàn)。
上下肢協(xié)同,打造"擬人式"動(dòng)作鏈條
為應(yīng)對(duì)車門阻力與抓握穩(wěn)定性挑戰(zhàn),墨茵采用"flow-based motion(流動(dòng)式動(dòng)作機(jī)制)"。在開門過(guò)程中,機(jī)器人不僅由手臂發(fā)力,更通過(guò)腿部與腰部姿態(tài)調(diào)整形成全身配合,模擬出類似"太極推手"的發(fā)力結(jié)構(gòu)。
項(xiàng)目初期團(tuán)隊(duì)嘗試過(guò)僅靠上肢發(fā)力拉門,但機(jī)器人經(jīng)常被車門"拽走"。最終通過(guò)強(qiáng)化手部結(jié)構(gòu)、增加腳底防滑、設(shè)定合理姿態(tài)與站位精度要求,并同步優(yōu)化控制模型、增強(qiáng)動(dòng)作執(zhí)行過(guò)程中的數(shù)據(jù)反饋機(jī)制和策略更新能力,逐步實(shí)現(xiàn)穩(wěn)定開門動(dòng)作。"從失敗無(wú)數(shù)次,到第一次拉開車門,那一刻我們知道這事成了。"研發(fā)團(tuán)隊(duì)成員回憶道。
Sim2Real遷移,構(gòu)建從虛擬到現(xiàn)實(shí)的落地閉環(huán)
訓(xùn)練完成后的模型通過(guò)Sim2Real技術(shù)平滑遷移至實(shí)體機(jī)器人,使虛擬世界中形成的策略能夠真實(shí)應(yīng)用。部署過(guò)程中,機(jī)器人還能收集環(huán)境反饋數(shù)據(jù),回流訓(xùn)練系統(tǒng)用于模型增強(qiáng),形成數(shù)據(jù)閉環(huán)。
這一"預(yù)訓(xùn)練-現(xiàn)實(shí)強(qiáng)化-端到端控制"的完整路徑,被廣泛認(rèn)為是當(dāng)前機(jī)器人行業(yè)中最具通用性與可擴(kuò)展性的技術(shù)范式。
落地4S店,服務(wù)真實(shí)用戶場(chǎng)景
目前,墨茵已在奇瑞多家4S店試點(diǎn)部署,承擔(dān)智能接待、產(chǎn)品講解、遞送物品等工作。"開車門"不僅是技術(shù)突破,更是其作為"智能銷售助理"角色的核心能力。
未來(lái),墨甲將繼續(xù)在汽車場(chǎng)景中深耕數(shù)據(jù)積累,優(yōu)化模型泛化能力。面對(duì)不同門把手、環(huán)境光照、開關(guān)阻力等變量,機(jī)器人將不斷進(jìn)化,實(shí)現(xiàn)分鐘級(jí)生成新動(dòng)作策略,極大降低新任務(wù)研發(fā)周期。
"我們今天在4S店打開的是一扇車門,未來(lái)希望能讓機(jī)器人走進(jìn)千家萬(wàn)戶,打開更多場(chǎng)景的‘服務(wù)之門'。"從構(gòu)想到現(xiàn)實(shí),從實(shí)驗(yàn)室到真實(shí)商業(yè)空間,墨甲墨茵以"開車門"為標(biāo)志,完成了具身智能機(jī)器人商業(yè)化的重要跳躍。行業(yè)首例的全自主物理交互,不僅展現(xiàn)了墨甲在多模態(tài)感知、上下肢協(xié)同、端到端控制等方面的深厚積累,更為"人形機(jī)器人+汽車"的融合應(yīng)用開啟了新范式。