行業(yè)首例｜墨甲機(jī)器人成功完成"自主開車門"操作

AiMOGA墨甲機(jī)器人

2025-07-29 09:44 1054

蕪湖2025年7月29日 /美通社/ -- 近日 AiMOGA墨甲機(jī)器人墨茵（Mornine）在真實(shí)4S店環(huán)境中成功完成"自主開車門"操作，成為業(yè)內(nèi)首個(gè)實(shí)現(xiàn)此項(xiàng)復(fù)雜物理交互任務(wù)的具身智能機(jī)器人。這一突破不僅標(biāo)志著具身智能從實(shí)驗(yàn)室走向真實(shí)世界，更為服務(wù)型人形機(jī)器人的商業(yè)化部署奠定了關(guān)鍵技術(shù)基礎(chǔ)。

在機(jī)器人行業(yè)中，看似簡(jiǎn)單的"開車門"動(dòng)作，實(shí)則對(duì)機(jī)器人感知、規(guī)劃與控制能力提出了極高要求。墨甲團(tuán)隊(duì)在不斷的工程試錯(cuò)與算法迭代中，攻克了感知融合、全身控制、上下肢協(xié)同等多個(gè)技術(shù)難點(diǎn)，最終讓墨茵具備了在非結(jié)構(gòu)化場(chǎng)景中，自主識(shí)別車門、調(diào)整站位、協(xié)調(diào)動(dòng)作、拉開車門的能力。

墨茵自主打開車門

打破"預(yù)設(shè)指令"邊界，實(shí)現(xiàn)端到端閉環(huán)控制

傳統(tǒng)機(jī)器人執(zhí)行任務(wù)常需依賴分步驟指令或遠(yuǎn)程操控，而墨茵采用端到端閉環(huán)控制架構(gòu)，實(shí)現(xiàn)了隱空間層面的"感知-規(guī)劃-執(zhí)行"的流暢融合。以3D激光雷達(dá)、深度相機(jī)、廣角相機(jī)等多模態(tài)傳感器為基礎(chǔ)，輔以視覺(jué)基礎(chǔ)模型（Visual Foundation Model），構(gòu)建起完整的環(huán)境與自身狀態(tài)感知模型，并借助Chery大模型進(jìn)行語(yǔ)義理解與任務(wù)生成。

當(dāng)面對(duì)不同車型門把手或突發(fā)阻力時(shí)，墨茵能實(shí)時(shí)調(diào)整路徑、姿態(tài)和發(fā)力方式。這種仿佛"本能反應(yīng)(System 1)"的執(zhí)行機(jī)制，使機(jī)器人真正具備了面對(duì)動(dòng)態(tài)環(huán)境的即刻決策與動(dòng)作調(diào)控能力。

強(qiáng)化學(xué)習(xí)賦能，自主識(shí)別"門把手"目標(biāo)

此次"開車門"能力并非靠人工示教，而是通過(guò)數(shù)百萬(wàn)次虛擬訓(xùn)練迭代完成。在訓(xùn)練中，機(jī)器人僅接收到"成功抓住門把手"這一獎(jiǎng)勵(lì)信號(hào)，卻在反復(fù)試驗(yàn)過(guò)程中自主聚焦了門把手區(qū)域。

"我們其實(shí)從未明確告訴機(jī)器人‘門把手'是什么，但它最終靠自己學(xué)會(huì)了抓住目標(biāo)。"研發(fā)人員表示。這種能力，正是端到端強(qiáng)化學(xué)習(xí)在真實(shí)世界中的落地體現(xiàn)。

注意力熱力圖

強(qiáng)化學(xué)習(xí)訓(xùn)練后模型自發(fā)聚焦門把手區(qū)域

上下肢協(xié)同，打造"擬人式"動(dòng)作鏈條

為應(yīng)對(duì)車門阻力與抓握穩(wěn)定性挑戰(zhàn)，墨茵采用"flow-based motion（流動(dòng)式動(dòng)作機(jī)制）"。在開門過(guò)程中，機(jī)器人不僅由手臂發(fā)力，更通過(guò)腿部與腰部姿態(tài)調(diào)整形成全身配合，模擬出類似"太極推手"的發(fā)力結(jié)構(gòu)。

項(xiàng)目初期團(tuán)隊(duì)嘗試過(guò)僅靠上肢發(fā)力拉門，但機(jī)器人經(jīng)常被車門"拽走"。最終通過(guò)強(qiáng)化手部結(jié)構(gòu)、增加腳底防滑、設(shè)定合理姿態(tài)與站位精度要求，并同步優(yōu)化控制模型、增強(qiáng)動(dòng)作執(zhí)行過(guò)程中的數(shù)據(jù)反饋機(jī)制和策略更新能力，逐步實(shí)現(xiàn)穩(wěn)定開門動(dòng)作。"從失敗無(wú)數(shù)次，到第一次拉開車門，那一刻我們知道這事成了。"研發(fā)團(tuán)隊(duì)成員回憶道。

Sim2Real遷移，構(gòu)建從虛擬到現(xiàn)實(shí)的落地閉環(huán)

訓(xùn)練完成后的模型通過(guò)Sim2Real技術(shù)平滑遷移至實(shí)體機(jī)器人，使虛擬世界中形成的策略能夠真實(shí)應(yīng)用。部署過(guò)程中，機(jī)器人還能收集環(huán)境反饋數(shù)據(jù)，回流訓(xùn)練系統(tǒng)用于模型增強(qiáng)，形成數(shù)據(jù)閉環(huán)。

這一"預(yù)訓(xùn)練-現(xiàn)實(shí)強(qiáng)化-端到端控制"的完整路徑，被廣泛認(rèn)為是當(dāng)前機(jī)器人行業(yè)中最具通用性與可擴(kuò)展性的技術(shù)范式。

機(jī)器人墨茵使用VLM模型和廣角攝像頭實(shí)時(shí)判斷車門打開狀態(tài)

落地4S店，服務(wù)真實(shí)用戶場(chǎng)景

目前，墨茵已在奇瑞多家4S店試點(diǎn)部署，承擔(dān)智能接待、產(chǎn)品講解、遞送物品等工作。"開車門"不僅是技術(shù)突破，更是其作為"智能銷售助理"角色的核心能力。

未來(lái)，墨甲將繼續(xù)在汽車場(chǎng)景中深耕數(shù)據(jù)積累，優(yōu)化模型泛化能力。面對(duì)不同門把手、環(huán)境光照、開關(guān)阻力等變量，機(jī)器人將不斷進(jìn)化，實(shí)現(xiàn)分鐘級(jí)生成新動(dòng)作策略，極大降低新任務(wù)研發(fā)周期。

"我們今天在4S店打開的是一扇車門，未來(lái)希望能讓機(jī)器人走進(jìn)千家萬(wàn)戶，打開更多場(chǎng)景的‘服務(wù)之門'。"從構(gòu)想到現(xiàn)實(shí)，從實(shí)驗(yàn)室到真實(shí)商業(yè)空間，墨甲墨茵以"開車門"為標(biāo)志，完成了具身智能機(jī)器人商業(yè)化的重要跳躍。行業(yè)首例的全自主物理交互，不僅展現(xiàn)了墨甲在多模態(tài)感知、上下肢協(xié)同、端到端控制等方面的深厚積累，更為"人形機(jī)器人+汽車"的融合應(yīng)用開啟了新范式。

消息來(lái)源：AiMOGA墨甲機(jī)器人