智象未來攜手諾亦騰機(jī)器人，共創(chuàng)具身智能數(shù)據(jù)新范式

本文作者：鄭佳美

2026-03-30 15:04

導(dǎo)語：共筑具身智能數(shù)據(jù)新范式?。

近日，智象未來（HiDream.ai）與諾亦騰機(jī)器人（Noitom Robotics）宣布正式達(dá)成戰(zhàn)略合作，雙方將在高質(zhì)量、規(guī)?；呱碇悄芤曨l數(shù)據(jù)的生成上展開深度合作，從而開啟拓寬具身智能行業(yè)數(shù)據(jù)入口的全新模式探索。

高可用的訓(xùn)練數(shù)據(jù)是目前發(fā)展迅猛的具身智能產(chǎn)業(yè)的瓶頸。不同于大語言模型可海量獲取文本數(shù)據(jù)，具身智能需整合視覺、運(yùn)動(dòng)、觸覺等多模態(tài)數(shù)據(jù)，傳統(tǒng)采集成本高效率低，合成數(shù)據(jù)因此成為關(guān)鍵。隨著產(chǎn)業(yè)爆發(fā)，訓(xùn)練數(shù)據(jù)正從小體量演示轉(zhuǎn)向大體量、可規(guī)模化交付的需求，數(shù)據(jù)的獲取、結(jié)構(gòu)化與工程化能力，正決定系統(tǒng)上限。

基于這一判斷，智象未來攜手諾亦騰機(jī)器人，將多模態(tài)大模型的毫米級(jí)可控視頻生成能力與真實(shí)數(shù)據(jù)基礎(chǔ)設(shè)施結(jié)合，以“真實(shí)數(shù)據(jù)+生成式視頻數(shù)據(jù)”融合，預(yù)計(jì)雙方年內(nèi)合作生成的具身智能視頻數(shù)據(jù)將達(dá)到數(shù)萬小時(shí)以上，這將開辟出可規(guī)?；?yīng)行業(yè)亟需的高質(zhì)量具身訓(xùn)練數(shù)據(jù)的全新路徑。

儀式現(xiàn)場(chǎng)，諾亦騰機(jī)器人創(chuàng)始人兼首席執(zhí)行官戴若犁、智象未來創(chuàng)始人兼首席執(zhí)行官梅濤等共同出席，見證了這一重要時(shí)刻。

諾亦騰機(jī)器人：構(gòu)筑具身智能數(shù)據(jù)底座

諾亦騰機(jī)器人是一家面向具身智能與人形機(jī)器人產(chǎn)業(yè)的數(shù)據(jù)公司。公司以“數(shù)據(jù)”為核心交付界面，基于高精度人體動(dòng)作捕捉與多模態(tài)數(shù)據(jù)采集能力，為機(jī)器人企業(yè)、具身智能模型團(tuán)隊(duì)等提供高質(zhì)量、可規(guī)?；挠?xùn)練數(shù)據(jù)與相關(guān)基礎(chǔ)設(shè)施能力。隨著具身智能產(chǎn)業(yè)加速發(fā)展，高質(zhì)量、多模態(tài)的訓(xùn)練數(shù)據(jù)正在成為推動(dòng)行業(yè)進(jìn)步的關(guān)鍵基礎(chǔ)要素。基于對(duì)具身智能發(fā)展路徑與數(shù)據(jù)瓶頸的判斷，諾亦騰機(jī)器人從數(shù)據(jù)基礎(chǔ)設(shè)施這一底層環(huán)節(jié)切入，專注構(gòu)建面向產(chǎn)業(yè)的技術(shù)與平臺(tái)能力，推動(dòng)具身智能從“數(shù)據(jù)獲取”走向“數(shù)據(jù)工程化與體系化”。

諾亦騰機(jī)器人聯(lián)合創(chuàng)始人、首席科學(xué)家韓磊博士表示：“具身智能的發(fā)展，本質(zhì)上是一個(gè)以數(shù)據(jù)為核心驅(qū)動(dòng)的系統(tǒng)工程。單一來源的數(shù)據(jù)難以支撐模型在復(fù)雜物理世界中的泛化能力。我們希望通過與智象未來的合作，將真實(shí)世界中高精度采集的人類動(dòng)作數(shù)據(jù)，與可規(guī)?；傻亩鄻踊曨l數(shù)據(jù)相結(jié)合，構(gòu)建兼具真實(shí)性與多樣性的訓(xùn)練數(shù)據(jù)體系。這將有助于突破當(dāng)前數(shù)據(jù)規(guī)模與質(zhì)量之間的瓶頸，加速具身智能模型從‘可用’走向‘好用’?！?/p>

智象未來：用毫米級(jí)高可控視頻大模型打開具身智能數(shù)據(jù)入口

作為全球領(lǐng)先的多模態(tài)生成式人工智能企業(yè)，智象未來專注底層架構(gòu)的持續(xù)創(chuàng)新，在生成質(zhì)量、語義理解與藝術(shù)表現(xiàn)力上不斷突破邊界，定義行業(yè)新標(biāo)桿。在本次合作中，智象未來充分發(fā)揮其領(lǐng)先的高可控視頻生成技術(shù)，將利用高精度動(dòng)作捕捉設(shè)備采集的原始傳感數(shù)據(jù)進(jìn)行了百倍以上的精細(xì)化放大。這一過程并非簡單的素材堆砌，而是通過可控視頻生成技術(shù)將精準(zhǔn)的動(dòng)作指令與極其豐富的視覺場(chǎng)景深度融合，它不僅賦予了具身智能訓(xùn)練數(shù)據(jù)在場(chǎng)景、光影變化及人體形態(tài)膚色上的超高復(fù)雜度，更確保了生成的每一幀視頻與底層操作數(shù)據(jù)之間的精準(zhǔn)配對(duì)。

智象未來聯(lián)合創(chuàng)始人兼 CTO 姚霆博士表示：“普通的通用視頻生成模型通常是為了好看，容易產(chǎn)生幻覺或物理不一致。為了讓生成的視頻數(shù)據(jù)能夠達(dá)到具身智能產(chǎn)業(yè)需求的物理一致性，我們基于智象自研的多模態(tài)大模型，對(duì)傳感動(dòng)捕設(shè)備采集的數(shù)據(jù)進(jìn)行了高可控性的生成式優(yōu)化，使之更加符合具身智能企業(yè)進(jìn)行高精度訓(xùn)練的要求。這種‘?dāng)?shù)據(jù)煉金術(shù)’打破了傳統(tǒng)動(dòng)捕數(shù)據(jù)的局限，為具身智能的進(jìn)化提供了取之不盡的高質(zhì)量‘燃料’?！?/p>

合作展望：共筑具身智能數(shù)據(jù)新范式

未來，雙方將圍繞高質(zhì)量底層數(shù)據(jù)構(gòu)建、VLA 模型規(guī)?；葸M(jìn)，以及視頻建模與動(dòng)作預(yù)測(cè)協(xié)同驅(qū)動(dòng)的世界模型展開全方位的深度合作。

智象未來將發(fā)揮多模態(tài)大模型的零樣本生成優(yōu)勢(shì)，攜手諾亦騰機(jī)器人對(duì)高精度多模態(tài) Human-centric 數(shù)據(jù)進(jìn)行規(guī)模化擴(kuò)展與視覺精細(xì)度增強(qiáng)；諾亦騰機(jī)器人將利用其高精度動(dòng)作捕捉與多模態(tài)數(shù)據(jù)基礎(chǔ)設(shè)施，為模型提供真實(shí)精準(zhǔn)的物理反饋數(shù)據(jù)。雙方將攜手構(gòu)建從虛擬生成到物理驗(yàn)證的完整數(shù)據(jù)閉環(huán)，共同加速具身智能時(shí)代的到來。

智象未來攜手諾亦騰機(jī)器人，共創(chuàng)具身智能數(shù)據(jù)新范式