浙江特级黄色A大片|国产欧美日韩在线激情|成人免费久久超碰手机在线|欧美色星在线视频在线|激情综合啪啪欧美一黄片|久草av电影性无码欧美|免费国产亚洲视频|国产一级黄色a片|全球成人亮清视频一区二区三区|日韩一级成人黄色毛片

每日經濟新聞
要聞

每經網首頁 > 要聞 > 正文

人形機器人面臨“現實落差”訓練瓶頸 智元發(fā)布真實世界持續(xù)學習系統(tǒng)

2026-01-06 20:43:38

每經記者|朱成祥    每經編輯|黃博文    

1月6日,智元在官方公眾號發(fā)布SOP(英文全稱為Scalable Online Post-training,指一套面向真實世界部署的在線后訓練系統(tǒng))。

智元相關負責人告訴《每日經濟新聞》記者,這是為了讓人形機器人在真實世界里持續(xù)進化。

一直以來,人形機器人行業(yè)對選用何種類型數據進行訓練存在爭議。有廠商使用模擬仿真工具進行訓練,也有廠商選用真機進行訓練。后者的訓練方式一度被業(yè)內詬病,認為缺乏真實場景的訓練,即訓練出來的人形機器人無法部署于真實場景。

簡而言之,使用實驗室中真機收集的數據進行訓練,人形機器人看似都能完成被布置的任務,但在實際使用中往往“手足無措”。

此次智元發(fā)布SOP框架,或有助于其補足關于真實場景的數據。

智元表示,現有VLA(視覺、語言、動作)預訓練模型已經提供了強大的通用性。然而,真實世界的部署受困于更高的任務專精度要求,以及離線數據采集方式的邊際效益遞減,往往需要通過后訓練獲得更高的任務成功率。遺憾的是,當前主流的VLA后訓練方法仍受離線、單機、串行采集等因素制約,難以支撐高效、持續(xù)的真實世界學習。這些限制并非源自具體算法,而是來自學習范式本身。

因此,智元推出SOP框架的核心目標是讓機器人在真實世界中實現分布式、持續(xù)的在線學習。

關于SOP框架的效果,智元表示,SOP讓多任務通才的性能普遍提升。

此外,在預訓練出現邊際效應遞減的背景下,SOP將有助于突破VLA的性能瓶頸。智元表示,SOP在三小時的在軌經驗下就獲得了約30%的性能提升,而80小時額外人類專家數據只帶來了4%的提升。


封面圖片來源:圖片來源:每經原創(chuàng)

如需轉載請與《每日經濟新聞》報社聯(lián)系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現在本站,可聯(lián)系我們要求撤下您的作品。

歡迎關注每日經濟新聞APP

每經經濟新聞官方APP

0

0