6月24日,紅星新聞記者從成都人形機器人創新中心了解到,該中心近日發布了中國首個基于視覺擴散架構的人形機器人任務生成式模型R-DDPRM(Raydiculous-Denoise Diffusion Probabilistic Robot Model)。
“大家所熟知的文生視頻模型OpenAI SORA、SVD,文生圖模型SD,OpenAI Dall-E等業界知名模型,就是基于擴散架構的垂直模型。”張睿睿介紹,這些模型都擁有強大的理解、推理和生成能力。擴散架構應用于人形機器人核心技術研發,將重構人形機器人底層架構,釋放人形機器人的決策技能,使其在操縱和泛化方面達到前所未有的高度。他稱,目前全球范圍內僅有少數人形機器人團隊發布相關階段性成果。
據介紹,目前業界的人形機器人任務生成式模型主要基于VAE、AC Transformer、LSTM等架構,這類架構下的人形機器人通常在規劃動作時考慮單一約束類型,例如物體抓持穩定性或規避障礙物路徑規劃,這就需要針對每種細分情況都要對應開發和執行一系列單獨的垂直模型(并聯線性),遇到執行問題需要局部調整試錯來緩慢推進任務進程,推理效率低、執行速度慢且大量消耗算力。R-DDPRM模型的創新之處在于能夠讓人形機器人跨越多個約束進行泛化,創造了真正的人形機器人“大腦”——能夠毫不猶豫“絲滑”地處理各種復雜任務。
張睿睿表示,該模型具有同時確定拿起物體的最佳抓持位姿、移動物體最佳路線、能耗最少最佳等多要素全局規劃思維能力,并能在人為破壞任務進程時迅速進行決策修正和調整執行方式,接續完成任務。該模型的泛化能力能讓人形機器人自主流暢地完成各種復雜任務。
據了解,成都人形機器人創新中心是我國中西部地區首個人形機器人創新中心,是四川省人工智能一號創新工程的首個原點項目,致力于打造具有國際領先水平的“有腦子”的人形機器人。
——信息來自:紅星新聞