近日,深圳留形科技有限公司(以下簡稱“留形科技”)宣布完成數(shù)千萬元Pre-A輪融資,投資方包括弘毅投資等著名投資機構,此前,公司還曾獲得真格基金種子輪投資,以及君盛投資的天使輪投資。據(jù)了解,留形科技成立于2022年,該公司的智能三維感知和重建算法可以賦予機器人等具身智能設備空間感知、智能記憶及主動交互能力。
機器人三維空間感知的重要性
據(jù)了解,空間感知是機器人在非結構化環(huán)境中實現(xiàn)自主決策的關鍵能力,它決定了機器人是不是“只會看”,還是能“看得懂、記得住、認得清”。具體來說,人形機器人要模仿人在空間中執(zhí)行任務,就必須感知、理解和記憶真實世界中的復雜環(huán)境,空間感知能力解決的是“認知”和“執(zhí)行”的連接問題。
留形科技CTO徐威表示,很多機器人能做動作,但做不到“自主判斷”。比如說去取外賣時,機器人需要識別門的位置、判斷電梯在哪、是否有人、怎么走最短的路,下了樓還能識別出哪個柜子是“自己的目標”,這些都需要實時構建空間模型并作出判斷。沒有空間感知,它就只能“看得見但看不懂,走得動走不對”??臻g感知能力就是讓它具備這樣的環(huán)境理解和操作規(guī)劃的基礎。
賽迪智庫產(chǎn)業(yè)政策研究所助理研究員李陳表示,傳統(tǒng)機器人依賴預設地圖或固定路徑,難以應對突發(fā)狀況。而三維感知技術通過實時生成厘米級精度的三維點云地圖,結合IMU慣性測量單元實現(xiàn)時空同步,使機器人能動態(tài)識別障礙物、狹窄通道和可通行區(qū)域。此外,傳統(tǒng)機器人依賴“傳感器+控制器”的分離式架構,而三維感知技術通過多傳感器深度融合和邊緣計算能力,實現(xiàn)了“感知-計算-執(zhí)行”的一體化。綜合來看,通過將環(huán)境信息轉化為可計算的結構化數(shù)據(jù),空間感知技術不僅賦予機器人物理世界的“認知地圖”,更通過多模態(tài)數(shù)據(jù)融合構建起深度理解能力,使人形機器人從“程序化執(zhí)行”邁向“類人交互”。
“通過精準感知和識別所處環(huán)境的三維結構、動態(tài)變化及物體狀態(tài),機器人能夠在坡面、不平整地面、樓梯等復雜地形中實現(xiàn)穩(wěn)定自主運動與路徑規(guī)劃,同時準確識別任務對象的位置與形態(tài)變化,助力完成抓取、搬運等操作任務。這一能力不僅提升了機器人在復雜環(huán)境中的導航穩(wěn)定性與交互準確性,還顯著降低了其對陌生環(huán)境的適應難度和重復學習成本,為實現(xiàn)智能泛化提供了堅實支撐?!盜DC中國研究經(jīng)理李君蘭說
而這一能力的獲得將給機器人行業(yè)帶來巨大改變。
徐威稱,從行業(yè)角度看,空間感知是實現(xiàn)“機器人從實驗室走向真實場景”的關鍵一步,尤其是在建筑測繪、工業(yè)巡檢、機器人導航與數(shù)字孿生等領域。如果機器人不具備一定的空間感知和記憶能力,它們就只能依賴提前設定的路徑規(guī)劃或人為控制,無法適應動態(tài)、真實的場景。
李君蘭認為,當前,AI大模型正加速推動機器人邁向具身智能,但機器人在智能泛化方面亟待突破。作為“感知–學習–決策–執(zhí)行”閉環(huán)中的核心環(huán)節(jié),空間感知技術正在成為實現(xiàn)環(huán)境理解、任務泛化與人機協(xié)同的關鍵突破口。它為機器人賦能路徑規(guī)劃、目標識別等核心能力,推動其從結構化環(huán)境走向復雜、多變的開放場景,并進一步加快具身智能的演進與應用落地。
三維空間感知能力如何實現(xiàn)
此前,機器人空間感知能力主要依賴導航定位、視覺與激光雷達等方案,但其有明顯不足:GPS信號無法在室內環(huán)境中穩(wěn)定接收;UWB、藍牙等室內定位技術需提前布設基礎設施,部署過程復雜且成本高昂;視覺與激光雷達方案泛化性弱,難以應對多變復雜環(huán)境,導致機器人在導航過程中頻繁出現(xiàn)感知誤差、定位失準甚至作業(yè)停滯。
而智能三維感知和重建則通過激光雷達、深度相機、IMU等多傳感器融合的方式,賦予機器人實時構建環(huán)境三維模型、精準定位及動態(tài)避障的能力。
據(jù)徐威介紹,這項技術的難點主要在于多傳感器融合。如果把機器人比作人類,大腦能自然整合來自眼睛、耳朵和身體的各種感知信息,但機器人卻要靠攝像頭、深度傳感器、IMU等“器官”各自工作,再通過算法把它們統(tǒng)一到一個“腦中地圖”里。這些傳感器采樣頻率不同、數(shù)據(jù)維度也不一樣,想讓機器人“看得懂、走得對”,就必須解決時間同步、空間配準、數(shù)據(jù)融合和實時建圖等一整套復雜問題。
李陳也表示,難點首先是多模態(tài)數(shù)據(jù)融合難題,需解決傳感器時空同步、異構數(shù)據(jù)對齊及決策沖突問題,不同傳感器的數(shù)據(jù)存在時空錯位與噪聲干擾,相機、IMU、激光雷達等多傳感器數(shù)據(jù)因采樣頻率差異導致融合失真;其次是復雜場景泛化不足,當前大部分訓練數(shù)據(jù)集中于工廠等標準化場景,家庭、災害現(xiàn)場等非結構化環(huán)境任務成功率較低,動態(tài)光照、強磁干擾等仍挑戰(zhàn)3D重建準確性。
據(jù)介紹,留形科技已有比較完整的技術儲備,此前推出了全球首款千元級空間記憶模組Odin1,這塊巴掌大的模組集成了其自研的MindSLAM?算法和多傳感器前融合架構,集成了SPAD dTOF深度模組、高分辨率彩色相機及IMU(慣性測量單元),可實現(xiàn)多傳感器數(shù)據(jù)的原生時空同步,確保不同傳感器數(shù)據(jù)在采集時的高度一致性與精準匹配。目前,留形科技已同多家頭部機器人廠商展開深入合作,留形Odin1計劃于今年7月正式進入量產(chǎn)階段,并將同步布局全球市場。
需要注意的是,除了技術難題,該項技術還面臨另一些棘手問題,這包括成本控制(如高性能傳感器成本高)、材料與供應鏈不穩(wěn)定、缺乏統(tǒng)一標準、用戶隱私顧慮以及生態(tài)配套不完善等挑戰(zhàn)。
李陳表示,我國在應用創(chuàng)新層面領先,但基礎硬件仍存代差。與國際領先對比,我國在中低端市場已實現(xiàn)進口替代,且在結構光、雙目視覺等特定領域技術領先,本土企業(yè)已在工業(yè)檢測、支付系統(tǒng)等場景實現(xiàn)規(guī)?;瘧谩5诨A算法創(chuàng)新與高端傳感器、感光芯片等硬件研發(fā)領域仍需突破。高精度三維重建需強大算力支持,人形機器人、自動駕駛等領域所使用的高端ToF傳感器單價超千元,制約消費級應用。
友情鏈接: 政府 高新園區(qū)合作媒體
Copyright 1999-2024 中國高新網(wǎng)chinahightech.comAll Rights Reserved.京ICP備14033264號-5
電信與信息服務業(yè)務經(jīng)營許可證060344號主辦單位:《中國高新技術產(chǎn)業(yè)導報》社有限責任公司