人類對于人形機器人的想象一直在變。
1984年,科幻迷卡梅隆把自己的一個夢境搬進電影,開創了《終結者》時代,施瓦辛格扮演的人形機器人鋼筋鐵骨,飛天遁地。
2009年,卡梅隆再次圓夢,在《阿凡達》中塑造了“腦機接口”的新機器人,將人類智力注入遙控的生物身體中,下身癱瘓的前海軍戰士通過頭戴式設備,操控人造的混血機器人阿凡達。
他指出了人與機器人,在未來世界共存的另一種可能性。
時間來到2021年,特斯拉首次亮相了人形機器人“擎天柱”Optimus,2022年,雷軍在個人年度演講中拋出王炸“全尺寸仿生人形機器人CyberOne”,它具有聰明的“大腦”、發達的“小腦”、強健的“四肢”。
事實上,人型機器人除了擁有類人的外形外觀、感覺系統、智能思維方式以外,還具備控制系統和決策能力,最終表現“行為類人”。
在應用場景上,除了個人/家庭機器人(輔助吸塵、地板清潔、草坪修剪、游泳池清潔、窗戶清潔、家庭安全等)、娛樂休閑機器人(用于滿足情感需求、教育、陪伴等),還包括商業機器人,其應用場景主要包括醫療、物流、農業和其他(包括國防、公共關系等)。
簡單來說,主要分為商用場景和個人/家庭應用場景兩大類。
以其中的服務型機器人為例。
根據中國電子學會的調研,其全球市場規模到 2022 年底預計就將達 159.9 億美元。而在我國,由于人口老齡化趨勢的不斷發展,服務型全尺寸人型機器人在醫療和公共衛生領域的需求,也將持續保持旺盛的上升勢頭。
在使用場景足夠廣泛的背景下,人型機器人似乎已經成為了當下資本企圖涉足的領域。但需要注意的是,從核心技術來看,人型機器人的“攻城略地”才剛剛開始。
一、人型機器人成熟了嗎?
在智能領域,人型機器人被譽為AI的終極形態。
在早前的8月份,2022世界機器人博覽會在北京亦創國際會展中心舉辦,共有130余家企業帶來的500余件展品,有30余款全球首發新品在現場集中發布。
而這場博覽會主要是以應用需求端為導向,采用“機器人+應用場景”的展覽模式,策劃了“機器人+醫療”、“機器人+物流”、“機器人+商用”、“機器人+農業”、“機器人+建筑”、“機器人+制造”、“機器人+礦山”等專區,匯聚各類場景下的前沿機器人產品。
往更具體的方向來說,人型機器人分為以高精度、穩定性為核心要素的工業機器人、以人機交互為核心的協作機器人、替代復雜重復性工作的服務機器人。
就拿Atias、Digit、Walker、Optimus四款機器人分析。
其中,Atlas采用的是液壓驅動的控制方法,追求運動能力上的極致,主要作為科研平臺,長期則期望在軍事領域發揮作用。與Atlas不同的是,Digit以電機驅動,并將重心上移,增加機器人負重,致力于物流“最后一公里”的配送應用。
而Walker同樣是電機驅動,并結合力控,讓機器人在B端與C端的環境中均能與人安全交互。就連即將發布的Tesla Bot也將走電機驅動的技術路線,擁有由Dojo超級計算機進行神經網絡自動訓練的“大腦”及人類級別的四肢,將在2023-2025年被首先用于造車場景。
值得注意的是,當下各大企業研發的人型機器人,整體更偏向于“工業化”方向。從某種角度來看,勞動力短缺的重工業領域,在需求量、價格等方面往往接受度更高。
但需要說明的是,人型機器人最后能否成功被不同領域所接受,智能化程度以及運動控制技術的發展具有關鍵的作用。
目前的人型機器人,在諸如生產機械臂裝配方面,幾乎都在使用著傳統的位置控制。
比較典型的就是:機器人沿著事先規劃好的軌跡在封閉、確認的空間中運動?;蛘咴谀承r候,機器人得到從視覺系統的反饋,這樣就能使得位置控制的機器人具備一定適應外界可變環境的能力。然而通過實際規劃軌跡運動的機器人仍然占大部分。
從長遠的角度來看,未來的機器人運動控制領域,必須引入力控,純位置控制是沒有前途的。
舉個例子,在重工業領域機器臂純位置控制是很難精確化的,最明顯的是在汽車外形不規則拋光、物品使用力度等制造場景上。
另一方面,人型機器人最終仍然需要往與人交互的層面上發展。也就是說,需要確保人型機器人在與人類做物理交互的安全,不能僅依靠純位置控制。
不過,目前國內的人型機器人大多數還處于初級階段,從功能上來看近似于一個會走路的智能音箱,象征意義比實用性大。同時,運動控制的價格占比也較高。
根據未來智庫數據顯示,在整個機器核心零部件生產成本方面,人形機器人中運動控制占比接近50%,其中減速器占比22%,伺服系統占比16%,控制器占比11%。
在運動控制技術之外,人型機器人對環境感知系統的要求同樣也極高。
目前市場上的機器人自由度在20-60個左右,靈活度相對而言并不算低。但人型機器人的自由度再高,沒有結合環境感知技術,是很難做到在與人交互時足夠的“擬人性”。
在環境感知技術層面上,無論是定位側重于情感識別與交互的小米CyberOne,或是偏向于工業化的特斯拉Optimus,仍然有待突破。
二、到底需要怎樣的機器人?
從掃地機器人一路發展到如今的人型機器人,在同樣能夠做一定家務的前提下,人們更需要一個多元化的人型機器人,具備陪伴、聊天、導盲、看護、娛樂、教育等能力已經成為了用戶對人型機器人的最終想象。
然而,現在的人型機器人領域遠不能夠達成用戶的需求。
原因在于,最終能夠起到決定機器人人機交互能力的,主要在于AI算法及軟件平臺能力。
目前,除了運動控制模塊受益于自動駕駛、工業機器人等領域的成熟應用外,環境感知也同樣得益于此,于是相關硬件商用化進程較快。
而在人機交互模塊,由于算法、算力的限制,在實際消費場景中,實現高效的人機智能交互還存在不小的難度。
小米CyberOne就是最好的例子。
雖然在機器視覺技術上,小米CyberOne搭載自研Mi-Sense深度視覺模組,結合AI交互算法,但小米CyberOne也僅僅是擁有簡單的空間感知能力,例如人物身份識別、手勢識別、表情識別。
即便是擁有極致運動控制性能的波士頓動力人形機器人Atlas,在聊天、逛街等方面,也仍然無法做得到。
另外更值得注意的是,在機器人領域進程中相對優越的Atlas,在發展過程中也仍然經歷了多次轉手,首先是被谷歌收購,到2017年又被轉手賣給日本軟銀,最后被韓國現代收入旗下。
一家美國軍方背景的公司最后硬是變成了全球跨國公司,歸根結底,還是人形機器人短期沒法商業化。
從這個層面講,現實與理想的差距是肉眼可見的,人形機器人和元宇宙一樣都還是“無源之水,無本之木”。
當然,僅是依靠片面的說詞并不能證明什么,或許從人型機器人在環境感應系統的發展看會更直觀一些。
環境感知系統包括視覺、聽覺、觸覺。
因為要模仿人,所以感知系統,是人形機器人的一個增量環節,包含著各類傳感器分支,對應的如攝像頭、激光雷達、溫度傳感器、氣味傳感器、聽覺傳感器等等。
其中,傳感器是服務機器人的重要部件。服務機器人的應用場景相對非標準化,要求對環境的感知能力,傳感器是其重要的部件之一。
雖然現階段傳感器的成熟度和豐富度已經很高了,但由于傳感器所輸出的信號也在一定程度上影響著視覺感知的識別結果。
直白一點說,在傳感器成熟度以外,能否實現精密操作執行將決定人形機器人應用前景。
這也就意味著,為了實現精密執行操作,機器人視覺感知技術在原來主要滿足避障、目標識別、路徑規劃等功能的基礎上,機器視覺模塊還要配合運動系統實現高精度估計和機械手的伺服控制。
原因很簡單,想要知道末端執行器相對于物體的三維位置,需要測量每個joint的角度利用正向運動學來計算,在一般的應用場景中,這個三維的位置被認為是己知的。
由此帶來的問題就是,機器人本身需要十分精確,這時就需要精確的傳感器將joint angle測量值反饋給控制器,我們需要很精確的正向運動學模型,來根據傳感器提供的角度得出此時末端執行器的位置,末端執行器的目標也需要被精確的放置在已知的三維位置上,以上任何一個環節出問題,都會導致誤差的出現。
為了得到精確的三維位置,未來多模態視覺感知或許有可能會成為滿足機器人視覺感知的不同需求。
但需要在任何狀態下都能夠獲取正確的正向運動模型,機器人就需要通過巨大的樣本量來進行深度學習,還要有海量的算力支持。
這不僅短時間內無法實現,也很難從價格上讓大量用戶所接受,產商盈利。
三、用戶和廠商之間沒有正比
根據方舟投資預計,到2025年,每臺工業機器人的成本將低于11,000美元,遠低于波士頓咨詢集團(BCG)的24,000美元左右的預期。
而該機構的分析基礎是摩爾定律更具準確性的萊特定律。即,生產單位數量每增加一倍,成本就會以固定百分比下降。
換個說法也就意味著在沒有徹底量產前,產品最終在性價比上很難形成競爭力。
即便假設隨著人型機器人技術的不斷提升攤薄成本,2025年的價格或許如方舟投資所預料一般。但如果僅僅是以當下分析,不到10萬元的人型機器人,還有一定的難度。
根據小米推出的CyberOne來看,研發涉及包含仿生感知認知技術、生機電融合技術、人工智能技術、大數據云計算技術、視覺導航技術等各領域的尖端技術,成本每臺大概六七十萬元,跟波士頓動力一樣,成本造價高。
另一方面,雖然2020年風險投資公司向機器人公司投入了63億美元中,但不少資金和關注都投擲在單任務機器人上,這些機器人是專門任務而設計的。
而單一任務機器人也可能效率低下,短時間內迫使企業不得不面臨著提高效率和節省成本的巨大壓力,而且經濟的未來又陷入了供應鏈挑戰和供需失衡等不確定性中,這些單一機器人構成的障礙,可能會多于其解決的問題。
誠然,這也就說明,一組可以做很多事情并靈活適應需求和工作流程的機器人,往往比單一用途機器人更有前途。
此外,相對于中小企業來說,機器人的成本仍然較高,中小企業規?;褂萌匀惠^為困難。
可以做一個簡單的預測,人型機器人第一批投入使用更多會偏向于無聊、單一的工業。
因為以目前智能家居讓人處于被動服務狀態來看,能夠完成感知用戶的狀態,識別用戶的意圖,學習用戶的習慣,通過IOT技術獲取環境以及設備的信息,提供主動服務的機器人時代還遠未到來。