2024年12月,趙明國在北京接受《環(huán)球人物》記者采訪。(本刊記者 楊皓/攝)
趙明國
清華大學自動化系研究員、機器人控制實驗室主任,2001年畢業(yè)于哈爾濱工業(yè)大學,主要從事人形機器人步態(tài)控制及無人駕駛自行車的研究。
2024年,入行的第二十四個年頭,趙明國經歷了人形機器人行業(yè)“被看見”的時刻。
“成果開始集中體現了?!壁w明國告訴《環(huán)球人物》記者:“有的人形機器人展示的是行動能力,走路更像人了;有的可以在超市完成各種抓取任務;有的可以遠程交互;有的可以疊衣服、刷盤子,甚至在工廠里完成一些操作;等等。”
說這話時,他的身后就站著一個雙足人形機器人,身高1.1米,體重20公斤,銀黑色系,機械感十足。相較之下,背黑色雙肩包、穿米色系帶帆布鞋的趙明國則顯得低調得多。他是清華大學自動化系研究員、機器人控制實驗室主任,主要從事人形機器人的算法開發(fā)和設計工作。
所謂人形機器人,是指模仿人的形態(tài)和行為而設計制造的機器人。相較一般機器人,人形機器人具有更加復雜的結構、傳感、驅動和控制系統,以及類人的感知、決策、行為和交互能力。行內有這么一句話:如果說機器人是“制造業(yè)皇冠頂端的明珠”,那么人形機器人則是其中最閃亮的那顆。這個圈子很小,叫得出名字的入局者就那么幾家。但今年,趙明國感到,情形變得很不一樣。
不只是那些激動人心的成果。向內一步,也是在今年,業(yè)內對人形機器人的底層技術邏輯達成了共識?!耙郧案闳诵螜C器人就是locomotion,也就是運動——如果一個機器人能在各種地形上行走,那么我們就認為這個機器人是高水平的。但今年,大家已經找到一個標準范式——用‘強化學習’,也就是讓智能體(Agent)與環(huán)境進行交互,根據環(huán)境的獎勵反饋來調整自己的行為,以獲得最大化的獎勵。以前我們要花很長時間才能實現的目標,現在很快就能做到,成本也大幅下降。大家都在朝這個方向努力?!壁w明國說,這種共識是全球性的,從這個意義上來說,2024年堪稱人形機器人行業(yè)的轉折點。
在新質生產力中,人形機器人是頗為獨特的存在——它是多個交叉學科綜合作用的結果,是一個國家綜合生產力的體現;它還是生產力的載體,類似今天的手機、汽車,“未來很多變革都將發(fā)生在人形機器人領域或者通過人形機器人來完成?!壁w明國說。
趙明國來自“冰城”哈爾濱,當年因為“離家近”入讀了哈爾濱工業(yè)大學,出于對物理和計算機的興趣選擇了“機電一體化”專業(yè)。1997年,日本本田公司推出了完全獨立依靠兩條腿行走的機器人P3。同年,時任中國國務院總理李鵬前往本田總部參觀,P3走到大廳當中,面對李鵬總理站好,伸出右手作歡迎狀,并用漢語自我介紹:“我是機器人P3,熱烈歡迎李鵬總理和夫人光臨,請允許我與您握手?!闭f罷,它握住李鵬總理的手,連續(xù)搖動了3次。
趙明國回憶:“當時我們搞機器人的老師和學生都在關注P3,說搞機器人的就應該搞這種機器人。”2001年,趙明國加入清華大學,從此走上研究人形機器人的道路。
向《環(huán)球人物》記者談及人形機器人可能帶來的改變時,趙明國條理清晰,語調平和。對他而言,那是一個可以預見的世界。
從“1V1”到“2V2”
今年12月中旬,在山東淄博舉行的一場足球賽火了。
這是一場中國高校機器人足球賽,球員是4個人形機器人,分別來自清華大學和中國農業(yè)大學。視頻畫面中,室內一塊幾十平方米大的綠地上,當足球向場地中央滾動時,參賽雙方各有一名“球員”移動到場邊,一方進攻,一方防守;其余兩名追著足球走動的“球員”則形成對峙,卻又遲遲沒有動作,各自對著幾十厘米外的足球作原地踏步狀。“4個機器人很膠著地搶在了一起?!眻鐾饨庹f道,更為這稍顯滑稽的場面增添了幾分幽默。
網友們互動很熱烈:“像我太爺太奶”“家里不亂的可以買一個回去添亂”“人類真是奇妙,造一個人工智能出來就是為了模仿老年人踢球”……
趙明國也關注到了這些討論,他是這類比賽的??汀?004年10月和12月,趙明國帶領清華大學隊在國內兩場機器人足球比賽中均獲得“四腿組”冠軍。此后,他又帶領團隊連續(xù)多年參加了全球級別最高、規(guī)模最大、影響力最廣泛的機器人賽事之一——RoboCup機器人世界杯人形組比賽,并多次獲得亞軍。
趙明國告訴《環(huán)球人物》記者,這些機器人看似笨拙的步態(tài)和遲鈍的表現背后,其實蘊含著重要的技術突破和可觀的應用前景。
人形機器人的工作機理和真人完全不同。人的大腦可以做許多預處理,供我們高效理解和使用感官系統接收到的原始信息。但對于人形機器人來說,足球、門柱……每捕捉到一幀,就要做一次識別和定位,還要在不確定的概率分布下作出決策。“所以有時它們會做出‘愚笨’的行為,人類會覺得‘這個機器人太搞笑了’。”
趙明國提到了今年的一場國際機器人足球比賽。在那場比賽中,其中一方“球員”已經把球踢到了對方的門線上,只需再走過去輕輕一碰就可以進球;更何況此時,對方“球員”已因摔倒在地不能行動而下場,它是場上唯一一名“球員”。
當時,這名“球員”從中場走到球門前,看了球一眼,便轉身離去;回到中場后,機器人又開始找球,再次走到球面前后,又轉身回到了中場。這樣的情形重復5次后,這名“球員”的研發(fā)團隊終于找到了原因:陰影。
場地上方燈光的照射使得處于門線附近的足球剛好被門柱橫梁的投影覆蓋。機器人識別不到足球,于是返回中場尋找;而當時正有人站在附近,形成了一片面積更大的陰影,機器人只好“無助地”在場地間穿梭。陰影的問題一解決,機器人很快便將這粒等候多時的進球“收入囊中”。
“其實我們已經實現了一些突破,足球比賽從1V1到2V2,遠不止是雙方增加了一名‘球員’那么簡單。想象一下,在一個球場中,球門的位置在這兒,我可以把球放在場上任何一個位置,對于機器人來說,每個位置對應的識別、判斷和決策都不一樣?!壁w明國解釋道:“1V1時,機器人可以不用管隊友或對手,只需要踢球;但變?yōu)?V2時,除了要考慮球的運動,還涉及與隊友、對手的互動。每多一名‘球員’,場上的情況就要復雜好幾倍,對應的技術難度就要上一個臺階?!?/p>
而趙明國的最終目標,是研制出像人一樣,能夠在足球場上實現團隊協作和對抗的人形機器人,到2050年擊敗人類世界杯冠軍?!案爬▉碚f,就是讓機器人學會在場上站位、跑位,同時具備控制頭的決策能力和控制雙足的決策能力,比如有球時怎么辦,沒球時又怎么辦,對方在什么位置我怎么繞,球門在什么位置我怎么踢……這就像訓練一名真人足球運動員——你想,訓練一個梅西出來有多難?”
既如此,為什么要讓機器人?趙明國說,他看中的是“讓機器人”這項任務背后的能力。
“加速進化”研制的人形機器人在踢足球。
“比如有人研究讓機器人搬運貨物,這個問題現在看很難,但5年后它可能就被解決了,研究者需要再換一個問題。但我認為‘踢足球’這個問題永遠有探索空間,因為踢球的水平可以不斷提高——比如現在可以每秒跑1米,5年后我們可以提高到每秒跑5米。我們判斷,‘踢足球’至少可以搞到2050年,它對技術的發(fā)展和促進可以一直延續(xù)下去。踢足球的問題解決到一個階段后,我們可以把相關的技術轉出來,轉到其他行業(yè)去應用。”趙明國說。而到了那時,今天我們對“機器人時代”的所有想象,或許都是最沒有想象力的答案。
事實上,就那些被網友們“調侃”的“球員”而言,當中已經有部分技術實現了遷移。比如用于社區(qū)巡檢的智能機器人,就可以根據實時環(huán)境靈活調整行動策略,一如綠茵場上審時度勢的“球員”。
趙明國非常重視人形機器人的應用價值,鼓勵學生創(chuàng)業(yè),深入市場。他的學生在2023年創(chuàng)立了一家人形機器人公司——北京加速進化科技有限公司(以下簡稱“加速進化”),那是接下來的故事。
互動
在趙明國的影響下,“加速進化”可能是“全國甚至全世界唯一一家用‘踢足球’帶動機器人技術發(fā)展的人形機器人企業(yè)”。
公司CEO程昊從小喜歡機器人,畢業(yè)于清華大學自動化系,曾是清華大學機器人足球隊成員,跟著趙明國參加過幾屆機器人足球賽。
2022年9月,特斯拉推出人形機器人“擎天柱”(Optimus)的一代原型機,其可以實現直立行走、搬運、灑水等復雜動作。特斯拉稱,“擎天柱”將于近年實現量產上市。自此,全球人形機器人賽道被引燃,各大公司紛紛入場。程昊覺得,是時候“回去”了。
趙明國記得,2022年的一天,在互聯網“大廠”擔任高管的程昊找到自己:“老師,我還是要回到機器人這個行業(yè)。”師徒倆一拍即合,程昊辭職創(chuàng)業(yè),第二年6月,“加速進化”成立,致力于研發(fā)更富有行動能力的人形機器人本體和易于開發(fā)的運控平臺。
老師在學校做研究,學生出去創(chuàng)業(yè),從而推動行業(yè)發(fā)展,這是當前人形機器人領域的普遍做法?!把芯亢貌缓糜弥苯泳湍茯炞C,最關鍵的是,我們可以知道當下最需要解決的問題是什么?!壁w明國回憶,有一次,他的一名研究生向他請教:在實驗中發(fā)現我們的算法有3個功能,但目前只能優(yōu)先強化一種,不知道哪一個功能在應用中更重要?
趙明國把這個問題帶到了“加速進化”,從工程師那里得到了答案。這個被工程師們選擇的功能叫做“抗負載變化”。以端水為例,具備“抗負載變化”功能的機器人在拿起水杯前就可以通過視覺預判杯子重量,并自動將負載重量調整至合適區(qū)間——這和真人端水時的行為模式十分接近。與現在只能抓取固定重量的機器人不同,具備“抗負載變化”功能的機器人適應性更強,靈活度更高,在復雜操作中有著非常廣泛的應用前景。
“我們經常會冒出來一些新點子,但這個點子未來在實際應用中能否用得上,就需要和一線的工程師們溝通,修正我們的研究。相應地,我們的研究也會有益于他們問題的解決。學術和產業(yè)的互動就這么產生了?!壁w明國說。
2024年8月21日,2024世界機器人大會在北京開幕,許多觀眾來此參觀體驗。
“我自己就能用上”
《環(huán)球人物》:您如何理解新質生產力?在您看來,人形機器人將在其中發(fā)揮怎樣的作用?
趙明國:新質生產力的特征是高科技創(chuàng)新,并具有高效能、高質量的特征,能引起社會的創(chuàng)新發(fā)展。人形機器人符合這幾點特征,屬于新質生產力。
此外,由于人形機器人是多學科交叉的結果,所以發(fā)展人形機器人可以帶動多個領域的技術革命,形成產業(yè)鏈創(chuàng)新,解決國家和社會發(fā)展中很多根本性問題。
《環(huán)球人物》:您認為,人形機器人這一行業(yè)發(fā)展至今,大致經歷過哪幾個階段?
趙明國:1973年,世界第一臺全尺寸人形智能機器人WABOT—1走出早稻田大學加藤實驗室。盡管它行走一步需要45秒,步幅只有10厘米,但它的問世代表人類已初步實現全尺寸人形機器人雙足行走。此后30多年間,人形機器人一直在發(fā)展,以本田、波士頓動力為代表的公司將人形機器人的運動能力發(fā)揮到了極致。但這些技術僅掌握在少數團隊手中,實現時間長,實現代價高。
機器人WABOT—1。(圖片來源:日本早稻田大學人形機器人研究所官網)
2019年前后,英偉達和蘇黎世聯邦理工學院等機構在四足機器人上率先驗證了先在仿真中應用“強化學習”再遷移到四足機器人上的可操作性,四足機器人的運動能力得到極大提升。2022年以后,許多團隊將這一思路應用于人形機器人,取得了非常好的效果。這一技術路線實現時間短、實現代價低,因此近年來,人形機器人的運動能力得到了很大提高。再加上具身智能技術的興起,使得人形機器人操作能力也得到提升,人形機器人的移動操作成為可能。
《環(huán)球人物》:目前我國人形機器人產業(yè)的現狀是怎樣的?在全球處于什么水平?
趙明國:若從產業(yè)的技術路線看,可以分成三個階段:第一階段,解決各種場景中的移動問題;第二階段,解決簡單場景中的移動操作問題,包括講解、引導、巡檢、搬運、裝配、整理等;第三階段,解決復雜場景中的移動操作問題,如適用于養(yǎng)老、工作空間和家庭的服務機器人。
目前國內的技術路線適用于第一階段的教育科研場景,正在嘗試第二階段的To B類(To Business,面向企業(yè)用戶)應用,即無人工廠、商店和物流等場景的移動操作。當前國內人形機器人的發(fā)展基本與全球同步,中美兩國位列全球人形機器人領域的第一梯隊。
2024年11月,葡萄牙里斯本,為物流工作制造的機器人吸引了眾多目光。
《環(huán)球人物》:根據您的研究,人形機器人作為新質生產力,預計將帶來多大的產業(yè)規(guī)模?能在哪些方面造福于人類生活?
趙明國:人形機器人市場潛力巨大。國際投資銀行高盛預測,到2035年,人形機器人市場規(guī)模有望達到1540億美元(約合11037.3億元人民幣)。特斯拉CEO馬斯克展望,長期來看人形機器人需求量可能高達100億臺??梢姡鼘χ袊洕哔|量發(fā)展具有重要的意義。
未來,人形機器人將具有高效、高敏捷性的移動能力,能夠感知復雜的自然環(huán)境,并通過智能完成復雜任務,解決中國由于老齡化帶來的很多問題。
我現在這個年紀,再搞20年人形機器人,大概70多歲,那時人形機器人我自己就能用上(笑),哪怕端端茶、倒倒水或者做一些簡單的服務。人形機器人在養(yǎng)老方面的應用與每個人都息息相關。
另外,人形機器人還能在一定程度上彌補勞動力短缺的問題,比如高空作業(yè)、地下勘測等特定場景使用的人形機器人。
現在是移動互聯網時代,手機扮演著重要角色;未來,我們學習、生活、工作中的很多事情將通過機器人來實現,那時就是“機器人時代”了。
趙明國,人形機器人