在2024世界機(jī)器人博覽會(huì)現(xiàn)場(chǎng),人形機(jī)器人“天工”一出場(chǎng)就吸引了眾多觀眾圍觀,儼然是博覽會(huì)上最亮眼的明星。作為具身智能應(yīng)用到機(jī)器人上的代表,“天工”的亮相也讓大家對(duì)于具身智能賦予機(jī)器人的能力有了具象化的了解。
具身智能可以理解為“具身+智能”,通過賦予AI“身體”,能夠與現(xiàn)實(shí)產(chǎn)生交互,讓AI從僅存于數(shù)字世界的軟件算法走向真實(shí)的物理世界,在物理世界也能呈現(xiàn)模擬人類甚至超越人類的智能水平。具身智能強(qiáng)調(diào)不僅通過算法和計(jì)算實(shí)現(xiàn)智能,還通過具身本體與物理世界的交互來展現(xiàn)和發(fā)展智能。
具身智能發(fā)展至今經(jīng)歷了三個(gè)階段,即早期萌芽階段、技術(shù)積累階段和技術(shù)突破階段。2022年至今,以ChatGPT為代表的大模型的通用知識(shí)和智能涌現(xiàn)能力為機(jī)器人實(shí)現(xiàn)智能感知、自主決策乃至擬人化交互方面帶來巨大潛力。
當(dāng)前人們的關(guān)注點(diǎn)轉(zhuǎn)向如何將AI應(yīng)用于物理世界,并期望通過AI的“具身化”找到新的智能增長(zhǎng)點(diǎn)!熬呱碇悄苁情L(zhǎng)了身體的智能,是技術(shù)上一個(gè)非常巨大的進(jìn)步!北本┚呱碇悄軝C(jī)器人創(chuàng)新中心總經(jīng)理熊友軍說,“我們認(rèn)為具身智能是人工智能的一個(gè)新范式,它具有可以跟物理世界直接進(jìn)行交互、能夠自主學(xué)習(xí)的特點(diǎn)。這種自主的學(xué)習(xí)實(shí)際上可以更加主動(dòng)和積極,也更加具有創(chuàng)造性!
中國(guó)信通院發(fā)布的《具身智能發(fā)展報(bào)告(2024年)》顯示,目前,具身智能技術(shù)尚處于多條路徑探索發(fā)展階段,并且在感知與認(rèn)知、學(xué)習(xí)與泛化、計(jì)算能力、多任務(wù)處理、安全性、隱私保護(hù)以及人機(jī)關(guān)系等多個(gè)方面都面臨挑戰(zhàn)。
在算法層面,具身智能系統(tǒng)在實(shí)現(xiàn)通用智能時(shí)面臨兩大根本性挑戰(zhàn)。一是系統(tǒng)需要人類智能的介入;二是尚未實(shí)現(xiàn)感知到行動(dòng)間的認(rèn)知映射。在數(shù)據(jù)層面,缺乏數(shù)據(jù)成為具身智能能力突破的重要壁壘。一方面,真實(shí)數(shù)據(jù)面臨獲取成本過高、廣泛、高質(zhì)量和多樣化的挑戰(zhàn)。另一方面,仿真合成數(shù)據(jù)面臨“現(xiàn)實(shí)差距”,即模擬環(huán)境與現(xiàn)實(shí)世界之間的差異挑戰(zhàn)。在軟件層面,缺乏統(tǒng)一的操作系統(tǒng)和標(biāo)準(zhǔn)化軟件開發(fā)工具鏈。在硬件層面,耐用性和能源效率以及與軟件的深度集成需求構(gòu)成了具身智能硬件發(fā)展的主要障礙。在標(biāo)準(zhǔn)與合規(guī)層面,具身智能技術(shù)、評(píng)測(cè)、安全倫理等標(biāo)準(zhǔn)缺失,面臨信息安全、個(gè)人隱私等一系列倫理和社會(huì)學(xué)問題。
報(bào)告顯示,具身智能將在技術(shù)涌現(xiàn)式創(chuàng)新和突破下,實(shí)現(xiàn)“一腦多形”“一機(jī)多用”,其相關(guān)應(yīng)用有望快速擴(kuò)展至社會(huì)經(jīng)濟(jì)的各個(gè)層面,推動(dòng)生產(chǎn)力的躍升和生活方式的變革。未來具身智能將從工業(yè)協(xié)作生產(chǎn)到柔性制造,從家務(wù)助手到醫(yī)療護(hù)理,從災(zāi)難救援到太空探索,深度融入人類社會(huì)?梢灶A(yù)見的是,具身智能有望帶來更高的應(yīng)用價(jià)值和更廣闊的市場(chǎng)空間。在工業(yè)制造領(lǐng)域,具身智能可以打破人機(jī)協(xié)作瓶頸,實(shí)現(xiàn)智能化柔性適配;在自動(dòng)駕駛領(lǐng)域,具身智能可以適應(yīng)開放環(huán)境,實(shí)現(xiàn)安全可靠駕駛;在家庭服務(wù)領(lǐng)域,具身智能可以解放人類雙手,實(shí)現(xiàn)全場(chǎng)景智能家務(wù)服務(wù);在醫(yī)療康養(yǎng)領(lǐng)域,針對(duì)老齡化問題,具身智能可以實(shí)現(xiàn)擬人交互服務(wù)等。