人工智能学会
您的位置: > 新闻动态 >

新闻动态

AI 科普丨科技热词“具身智能”到底是什么?

发布时间:2025-03-14 16:26浏览量:

转自 中科院物理所

  到底什么是具身智能呢?简单地说,具身智能就是强调智能行为需要通过身体与环境的交互来实现,而不仅仅依赖“大脑”的运算。

 

  这其实很好理解,就像我们人类,刚出生的小宝宝要想认识世界,肯定不是通过大脑来思考的,是用眼睛去看、用耳朵去听、用手去触摸,通过与外部环境的互动来获取信息,从而产生智能行为。正如著名哲学家梅洛庞蒂所说:“身体是我们拥有世界的方式。”在具身智能看来,身体不是心智的外壳,而是智能的本源。

 

 
 

  “具身智能理论强调认知过程的物理基础,认为心智、思维和知觉并非脱离身体的抽象过程,而是深深根植于生物体与环境的动态交互之中。智能并不单纯存在于大脑之中,而是整个身体与环境相互作用的结果。”

 —— E. Thompson, M. Rosch, & D. L. Schaller

 
 

  具身智能的研究对于人工智能的发展有着重要意义。虽然当前的人工智能系统在某些任务上的表现已经超过了人类,比如下围棋、识别图像等,但它们在灵活性、适应性、创造力等方面还远不及人类。这就像是高考状元和三岁小孩的区别,前者擅长应试,后者却拥有惊人的学习能力。为什么会这样呢?这就要从人工智能发展的历史说起了。

 

  传统的人工智能主要基于“符号主义”思想,也就是认为知识可以用符号来表示,智能就是对符号的运算。这种方法在一些特定领域取得了成功,比如国际象棋,在处理现实世界的复杂问题时却捉襟见肘。因为现实世界充满了不确定性,很多知识难以用符号准确描述。此外,符号主义忽视了感知、运动等因素在智能中的作用。

 

  20 世纪 80 年代,一些学者开始反思符号主义的局限,提出了“连接主义”思想。他们认为,智能源自大量神经元的连接,而不是抽象的符号运算。这催生了人工神经网络和后来深度学习的发展,使得人工智能在感知、模式识别等任务上取得了长足进步。但是,连接主义仍然把智能视为头脑的产物,忽视了身体在智能中的重要作用。

 

  进入 21 世纪,随着认知科学的发展,越来越多的证据表明,人类的智能是大脑、身体和环境相互作用的结果,具有鲜明的身体性。这就是具身智能的核心思想。

 

  比如,发展心理学家皮亚杰通过大量实验发现,婴儿是通过手脚的运动来认识世界的,从而逐步建立起物体永恒性等基本概念。又如语言学家莱考夫指出,我们对很多抽象概念的理解,都借助了身体隐喻,比如“理解是抓住(grasp)”“高兴是向上(up)”等。可见,我们的思维方式深深植根于身体经验之中。

 

  受此启发,人工智能和机器人学家们开始探索具身智能的实现路径。一些学者设计了拟人化的机器人,让它们像人一样用手、眼去感知环境、操纵物体,通过不断地尝试来学习各类技能。

 

  这就像小宝宝学走路一样,从跌倒到蹒跚,再到熟练行走,机器人在实践中积累了丰富的“身体经验”,形成了属于自己的“世界模型”,这为它们应对复杂多变的现实世界打下了基础。

 

 

  什么是“世界模型”呢?我们人类之所以能够在复杂多变的环境中生存和发展,一个重要原因就是我们头脑中有一个对世界的整体认知,这就是“世界模型”。

 

 
  它像是我们头脑中的一张地图,囊括了我们对世界的种种认知,包括空间、时间、事物、规律等各个方面。比如,当你走进一个房间,即使你从没来过这里,你也知道桌子可以用来放东西,椅子可以用来坐,门可以打开和关闭。
 

 

  之所以如此,就是因为你头脑里的世界模型告诉你,桌子、椅子、门等物体有各自的属性和功能。世界模型使我们能在头脑中预演各种行为的后果,从而做出明智的决策。

 

  世界模型和具身智能密切相关。具身智能理论认为,世界模型不是天生就有的,也不是单纯用符号编码的,而是主体通过自己的感知和运动,在与环境的互动过程中逐步建构起来的。

 

  婴儿刚出生时对世界几乎一无所知,但她是会不断用手触摸周围的物体,用眼追踪移动的事物,通过这些感知运动的经验,逐渐认识到世界的种种规律,形成了自己的世界模型。

 

  可以说,世界模型是具身实践的结晶,是身体铭刻在心智中的烙印。反过来,成熟的世界模型又能指导具身实践,让我们的行为更加智能和高效。由此可见,世界模型是连接具身和智能的桥梁,是具身智能的基石。

 

 

 
 
  “具身智能”这个概念,可以追溯到 20 世纪中叶。它最早由哲学家海德格尔、梅洛庞蒂等人提出,他们强调人的存在本质上就是“在世存在”,身体在其中扮演了重要角色。
 

  后来,认知语言学家莱考夫进一步指出,人类的概念系统主要来源于身体经验,高度依赖身体隐喻。发展心理学家皮亚杰、吉布森等也通过大量实证研究,揭示了感知运动在认知发展中的重要作用。

 

  进入 21 世纪,随着神经科学的发展,身体、大脑、环境互动的复杂动态过程逐渐被阐明,催生了体化认知、扩展心智、涌现主义等流派,共同塑造了具身智能的理论体系。可以说,“具身智能”是多学科交叉融合的结晶,为解开“智能本质”这一终极问题提供了新的视角和思路。

 

  另一些学者则从进化的角度来思考智能的本质。他们发现,不同物种的智能水平与它们的身体结构和生存环境紧密相关。

 

  比如章鱼,它们的大脑构造与人类大不相同,触手上分布着大量神经元,使得它们拥有惊人的空间感知力和操控能力,能够灵活地解决问题。再比如蜜蜂,单个蜜蜂的智力并不高,但由于每只蜜蜂的感知运动系统与群体分工完美契合,整个蜂群表现出了超强的集体智慧,能够高效地完成授粉、酿蜜等复杂任务。

 

  由此可见,智能是生物在长期进化中对环境的适应,是身体、大脑、环境共同塑造的“神迹”。

 

  具身智能和我们所熟悉的机器人有什么区别呢?具身智能是一种智能理论和范式,强调智能行为依赖于身体和环境的互动,具有鲜明的身体性和情境性。而机器人则是这一理论在工程实践中的载体和试验田。

 

  传统的机器人大多采用模块化设计,感知、规划、控制等功能相对独立,更多强调计算而非互动。但随着具身智能理念的兴起,越来越多的研究者开始探索新型机器人,让其拥有更加灵活、鲁棒、适应性强的身体结构,更加注重感知运动的作用,更加强调与环境的实时互动。

 

 

  软体机器人、类人机器人、发展型机器人等就是这方面的尝试。总的来说,具身智能为机器人的设计和研发提供了新的思路和方法,而机器人的发展反过来也在检验和完善具身智能理论。两者相辅相成,共同推动着人工智能的进步。

 
 
 

  那么,具身智能会给人工智能和机器人带来哪些变革呢?首先,它有望突破传统人工智能的局限,让机器具备更强的环境适应能力。

 

  通过视觉、触觉等多通道感知,机器人可以全面地理解周围世界,并根据环境的变化灵活调整自己的行为。这对于在复杂环境下作业的机器人,如深海探测器、火星探测器等,具有重要意义。其次,具身智能强调人机交互,让机器人拥有更自然、更高效的交互方式。

 

  比如家用服务机器人,如果能通过表情、手势等非语言信息来理解人的需求,再辅以亲切的语音反馈,将大幅提升用户体验。

 

  再次,具身智能为类脑芯片、认知康复、智能可穿戴等领域带来了新的思路。以智能假肢为例,如果传感器与人体神经系统可以实现无缝对接,那么有望帮助截肢者重拾运动能力和触觉。

 

  当然,发展具身智能绝非一蹴而就。它需要人工智能、机器人、认知科学、神经科学等多学科协同攻克技术难关,一起跨越诸多技术鸿沟。

 

  更重要的是,它还需要我们反思“什么是心智”“什么是自我”等深刻命题。传统的二元论(一种哲学观点)将心智视为与身体分离的独立实体。

 

  然而,具身智能的研究挑战了这一观点,告诉我们心智实际上是融入具体情境中的,它在与环境的持续互动中不断发展和演化。这提醒我们要跳出头脑中心主义的桎梏,以开放的心态拥抱生命和智能的复杂性。

 

  具身智能的兴起,标志着人工智能正在从“智能即计算”的传统范式,转向“智能即互动”的新范式。

 

 
  在这个新范式下,智能不再是封闭系统内的符号操作,而是开放系统中的涌现属性;不再是抽象的逻辑推理,而是具身的实践体验;不再是独立的认知模块,而是知觉、运动、情感、社会的有机融合。这一转变不仅仅是技术的革新,更是观念的革命,是对智能本质的新认识,是走向人机共生的必由之路。
 

 

 
原文链接:https://mp.weixin.qq.com/s/8QdrS2fpNTOR8T-fs5A0HQ?scene=25#wechat_redirect