如何定义生命：一场人类与AI的思想实验

导语

" 生命是什么？" ——这个问题横跨哲学、生物学与人工智能，是人类思想中最古老、也最开放的追问。

今年 5 月，多伦多大学、谷歌与塔夫茨大学的研究者用大语言模型来重新审视人类对生命概念的理解。他们收集并分析了专家对 " 生命 " 定义的多种表述，通过模型的语义比较与聚类，呈现出八类核心观点——从自我维持的物质系统到具备认知特征的信息处理主体。这一研究展示了 AI 不仅只是整理文献的工具，而能成为思想的共作者的可能性。

关键词：大语言模型（LLMs）、AI 思想实验、科学哲学、自组织系统、认知自主性、人机协作

郭瑞东丨作者

张江丨审校

在科研界，大语言模型最常见的用途是替研究者 " 读论文 " ——总结、分类、撰写综述。然而，来自多伦多大学、谷歌与塔夫茨大学的一组研究者决定换一种思路：让 AI 不再只是帮忙整理文献，而是去追问观念的源头 [ 1 ] 。

他们把 " 大语言模型 " 当作思想史的显微镜，去分析人类几百年来对 " 生命是什么 " 的回答。模型在海量语义中梳理出脉络，揭示出生命与非生命在定义上的模糊地带——一种从机械到有机、从物质到信息的连续谱。这项研究揭示了生命与非生命在定义上存在的连续性，并为解决科学中其他有争议的定义开辟了可借鉴的方式。

生命是什么，历史之中众说纷纭

生命是什么？追踪众多先贤对这个问题回答，会发现生命的含义，如同思想史中其它核心概念，并非一成不变，而是通过历史争论、误读或重构形成的。

每一个时代，人们对生命的定义都会受到观测手段的限制。例如笛卡尔的时代，水力磨坊是当时的先进机器。于是 16 世纪笛卡尔认为动物是机器，动物行为可完全用机械原理解释（如反馈、液压）；之后博物学者收集了众多植物标本后，18 世纪的哲学家康德在《植物变形记》搜寻所有植物的原型，强调了生命的整合性；到了 19 世纪，生理学的奠基人 Claude Bernard 认为生命的核心是维持内部稳定（也称为 " 稳态 "）；而到了 20 世纪，薛定谔在他的讲座 " 生命是什么 " 中，则将生命和负熵联系起来。

写毕业论文时，我们需要对前人的相关工作进行回溯。温故而知新，对过往研究的溯源，能展现问题本身的多义性和语境依赖性。然而溯源的过程，若是交由大语言模型来进行，那大语言模型又会得出哪些不一样的结论？

在这项由大语言模型和人类共同完成的研究中，研究者先通过电子邮件访谈，询问 68 个和生命有关的当代专家学者，如何用一句话来回答对生命是什么这个问题，得到的回答那叫一个五花八门。有的很简洁：生命是学会了如何学习的物质（Life is matter that has learned how to learn.）；有的像是抖机灵，比如所有通过持续变化而保持一致的事物（Anything that keeps changing in order to stay the same.）。

之后的整理阶段，如果是由人类研究者来进行，那就是去试图从众多的定义中寻找共性，看看这些定义中有哪些反复出现的部分。或者如图 1 这样，根据自定的标准，判断这些定义是基于主观观察还是客观事实，是连续变化的还是非黑即白的，是可执行的还是仅具启发意义的。

图 1：对 68 种由专家给出的对生命定义的分类（由人类作者完成）

让大语言模型去溯源，会发生什么？

上述的分类能了解专家观点的分布情况，但却不能显示专家们的意见之间有什么相互关系。而当科学家让大语言模型来分析这些定义时，便能用算法的力量完成人类难以穷尽的比对。研究者使用 Claude，ChatGPT 和 Lamma 三个主流大语言模型，通过如图 2 的提示词，让大语言模型评估逐个评估这些定义间两两的相关性，这样的方法，对于人类来说，意味着提问数千次，回答次数这么多，人类回答时的心理状态就可能影响答案，无法如大语言模型一般稳定输出。

图 2：询问大语言模型定义相似性的提示词模板

研究者让大语言模型逐对比较 68 种 " 生命定义 " 之间的语义相似性，并将结果绘制成相关性热图（图 3a）。图中颜色越接近绿色，表示两种定义在语言表达上越相似，包含的思想元素也越多重合。

接着，研究者对这些相似性数据进行层次聚类，把彼此更接近的定义归为同一类，得到右侧的聚类图（图 3b）。每个定义因此都获得了与其他 67 个定义之间的 " 相似度评分 "，这些分值共同构成一个矩阵。图中颜色的深浅，就对应着这个矩阵中不同的数值——让我们得以一眼看到哪些定义在思想上彼此靠近，哪些又相距遥远。

图 3：从成对相关性到聚类空间投影的数据转换过程

有了这个聚类图，可以将距离相近的点当成一类，将 68 种定义分成多组，之后使用图 4 的提示词，来提取每个组中的共同之处。

图 4：提取生命定义共性用到的提示词模板

具体来看，对生命的 68 种定义，被分为了 8 类，以下是大语言模型给出的对生命定义的总结：

（1）感知（Perceptual Categorization）：生命是一种由感知驱动的分类过程：一个系统若能觉察自身 " 活着 "，便会开始区分 " 我 " 与 " 非我 "。细菌分裂、树木生长，本质上都是这种自我识别机制的体现。生命，是意识到自身存在的那一刻。

（2）自维持的动力学模式（Self-Sustaining Dynamic Patterns）：生命是一个能够自我维持的动力系统。它通过递归循环不断生成自身存在的条件——不靠外力，而是自己给自己打节拍，在与世界的互动中，一边存在，一边成为。

（3）动态关系过程（Dynamic Relational Process）：生命是持续的交换与流动。它的存在依赖与环境及其他生命体之间的能量、物质与信息循环。就像火焰依靠燃料与氧气，生命也靠不断的连接与互动而维持自身。孤立，意味着熄灭。

（4）实用怀疑主义（Pragmatic Definitional Skepticism）：生命并无唯一的定义。它是一个因研究目的而异的工作性概念：合成生物学、天体生物学、生态学——各自都在用自己的语境理解 " 活着 " 的意义。

（5）认知自主性（Cognitive Autonomy）：生命是一个目标导向的信息处理系统。它感知环境、学习经验、调整行为，以维持自身边界并抵抗熵增。无论是变形虫避盐，还是人类自觉节食，本质上都是有目的的自我调节。

（6）耗散自组织系统（Dissipative Self-Organizing Systems）：生命是远离平衡态的秩序，它通过能量的受控耗散维持自组织。细胞膜像一座 " 半透的门 "，筛选物质进出，确保系统在波动中保持稳定。生命在平衡与混沌之间走钢丝。

（7）自我复制的信息系统（Informational Self-Replication）：生命是一段能自我复制的信息。它以 DNA 和 RNA 为载体，以能量代谢为引擎，在衰变中持续重写自身。若有一天，AI 也能稳定复制其结构与功能，它是否也算一种 " 生命 "？

（8）自我复制的热力学系统（Self-Replicating Thermodynamic Systems）：生命是一个在物理与化学层面能自我维持的体系。它通过吸收、转化能量与物质来支撑生长与繁衍。感知、反应、进化，不过是这一自我复制机制的延伸。

前文的八类定义揭示了 AI 对 " 生命 " 这一概念的不同理解，但要理解这些思想之间的关系，还需要更直观的方式。此时，AI 的计算工作告一段落，人类的洞察力开始接手。研究团队使用一种名为 t-SNE 的降维方法，将定义间的语义相似性映射到一个二维平面上，如图 5 所示。在这幅图中，每个点代表一种关于 " 生命是什么 " 的定义，颜色区分其所属类别。为了让整体结构更易辨识，研究者进一步计算了点的语义密度，并在背景上叠加了等高线。你可以把它想象成一张 " 思想地形图 "：点群越密的地方，等高线越密、颜色越浅，代表语义相近、观点集中；而线条稀疏、颜色较深的区域，则对应那些相对独立、少有人涉足的思想高地。

研究者还尝试理解这张 " 思想地形图 " 中两条坐标轴所代表的含义。通过将八种生命定义映射到图中，他们发现，水平轴（从左到右）呈现出一个从 " 观察者依赖的感知框架 " 向 " 客观的物质结构定义 " 过渡的方向；而垂直轴（自下而上）则对应从 " 具象的物理基础 " 到 " 抽象的信息与目的论过程 " 的渐变。这两个维度并非截然分开的类别，而是连续变化的思想光谱，展示了人类理解 " 生命 " 时在主观与客观、具体与抽象之间的摆动。

图 5：生命定义聚类后的可视化

从图 5 可以看出，点在中部与左下区域明显聚集。当代学者对 " 生命是什么 " 的定义，主要集中在两个主题：认知自主性（青绿色，约 24 种定义）与耗散自组织系统（蓝色，约 21 种定义）。这两个聚簇共包含了约 66% 的定义，代表了当前学界对生命的主流理解方向。它们的共同特征是：同时整合了物理、信息与行动者三个层面的视角，采用跨学科的方式刻画生命的复杂性。

然而，在这两个高密度区域之外，图中仍可看到一些零散分布的定义点。这种零散分布的状态表明，学者们在生命的定义上仍未达成共识。" 生命 " 作为一个开放性问题，天然包含多义与争议，而这正是思想活力所在。总体来看，大语言模型与研究者的合作揭示了生命定义的两大思想聚焦点，也反映出现代科学对生命理解的多层结构——从信息与能量的组织，到认知与自我维持的动态过程。

从 " 定义生命 " 到更广阔的思想地图

这项研究的方法并不复杂，却具有极强的推广潜力。同样的框架，可以用来探讨其他长期悬而未决的问题——例如 " 什么是衰老 "。研究者可以通过访谈不同领域的专家，收集他们对 " 衰老 " 的定义，并为每种定义附上代表性文献；再借助大语言模型评估这些定义之间的语义相似性，进行聚类与降维分析。如此，便能绘制出衰老研究的 " 思想空间 "，识别出当前学界在这一复杂议题上的核心聚焦点与分歧。

对于无法进行访谈的主题，如 " 什么是智能 "，也能采取类似思路。研究者可从公开文献、历史资料或语录中整理定义（参考文献 [ 2 ] ），再通过模型的语义分析揭示不同年代、不同学派对 " 智能 " 这一概念的演化路径。这不仅是一种数据分析方法，更是一种思想谱系重建技术。

更广义地看，这类工作代表了 " 人类 + 大语言模型 " 的新型科研范式。人类提供判断与洞察，AI 则负责规模化、无偏的语义计算。两者的协作，让个体研究者也能像文艺复兴时期的思想家一样，借助工具重塑知识的版图，重新追问那些永恒的问题——何为生命？何为智能？何为思考本身？

例如 Edge 杂志在 2018 年以前，每年会针对一个问题，邀请全球知名的科学家思想家给出回复，每个回答是一篇或长或短的评论文章，这些回答被集结成书，这样的年度问题，持续了数十年。这种方法完全可以被用于重新解读那些思想家的回答：让 AI 去聆听十年前的思考，在当下时代重新生成对话。

参考资料：

[ 1 ] Bender, R., Kofman, K., Blaise, A., & Levin, M. ( 2025 ) . What Lives? A meta-analysis of diverse opinions on the definition of life. ArXiv.org. https://arxiv.org/abs/2505.15849

[ 2 ] Legg, S., & Hutter, M. ( 2006 ) . A Collection of Definitions of Intelligence. http://www.vetta.org/documents/A-Collection-of-Definitions-of-Intelligence.pdf

作者：郭瑞东

审核：张江北京师范大学系统科学学院教授

出品：中国科协科普部

监制：中国科学技术出版社有限公司、北京中科星河文化传媒有限公司

意识科学读书会

从神经元放电到自我意识的涌现，意识是人类最稀松平常的主观体验，也始终是科学中最迷人的问题。在 " 我是谁 " 的终极追问下，当我们深入意识的机制与机理，会发现更值得深思的是，无论是神经机制的功能整合、信息的跨脑区传递，还是现象意识的主观性质，不同层面的问题都在共同指向一个核心挑战：物理过程如何产生主观体验？功能计算如何关联现象感受？局部神经活动又如何整合为统一的意识？而要回答这些问题的并不简单，它可能会挑战我们对世界和实在，乃至科学方法本身的理解。

为了对意识问题进行系统探讨，集智俱乐部联合来自哲学、认知神经科学、计算机科学、复杂科学领域的研究者共同发起「意识科学读书会」，跨越理论与实证、功能与现象、生物与人工的视角，全面深入研讨意识这一现象本身。重点探讨当代主流意识理论的核心主张与分歧，神经机制与主观体验之间的桥梁，以及 AI 意识、脑机接口等技术如何重塑人类意识主体的边界与文明的未来。

详情请见：走向意识科学：从现象之窗到理论之梯

推荐阅读

1. 涌现之谜：从人类认知革命到 AI 觉醒｜新书推介《通用人工智能》

2. 从命令到协同：人类如何成为 AI 最强训练搭档？

3. AI 能否成为 " 社会科学家 "？GPT-4 模拟人类行为实验效应的突破与隐忧

4. 系统科学前沿十讲：探究复杂世界演变背后的规则（二）

5. 集智学园精品课程免费开放，解锁系统科学与 AI 新世界

6. 高考分数只是张入场券，你的科研冒险在这里启航！

点击 " 阅读原文 "，报名读书会

宙世代

一起剪

相关标签