摘要
非线性动态系统在自然界中无处不在,且难以预测。这些系统对初始条件的小扰动可能十分敏感,并且通常由多个尺度的过程组成。基于李雅普诺夫谱的经典方法依赖于对动态前向算子的了解或其数据导出的近似。不过,这个算子通常是未知的,或者数据噪声太大,无法获得其真实表示。在这里,我们提出了一种数据驱动的方法来分析动态系统的局部可预测性。这种基于递归概念的方法与局部动态指标的成熟框架密切相关。应用于理想化系统和来自大规模大气场的真实数据集时,我们的方法在估计局部可预测性方面证明了其有效性。此外,我们讨论了它与其他局部动态指标的关系,以及它如何揭示可预测性的尺度依赖特性。进一步地,我们探讨了它与信息理论的联系,包含加权策略的扩展以及实时应用。我们相信这些方面共同展示了它作为复杂系统强大诊断工具的潜力。
关键词:时间延迟递归(time-lagged recurrence)、局部可预测性(local predictability)、动力系统、数据驱动方法、局部动力指数(local dynamical indices)、李雅普诺夫指数(Lyapunov exponents)、极端值理论(extreme value theory)、天气预测、相空间
论文题目:Time-lagged recurrence: A data-driven method to estimate the predictability of dynamical systems
论文链接:https://www.pnas.org/doi/abs/10.1073/pnas.2420252122
发表时间:2025 年 5 月 16 日
论文来源:PNAS
从天气变化到生态系统演化,自然界中大多数复杂系统的行为都遵循非线性动力学规律。这些系统的核心特征之一是混沌性(chaos):微小的初始扰动可能导致长期预测的彻底失效。传统上,科学家依赖李雅普诺夫指数(Lyapunov exponents)等全局指标评估系统的平均可预测性,该指数描述了相邻轨迹的指数发散速率,无法捕捉状态依赖的局部特性(state-dependent local properties),例如,大气环流在某些区域可能比另一些区域更容易预测。如何从观测数据中直接提取局部可预测性信息,成为动力系统研究的重要挑战。此外,现有方法多依赖于系统动态方程的线性近似,难以处理非线性效应主导的有限扰动。近期,一项发表于 PNAS 的研究提出了一种名为时间延迟递归(time-lagged recurrence,TLR)的数据驱动方法,为这一难题提供了创新解决方案。
时间滞后递归(TLR):数据驱动的新指标
本文提出的时间滞后递归(TLR)方法摒弃了对系统模型的依赖,直接从观测数据中提取局部可预测性信息。其核心思想是:通过相空间中状态的 " 递归 "(recurrence)量化系统的稳定性。具体而言,对于一个参考状态 ζ,研究者首先识别其邻近状态(称为 " 递归点 "),然后追踪这些邻近状态在未来某一时间窗口 η 内的演化轨迹。若多数邻近轨迹在时间 η 后仍接近参考状态的未来位置,则表明该状态具有高可预测性;反之则意味着低可预测性。
TLR 方法的三步框架
1. 递归点识别:利用极端值理论(extreme value theory),通过距离分布的分位数阈值(quantile threshold)筛选参考状态的邻近点,避免噪声干扰(图 1 蓝色实心点)。
2. 未来状态追踪:将递归点向前演化至时间窗口 η,生成 " 前向递归点 "(forward recurrences,图 1 蓝色空心点),并与参考状态的未来邻域(forward-reference-state recurrences,图 1 橙色空心点)进行匹配。
3. 可预测性量化:计算匹配比例(即前向递归点与未来邻域的交集占比),定义为局部可预测性指数。该值越接近 1,表明该状态的局部可预测性越高。
值得注意的是,TLR 通过分位数阈值自适应调整邻域尺度,能够揭示不同空间尺度下的可预测性特征。例如,小尺度邻域可能反映短期扰动的影响,而大尺度邻域则对应系统长期演化的稳定性。
图 1. 在 Lorenz-63 系统的相空间中演示了计算的原理图。
验证:洛伦兹模型和真实大气环流
洛伦兹 -63 系统:混沌吸引子的可预测性图谱
研究者首先在经典的洛伦兹 -63 模型中验证 TLR 的有效性,选用了时间窗口
。图 2 展示了的计算结果,其中相空间中的每个状态着色为对应的值,结果表明:
短期预测窗口(如
,为该系统的李雅普诺夫时间):吸引子两翼(wings)的可预测性较高,而轨迹切换区域(lobe-switching region)的 值相对较低。
长期预测窗口(如
):随着时间窗口增加,整体可预测性急剧下降,但部分中间区域可保持相对稳定。
图 2. Lorenz-63 系统的 随着 η 的分布情况。
进一步聚类分析表明,可预测性的空间异质性与系统的动力学特性一致。例如,吸引子两翼的轨迹虽易快速离开邻域(低持久性,low persistence),但因发散速度较慢,仍表现出较高的短期可预测性。这一结果挑战了传统观点——低持久性必然对应低可预测性。
大气环流:天气模式的预测瓶颈
在真实数据验证中,研究者聚焦欧洲 - 大西洋区域的 500 百帕位势高度场(Z500),分析冬季天气型(weather regimes)的可预测性差异。结果显示:
北大西洋涛动负相位(NAO −)的可预测性最高,其次是正相位(NAO+)。
阻塞型天气(如斯堪的纳维亚阻塞,Scandinavian Blocking)的值最低,与已知的阻塞高压难以预测的现象一致。
图 3. 北大西洋冬季天气状况的可预测性分析。
这一发现不仅与气候模式(climate models)的预测结果吻合,还揭示了 TLR 在高维复杂系统中的实用性——无需降维或简化假设,直接从原始数据中提取局部信息。
理论拓展:与信息论及经典指标的比较
TLR 方法的一个关键优势在于其与信息论的天然联系。研究者证明,可解释为条件概率(conditional probability),即" 已知当前状态在邻域内,其未来状态仍落入未来邻域 " 的概率。这一视角将可预测性直接关联到香农熵(Shannon entropy),为量化系统不确定性提供了新工具。
与经典指标(如非线性局部李雅普诺夫指数,NLLE)的对比显示,TLR 在非线性区域的表现更优。例如,NLLE 假设误差呈指数增长,而 TLR 通过递归点的实际演化直接捕捉非线性效应。此外,TLR 能够揭示可预测性的 " 非单调衰减 " ——在某些时间窗口,系统可能因吸引子结构出现短暂的可预测性回升。
实时应用与未来展望
尽管 TLR 依赖于未来状态信息,无法直接用于实时预测,但研究者提出了一种历史相似性代理法(analogue-based proxy)。通过搜索当前状态的 " 历史相似状态 " 并计算其平均,可实时估计系统的可预测性。初步测试表明,该方法在洛伦兹系统中能有效捕捉相空间特征,为天气与气候预测的实时应用铺平了道路。
时间滞后递归(TLR)的提出,标志着数据驱动方法在动力系统研究中的一次重要突破。它不仅克服了传统指标对模型和线性近似的依赖,还为高维复杂系统(如大气环流、生态系统)的局部可预测性分析提供了通用框架。未来,结合机器学习与极端值理论,TLR 有望在气候预测、灾害预警等领域发挥更大价值。
彭晨 | 编译
关于集智俱乐部
集智俱乐部成立于 2003 年,是一个从事学术研究、享受科学乐趣的探索者的团体,也是国内最早的研究人工智能、复杂系统的科学社区。它倡导以平等开放的态度、科学实证的精神,进行跨学科的研究与交流,力图搭建一个中国的 " 没有围墙的研究所 "。集智科学研究中心(民间非盈利企业)是集智俱乐部的运营主体,长期运营社区生态,催化理论创新。使命:营造跨学科探索小生境,催化复杂性科学新理论。
复杂系统自动建模读书会第二季
" 复杂世界,简单规则 "。
集智俱乐部联合复旦大学智能复杂体系实验室青年研究员朱群喜、浙江大学百人计划研究员李樵风、清华大学电子工程系数据科学与智能实验室博士后研究员丁璟韬、美国东北大学物理系 Albert-L á szl ó Barab á si 指导的博士后高婷婷、北京大学博雅博士后曹文祺、复旦大学数学科学学院应用数学方向博士研究生赵伯林、北京师范大学系统科学学院博士研究生牟牧云,共同发起「复杂系统自动建模」读书会第二季。
读书会将于 9 月 5 日起每周四晚上 20:00-22:00 进行,探讨四个核心模块:数据驱动的复杂系统建模、复杂网络结构推断、具有可解释性的复杂系统推断(动力学 + 网络结构)、应用 - 超材料设计和城市系统,通过重点讨论 75 篇经典、前沿的重要文献,从黑盒(数据驱动)到白盒(可解释性),逐步捕捉系统的 " 本质 " 规律,帮助大家更好的认识、理解、预测、控制、设计复杂系统,为相关领域的研究和应用提供洞见。欢迎感兴趣的朋友报名参与!
详情请见:
登录后才可以发布评论哦
打开小程序可以发布评论哦