导语
同一条规律如何跨越生物、河流与注意力经济,成为复杂系统的 " 共同脉搏 "?文章从生物学的开普勒定律 - 克莱伯定律出发,指出生命并非唯一遵循此规律的系统:亚马逊河流盆地展现 " 河流的呼吸 ",互联网中 " 用户的注意力流滋养着网站 ",企业、城市与贸易网络也有相似的流量—规模匹配。如何理解这条跨越生物、河流与互联网的 " 广义克莱伯定律 "?作者从传统 WBE 模型转向更普适的最优运输与连续场视角,强调指数取决于空间维度与网络骨架。并引入 " 开放流网络 " 作为统一视角统一欧式与非欧系统,揭示复杂系统流入、维持、耗散、流出的共同生命节律。
本周五,本文作者陶如意将为我们带来主题分享「分形、自相似与幂律分布」,带你进入尺度变幻、相似相生的奇妙世界:从海岸线的分形,复杂网络拓扑结构的自相似,到复杂系统的数学语言规模法则。
研究领域:克莱伯定律,规模法则,新陈代谢,WBE 模型,最优运输理论,开放流网络
陶如意丨作者
张江丨审校
克莱伯定律是指生物体的新陈代谢和生物体重存在 3/4 幂次关系,这一理论的地位堪称生物学的开普勒定律。克莱伯定律在唯象上刻画了各类生物之间广泛存在的共性规律,是生物学从关注多样性到寻找统一规律的里程碑。科学家们后续也展开了许多对克莱伯定律背后的 " 牛顿定律 " 的探索,包括以 Geoffery West 等人为代表的对克莱伯定律机制层面的经典解释。在他们的 WBE 模型中,生物体内的输运网络被视为一个分形结构 ,而克莱伯定律中的 3/4 幂指数,正是源自能量最小耗散原则下,分形输运网络的几何关系。换句话说,生命体的能量输送就像一套设计精妙的输运系统,兼顾了效率和经济,克莱伯定律正是这种条件下的必然结果。
但生命并不是唯一遵循这条法则的系统。
复杂系统的新陈代谢
河流的呼吸
让我们先把目光来到亚马逊河流盆地。这里的排水网络是一个从多而细小的河流分支,逐渐向主干道汇聚,最终流入亚马逊河的系统。大大小小的河流分支相互嵌套,也形成了一个分形结构(如图 1 所示)。美国马里兰大学的 Banavar 等人通过特定的方法,统计了亚马逊河流盆地各地单位时间的河流流量和河流容量之间的关系,发现二者满足 2/3 幂次关系 [ 1 ] 。如果我们仔细琢磨,不难发现这里单位时间的河流流量,恰好就对应了生物克莱伯定律中的新陈代谢,河流的容量就恰好对应当前河道的规模。如果把河流也看作一个生命体,也就意味 Banavar 发现的规律,恰恰就是河流的 " 克莱伯定律 ",只不过幂指数是 2/3,而不是 3/4。
图 1. 左图是亚马逊河流盆地的河流网络;右图是 Banavar 统计的单位时间的河流流量和河流容量之间的关系。
网络上的流动
我们不妨将视野继续扩展,离开自然界,将目光转向互联网社区。对于一个互联网虚拟社区,用户进入网站,在网页中浏览和跳转,然后离开,整个过程构成了一个集体注意力流。如果我们将在线社区和生命系统类比,将用户的注意力流类比为生物的能量流,会发现二者的对应关系非常完美。
用户进入网站的总注意力流(UV,进入网站的用户量),恰好就可以对应网站的 " 能量流入 ",新陈代谢单元就对应着每个网页节点。生物体的质量就对应着网站系统上的总点击量(PV)。正如生命系统的能量和物质的流入,维持着每个新陈代谢单元的运作,在线社区也依赖着用户的注意力流,用户的注意力流滋养着网站,是网站生长和维持运作的养料。而且,用户进入网站的点击量和网站的用户量,二者恰好也是一个幂律关系,也就是说,在线社区也有它的克莱伯定律 [ 2 ] 。(如图 2 所示)
图 2. 贴吧的克莱伯定律
广义克莱伯定律
其实,生物体的克莱伯定律本质上是在刻画系统的流量和系统规模的匹配缩放关系,强调系统的物质或能量的流入和流出,与规模存在幂律关系,而系统规模的累积和消耗过程又直接和流入流出有关,这就形成了一个经典的系统动力学反馈系统,而对这一过程的刻画自然而然的就和系统的生长和演化存在深刻的联系。我们将这类描述复杂系统流量和规模的关系,称之为 " 广义克莱伯定律 "。
这样的例子我们还可以列举出非常多,比如企业系统,企业的收入与企业资产也可以分别对应企业系统的流量和规模,只不过这里流动的是货币,而收入和资产的关系也刚好是幂律;还有城市人口的流入和城市规模的关系;等等。在这些系统中,流动的可以是具体的物质,比如能量流、人口流动,货币流动(如图 3 右侧所示),也可以抽象的概念,比如用户的注意力流(如图 3 左侧所示)、价值流等。关键在于这类系统的增长和生物体类似,由这些流动所驱动,所以这些流动构成了广义上系统的新陈代谢。
既然广义克莱伯定律如此普遍,我们该如何用一种更加普适的方式在机制上解释它呢?首先我们可以将目标收回到 WBE 模型,它是否可以解释?这一追问就暴露了 WBE 模型的局限性。尽管现实世界中确实存在大量的分形结构,但直接将一个树状分形结构网络用于建模还是有些过于理想化。原因在于,一是真实世界中很难存在如数学世界中那样的规整的分形结构,严格的分形结构必然会损失其现实含义;另一个更重要的原因是,对于一个非欧系统来说,它的分形结构并不直观,WBE 中适用于血管的约束很难直接进行推广。
于是,就有了后续在更加广泛意义上的对克莱伯定律的延伸以及其机制的讨论。
普适的机制:最优运输理论
马里兰大学的 Banavar 教授带领团队,从最优运输理论出发,为克莱伯定律的机制建立了更为简洁的模型 [ 1 ] ,而且,Banavar 认为,克莱伯定律并非仅存在与生命系统,对于一般的 d 维流网络,也存在系统流量和规模的关系,且二者关系为F ~ Md/d+1,也就是幂指数和系统所处维度有关。所以他的模型还可以同时解释河流系统的 2/3 幂指数。
Banavar 模型如图 4 所示,将一个系统的能量分配看做是由一个中心节点向四周节点分发流量的运输过程,要求这一过程满足:
1. d 维几何体由均匀分布在空间中的代谢单元构成,每个代谢单元是同质的,消耗相同的能量。
2. 流动是局部的,不存在长距离的连边,这是由欧式空间决定的
除此之外,还引入了如下假设:生物体的体重和整个系统中的流量成正比,那所谓的新陈代谢和系统规模的关系,就是系统流量和存量之间的关系。如果将整个系统的输运成本定义为系统中的流量总和,也就是要花费最小的流量流经所有的节点,可以计算得到一个最优的输运结构(如图 4 所示)。相比于 WBE 模型,Banavar 模型引入的假设力度更弱,这就使得它的可扩展能力更强。
图 4. Banavar 模型示意图。左图是成本最高的网络,右图是成本最低的网络。
在 2001 年,德国物理学家 Dreyer 在 PRL 上发表了模型 [ 3 ] ,进一步将 " 代谢 "-" 规模 " 的幂律关系推广,将 Banavar 模型中的离散网络节点扩展为了 d 维空间中的连续场,也就是物质和能量在一个连续的场中变化。我们可以这样理解德雷尔模型中描述的物理图景(如图 5 所示):无论是生物,还是河流,我们可以忽略这些系统的内部细节,而将其抽象看地看做一个均匀连续的场,系统的生长可以抽象成物质和能量从一个源出发,在这个场中流动,且每个位置都需要消耗一些物质和能量。引入流量守恒之后,那么这个系统的流量就会随着和源距离的增加而递减,最终,系统的 " 边界 " 就是能量或者物质等于 0 的位置。系统如果扩大了 N 倍,要保证每个位置都继续维持自身的运转,那么流经每个位置的流量也势必要增多。而流量增多和系统扩大的关系,则正是系统流量和存量的关系,即广义克莱伯定律了。Dreyer 模型将最优性假设也移除了,形式上进一步简化。
图 5. Dreyer 球模型示意图。用一个连续场建模系统流动
无形的流动:开放流网络
不过,上述的 Banavar 模型和 Dreyer 模型,我们其实都没有离开欧式空间讨论,流动都发生在一个实际的物理空间。如果系统的流动并没有被嵌入在欧式空间呢?如果系统的流动发生在一个网络上呢?对于互联网、企业等这类非欧系统,它们无法通过欧式几何坐标来描述,其实最好的方式是将其抽象为一个网络结构,而集体注意力流、现金流这些流动,都是发生在这个网络结构上的。实际上,这种 " 网络化 " 的抽象,在现实世界中更加普遍,可以同时描述欧式空间和非欧空间中流动。
和普通的复杂网络不同的是,这里的网络结构内存在一个处于平衡状态的动力学,即每个时刻都有流量在连边上流动,且流量不随时间发生变化。连边及其权重刻画了流量如何在节点之间动态传递。我们将这类网络称为开放流网络,如图 6 所示。
图 6. 开放流网络示意图
我们有两种方式来定义开放流网络的 " 新陈代谢 "。第一种是系统层面,我们可以直接将一个网络看做研究对象,研究总流量和总体规模之间的关系。
系统尺度的定义
还是以互联网上的用户注意力流为例。对于一个网站,在一定时间内用户从外部进入当前网站的数量就是这个网站的入流,也就是网站的 UV,用户在网站内跳转,即用户的注意力流就冲刷出了一个流网络。此时系统内产生的总点击量就可以看做是系统的规模,即网站的 PV。一个网站在给定时间内就可以构成一个流量 - 存量的点对。当然,由于系统往往会随时间演化,所以我们可以对一个网络获得不同时间的点对,分析 UV ( t ) 和 PV ( t ) 的关系。
吴令飞和张江等人 [ 4 ] 通过分析 30w 贴吧数据发现,通过计算这类在线社区,UV ( t ) 和 PV ( t ) 确实存在幂律关系,即
UV ( t ) ~ PV ( t ) θ
而且幂指数(θ)对于不同的贴吧来说并不相同。实际上,这个幂指数的倒数恰好可以反映当前社区的用户粘性(按照 PV ( t ) ~ UV ( t ) 1/ θ 来理解更清晰),幂指数的倒数越大,表示用户量的增加会带来更多非线性增加的访问量,说明当前社区的内容质量越高,越能吸引用户在其中浏览。从更广泛的意义上来说,整个互联网中流动着人类的注意力,即集体注意力流(attention flow),集体注意力流刻画了人们的注意力在不同资源上,因点击、回复、点赞等交互行为导致的注意力流动、转移的动力学,反映了人类集体兴趣的转移动力学。而注意力流恰恰是一个典型的开放流网络,如图 7 所示。网络的流 - 存幂律关系刻画了人们在当前系统的兴趣转移过程的特点。
图 7. 注意力流网络
然而,很多时候我们无法做重复实验,获得同一系统的大量样本,更多时候我们能获取的是一个节点数量庞大的单个网络,一个典型的例子就是国际贸易网络,所有国家都是这个网络的节点,此时我们更关心的是每个节点的属性,所以就有了对开放流网络新陈代谢的第二种在节点层面的定义:即我们可以对每个节点计算属于它的流量和规模。
节点尺度的定义
在这个情况下,流量比较容易理解,对于一个平衡的流网络来说,节点 i 的流量就是流经当前节点所有连边的出流或者入流(由于网络平衡,所以这两个量相等)。
而节点的规模定义就没有那么想当然,但一个直观的理解是,流网络节点的规模其实是对 Banavar 模型中的河流容量的直接扩展,而复杂网络和河流网络最大的区别在于,复杂网络中是存在回路的,所以不能简单统计从源到当前节点的直接流量,而应该计算从源到当前节点所有路径的流量。最终节点 i 的规模其实等价于流经节点 i 的流量在整个网络中的分布量,而这其实和网络科学中的一类节点重要性的定义一致。这里不对具体的数学细节进行展开,有兴趣的朋友可以去阅读集智百科词条 [ 5 ] 或者论文原文。总之,我们可以很方便地使用一些图论中的数学工具来获得节点规模的计算。
有了流量和规模的定义,我们就可以对一个网络计算其是否满足克莱伯定律。在张江等人的工作 [ 4 ] 中,系统揭示了各类开放流网络克莱伯定律的幂指数(表 1 所示)实际上,网络的幂指数的大小其实是在揭示网络中节点流量和其重要性的匹配程度,幂指数越大的网络,意味着网络的中心性越强,具体可参照下表 1。
表 1:不同的开放流网络以及特征
网络 | 幂指数 η | 性质 | 含义 |
生态流网络 | ≈ 1 | 中性的 | 大物种在网络中的控制力与该物种的流量成比例 |
点击流网络 | <1 | 去中心化的 | 大网站的影响力没有达到与流量匹配的程度 |
国际贸易网全网 | ≈ 1 | 中性的 | 大国在贸易中的控制力与该国的流量成比例 |
工业产品贸易网 | >1 | 中心化的 | 大国在贸易中的地位远超过了与流量匹配的程度 |
农业等基础产品贸易网 | <1 | 去中心化的 | 大国的影响力没有达到与流量匹配的程度 |
实际上,除了以上两类系统层面和节点层面的流 - 存幂律关系之外,开放流网络还存在着其他的幂律,比如节点流量和耗散的幂律关系
( Ti 是流经节点 i 的总流量,Di 是节点 i 的耗散量),意味着越大的流量往往意味着非线性增长的耗散,如生态系统能量在不同能级的耗散、企业金钱流的浪费等等;而这些信息都和系统的生长和死亡有关,流入、维持、耗散、流出,构成了复杂系统生长和死亡的基本框架。
从生物体的新陈代谢,到河流网络,到广泛存在的网络流动。我们看到了流量与系统规模之间那条普适的幂律曲线。克莱伯定律也早已不只是生物系统的专属语言,它更像是一切 " 活着 " 的复杂系统的共同脉搏。它也是复杂系统在生长、演化和耗散中为数不多的、能够被我们看见的规律,是揭示复杂系统演化机制的关键钥匙。
参考文献
[ 1 ] Banavar, J. R., Maritan, A., & Rinaldo, A. ( 1999 ) . Size and form in efficient transportation networks. 399 ( May 1999 ) , 1998 – 2000.
[ 2 ] Wu, L., Zhang, J., & Zhao, M. ( 2014 ) . The Metabolism and Growth of Web Forums. 9 ( 8 ) , 1 – 11. https://doi.org/10.1371/journal.pone.0102646
[ 3 ] Dreyer, O. ( 2001 ) . Allometric scaling and central source systems. Physical Review Letters, 87 ( 3 ) , 38101-1-38101 – 38103. https://doi.org/10.1103/PhysRevLett.87.038101
[ 4 ] Zhang, J., Lou, X., & Guo, L. ( 2016 ) . Universal patterns and constructal law in open flow networks. International Journal of Heat and Technology, 34 ( 1 ) , S75 – S82. https://doi.org/10.18280/ijht.34S109
[ 5 ] 集智百科流网络:https://wiki.swarma.org/index.php/%E6%B5%81%E7%BD%91%E7%BB%9C
作者:陶如意 北京师范大学系统科学学院在读博士生
审核:张江 北京师范大学系统科学学院教授
出品:中国科协科普部
监制:中国科学技术出版社有限公司、北京中科星河文化传媒有限公司
登录后才可以发布评论哦
打开小程序可以发布评论哦