科学家要为复杂系统预测找把“基准尺”
2026-02-01 19:25:19 · chineseheadlinenews.com · 来源: 中国科学报
研究者们热衷于研发更精妙的算法,训练更庞大的模型,试图预见明天股市的涨跌或未来十年的全球气候。然而,一个与之相伴且更为基础的问题值得关注:对于气象、经济走势或互联网这类错综复杂的系统而言,预测的“天花板”究竟在哪里?
打个比方,如果对某地区飓风路径的预测准确率已达到了80%,要是再继续投入,能否把这个数值再提升到90%?还是说,这个系统的预测极限可能就是81%,再投钱也是徒劳?
近日,由来自清华大学、电子科技大学、南方科技大学以及哈尔滨工程大学的研究者组成的联合团队,在《物理报道》期刊发表了题为《复杂系统可预测性》的长篇综述论文。与大多数专注于改进预测方法不同,这项工作的核心是探索“预测的极限”,并为各种复杂系统的预测建立一把“基准尺”。
“基于这项研究,我们不一定能提升它预测的效率,但一定能避免做无用功,至少能知道这个问题你还值不值得往下做。”电子科技大学大数据研究中心主任、教授周涛说道。
从“各自为战”到寻找共通“标尺”
过去,针对不同类型复杂系统的可预测性研究往往处于分散状态。例如,预测社交网络未来结构是一种方法,预测河流径流量是另一种路径,而预测发电机组的运行状态又是完全不同的思路。
此次发表的综述论文,系统梳理了上述例子分别代表的“时间序列”“复杂网络”和“动力学行为”这三大类复杂系统的可预测性研究。研究团队发现,在这些看似风马牛不相及的预测任务背后,可能存在共通的理论基础和方法论。
“我们试图找到能够衡量各类系统内在可预测性的统一视角,比如信息论中的‘数据压缩极限’。”周涛介绍,一个系统的数据能被压缩到什么程度,与其内在的规律性和可预测性密切相关。“另一个来自统计力学中的‘熵’,特别是用于刻画系统混乱程度的‘柯尔莫哥洛夫熵’。”
他表示,这些理论工具,或许能为研究者提供一套跨领域的诊断方法,用来评估一个系统本质上“好不好预测”。
“这就像为预测领域制定一把‘基准尺’。”周涛总结,其目的不是取代具体的预测算法,而是告知特定领域内,某个具体问题的理想的“目标分数”究竟该定在哪里,以及目前离这个目标还有多远。从专注于“如何做得更好”,转向同时思考“最好能做到多好”。
有效预测时长:知道何时停下来
研究还提出了“有效预测时长”这一关键概念。
周涛以气候预测为例,某些天气系统有效的预测窗口可能就是7天。这意味着对7天之后的预报来说,其参考价值会急剧下降。这个概念具有直接的现实意义,即不仅能帮助公众理解预报的局限性,也能指导研究资源和工程投入的分配。
再例如在互联网领域的广告推荐系统。“如果基于分析判断,对用户点击行为的预测精度已经接近当前系统的理论极限,那么一些高耗能的优化算法可能就不需要再部署了,因为收益会非常有限。”周涛说道。
此次综述文章不仅仅是对已有文献的汇编,更是团队十余年研究成果的凝练与升华。其中,对于跨领域可预测性统一理论框架的提出与梳理具有首创性。
尽管整体理论框架初步建立,但针对真实世界的复杂系统,衡量其可预测性依然充满挑战。文章指出,当系统具有“非平稳性”“高维度与强耦合”以及“多尺度”等特征时,如何可靠地量化其预测极限,仍是待解的难题。
后续,研究团队将深入探索可预测性分析应用于蛋白质折叠、基因调控等生物复杂系统,以及网络结构随时间演化的预测极限问题。
周涛表示团队也将建立“复杂性——可预测性”映射框架、推动理论方法与人工智能的深度协同、加强跨领域的基准与标准化以及提升对极端与稀有现象的高灵敏度预测能力,将有望推动复杂系统可预测性研究走向更系统化的“预测科学”。