空气污染

首页 » 常识 » 常识 » 中科院马健利用Copula熵发现北京大气
TUhjnbcbe - 2021/1/17 17:01:00
阴囊湿疹勿乱抓 http://www.nanjingwang.net/lcjc/7140.html

引言

因果关系是人类面对的永恒主题之一。我们总是希望知道自然现象、社会现象或者生命现象为什么发生,事物发生的因果链条是怎样的。哲学家说,发现因果,胜过做王者。因果关系乃是世界之中的必然规律,宛如神的旨意,无论人类是否愿意,它都是必然发生,人只有无条件的遵从,强制性自然是胜过的国王的法令。能够自如运用这样的因果,则可以号令万物,有如王者一般。本文的目的就是利用因果发现技术,发现北京大气污染现象中的因果关系,以便我们明白因果,号令天气。

然而发现因果关系并非易事,古往今来的哲学家费尽思量。控制论学者维纳提出了一种因果关系的哲学概念,表述为因必须有助于改善果的预测。在此理念基础上,格兰杰提出了著名的格兰杰因果关系(GrangerCausality)检验。然而这种检验适用于比较简单的情况,对于复杂的非线性因果并不适合。Schreiber定义了用于发现稳态时序包含的因果关系的传递熵(TransferEntropy)的概念,可以被认为是格兰杰因果的非线性版本,应用范围就广泛了。传递熵作为广泛采用的因果关系度量,基于条件独立的概念,较之其他经验式因果关系建模方法更科学合理。问题是从数据计算传递熵并非易事,常常借助与假设条件,且存在估计误差。自如的估计传递熵需要借助于copula熵的概念。

Copula熵

Copula熵是由本人和导师孙增圻教授在年严格定义的一种用于度量统计独立性关系的数学概念。关于这些内容,在前一篇博客文章中已经做了较多叙述。统计独立性在概率统计中是基础性的概念,在高斯变量的情况下,退化成相关性。而相关性的度量在统计学科的早期就被提出并研究,最广为人知的度量是皮尔逊相关系数(PearsonCorrelationCoefficient)。但皮尔逊相关系数只限于线性高斯的情况,因而虽然经典,但在充满了非线性的复杂自然界面前,往往力不从心,应用范围十分有限。如果不考虑前提条件地应用,得出的结论也是不可靠的。

Copula熵是一种理想的统计独立性度量,它严格的数学定义使其满足很多数学家梦寐以求的公理性质,多变量、对称性、非负性、不变性,以及高斯情况下与相关系数等价等。由于统计独立性的基础性地位,copula熵的应用自然是广泛的。目前,其已经被应用于解决一些经典的统计问题,比如关联分析、结构学习、变量选择和因果发现等。这里主要

1
查看完整版本: 中科院马健利用Copula熵发现北京大气