第五节 平稳随机过程
平稳随机过程在水文水资源分析计算中最为常用。
一、平稳随机过程的概念
一个随机过程X(t),若对任何n与k,X(t)的n维分布函数满足
则X(t)被称为平稳随机过程(简称平稳过程),否则被称为非平稳随机过程。
从式(2-16)可以看出,平稳随机过程的n维分布函数不因所选开始时刻的改变而不同,即平稳随机过程的统计特性与所选取的时间起点无关。也就是说,平稳随机过程的统计特性不随时间t的变化而改变。例如,在河流同一断面上,利用1900年开始的相当长的年径流系列计算得到的年径流量n维分布函数与利用任一年(如1913年)开始的相当长的年径流系列计算得出的n维分布函数是相等的。这种现象的解释是:若产生随机过程的主要物理条件在时间进程中没有变化,则该随机过程的统计特性也不会随时间而变化。如果产生年径流的气候条件与下垫面条件都没有重大变化,则年径流的统计特性也不会随时间而变化,因而不同开始时刻的年径流n维分布函数也不会有变化。由于平稳随机过程的这个特点,可使问题的分析计算大为简化。它具有一系列简单的特性,因而这类随机过程在实际工作中得到了广泛应用。
二、平稳随机过程的数字特征
平稳过程的数字特征具有以下特点。
1.均值平稳
根据平稳过程的定义,当n=1时,对任意τ有
当τ=-t时,则有
同样有
即平稳过程X(t)的一维分布函数及一维概率密度都与时间t无关。那么
从式(2-19)看出,平稳随机过程X(t)的均值函数与时间t无关,即其均值函数μ为常数。也就是说,平稳随机过程的均值平稳,又称一阶平稳。
2.方差平稳
由前面有
因此,平稳随机过程X(t)的方差函数σ2是常数,不随时间t而变,称为方差平稳或二阶平稳。当然,标准差也是平稳的。
3.偏态系数平稳
可见,平稳随机过程X(t)的偏态系数是常数,不随时间t而变,称为偏态系数平稳。
4.协方差平稳
根据平稳过程的定义,当n=2时,对任意k有
令k=-t1,t2-t1=τ(时间间隔),则
可见,平稳过程的二维分布函数与具体时间位置无关,只与时间间隔τ(又称滞时)有关。自协方差函数为
因此,平稳随机过程X(t)的自协方差函数只与时间间隔τ有关,称为自协方差平稳,它属于二阶平稳范畴。
5.自相关函数平稳
式(2-24)说明平稳过程的自相关函数与具体时间位置无关,只与时间间隔τ有关,即平稳随机过程的自相关函数平稳。
现用表2-2进一步说明。在某河流断面上,年径流量的总体若以n年为一组,客观上存在着多组样本(N组)。所有可能出现的样本x1(t),x2(t),x3(t),…的集合构成了随机过程X(t)。对于特定的时间t1,X1=X(t1)是一个随机变量。同样,X2=X(t2),X3=X(t3),…,Xn=X(tn)都是随机变量。计算随机过程的数字特征,见表2-2最后几行。
若X(t)是平稳随机过程,则μ1=μ2=…=μn,D1=D2=…=Dn,协方差Cov(ti,tj)、自相关系数ρ(ti,tj)只与时间间隔tj-ti有关。而表2-1的月平均流量序列的数字特征随截口(月份)变化,表明月平均流量序列是非平稳过程。
表2-2 随机序列及其数字特征
续表
三、平稳随机过程的分类
平稳随机过程可分为两类,一是严平稳随机过程,即满足定义[式(2-16)]的平稳随机过程,又称狭义平稳过程或高阶平稳过程,这样的平稳过程在现实中是没有的;二是宽平稳随机过程,即均值和协方差平稳的过程,也称广义平稳过程或二阶平稳过程。在现实世界中宽平稳过程还是存在的,一般平稳过程如没加特别指明外都是指宽平稳过程。在水文水资源系统中,当影响它的主要因素(气候、下垫面及人类活动等)相对稳定时,以年为时间尺度的水文序列可近似作为平稳随机序列,如年降水量序列、年径流序列、年蒸发量序列等。
这里以水流脉动现象为例进一步给予说明。见表2-3,在某河流某断面上定点连续观测了N次,每次观测n分钟(N和n都比较大)。设整个观测期内水流条件基本不变。从表2-3可以看出,各截口的均值和均方差都没有显著性差异,各截口时间间隔τ=1、2的自相关系数ρ(1)、ρ(2)都很小,与0无显著差异。可见,水流脉动现象为一宽平稳过程。
表2-3 某河段某点水流脉动流速及其统计特征值(一) 流速单位:m/s
四、平稳随机过程的各态历经性
前述的各截口数字特征是通过大量的样本函数计算而得的。这样计算的数字特征能真实反映随机过程的统计特性。
在水文学中,往往难以获取大量的样本函数x1(t),x2(t),x3(t),…,如以年为时间尺度的水文序列(年径流序列、年降水量序列等),而实际上仅仅有其中一个样本函数如x1(t)。在这种情况下,能否用一个样本函数来分析随机过程的统计特性呢?
1.各态历经性
理论证明,在一定条件下,平稳随机过程的一个相当长的样本资料(一个现实)可以用来分析计算平稳随机过程的统计特性。这样的随机过程被称为具备各态历经性或遍历性,并称为各态历经过程。
平稳过程各态历经性或遍历性,可以理解为在样本容量很大的情况下,各个样本函数都同样经历了平稳过程的各种可能状态,或者说每一个样本函数能够代表过程的所有可能样本函数,因而任何一个样本函数都可以代表平稳过程的统计特性,则可由任何一个样本函数估计平稳过程的统计特征。图2-4给出的平稳过程就具有各态历经性。若任选一个现实并把它的观测时间延长,则它就能很好地代表平稳过程X1(t)。
图2-4 各态历经平稳过程
图2-5 非各态历经平稳过程
下面以水流脉动现象为例进行说明。表2-4右边统计参数是由各样本函数分别估计出来的。从表2-4中任取一个现实,如第4个现实,得均值为0.859、均方差为0.268,这和各截口的均值和均方差甚为接近,统计上没有区别,也就是说,它们是相等的,即可以用一个现实的统计参数代替随机过程的统计参数。从前面知,水流脉动过程是平稳过程。因此,这个实例印证了上述结论。显然,非平稳随机过程不具备这样的性质。
表2-4 某河段某点水流脉动流速及其统计特征值(二) 流速单位:m/s
需要说明的是,并不是所有的平稳随机过程都具备各态历经性,如图2-5所示,任选一个现实并把它的观测时间延长,它都无法代表平稳过程X2(t)。对于水文水资源系统而言,一般常常假定平稳随机过程具有各态历经性。
2.基于时间域的数字特征计算
设平稳随机过程X(t)的任意一个样本函数x(t)(0≤t≤T),其数字特征计算如下。
(1) 均值。
若为离散序列x1,x2,…,xn时,则
根据平稳过程的各态历经性,当T或n足够长时,。
(2) 方差。
当T或n足够长时,。
(3) 偏态系数。
当t或n足够长时, Cs*=Cs。
(4) 自协方差。
当T或n足够长时,Cov*(τ)= Cov(τ)。
(5) 自相关系数。
当T或n足够长时,ρ*(τ)=ρ(τ)。
这样计算出来的数字特征,称为时间平均。对于平稳过程,当T或n足够长时,时间平均等于统计平均。