首先从博雷尔正轨数定律 (Borel’s Normal Number Theorem) 说起。众所周知,(0,1]区间上的每一个实数ω都与一列唯一的无穷的二进制展开序列{Xk(ω)}一一对应,其中Xk(ω)表示二进制展开的第 k 位,对应关系为:

ω=k=1nXk(ω)2k

如果用 (0,1] 上的勒贝格测度λ作为概率测度来计算Xk(ω)的分布,我们容易发现

{ω:X1(ω)=1}=(12,1]{ω:X2(ω)=1}=(14,12](34,1]{ω:Xk(ω)=1}=(12k,22k](32k,42k](2k12k,1]

而其中等式右边每一个集合的勒贝格测度都为 1/2。由此,Xk(ω)是事件集Ω=(0,1]导出的概率为 1/2 的 0-1 分布的随机变量。

事实上,Xk(ω)不仅是同分布的,而且是相互独立的。强大数定律的结论告诉我们:

λ{ω:1nk=1nXk(ω)12}=1

即:如果考虑区间 (0,1] 上这样一个子集A,这个子集的构成元素是所有与均值收敛于 1/2 的二进制展开序列相对应的实数,那么这个子集的 “长度”,即勒贝格测度为 1(λ(A)=1)。这就是博雷尔正轨数定律。

以上所介绍的 (0,1] 上实数与其二进制展开序列的对应关系,我认为是解释概率空间基本概念的最经典、最直观的模型:它不仅近乎完美地解释了事件集与随机变量的对应关系,进而直观揭示分布与测度的关系,而且证明了如何在同一个概率空间中生成无穷维相互独立的随机变量。

如果对以上模型稍作推广,可以得到一些更有趣的结论。对于任意的012之间的常数p,我们考虑ω的 “非对称” 的无穷二进制展开序列Xk(ω),其中每一个Xk(.)都是如下集合Ak的指示函数:

A1=(1p,1]A2=(pp2,p](12p+2p2,1p](1p2,1]

由对称性可知,p>1/2的情形可以类似得到。表达式虽然复杂,但是构造的原理很直观:首先将区间分为长度为 p:(1-2p):p 的三段,然后将每一小段安比例 p:(1-2p):p 继续分割,如此不断进行下去,将第 k 步得到的 3k 个区间中每隔两个选取一个合并,如此就可以得到Ak。容易得到,这种无穷序列和 (0,1] 区间的实数也是一一对应的,Xk服从相互独立的 0-1 分布,P{Xk=1}=p

这里采用了的分割方法和二进制分割略有区别; 当p=12时,每次分割的中间那段区间是退化的,因此得到的结果与二进制的分割本质相同。在这种形式下,与集合A对应的集合B包含所有那些与收敛于p的 “非对称” 二进制展开序列对应的实数集合,即:

B={ω:1nk=1nXk(ω)p}

强大数定律告诉我们:

λ(B)=1

当 p 不为 1/2 时,我们显然有

λ{1nk=1nXk(ω)12}=0

因为大括号内的集合属于集合B的补集,所以其测度为 0。我们把括号内的集合记为A。注意:虽然AA的表达式相同,但是两个集合对应的二进制展开形式是不同的,因此它们是两个截然不同的集合,所以它们虽然在相同的测度空间内,但有着截然不同的测度。

最后,我们按照如下次序构造集合C

C1=(0,p](1p,1]C2=(0,p2](pp2,p](1p,1p+p2](1p2,1]C3=(0,p3](p2p3,p2](1p3,1]Ck=(0,pk](pk1pk,pk1](1pk,1]C=k=1Ck

我们首先挖去 (0,1] 上中央长度为(12p)的区间;在剩下的两个区间内,我们继续挖去每一个区间中央长度为(12p)p的区间,如此不断进行下去,最后得到的集合就是C

给定ωC,那么该条件下的Xk如何分布呢?

首先考虑X1。容易知道,P(X1=0,ωC)=λ(C(0,p]),而λ(C(1p,1])=P(X1=1,ωC)。由集合 C 的对称性,λ(C(0,p])=λ(C(1p,1]),因此,P(X1=1,ωC)=P(X1=0,ωC)。即:在集合 C 上,X1服从等概率的 0-1 分布。以此类推,所有的Xk在集合C上都服从等概率的 0-1 分布。

强大数定律告诉我们:几乎所有C中的实数,与之对应的二进制展开序列均收敛于 1/2。而这样的实数构成的子集,属于零测集A的子集,因此也是零测集。这就说明λ(C)=0

如果令p=1/3,我们就解释了在强大数定律意义下康托三分集测度的含义。

类似地,我们可以进一步解释广义康托集与强大数定律的关系。有兴趣的读者可以作出相应推广。

注:本文已经由 COS 编辑部整理为 PDF(LaTeX)版本,读者可以下载:强大数定律与康托三分集(PDF,105K)

发表 / 查看评论