第1章事件与概率 1.1 样本空间和事件域 1.1.1 样本空间和事件 样本空间和事件是概率论中两个最基本的概念. 对于实际当中随机现象的研究,需要对其进行“观察或试验”.试验又分为实际的试验和理想化的试验两种,二者的不同在于: 以抛硬币举例,实际的试验中硬币掉落后不一定是正面或反面朝上,它可能是站着的;但是在理想试验中,我们只承认正面或反面朝上这两种可能结果.另外在实际当中有些观察是不能重复的,比如经济中的很多现象,但理想试验中认为观察是可以在同样条件下重复的. 概率论中所考虑的理想试验有下面两个特点: ①在相同条件下可以重复; ②试验的结果虽然事先不能准确预言,但是所有可能结果已知.这样的理想试验被称作随机试验. 要为随机试验制作一个抽象模型以便进行理论研究,关键的地方就是要给出这个试验的所有可能结果.实际上,概率论的研究并不关心试验的具体操作,比如扔硬币时究竟距离地面几米等,而只是关心,各种结果出现的数量规律. 随机试验的结果称为事件.在本书中,用大写的英文字母A,B,C,…来表示.比如,“扔3个硬币恰好出现了两个正面”就是一个事件.事件又分为复合(可分解)事件和简单(不可分解)事件两种.例如“掷两个骰子使总和为6”就是一个复合事件,它可以分解为5个简单事件,即: ①两次抛掷骰子的点数分别为1,5; ②两次抛掷骰子的点数分别为2,4; ③两次抛掷骰子的点数均为3; ④两次抛掷骰子的点数分别为4,2; ⑤两次抛掷骰子的点数分别为5,1.所谓简单事件就是不可分解的事件,比如刚刚所说的5个事件.在随机试验中,我们用ω来表示这些简单事件,并称之为样本点.随机试验的每一个不可分解的结果可以用一个且只能用一个样本点来表示.样本点的全体称为样本空间,用Ω来表示. 样本点、样本空间和事件都有着很直观的意义,而同时我们可以看出,这些概念与集合论中的点集和点的概念可以对应起来: Ω就是一个集合,ω是其中的元素(点),任何一个事件其实都等同于Ω的一个子集.判定一个事件A发生与否的依据就是看A所包含的基本结果即样本点是否出现. 因为每次试验必然出现Ω中的某个结果,即Ω必然发生,所以样本空间Ω又称为必然事件.另外,在集合论中约定不包含任何一个样本点的集合也是一个点集,称为空集,用来表示,这里把空集也作为一个事件来考虑.因为作为一个事件在任何一次试验中都不会发生,所以又被称为不可能事件. 样本空间一旦给定,随机试验的所有可能结果就给定了.所以样本空间实际上就提供了一个理想试验的模型.给定一个样本空间就相当于给定了一个随机试验.在概率论的研究中,一般都假定样本空间是给定的,提到概率时也总要把它结合所给定的样本空间来谈. 在研究实际的随机现象时,一般首先要将实际问题抽象化,构造一个适当的随机试验的模型,即构造一个适当的样本空间;之后再利用概率论的一般理论来得到一些结果,然后返回到实际中,研究这些结果的实际意义. 下面是样本空间和事件的一些例子. 例1.1.1 抛掷一枚硬币.结果有“正面朝上”和“反面朝上”两种,简单记为“正面”和“反面”.样本空间Ω1= (正面,反面). 例1.1.2 连续抛掷同一枚硬币n次并连续记录每一次抛掷出现的结果,则样本空间Ω2由所有形如(ω1,ω2,…,ωn)的样本点构成, 其中ωi=“正面”或者“反面”. 例1.1.3 连续抛掷同一枚硬币,一直到正面出现为止,则样本空间Ω3中的点就是ω1=“正”, ω2=“反正”, ω3=“反反正”, ω4=“反反反正”,等等. 例1.1.4 连续抛掷同一枚硬币并连续记录每一次抛掷出现的结果,则样本空间Ω4由所有形如(ω1,ω2,ω3,…)的样本点构成, 其中ωi=“正面”或者“反面”. 例1.1.5 向平面上的一个有界区域Ω5内投掷质点,记录落点的位置,其坐标用ω(a,b)表示,则样本空间与此区域重合. 以上的5个例子涉及3种不同情况下的样本空间: 第1,2个例子中样本空间Ω中的样本点个数为有限个,称为有限样本空间,而Ω3,Ω4,Ω5中样本点个数都为无限个.但是Ω3中样本点个数为可列个,Ω4,Ω5中样本点个数为不可列个.一般又把Ω1, Ω2, Ω3这样的样本空间归为一类,称为离散样本空间,把Ω4, Ω5这样的样本空间称为连续样本空间. 1.1.2 随机变量 从上一节样本点的定义和例子中,可以看出样本点不必然是数.作为随机试验的结果,它可以是用文字来描述的,比如例1.1.1中的结果是“正面”或者“反面”.但是要把试验结果和数值联系起来也是很容易的,比如抛硬币,出现正面对应数值1,反面对应数值0就可以了. 一般地,对任意一个随机事件A,令1A为如下示性函数,1A=1,如果A发生; 0,如果A不发生;就可以将A和数值联系起来了. 更一般地,可以用一个变量ξ表示随机试验的结果.ξ随着基本试验结果即样本点的不同而取不同的数值.这样的ξ具有着函数的形式,它的自变量是样本点,定义域是样本空间,值域可以是全体实数或者实数的某个子集,数值和样本点之间的对应关系也是确定的,称这样的函数为随机变量,在本书中一般用希腊字母ξ, η, ζ来表示. 随机变量是概率论的主要研究对象,为了对它进行研究,除了要求它是定义在样本空间上的一个函数之外,还要要求它满足另外一些条件.随机变量的严格定义是满足这种要求的函数,前面给出的定义其实是不严格的,它的严格数学定义将在第2章给出. 引进随机变量的意义首先在于它可以把随机试验的结果用数值表示出来,使得研究变得方便.其次,即使样本点已经是数值化的,引进随机变量也是有意义的,因为有时人们感兴趣的并不是试验的直接结果,而可能是结果的某些函数.比如,抛掷两枚骰子,可能关心的是两次骰子出现的点数之和,而不是两次骰子出现的具体值.这时就可以用一个随机变量来表示“两次抛掷所出现的点数之和”的各种结果,它的取值随着抛掷骰子的不同结果而变化. 例1.1.6 连续抛掷同一枚硬币3次,这时Ω={ω1=正正正,ω2=正正反,ω3=正反反,ω4=反反反,ω5=反正正,ω6=反反正,ω7=正反正,ω8=反正反}.可以用一个随机变量ξ来表示这些结果: ξ(ωk)=k,k=1,2,…,8.如果我们所关心的是3次抛掷中出现正面的次数,也可以用一个随机变量η来表示: η(ω1)=3 , η(ω2)=η(ω5)=η(ω7)=2, η(ω3)=η(ω6)=η(ω8)=1, η(ω4)=0. 例1.1.7 连续抛掷同一枚骰子两次,Ω2={(ω1,ω2)}, ω1,ω2在1,2,3,4,5,6中取值.用ξ来表示两次抛掷出现的点数之和,则ξ(ω)=ω1+ω2. 例1.1.8 在包含a个正品和b个次品的产品中随机抽取,每次抽出一个产品,记录下是正品还是次品后放回,共抽取n次,则Ω={(ω1,ω2,…,ωn)},其中ωi的取值为“正品”或者“次品”, i=1,2,…,n. 要描述这n次抽取中抽到次品的次数,可以令ξ(ω)={ω1,ω2,…,ωn序列中“次品”出现的个数}. 例1.1.9 连续抛掷同一枚硬币并记录每一次抛掷出现的结果,样本空间如例1.1.4所给出.如果用随机变量ξ表示第一次出现正面的时间,则ξ(ω)=k,如果ω= "ω1,ω2,…,ωk,…" ,ω1=ω2=…=ωk-1=“反面”, ωk=“正面”.注意到在例1.1.5中我们考虑了同样的问题,那里的样本点ωk=“反反…反正”,其中前k-1个都是“反”,第k个是“正”.从而对于Ω3来说,若用随机变量η表示第一次出现正面的时间,则η(ωk)=k,k=1,2,…. 例1.1.10 在数轴上的\区间内投掷质点,记录质点的位置,则Ω=\. 用随机变量ξ来描述质点坐标的话,则ξ(ω)=ω. 在例1.1.6, 1.1.7, 1.1.8和1.1.9中,随机变量的取值或者有限或者可列,这样的随机变量称为离散型随机变量,而1.1.10中随机变量的取值充满了\区间,这样的随机变量称为非离散的随机变量. 随机变量作为定义在样本空间上的函数,描述了人们所关心的随机试验的结果,它除了可以表示简单事件之外,也可以用来描述复杂事件.下面是几个例子. 例1.1.11 例1.1.7中,事件“两次出现点数之和不小于3”可以表示为{ω|ξ(ω)≥3},简单记为{ξ≥3}; “出现点数为6”就是{ξ=6}. 例1.1.12 例1.1.8中“抽到次品个数不多于5次”的事件可以表示为{ξ≤5}. 例1.1.13 例1.1.10中,事件“投掷在a,a+b2〗区间内”可以表示为ξ∈ a,a+b2〗. 由此,对于随机事件的描述可以有3种方式: ①用集合表示; ②用语言描述; ③用随机变量表示. 1.1.3 事件间的关系和事件运算 前面已经给出了复合事件和简单事件的概念,知道一个复合事件可以分解成一些简单事件的合集,换句话说,一个复合事件就是它所“包含”的简单事件的“并”.这里的“包含”所说的就是事件之间的一种关系,而“并”是事件的一种运算.在本节中将要介绍事件之间的各种关系和运算. 任意给定一个样本空间Ω,可以考虑其中的各种事件之间的关系(要注意,这些关系和运算只有在同一个样本空间下的事件之间考虑才有意义). 1. 事件间的关系 1) 包含关系 为了直观起见,我们用Venn图描述事件集合: 用一个长方形表示样本空间Ω,用圆形或其他集合图形表示事件. 所谓的包含关系是指: 对于两个事件A和B,如果属于A的样本点必属于B,则称A包含于B或者B包含A,记为AB或者BA(如图1.1所示).换句话说,事件A发生蕴含着B的发生(概率论中还习惯用“A发生必然导致B发生”的说法,这里导致并没有时间上的先后或逻辑上的因果,只是一个习惯说法).显然对任何事件A,有AΩ成立. 例如掷一颗骰子,事件A为“出现2点”, B为“出现点数不大于3" ,显然AB.如果用随机变量ξ表示掷骰子的点数,则事件A就是{ξ(ω)=2},事件B是{ξ(ω)≤3},显然{ξ=2}{ξ≤3}. 2) 相等关系 如果AB和BA同时成立,则称事件A和B相等,记为A=B. 3) 互斥关系 如果事件A和B没有相同的样本点(如图1.2所示),则称A与B互斥,或说互不相容.换句话说,事件A和事件B不能同时发生.特别地,认为任何事件与不可能事件互斥. 图1.1 AB 图1.2 A与B互斥 我们已经知道,任何一个事件都不过是样本空间Ω的一个子集.从集合论的角度来看事件是很有用的,对事件所引入的关系和通常对集合引入的关系是一致的.我们还可以考虑事件的运算,这些运算和集合的运算也是一致的. 2. 事件间的运算 1) 事件的并 事件A和B的并记为A∪B,表示的是由A和B中所有的样本点(若有相同的样本点,只计入一次)组成的新事件(如图1.3 所示).若A, B互斥,A∪B又记为A+B,也称为A与B的和. 显然AA∪B, BA∪B,即A发生或者B发生都导致A∪B发生.沿用集合论中的符号,事件A中包含某个样本点ω,记为ω∈A,否则记为ω A,则上述A, B, A∪B之间的关系可以表示为“ω∈A∪Bω∈A或者ω∈B" .从而,A∪B发生就意味着事件A或B至少有一个发生. 2) 事件的交 事件A和B的交记为A∩B,一般简单记为AB,表示的是由A和B中公共的样本点组成的新事件,即“ω∈A∩Bω∈A且ω∈B" (图1.4),则事件A∩B发生就意味着A和B同时发生.特别地,如果AB=,则A与B互斥,反过来若A与B互斥,则AB=. 图1.3 A∪B 图1.4 A∩B 事件的并和交都可推广到多个事件的情形.设有n个事件A1, A2, …, An,它们的并事件A1∪A2∪…∪An一般简单记为∪nk=1Ak,称为有限并.它们的交事件A1∩A2∩…∩An,记为∩nk=1Ak,称为有限交.显然,∪nk=1Ak发生意味着Ak( k=1,2,…,n)至少有一个发生,∩nk=1Ak发生意味着Ak(k=1,2,…,n)同时发生.如果有可列个事件A1, A2, …,也可以同样定义它们的并和交,分别记为∪∞k=1Ak和∩∞k=1Ak.∪∞k=1Ak发生意味着Ak(k=1,2,…)至少有一个发生,∩∞k=1Ak发生意味着Ak(k=1,2,…)同时发生. 3) 事件的差和余 事件A与B的差记为A-B或A\\B,表示由在A中但不在B中的样本点组成的事件(图1.5).ω∈A-Bω∈A且ωB, A-B发生意味着A发生而B不发生. 图1.5 A-B 特别地,Ω-A记为Ac,称为A的余,或对立事件.把Ω-A称为对A的取余运算.显然A和Ac互斥.A∩Ac=, A∪Ac=Ω.另外,(Ac)c=A,即A是Ac的对立事件.Ωc=, c=Ω. 3. 事件的运算法则 在很多时候,还需要进行多个事件的并、交、取余、差等的混合运算.在进行混合运算时,有如下约定: 先做取余运算,再做交运算,最后做并或差的运算.当然还可以用括号来表示运算的先后顺序.比如,计算A∪Bc∩C,则需先对B取余,再计算Bc与C的交,最后再计算其与A的并.若计算(A∪Bc)∩C,则需先对B取余,再计算与A的并,最后计算其与C的交.并与差的运算按先后顺序,例如计算A-B∪C是先做差再做并运算,而A-(B∪C)计算顺序则相反. 根据这些运算规则可知,两个事件A和B的差A-B等于ABc.另外,记A△B=ABc∪AcB=A∪B-AB,称为A和B的对称差,表示由属于且只属于A或B其中之一的样本点组成的事件.A△B发生,则意味着要么A发生,要么B发生,且A, B不能同时发生. 另外,很容易验证事件的运算满足下面的性质. (1) 交换律: A∪B=B∪A, A∩B=B∩A; (2) 结合律: (A∪B)∪C=A∪(B∪C), (AB)C=A(BC); (3) 分配律: (A∪B)∩C=AC∪BC, (A∩B)∪C=(A∪C)∩(B∪C); (4) 对偶律(德·摩根(De Morgan公式): (A∪B)c=Ac∩Bc, (A∩B)c=Ac∪Bc. 特别地,德·摩根公式对有限个或可列个事件情形也成立: ∩nk=1Akc=∪nk=1Ack, ∪nk=1Akc=∩nk=1Ack, ∩∞k=1Akc=∪∞k=1Ack, ∪∞k=1Akc=∩∞k=1Ack.以上证明留给读者. 4. 极限事件 类似于数列,也可以定义事件的极限,为此首先要给出上极限和下极限的定义. 上极限事件: 设{Ak,k=1,2,…}为一列事件,称∩∞n=1∪∞k=nAk为它的上极限事件(要注意的是,这种形式的运算是按照“从里到外”的顺序来做的,例如这里就是先做可列并,再做可列交).容易看出,ω∈∩∞n=1∪∞k=nAk对任意(之后用符号表示)n≥1, ω∈∪∞k=nAkn≥1,至少存在(之后用符号表示)一个N≥n,有ω∈AN.这就意味着当{Ak,k=1,2,…}的上极限事件发生时,{Ak,k=1,2,…}中有无穷个事件发生.通常记为{Ak,i.o.}, i.o.是infinitely often的缩写.其实这也可以作为上极限事件的定义,即{Ak,k=1,2,…}的上极限事件是由那些属于{Ak,k=1,2,…}中无穷多个事件的样本点所构成的事件.反方向的推导是显然的: 如果ω∈{Ak,k=1,2,…}中的无穷多个,则对任意n≥1,必然N≥n,使得ω∈AN. 下极限事件: 称∪∞n=1∩∞k=nAk为{Ak,k=1,2,…}的下极限事件.从而ω∈∪∞n=1∩∞k=nAkN≥1,ω∈∩∞k=NAkN≥1,ω∈Ak.{Ak,k=1,2,…}的下极限事件发生意味着{Ak,k=1,2,…}中至多有限个不发生.这同样也可以作为下极限事件的定义. 上极限事件和下极限事件一般又分别记做lim supk→∞Ak和lim infk→∞Ak,可以证明lim supk→∞Aklim infk→∞Ak;若ω∈lim infk→∞Ak,则除去{Ak,k=1,2,…}中的至多有限个之外,ω属于剩余所有的事件集合.从而它自然属于{Ak,k=1,2,…}中的无穷多个集合,即ω∈lim supk→∞Ak. 当上极限事件和下极限事件相等时,称{Ak,k=1,2,…}的极限存在,记为limk→∞Ak.可以证明对一列事件{Bk,k=1,2,…}, limk→∞∪nk=1Bk=∪∞k=1Bk, limk→∞∩nk=1Bk=∩∞k=1Bk.一般地,上升或下降的事件序列存在极限. 表1.1汇总了本节的内容. 表 1.1符 号概 率 论 意 义Ω样本空间,必然事件不可能事件ω样本点,简单事件A事件ω∈A样本点ω在事件A中,试验结果ω出现则A发生ABA发生则蕴含着B发生A=BA, B为同一事件A∩B或AB发生则意味着A, B同时发生AB=A, B互斥,它们不能同时发生A∪B发生则意味着A, B至少有一个发生AcA的对立事件,Ac发生则A不发生,反之亦然A-B发生则表示A发生但B不发生A△B发生则表示A, B中只有一个发生lim supk→∞Ak发生则意味着{Ak,k=1,2,…}中有无穷多个事件发生lim infk→∞Ak 发生则意味着{Ak,k=1,2,…}中至多有限个事件不发生1.1.4 事件域 在概率论中,样本空间Ω是一个基本的概念,它由随机试验的所有简单结果即全体样本点组成.任何一个事件都是Ω的子集.但是,在概率论中,由于理论的局限,一般并不能把Ω的所有子集都作为事件来研究,而是事先确定一个“事件域”.所谓事件域就是由Ω的某些子集所构成的一个集合类.只有在事件域中的集合才能被看做事件进行研究,不在事件域中的Ω的子集则不在研究范围内. 注: 不把Ω的所有子集都作为事件来研究,是因为要把Ω的所有子集都看做事件,都定义其概率,在有些时候会遇到不可克服的困难.但是要理解这些,需要对实变函数或测度论有一定的了解,这里不再展开讨论. 在概率论中,对于“事件域”的划定,并不是具体给出那些在其中的集合,而只是给出一个“事件域”应满足的规则.只要是按照这种规则给出的集合类,都是一个“事件域”.这样的话,即使在同一个样本空间Ω下,事件域也可以有很多不同的情形. 在下文中我们一般用表示事件域,它需要满足的规则如下: (1) Ω应该是事件,也就是说Ω应该在事件域中,即Ω∈. (2) 如果集合A算做一个事件,那么Ac也应该是事件.即若A∈,则Ac∈. (3) 如果集合列{Ak,k=1,2,…}都算做事件,那么∪∞k=1Ak也应该是事件,即如果Ak∈,k=1,2,…,则∪∞k=1Ak∈. 满足以上3个规则的Ω上的集合类就称为一个事件域.学过实变函数或测度论的读者,可以很容易看出这一定义和σ-代数(也叫σ-域)的定义是相同的.所以以后也会经常借用这一名称,把事件域称为σ-域. 有了事件域的定义后,再说到事件将不再是指Ω的任意一个子集,而是事件域中的某个集合. 根据上一节所讲的集合的运算,由事件域所满足的3个规则可以很容易推导出事件域的如下性质. (1) ∈,这由所满足的第1,2条规则马上可得. (2) 若A1,A2,…,An都是事件,则∪nk=1Ak也是事件.事实上,只要令An+1=An+2=…=,则∪nk=1Ak=∪nk=1Ak∪∪∪…=∪∞k=1Ak,由满足的第3条规则即得结论. (3) 若A1,A2,…,An是事件,则∩nk=1Ak也是事件,此结论对于可列个事件的交也成立,只需注意到∩∞k=1Ak=∪∞k=1Ackc, ∩nk=1Ak=A1∩A2∩…∩An∩Ω∩Ω…即可. 下面是事件域的几个例子: (1) ={,Ω}; (2) ={,A,Ac,Ω}; (3) ={Ω的所有子集}. 从以上例子可以看出,事件域可以很简单,也可以很复杂.对于不同的事件域,有时会比较它们的大小,这里的大小并不是根据事件域所含的事件个数来比较的,而是根据它们之间的包含关系.即: 若有两个事件域, ,如果,就说 比 要小.如果没有这样的包含关系,那么两个事件域是不能比较大小的. 对于事件域的选择,会根据所研究问题的不同而有所不同.比如在离散样本空间的情形,通常会选择最大的事件域,即把样本空间的所有子集都做为事件;而对于连续样本空间做法则不同.下面将介绍一个非常重要的事件域,它在后面的章节中有重要的作用. 为了介绍这个事件域,需要先引入一个新的概念: 给定Ω的任意一个非空集类,必存在唯一的一个Ω中的σ-域,它具有如下两个性质: ①包含; ②它是包含的σ-域中最小的一个.这个σ-域记为σ(),称为由生成的σ-域.σ()的存在性可以简单证明: 首先Ω的所有子集必包含,且它显然是σ-域,所以至少存在一个包含的σ-域.下面只要把包含的所有σ-域做交即可,这个交就是σ().关于任意多个σ-域之交还是σ-域,请读者自行验证. 我们要介绍的这个重要的σ-域称为博雷尔(Borel)σ-域: 若Ω为实直线R,考虑R上的子集类为R上所有形如\注: (1) R上的博雷尔 σ-域是一个重要的概念,在实变函数中有其详细的介绍.在概率论的有些问题中,可以把R作为样本空间,(R)作为事件域.但更常做的是把R作为随机变量的取值空间,即值域,并借用(R)在实变函数中的意义为随机变量的研究提供方便的分析工具.详细的内容在第2章讲述随机变量的严格数学定义时给出. (2) 根据实变函数中的结论,除了(R)=σ()之外,若令1为R上所有形如(-∞,x)的集合类,2为所有形如(-∞,x\]的集合类,3为所有形如(a,b)的集合类,4为所有形如(a,b\]的集合类,则(R)=σ(1)=σ(2)=σ(3)=σ(4).也就是说,(R)中包含R上一切开区间、闭区间、单个实数、可列个实数以及由它们经可列次并、交运算而得出的集合. (3) 对于n维欧式空间Rn,可以类似定义n维博雷尔 σ-域,记为(Rn).它是由Rn中所有n维矩形生成的σ-域,在第3章关于随机向量的定义中,(Rn)有重要作用. 在有了样本空间Ω和事件域之后,通常把它们合并在一起记为(Ω,),并称(Ω,)为可测空间.这本身是实变函数中的叫法. 所谓可测空间只不过是在Ω之外附加一个而已,中的集合就称为可测集.顾名思义,也就是可以“测量”,可以“研究”的集合.给定了,就划定了“测量”、“研究”的范围,即所有的研究将局限在中的集合上. 下一节将引入概率,Ω, 加上概率组成的三元组是概率公理化的基础. 1.2 概 率1.2.1 概率的定义 我们已经知道,概率论是研究随机现象的数量规律的学科,其中各个事件发生的可能性大小就是其中最重要的数量规律.而这个可能性的大小就是概率. 在概率论的发展历史上,关于概率的曾经的定义有很多,包括概率的古典定义(由拉普拉斯给出,又称组合性概率)、频率定义(又称统计性概率)、几何概率、主观概率等.但是这些定义都有各自的局限性,甚至在有些问题中会出现一些歧义.而如何给出概率的严格定义,完善概率论自身的理论基础,一度是概率论发展中所必须解决的非常重要的问题.这一问题也是1900年希尔伯特(Hilbert)在国际数学家大会上所提出的20世纪应解决的23个数学问题之一.之后有很多人致力于去解决这一问题.而直到1933年,由苏联数学家柯尔莫哥洛夫提出的概率的公理化定义以及他所建立的概率论的公理化体系,才使得这一问题得到真正的解决.这一公理化体系既综合了历史上几种概率定义的共同特性,又避免了各自的局限性和含混之处.概率论的公理化体系的建立是概率论发展史上的一个里程碑,在此基础上,概率论才真正作为一个严谨的数学学科迅速发展起来. 本节将首先给出柯尔莫哥洛夫给出的概率的公理化定义,在1.2.3节中再分别介绍概率曾经的几种定义,读者可以很容易看出它们之间的区别. 定义1.2.1 设Ω为给定的一个样本空间,是Ω上的一个事件域,P是定义在上的一个集合函数,它被称为概率,如果它满足如下3个性质: (1) A∈, P(A)≥0; (2) P(Ω)=1; (3) 若Ai∈,i=1,2,…,并且它们两两互不相容,则P∪∞i=1Ai=∑∞i=1P(Ai); 这3条性质又分别称为概率的非负性公理、正则性公理及可列可加性公理. 一个集合函数就是指一个从集合到实数的映射.概率就是定义域为,满足以上3条公理的集合函数.很明显,这一定义并没有具体给出中任一事件A的概率如何计算,而只是规定了概率所满足的性质.这样即使在同一个Ω,同一个上,概率也可以有多种选择.只要是满足3条公理的集合函数,都是(Ω,)上的概率. 在(Ω,)上定义了概率P之后,称(Ω,,P)的三元组为概率空间.在概率论理论问题的研究中,一般都假定(Ω,,P)已经给定.而对于实际问题,如何给定Ω,选择合适的,确定P,则要视具体情况而定. 例1.2.1(有限概率空间) 设样本空间Ω={ω1,ω2,…,ωn}是一个有限样本空间,取为Ω的所有子集构成的集类.p1,p2,…,pn为n个非负实数且∑ni=1pi=1.定义P(ωi)=pi,i=1,2,…,n,对Ω的任意子集A, P(A)=∑j:ωj∈A pj.则容易验证,和P分别满足事件域和概率的要求.此时的(Ω,,P)就是一个概率空间.这种情形称为有限概率空间.特别地,若p1=p2=…=pn=1n,则称(Ω,,P)为一个古典概率空间.特别当n=2时,Ω={ω1,ω2}, ={,Ω,{ω1},{ω2}}, P({ω1})=p1=p, P({ω2})=p2=1-p, P(Ω)=1, P()=0,这种情形下的(Ω,,P)称为一个伯努利空间. 例1.2.2(离散样本空间) 设Ω={ω1,ω2,…}为一可列样本空间,仍然取为Ω的所有子集构成的集合类.p1,p2,…是一列非负实数,且∑∞i=1pi=1,令P({ωi})=pi,且A∈,按与上例同样的方法定义P(A),则这样的(Ω,,P)仍然是一个概率空间,称为离散概率空间. 例1.2.3 设Ω=\是实数轴上的一个区间(a