概率论(下)

二维随机变量

二维随机变量概念

在同一随机试验E中,称定义在同一样本空间上的两个随机变量X,Y构成的有序数组(X,Y)为二维随机变量。对每个样本点w,有两个实数X(w),Y(w)与之对应且满足:

  • 对任意实数x,事件{w|X(w)<=x}都有确定的概率
  • 对任意实数y,事件{w|Y(w)<=y}都有确定的概率
    n维随机变量
    设随机试验E的样本空间为Ω,X1,X2,…,Xn为定义在Ω上的n个随机变量,称它们构成的有序数组(X1,X2,…,Xn)为n维随机变量。
    二维随机变量积其分布
    定义:对任意实数(X,Y)∈R^2记

称二元函数

的联合分布函数。 一维随机变量 X、Y的分布函数

称为 (X, Y) 的边缘分布函数。

由联合分布函数可确定边缘分布函数

联合分布函数的性质
  1. 单调不减性:F(x,y)分别对x,y单调不减。

  2. 有界性:0<=F(x,y)<=1

3.右连续性:F(x,y)分别关于x或y为右连续。

4.相容性:对任意x1<x2,y1<y2,有:

如果二元函数F(x,y)满足上述4个性质,则必存在二维随机变量(X,Y)以F(x,y)为分布函数。

n维随机变量

定义:n维随机变量

的联合分布函数:

式子中

为n个任意实数。

的联合分布函数可确定。其中任意k个分量的联合分布函数,称为k维边缘分布函数.例如:

二维离散型随机变量及其联合分布律的定义

定义:设二维随机变量(X,Y)至多取可列对数值:

称(X, Y)为二维离散型随机变量,称上式为(X, Y)的联合分布律.

二维离散型随机变量的性质

1.联合分布函数为

2.随机变量X和Y的分布律为

二维连续型随机变量及其联合概率密度的定义

设二维随机变量(X,Y)的联合分布函数为F(x,y),如果存在非负的函数f(x,y)使得对任意实数对(x,y)∈R^2,有

称(X,Y)为连续型随机变量,称f(x,y)为(X,Y)的联合概率密度。

联合概率密度的性质

1.

2.如果联合概率密度函数f(x,y)在(x,y)处连续,则有

3.若区域G∈R^2,则有

二维随机变量的联合分布函数与边缘分布函数的关系

设二维随机变量( X,Y)的联合分布函数为F(x, y),则X、Y都是随机变量,且X、Y 的分布函数分别为

此时称F(x),F(y)为(X,Y)关于X、Y的边缘分布函数


设二维离散型随机变量(X,Y)的联合分布律为

则X、Y都是离散型随机变量,且X、Y 的分布律分别为

此时称pi、pj 为(X,Y) 关于X、Y的边缘分布律.


设二维连续型随机变量( X, Y) 的联合概率密度为 f(x, y), \quad(x, y) \in R^{2}
则X、Y都是连续型随机变量,且X、Y 的概率密度分别为

此时称

关于X、Y 的边缘概率密度.

随机变量的独立性

设(X,Y)是二维随机变量,若对任意实数对(x,y)均有

成立,称X与Y相互独立,否则称它们是相依的。

注意:只要有一个实数对(x0,y0),使定义中的式子不成立,则X和Y不相互独立。

等价条件:
1.分布函数形式

2.分布律形式

3.概率密度形式

多维随机变量独立性

设n维随机变量(X1,X2,…,Xn)的联合分布函数为F(x1,x2,…,xn),若对任意实数x1,x2,…,xn均有

则称(X1,X2…Xn)相互独立。

随机变量的相互独立实质上是随机事件的相互独立。

性质

若n维随机变量(X1,X2,…,Xn)相互独立,则

  1. 其中任意k个随机变量也相互独立
    2.(X1,X2,…,Xn)两两独立。(两两独立不一定相互独立)
    3.m维随机向量与n维随机向量相互独立。(两个不相交的子向量也相互独立)
    4.函数随机向量也相互独立
    离散型条件分布
    设(X,Y)的联合分布律为:,则在事件发生的条件下,事件发生的条件概率为则此概率数列具有分布律的性质
  2. P{X=xi|Y=yi}>=0 i=1,2,…
    2.

则称上述分布律为在Y=yj的条件下,随机变量X的分布律。

如何判断两个离散型随机变量X,Y相互独立。
离散型随机变量的条件分布函数
连续型条件分布函数
条件概率密度

为在 Y=y的条件下随机变量X 的条件概率密度。其中x是自变量,y是固定值。

如何判断X,Y两个连续型随机变量相互独立
联合分布,边缘分布,条件分布的关系

通过联合分布可以求出边缘分布,进一步求得条件分布。然后通过边缘分布和条件分布可以确定唯一一个联合分布。

离散型随机变量的函数及其分布率
一维情况

根据随机变量X的分布律和函数,求出对应变量的值,然后合并函数值相同的取值点对应的概率。

二维情况

根据二维离散型随机变量的联合分布率和二元函数求出函数值,然后合并函数值相同的取值点对应的概率。

离散卷积公式

设随机变量(X,Y)是离散型随机变量,X,Y相互独立,其分布律为

则X+Y的分布律为

随机变量若相互独立且具有相同类型的分布,则可以相加。二项分布随机变量可等价表示为多个独立0-1分布随机变量之和。

连续型随机变量的函数及其概率密度
一维连续型随机变量函数的概率密度

然后对F(y)求导即可。解题关键是将g(X)<=y转换为关于X的取值范围并求概率。

二维连续型随机变量函数的概率密度

然后求导得出其概率密度。关键把z看成常数,确定积分上下限。

Z=X+Y,若随机变量X,Y相互独立,则

正态分布具有可加性,均匀分布不具有可加性。

数学期望

离散型随机变量的期望

连续型随机变量的期望

随机变量的数学期望是它所有可能取值的加权平均值,是一个数字。定义中的绝对收敛是保证数学期望的唯一性。

随机变量的函数的数学期望

离散型随机变量

连续型随机变量

期望性质

1.E(c)=c
2.E(cX)=cE(X)
3.

4.如果X,Y相互独立,那么期望的乘积等于乘积的期望
5.

方差

方差刻画了随机变量X相对数学期望的偏离程度,随机变量X关于自身的数学期望的偏离程度比相对其他任何值的偏离程度都小
1.常数的方差等于0
2.

3.

4.

5.

6.切比雪夫不等式,若随机变量X的方差D(X)存在,则任意

协方差

若E{[X-E(X)][Y-E(Y)]}存在,称

为随机变量( X, Y)的协方差.有

相关系数
协方差矩阵

设n维随机变量(X1,X2,…,Xn)的协方差均存在那么随机变量的协方差矩阵为

性质

1.Cij=D(Xi),i=1,2,3…,n
2.Cij=Cji
3.C是非负定矩阵
4.

设随机变量X,

为X的k阶原点矩

为X的k阶绝对原点矩。

为X的k阶中心矩

依概率收敛

设{Xn}是一个随机变量序列,X是一个随机变量或常数,若对任意

\varepsilon >0

有,

则称随机变量序列{Xn}依概率收敛于X。表示当n很大时,Xn与X出现较大偏差的可能性很小。

大数定律

设Xn,n=1,2…是随机变量序列,其数学期望都存在,若对于任意的

称随机变量序列{Xn}服从大数定律。
大数定律的概率意义:{Xk}的前n项算术平均将紧密地聚集在其数学期望的附近。

切比雪夫大数定律

设Xk是相互独立的随机变量序列,其数学期望和方差都存在,且存在常数C,使得

则随机变量序列{Xk}服从大数定律。

切比雪夫不等式

设随机变量X的数学期望E(X)和方差D(X)都存在,则对于任意的

该公式刻画的是其随机变量与数学期望的概率关系,是对方差存在的随机变量落在以数学期望为中心的对称区间内的概率的粗略估计。其方差越小,说明了随机变量和数学期望距离小的概率越大。

独立同分布大数定律

设X1,X2…Xn…是相互独立的随机变量,且E(xi)=μ,D(Xi)=σ^2,i=1,2…则

伯努利大数定律

设m为n重伯努利试验中事件A出现的次数,p为A在每次实验中发生的概率,则

依分布收敛

对于同一分布的随机变量,随着叠加次数的增大,逐渐趋向于正态分布。设X1,X2,…Xn,…是随机变量序列,X为随机变量,Fn(x)和F(x)分别是Xn和X的分布函数,如果在F(x)的连续点处均有

则称随机变量序列X1,X2,…Xn,…依分布收敛于X.依分布收敛但不一定满足依概率收敛。

中心极限定理

设{Xk},k=1,2…为相互独立,具有相同分布的随机变量序列,且E(Xk)=μ,D(Xk)=σ^2,(k=1,2…),则{Xk}服从中心极限定理,即

{Xk}服从中心极限定理的含义:{Xk}前n项和的标准化随机变量序列依分布收敛于标准正态分布随机变量。夺格均匀地小的独立随机变量的叠加,其分布近似正态分布。

数理统计的基本概念

总体,样本的概念

总体指研究对象的全体。个体指组成总体的每个元素。

极大似然估计

思想方法:一个随机试验有若干可能结果,某结果发生了,则认为该结果发生的概率最大,n维随机变量的联合概率密度称为似然函数。极大似然估计法是求参数θ的估计值,使似然函数达到极大值。极大似然估计值仍是一个函数,极大似然估计量是一个数。

矩估计法。

先计算一阶原点矩即数学期望。然后让样本矩估计等于总体矩估计,就可求得参数。矩估计量与极大似然估计量不一定完全相同。用矩估计来估计参数比较方便,但数据量较大时极大似然估计法更加准确。

估计量的优良性准则
  1. 无偏估计,设θ^是未知参数θ的估计量,若E(θ^)=0,则称θ^为θ的无偏估计。
    2.有效性,比较两个总体参数估计量的方差,哪一个方差小则更有效。
    3.相合性,若估计参数依概率收敛于真实参数的值,则称改估计参数为未知参数的相和估计量。只要样本n足够大,用θ^去估计θ其误差可以任意小。
    区间估计
    设总体的未知参数为θ,由样本确定两个统计量。对于给定实数满足

随机区间[θ^1,θ^2]为θ的置信度为1-α的置信区间。


本博客所有文章除特别声明外,均采用 CC BY-SA 4.0 协议 ,转载请注明出处!