一、教学大纲要求
(一)掌握内容 1.二项分布 (1)分布参数;
(2)各项统计指标(均数、标准差等)的计算方法; (3)二项分布的分布特征,近似分布及其应用条件。 2.Poisson分布 (1)分布参数;
(2)各项统计指标(均数、标准差等)的计算方法; (3)Poisson分布的分布特征,近似分布及其应用条件。 (二)熟悉内容 1.二项分布
(1)样本率的分布; (2)总体率的区间估计; (3)样本率与总体率的比较; (4)两样本率的比较。 2.Poisson分布
(1)总体均数的区间估计; (2)样本均数与总体均数的比较; (3)两个样本均数的比较。 (三)了解内容
二项分布及Poisson分布的前提条件及其概率密度函数的应用。
二、教学内容精要
(一)基本概念
1.概率分布
二项分布(binomial distribution)和Poisson分布是统计学中很重要的两种分布。 二项分布:若一个随机变量X,它的可能取值是0,1,…,n,且相应的取值概率为
P(Xk)(k)(1)nknk (7-1)
则称此随机变量X服从以n、π为参数的二项分布,记为X~B(n,π)。
Poisson分布:若离散型随机变量X的取值为0,1,…,n,且相应的取值概率为
P(Xk)kk!e(μ>0) (7-2)
则称随机变量X服从以μ为参数的Poisson分布(Poisson Distribution),记为X~P(μ)。
2.两种分布成立的条件
(1)二项分布成立的条件:①每次试验只能是互斥的两个结果之一;②每次试验的条件不变;③各次试验独立。 (2)Poisson分布成立的条件:①平稳性:X的取值与观察单位的位置无关,只与观察单位的大小有关;②独立增量性:在某个观察单位上X的取值与前面各观察单位上X的取值无关;③普通性:在充分小的观察单位上X的取值
最多为1。
(二)分布参数
1.二项分布,X~B(n,π)
X的均数μX = nπ (7-3)
2X的方差X = nπ(1-π) (7-4)
X的标准差X =
n(1) (7-5)
2.Poisson分布,X~P(μ)
X的均数μX =μ (7-6)
2X的方差X=μ (7-7)
X的标准差σ
(三)分布特性 1.可加性
二项分布和Poisson分布都具有可加性。
X = (7-8)
如果X1,X2,„ Xk相互独立,且它们分别服从以ni,p(i=1,2, „,k)为参数的二项分布,则X=X1+X2+„+Xk
服从以n,p(n=n1+n2+„+nk)为参数的二项分布。如果X1,X2,„,Xk相互独立,且它们分别服从以μi(i=1,2, „,k)为参数的Poisson分布,则X=X1+X2+„+Xk服从以μ(μ=μ1+μ2+„+μk)为参数的Poisson分布。
2.近似分布
特定条件下,二项分布、Poisson分布可近似于某种其它的分布,这一特性拓宽了它们的应用范围。 二项分布的正态近似:当n较大,π不接近0也不接近1时,二项分布B(n,π)近似正态分布N(nπ,
。 n(1))
二项分布的Poisson分布近似:当n很大,π很小,n为一常数时,二项分布近似于Poisson分布。 Poisson分布的正态近似:Poisson分布P(μ),当μ相当大时(≥20),其分布近似于正态分布。 (四)应用 1.二项分布的应用 (1) 总体率的区间估计 有查表法和正态近似法两种方法。
当n≤50时可以通过查表求总体率的95%和99%可信区间。
当二项分布满足近似正态分布的条件时(n较大,样本率p不接近0也不接近1),可用正态近似法求总体率的1-α可信区间:
(p-uαSp, p+uαSp) (7-9) Sp=
(2) 样本率与总体率比较
应用二项分布的概率计算公式计算事件(一般指X取某给定值一侧的所有值)发生的概率,再比较其与检验水准α大小,推断样本所在的总体率与给定总体率的关系。
(3) 两样本率的比较
根据独立的两个正态变量的差也服从正态分布的性质和二项分布在一定条件下的近似正态分布特性,当两个样本的含量n1和n2较大,且p1、(1-p1)、p2、(1-p2)均不太小,可用u检验方法对两样本率对应的总体率作统计推断。
p(1p)n (7-10)
up1p2Sp1p2(1 (7-11)
Sp1p2
X1X2n1n2X1X2n1n2)(1n11n2) (7-12)
2.Poisson分布的应用 (1) 总体均数的区间估计 有查表法和正态近似法两种方法。
当样本计数X≤50时,可用查表法求得总体均数的95%或99%可信区间。
当样本计数X>50时,可利用Poisson分布的正态近似性,计算其总体均数(1-α)可信区间如下:
(Xu(2)样本均数与总体均数的比较
有直接计算概率法和正态近似法两种方法。
样本均数与总体均数比较的目的是推断此样本所代表的未知总体均数μ是否等于已知总体均数μ0。
当总体均数较小时,可采用直接计算概率法进行比较。X取某一值的概率以Poisson分布的概率密度函数来计算,即
P(Xk)kX,XuX) (7-13)
k!e(k=0,1,2,…)
注意:样本均数与总体均数比较时,应以X取大于等于(样本均数大于总体均数时)或小于等于(样本均数小于总体均数时)样本均数的所有值的概率总和同检验界值α进行比较,切不可仅以X取样本均数的概率同检验界值进行比较。
当总体均数较大时,可用正态近似法进行统计推断。此时Poisson分布近似正态分布,故可计算标准正态统计量u,
uXu0u0 (7-14)
通过u值得出相应的概率,推断样本均数与总体均数的关系。
(3)两个样本均数的比较:两个样本计数均较大时,可根据Poisson分布的正态近似性对其进行u检验。 两个样本观察单位相同时,用下式计算u值。
uX1X22X1X (7-15)
两个样本观察单位不同时,用下式计算u值。
uX1/n1X2/n2X1n21 (7-16)
Xn222
三、典型试题分析
(一)单项选择题
1.某地人群中高血压的患病率为π,由该地区随机抽查n人,则( )
A.样本患病率p=X/n服从B(n, π) B.n人中患高血压的人数X服从B(n, π) C.患病人数与样本患病率均不服从B(n, π) D.患病人数与样本患病率均服从B(n, π) 答案:B
[评析] 本题考点:二项分布概念的理解。
二项分布中所指的随机变量X代表n次试验中出现某种结果的次数,具体到本题目就是指抽查的n个人中患高血压的人数,因此答案为B。
2.二项分布近似正态分布的条件是( )
A.n较大且π接近0 B.n较大且π接近1 C.n较大且π接近0或1 D.n较大且π接近0.5 答案: D
[评析] 本题考点:二项分布的正态近似特性。
从对二项分布特性的描述中可知:当n较大,π不接近0也不接近1时,二项分布B(n,π)近似正态分布N(nπ,
。π不接近0也不接近1,等同于π接近0.5,因而此题目答案为D。 n(1))
3. 以下分布中,其均数和方差总是相等的是( ) A.正态分布 B. 对称分布 C.Poisson分布 D. 二项分布
答案:C
[评析] 本题考点:Poisson分布的特性。
Poisson分布P(μ)的参数只有一个,即μ。它的均数和方差均等于μ,这一点大家需要牢记。
4. 测得某地区井水中细菌含量为10000/L,据此估计该地区每毫升井水中细菌平均含量的95%可信区间为( ) A.100001.9610000 B. 101.9610 C.101.96答案:C
[评析]本题考点:Poisson分布的正态近似性。
当X较大(一般大于50)时,Poisson分布近似正态分布,按照正态分布资料的计算公式计算该地区井水中平均每升细菌含量的95%可信区间,再除以1000即得平均每毫升井水中细菌的平均含量(设YSX10000X1000100001000 D. 101.9610000
,有
SY10001000)。
(二) 是非题
从装有红、绿、蓝三种颜色的乒乓球各500、300、200只的暗箱中随机取出10个球,以X代表所取出球中的红色球数,则X服从二项分布B(10,0.5)。( )
答案:正确。
[评析] 本题考点:二项分布的定义。
二项分布成立的条件是:①每次试验只能是互斥的两个结果之一;②每次试验的条件不变;③各次试验独立。此题目所述情况完全满足后两个条件,关键在于第一个条件的判断,从表面上看,每次试验的结果有三种,但本题目所关心的试验结果是“红色与否”,因而该试验结果仍为两种互斥的情况—“红色”和“非红色”。所以,此题目所述情况满足以上三个条件,X服从二项分布B(10,0.5)。
(三)计算题
炮击命中目标的概率为0.2,共发射了14发炮弹。已知至少要两发炮弹命中目标才能摧毁之,试求摧毁目标的概率。
答案:0.802
[评析] 本题的考点:二项分布概率函数的理解和应用能力。
摧毁目标的概率即有两发或两发以上炮弹命中目标的概率,此概率又等于1减去只有一发命中或无一命中的概率之差。根据二项分布的概率函数计算如下:
PX21PX11(10.2)14(1)0.2(10.2)1411310.0440.1540.802
四、习 题
(一)名词解释
1.二项分布 2. Poisson分布 3. Bernoulli试验 (二) 单项选择题:
1. X1、X2分别服从二项分布B(n1,p1)、B(n2,p2),且X1、X2相互独立,若要X= X1+X2也服从二项分布,则需满足下列条件( )。
A.X1=X2 B. n1=n2 C.p1=p2 D. n1p1=n2p2
2. 二项分布B(n,p)的概率分布图在下列哪种条件下为对称分布( )。
A.n=50 B. p=0.5 C.np=1 D. p=1
3. Poisson分布P()满足下列何种条件时近似正态分布N(,
A.相当大 B. =1
C.=0 D. =0.5
4. 已知某高校学生近视眼的患病率为50%,从该高校随机挑选3名学生,其中2人患近视眼的概率为( )。
A.0.125 B. 0.375 C.0.25 D. 0.5
5. 某自然保护区狮子的平均密度为每平方公里100只,随机抽查其中一平方公里范围内狮子的数量,若进行100次这样的抽查,其中的95次所得数据应在以下范围内( )。
A.5~195 B.80.4~119.6 C.95~105 D.74.2~125.8
(三)简答题
1.服从二项分布及Poisson分布的条件分别是什么? 2.二项分布、Poisson分布分别在何种条件下近似正态分布? 3.在何种情况下,可以用率的标准误Sp描述率的抽样误差? (四)计算题
1. 已知我国成人乙肝病毒表面抗原平均阳性率为10%,现随机抽查某地区10位成人的血清,其中3人为阳性。该地区成人乙肝表面抗原阳性率是否高于全国平均水平?
2. 对甲、乙两种降压药进行临床疗效评价,将某时间段内入院的高血压病人随机分为两组,每组均为100人。甲药治疗组80位患者有效,乙药治疗组50位患者有效,两种降压药有效率有无差别?
3. 某放射性物质发生脉冲频率为100/克/小时,已知某矿区矿石中该放射性物质的含量为4克/千克,今又测得另一矿区同种矿石每千克发生脉冲频率为1000/小时,问两个矿区矿石中该放射性物质的含量是否相等? 4. 一台仪器在10000个工作时内平均发生10次故障,试求在100个工作时内故障不多于两次的概率。
)( )。
五、习题答题要点
(一)名词解释
1. 二项分布:若一个随机变量X,它的可能取值是0,1,…,n,且相应的取值概率为
P(Xk)(k)(1)nknk
则称此随机变量X服从以n、π为参数的二项分布(Binomial Distribution),记为
X~B(n,π)。
2. Poisson分布:若离散型随机变量X的取值为0,1,…,n,且相应的取值概率为
P(Xk)kk!e(μ>0)
则称随机变量X服从以μ为参数的Poisson分布(Poisson Distribution),记为X~P(μ)。
3. Bernoulli试验:将感兴趣的事件A出现的试验结果称为“成功”,事件A不出现的试验结果称为“失败”,这类试验就称为Bernoulli试验(Bernoulli Test)。
(二)单项选择题
1.C 2.B 3.A 4.B 5.B (三)问答题
1.二项分布成立的条件:①每次试验只能是互斥的两个结果之一;②每次试验的条件不变;③各次试验独立。Poisson分布成立的条件:①平稳性:X的取值与观察单位的位置无关,只与观察单位的大小有关;②独立增量性:在某个观察单位上X的取值与前面各观察单位上X的取值无关;③普通性:在充分小的观察单位上X的取值最多为1。
2. 二项分布的正态近似:当n较大,π不接近0也不接近1时,二项分布(Bn,π)近似正态分布N(nπ, Poisson分布的正态近似:Poisson分布P(μ),当μ相当大时(≥20),其分布近似于正态分布。
3. 当率P所来自的样本近似服从正态分布时,即n较大,P不接近0也不接近1时,可以用率的标准误Sp描述率的抽样误差。 (四)计算题
1. 建立检验假设
H0:该地区成人乙肝表面抗原阳性率为10%; H1:该地区成人乙肝表面抗原阳性率大于10%。
α=0.05。
从总体率为10%的人群随机抽取10人,3人或3人以上阳性的概率为: P(X≥3)=1-[P(X=0)+P(X=1)+P(X=2)]=1-[0.9+10*0.1*0.9+45*0.1*0.9]=0.0702
P(X≥3)>0.05,在α=0.05水平上,不拒绝H0,不能认为该地区成人乙肝表面抗原阳性率高于全国水平。 2. 建立检验假设
H0:两种药有效率无差别; H1:两种药有效率有差别。
α=0.05。
Sp1p2X1X2n1n2110
9
2
8
。 n(1))
(1n11n2)
Sp1p28050100100100(1100)0.1095
up1p2Sp1p2
u0.80.50.1142.6312>2.58,P<0.01
在α=0.05水平上,拒绝H0,接受H1,即两种降压药有效率有显著差别,甲药比乙药有效率高。 3. 放射性物质含量为4克/千克的矿石每千克的平均脉冲记数为=100*4=400/小时,可利用Poisson值较大,分布的近似正态分布特性进行计算。
H0:两矿区矿石中该放射性物质含量相等,即后一矿区矿石发生脉冲频率的总体均数为400/小时;H1:两矿区矿石中该放射性物质含量不相等,即后一矿区矿石发生脉冲频率的总体均数不等于400/小时。α=0.05。
uXu0u0u100040040030>2.58,P<0.01。
在α=0.05水平上,拒绝H0,接受H1,即两矿区矿石中该放射性物质含量不相等,后一矿区矿石中该放射性物质含量高于前一矿区。
4. 该仪器在100个工作时内故障不多于两次的概率即为P(X0),P(X1),P(X2)三者之和。而100个工作时内故障平均次数为100P(X2)10100000.1,根据Poisson分布的概率函数计算如下:
00!e11!e22!e0.904840.090480.004520.99984
故该仪器在100个工作时内故障不多于两次的概率为0.99984。
(夏结来 薛富波)
因篇幅问题不能全部显示,请点此查看更多更全内容