中国高校课件下载中心 》 教学资源 》 大学文库

《概率论与数理统计》课程教学课件(讲稿)第八章 假设检验 第四节 总体分布的假设检验(χ2拟合优度检验法)

文档信息
资源类别:文库
文档格式:PDF
文档页数:15
文件大小:3.2MB
团购合买:点击进入团购
内容简介
《概率论与数理统计》课程教学课件(讲稿)第八章 假设检验 第四节 总体分布的假设检验(χ2拟合优度检验法)
刷新页面文档预览

第四节总体分布的假设检验2拟合优度检验法

第四节 总体分布的假设检验 ——χ 2拟合优度检验法

引言前面讨论的参数估计和假设检验主要是对正态分布总体进行的,但在实际应用中,总体的分布往往是未知的.因此,在实际应用中首先要对总体的分布类型进行推断如何对总体的分布类型进行推断?通常可以根据经验,或根据样本数据的直方图或经验分布函数,得到一个关于总体分布的直观印象,然后对总体分布的类型作出假设,通过检验对总体的分布类型作出推断本节介绍皮尔逊提出的总体分布类型检验法分布拟和检验

引 言

问题的一般提法:设总体X一F(x),F(x)未知,XX,.X,为来自X的样本.要检验假设:Ho:F(x)=Fo(x)H:F(x)+Fo(x)对H.的显著性检验,称为总体分布的拟合检验.(注意也可用分布律或概率密度代替F(x))。其中F(x)可以是完全已知的分布函数,也可以是已知函数的形式,但其中含有若于个未知参数的分布函数F.x;0,....,O.)这时一般先用最大似然估计法得到,…,的估计值.,然后用Fx..)代替Fx)进行检验就行了

拟合优度检验法我们门将实数轴分成K个互不相交的区间-00=t,<t<t,<...<tk=+00样本观测值x,x2,…,x,落入区间[t-,t)的频数记为f那么,频率为-1,2..k11由于H,真时x,x,……,x落入区间[t,t)的概率P,=Fot)-Ft-1),所以,当n很大时,p,应和fn差别不大,即np与f差别不大根据这种思想,英国统计学家皮尔逊构造出了检验统计量

χ 2拟合优度检验法

K(fi-np)V(L-P)"-npiPi=1i-1并证明了若n≥50,在H.真时,的渐近分布是自由度为k-m-1的×2分布,其中m是分布函数中被估参数的个数H.真时×不应该太大,×过分大就应该拒绝H所以H.拒绝域的形式为>q,q为正数说明:上式中的因子一起了调节作用,否则对于较小p而言,即是pPi.相对来说有较大差别也不会很大。因子的作用是使得的极限分布为已知,从上分析可知,该检验应该是右单边检验

  2 2 2 1 1 = . k k i i i i i i i i f n f np p n p np               2 2 1 - i i i i i i p p p f f p n n n        说明:上式中的因子 起了调节作用,否则对于较小 而言,即是 与 相对来说有较大差别, 也不会很大。因子 的作用是使得 的 极限分布为已知,从上分析可知,该检验应该是右单边检验

由于H.真时,对于给定的很小正数α有p2-mp≥x(k-m-1)/=0所以,在显著水平α下,H,的拒绝域为-z-p≥xa'(k-m-1)对给定的样本观测值,"若x-z(t-np≥xa(k-m-1)np则在显著水平α下拒绝H,否则,不能拒绝H注意,分组时k一般为7-14,每个区间所含的样本观测值的个数应不少于5个

例如生物学家孟德尔(Mendel)在豌豆培养试验中观察了把黄色圆型种子豌豆与绿色皱纹型种子豌豆杂交得到的不同种类的种子,这种杂交的可能子代种类是:黄圆、黄皱、绿圆、绿皱,孟德尔根据遗传学的理论指出,这四类豌豆个数之比为9:33:1,他在n=556个豌豆中观察到这四类豌豆的个数分别为315101,108,32现在要在水平α=0.05之下检验孟德尔理论的正确性

例如:

解:用随机变量X表示杂交后的豌豆的类型,对可能的四种类型黄圆、黄皱、绿圆和绿皱,X的取值分别1,2,3和4.四种类型豌豆的数量分别记为f(i=1,2,3,4)又记p:=PX=(i=12.3,4)根据孟德尔的理论应有P=9/16,Pz=3/16,3=3/16,P4=1/16要检验孟德尔理论的正确性,就是要检验上式就是X的分布律

于是提出假设H:P,=9/16,pz=3/16,p,=3/16,p4=1/16由于n=556很大,可采用分布拟合×检验检验统计量--p~x(3)np,i=lH.的拒绝域为α*≥X0.05(3)/-(x*≥7.81)由于观察值×2=0.470未落入拒绝域,所以在显著水平α0.05下不能拒绝原假设H.,即不能拒绝孟德尔的理论可见实际数据与孟德尔理论是比较吻合的

几点注释①若分布函数F(x)的类型未知,可由实际问题分析或由样本观察数据的直方图来推测。②若已知F.(x)分布类型,还有r个参数未知时,须先用极大似然估计法求出未知参数的估计值,然后再作假设。③此检验要求一定是大样本,一般n≥50。至于k的大小,对于正态总体,样本容量n与区间个数k要满足渐近最优关系N502005001001000200010000k=1.87(n-1)0.4k9122230567416④若理论频数v=np<5时,则将相临的小区间合并,直至全部np≥5(合并区间的同时,也将实测频数合并),合并后的小区间数设为k,则此时×统计量的由度变为df=k*-r-12一③手工计算时常采用公式

共15页,试读已结束,阅读完整版请下载
刷新页面下载完整文档
VIP每日下载上限内不扣除下载券和下载次数;
按次数下载不扣除下载券;
注册用户24小时内重复下载只扣除一次;
顺序:VIP每日次数-->可用次数-->下载券;
相关文档