中国高校课件下载中心 》 教学资源 》 大学文库

《统计学》课程授课教案(讲义)第七章 抽样推断

文档信息
资源类别:文库
文档格式:DOC
文档页数:15
文件大小:77.5KB
团购合买:点击进入团购
内容简介
《统计学》课程授课教案(讲义)第七章 抽样推断
刷新页面文档预览

第七章抽样推断(一)教学目的通过本章的学习,掌握抽样基本理论及参数的估计方法,学会对总体参数进行区间估计。(二)基本要求要求掌握抽样调查中的基本概念、抽样估计的基本方法,学会样本统计量的计算方法,并能对总体参数进行估计。(三)教学要点1、不同抽样组织形式的抽样误差计算;2、总体均值及比例的区间估计;3、必要抽样数目的计算方法。(四)本章难点1、如何理解抽样估计的基本理论:2、抽样误差的含义与计算方法:3、不同类型总体的参数区间估计问题。(五)教学时数6 课时(六)教学内容本章共分四节第一节抽样调查的一般问题一、抽样的概念和特点(一)抽样调查的概念抽样调查是一种非全面的调查方法。它既是搜集统计资料的方法,又是对现象总体进行科学估计和判断的方法。所以它不论在统计调查还是在统计分析中都有广泛的应用。抽样调查是按随机原则从全部研究单位中抽取一部分单位进行观察,根据样

第七章 抽样推断 (一)教学目的 通过本章的学习,掌握抽样基本理论及参数的估计方法,学会对总体参数进 行区间估计。 (二)基本要求 要求掌握抽样调查中的基本概念、抽样估计的基本方法,学会样本统计量的 计算方法,并能对总体参数进行估计。 (三)教学要点 1、不同抽样组织形式的抽样误差计算; 2、总体均值及比例的区间估计; 3、必要抽样数目的计算方法。 (四)本章难点 1、如何理解抽样估计的基本理论; 2、抽样误差的含义与计算方法; 3、不同类型总体的参数区间估计问题。 (五)教学时数 6 课时 (六)教学内容 本章共分四节 第一节 抽样调查的一般问题 一、抽样的概念和特点 (一)抽样调查的概念 抽样调查是一种非全面的调查方法。它既是搜集统计资料的方法,又是对现 象总 体进行科学估计和判断的方法。所以它不论在统计调查还是在统计分析中都有广 泛的应用。 抽样调查是按随机原则从全部研究单位中抽取一部分单位进行观察,根据样

本资料计算样本的特征值,然后以样本的特征值,对总体的特征值做出具有一定可靠性的估计和判断,以反映总体的数量特征和数量表现的一种统计方法所谓随机原则,即是在抽取样本时,排除人们主观意图的作用,使得总体中的各单位均以相等的机会被抽中。随机原则又称为等可能性原则。例如,从一定面积的小麦中,通过随机抽样,抽取若干地块实割实测,计算平均亩产,以此来推断全部面积的小麦产量。再如,对一批产品进行质量检查时,从全部产品中随机抽取部分产品进行检测计算合格率,以此来推断全部产品的合格率等等。(二)抽样调查的基本特点1、调查单位的确定是按随机原则从全部总体单位中抽取的。2、用部分单位的指标数值去推断和估计总体指标数值。3、抽样调查中的抽样误差是不可避免的,但在事先是可以计算并加以控制的。二、抽样调查的作用1、有些现象是无法进行全面调查的,为了测算全面资料,必须采用抽样调查的方法。例如,对无限总体不能采用全面调查。另外,有些产品的质量检查具有破坏性,如电视机使用寿命检验,罐头的防腐期限试验,轮胎的里程试验等,这些调查所使用的测试手段对产品具有破坏性,不可能进行全面调查,只能采用抽样调查。2、从理论上讲,有些现象虽然可以进行全面调查,但实际上没有必要或很难办到,也要采用抽样调查。例如,要了解全国城乡人民的家庭生活状况,从理论上讲可以门逐户进行全面调查,但是调查范围太大,调查单位太多,实际上难以办到,也没有必要。采用抽样调查可以节约时间、人力、物力和才力,提高调查结果的时效性,又能达到和全面调查同样的目的和效果。3、抽样调查的结果可以对全面调查的结果进行检查和修正。全面调查涉及面宽工作量大,参加人员多,调查结果容易出现差错。因此,在全面调查(如人口普查)之后进行抽样复查,根据抽查结果计算差错率,并依此为依据检查和修正全面调查结果,从而提高全面调查质量。4、抽样调查可以用于工业生产过程的质量控制。在工业产品成批或大量连续生产过程中,利用抽样调查可以检验生产过程是否正常,及时提高信息,进行质量

本资料计算样本的特征值,然后以样本的特征值,对总体的特征值做出具有一定 可靠性的估计和判断,以反映总体的数量特征和数量表现的一种统计方法。 所谓随机原则,即是在抽取样本时,排除人们主观意图的作用,使得总体中 的各单位均以相等的机会被抽中。随机原则又称为等可能性原则。例如,从一定 面积的小麦中,通过随机抽样,抽取若干地块实割实测,计算平均亩产,以此来 推断全部面积的小麦产量。再如,对一批产品进行质量检查时,从全部产品中随 机抽取部分产品进行检测计算合格率,以此来推断全部产品的合格率等等。 (二)抽样调查的基本特点 1、调查单位的确定是按随机原则从全部总体单位中抽取的。 2、用部分单位的指标数值去推断和估计总体指标数值。 3、抽样调查中的抽样误差是不可避免的,但在事先是可以计算并加以控制的。 二、抽样调查的作用 1、有些现象是无法进行全面调查的,为了测算全面资料,必须采用抽样调查的 方法。例如,对无限总体不能采用全面调查。另外,有些产品的质量检查具有破 坏性,如电视机使用寿命检验,罐头的防腐期限试验,轮胎的里程试验等,这些 调查所使用的测试手段对产品具有破坏性,不可能进行全面调查,只能采用抽样 调查。 2、从理论上讲,有些现象虽然可以进行全面调查,但实际上没有必要或很难办 到,也要采用抽样调查。例如,要了解全国城乡人民的家庭生活状况,从理论上 讲可以挨门逐户进行全面调查,但是调查范围太大,调查单位太多,实际上难以 办到,也没有必要。采用抽样调查可以节约时间、人力、物力和才力,提高调查 结果的时效性,又能达到和全面调查同样的目的和效果。 3、抽样调查的结果可以对全面调查的结果进行检查和修正。全面调查涉及面宽, 工作量大,参加人员多,调查结果容易出现差错。因此,在全面调查(如人口普 查)之后进行抽样复查,根据抽查结果计算差错率,并依此为依据检查和修正全 面调查结果,从而提高全面调查质量。 4、抽样调查可以用于工业生产过程的质量控制。在工业产品成批或大量连续生 产过程中,利用抽样调查可以检验生产过程是否正常,及时提高信息,进行质量

控制,保证生产质量稳定。5、利用抽样调查原理,可以对某些总体的假设进行检验,来判别这种假设的真伪,依决定行动的取舍。例如,某地区去年职工家庭年收入为7200元,本年抽样调查结果表面,职工家庭年收入为7100元,这是否意味着职工生活水平下降呢?我们还不能下这个结论,最好通过假设性检验,检验这两年职工家庭收入是否存在显著性统计差异,才能判断该地区今年职工年收入是否低于去年水平。总之,抽样调查是一种科学实用的调查方法,目前它不仅广泛应用于自然科学领域,也愈来愈多地应用于社会经济现象数量方面的研究。随着抽样理论的发展,抽样技术的进步和完善,广大统计工作者业务水平的提高,抽样调查在社会经济统计中的应用将会愈加普及。三、抽样调查的几个基本概念(一)全及总体和抽样总体全及总体也称为总体或母体,是指所要认识的研究对象的全体,它是由所研究范围内具有某种共同性质的全体单位所组成的集合体。例如,我们要研究某城市职工的生活水平,则该城市全部职工就构成全及总体或总体。在本章用大写的字母N代表全及总体的单位数。抽样总体就是按随机原则从全及总体中抽取的一部分单位组成的小总体。抽样总体简称样本,它也是由许多性质相同的单位组成的。本章中用小写n代表样本的单位数,样本单位数Ⅱ也称为样本容量。组成样本的每个单位称为样本单位。例如,某城市有20万个住户,我们要采用抽样调查的方法研究该城市住户的家庭的收支情况,则该城市全部住户构成全及总体,N=20万。如果从全部住户中随机抽取千分之五即1000户进行调查,则被抽中的1000户构成抽样总体即样本,样本容量n=1000。样本按照样本容量的大小可以分为大样本和小样本。一般地说,n≥30为大样本,n<30为小样本。在对社会经济现象进行抽样调查时,多数采用大样本。应当注意的是,作为抽样推断对象的全及总体是唯一确定的,但作为观察对象的样本就不是唯一的。从一个全及总体中可以抽取很多个样本,每次抽到哪个样本是不确定的。明白这一点对理解抽样推断是很重要的

控制,保证生产质量稳定。 5、利用抽样调查原理,可以对某些总体的假设进行检验,来判别这种假设的真 伪,依决定行动的取舍。例如,某地区去年职工家庭年收入为 7200 元,本年抽 样调查结果表面,职工家庭年收入为 7100 元,这是否意味着职工生活水平下降 呢?我们还不能下这个结论,最好通过假设性检验,检验这两年职工家庭收入是 否存在显著性统计差异,才能判断该地区今年职工年收入是否低于去年水平。 总之,抽样调查是一种科学实用的调查方法,目前它不仅广泛应用于自然科 学领域,也愈来愈多地应用于社会经济现象数量方面的研究。随着抽样理论的发 展,抽样技术的进步和完善,广大统计工作者业务水平的提高,抽样调查在社会 经济统计中的应用将会愈加普及。 三、抽样调查的几个基本概念 (一)全及总体和抽样总体 全及总体也称为总体或母体,是指所要认识的研究对象的全体,它是由所研 究范围内具有某种共同性质的全体单位所组成的集合体。例如,我们要研究某城 市职工的生活水平,则该城市全部职工就构成全及总体或总体。在本章用大写的 字母 N 代表全及总体的单位数。 抽样总体就是按随机原则从全及总体中抽取的一部分单位组成的小总体。抽 样总体简称样本,它也是由许多性质相同的单位组成的。本章中用小写 n 代表样 本的单位数,样本单位数 n 也称为样本容量。组成样本的每个单位称为样本单位。 例如,某城市有 20 万个住户,我们要采用抽样调查的方法研究该城市住户的家 庭的收支情况,则该城市全部住户构成全及总体,N=20 万。如果从全部住户中 随机抽取千分之五即1000户进行调查,则被抽中的1000户构成抽样总体即样本, 样本容量 n=1000。样本按照样本容量的大小可以分为大样本和小样本。一般地 说,n≥30 为大样本,n<30 为小样本。在对社会经济现象进行抽样调查时,多 数采用大样本。 应当注意的是,作为抽样推断对象的全及总体是唯一确定的,但作为观察对 象的样本就不是唯一的。从一个全及总体中可以抽取很多个样本,每次抽到哪个 样本是不确定的。明白这一点对理解抽样推断是很重要的

(二)全及指标和抽样指标1、全及指标又称总体指标全及指标主要有四个:全及平均数、全及成数、总体数量标志的标准差及方差、总体是非标志的标准差及方差。2、抽样指标,又称样本指标。抽样指标有四个对应指标:抽样平均数、抽样成数、样本数量标志标准差及方差、样本是非标志标准差及方差。(三)样本可能数目和抽样方法1、样本可能数目又称样本个数,是指从全及总体中可能抽取或可能构成的样本总体。它既和每个样本的容量有关,也和抽样的方法有关。当样本容量给定时,样本的可能数目便由抽样方法决定。2、抽样方法按抽取样本的方式不同分为重复抽样和不重复抽样。(1)重复抽样。重复抽样是从全及总体中抽取样本时,随机抽取一个样本单位,记录该单位有关标志表现以后,把它放回到全及总体中去,再从全及总体中随机抽取第二个单位,记录它有关标志表现以后,也把它放回全及总体中去,照此下去直到抽选n个样本单位。可见,重复抽样时全及总体单位数在抽选过程中始终没有减少,而且各单位有被重复抽中的可能。(2)不重复抽样。不重复抽样是从全及总体中抽取第一个样本单位,记录该单位有关标志表现后,这个样本单位不再放回全及总体中参加下一次抽选。然后,从总体N-1个单位中随机抽选第二个样本单位,记录了该单位有关标志表现以后,该单位也不再放回全及总体中去,再从全及总体N-2单位中抽选第三个样本单位,照此下去直到抽选出Ⅱ个样本单位。可见,不重复抽样时,总体单位数在抽选过程中是逐渐减少的,而且各单位没有重复被抽中可能两种抽样方法会产生三个差别:①抽取的样本可能数目不同:②抽样误差的计算公式不同③抽样误差的大小不同。四、抽样调查的理论基础抽样调查是建立在概率论大数定律基础是的。大数定律的一系列定理为抽样

(二)全及指标和抽样指标 1、全及指标又称总体指标 全及指标主要有四个:全及平均数、全及成数、总体数量标志的标准差及方 差、总体是非标志的标准差及方差。 2、抽样指标,又称样本指标。 抽样指标有四个对应指标:抽样平均数、抽样成数、样本数量标志标准差及 方差、样本是非标志标准差及方差。 (三)样本可能数目和抽样方法 1、样本可能数目又称样本个数,是指从全及总体中可能抽取或可能构成的样本 总体。它既和每个样本的容量有关,也和抽样的方法有关。当样本容量给定时, 样本的可能数目便由抽样方法决定。 2、抽样方法按抽取样本的方式不同分为重复抽样和不重复抽样。 (1)重复抽样。重复抽样是从全及总体中抽取样本时,随机抽取一个样本单位, 记录该单位有关标志表现以后,把它放回到全及总体中去,再从全及总体中随机 抽取第二个单位,记录它有关标志表现以后,也把它放回全及总体中去,照此下 去直到抽选 n 个样本单位。 可见,重复抽样时全及总体单位数在抽选过程中始终没有减少,而且各单位 有被重复抽中的可能。 (2)不重复抽样。不重复抽样是从全及总体中抽取第一个样本单位,记录该单位 有关标志表现后,这个样本单位不再放回全及总体中参加下一次抽选。然后,从 总体 N-1 个单位中随机抽选第二个样本单位,记录了该单位有关标志表现以后, 该单位也不再放回全及总体中去,再从全及总体 N-2 单位中抽选第三个样本单 位,照此下去直到抽选出 n 个样本单位。 可见,不重复抽样时,总体单位数在抽选过程中是逐渐减少的,而且各单位 没有重复被抽中可能。 两种抽样方法会产生三个差别:①抽取的样本可能数目不同;②抽样误差的 计算公式不同;③抽样误差的大小不同。 四、抽样调查的理论基础 抽样调查是建立在概率论大数定律基础是的。大数定律的一系列定理为抽样

调查提供了数学依据。大数定律是阐明大量随机现象平均结果的稳定性的一系列定理的总称。它说明如果被研究的总体是由大量的相互独立的随机因素所构成,而且每个因素对总体的影响都相对的小。那么将这些大量因素加以平均,因素的个别影响将相互抵消,而呈现出共同作用的影响,使总体具有稳定的性质。第二节抽样误差一、抽样误差的概念(一)抽样误差的一般概念一般地说,抽样误差是指样本指标与被它估计未知的总体参数(总体特征值)之差。具体地是指样本平均数x与总体平均数X的差,样本成数p与总体成数P的差(p-P)。例如,某地区全部小麦平均亩产400公斤,而抽样调查得到的平均亩产为391公斤或403公斤,则样本指标与总体指标之间的误差为-9公斤或3公斤。(二)统计调查误差的种类统计调查误差按产生的原因可以分为登记性误差和代表性误差。二、影响抽样误差的因素1、总体被研究标志的变异程度。2、样本容量的大小,即样本单位数的多少。3、抽样的组织形式。4、抽样的方法。三、抽样平均误差(一)抽样平均误差的意义(二)抽样平均误差的计算我们用希腊字母μ表示抽样平均误差;用ux表示抽样平均指标的抽样平均误差;用up表示抽样成数的抽样平均误差。E(x-X)μ=VK式中:

调查提供了数学依据。 大数定律是阐明大量随机现象平均结果的稳定性的一系列定理的总称。它说明如 果被研究的总体是由大量的相互独立的随机因素所构成,而且每个因素对总体的 影响都相对的小。那么将这些大量因素加以平均,因素的个别影响将相互抵消, 而呈现出共同作用的影响,使总体具有稳定的性质。 第二节抽样误差 一、抽样误差的概念 (一) 抽样误差的一般概念 一般地说,抽样误差是指样本指标与被它估计未知的总体参数(总体特征值)之 差。具体地是指样本平均数 x 与总体平均数 X 的差,样本成数 p 与总体成数 P 的差(p-P)。例如,某地区全部小麦平均亩产 400 公斤,而抽样调查得到的平均 亩产为 391 公斤或 403 公斤,则样本指标与总体指标之间的误差为-9 公斤或 3 公斤。 (二) 统计调查误差的种类 统计调查误差按产生的原因可以分为登记性误差和代表性误差。 二、影响抽样误差的因素 1、总体被研究标志的变异程度。 2、样本容量的大小,即样本单位数的多少。 3、抽样的组织形式。 4、抽样的方法。 三、抽样平均误差 (一) 抽样平均误差的意义 (二) 抽样平均误差的计算 我们用希腊字母μ表示抽样平均误差;用μx 表示抽样平均指标的抽样平均 误差;用μp 表示抽样成数的抽样平均误差。 K x X x  − = 2 ( )  式中:

x一一抽样平均数X一一全及平均数p一一抽样成数P一一全及成数K一一样本可能数目(或抽样平均数的个数)1、抽样平均数的抽样平均误差(1)在重复抽样的条件下u=n"n(2)在不重复抽样条件下(-岁)u=/nIN2、抽样成数的抽样平均误差(1)在重复抽样的条件下P(1- P)μp=Vn其中,P为总体成数,n为样本单位数(2)在不重复抽样的统计下P(I-P)(-nμp =Nn四、抽样极限误差根据定义,抽样平均误差是所有可能样本指标与总体指标之间的平均离差。而在组织抽样推断时,我们实际只抽取一个样本,用一个样本指标去推断总体指标。由于抽样是按随机原则进行的,所有不同的样本组合都可能抽到,这样所得到的每个样本实际误差,有可能小于抽样平均误差,也有可能大于抽样平均误差,因此包括在抽样平均误差范围内的只有一部分样本,而不是所有的样本组合。这样我们在用一个样本指标估计总体指标时,两者之间有多大的误差就不能完全肯定,需要研究和计算抽样极限误差

x ——抽样平均数 X ——全及平均数 p ——抽样成数 P ——全及成数 K ——样本可能数目(或抽样平均数的个数) 1、抽样平均数的抽样平均误差 (1)在重复抽样的条件下 n n x    = = 2 (2)在不重复抽样条件下 (1 ) 2 N n n x = −   2、抽样成数的抽样平均误差 (1)在重复抽样的条件下 n P P P (1− )  = 其中,P 为总体成数,n 为样本单位数 (2)在不重复抽样的统计下 (1 ) (1 ) N n n P P p − −  = 四、抽样极限误差 根据定义,抽样平均误差是所有可能样本指标与总体指标之间的平均离差。 而在组织抽样推断时,我们实际只抽取一个样本,用一个样本指标去推断总体指 标。由于抽样是按随机原则进行的,所有不同的样本组合都可能抽到,这样所得 到的每个样本实际误差,有可能小于抽样平均误差,也有可能大于抽样平均误差, 因此包括在抽样平均误差范围内的只有一部分样本,而不是所有的样本组合。这 样我们在用一个样本指标估计总体指标时,两者之间有多大的误差就不能完全肯 定,需要研究和计算抽样极限误差

抽样极限误差是抽样指标与总体指标之间,在一定概率保证程度下的,抽样误差的最大可能范围。总体指标虽然是一个确定的量,但它是未知的,而样本指标是一个随机变量,其取值是不定的,它是围绕着总体指标左右变动的,因此,我们只能在一定的概率保证程度下,用一定的范围来控制误差。我们通常用△表示抽样极限误差,设△x和△p分别表示抽样平均数和抽样成数的可能误差范围,则有: x=I x-X Ip=Ip-P I根据概率论数理统计原理,样本平均数和样本成数分别渐进地服从于N(Xμx)和N(P,p(1-p))的正态分布。因此有:P(I x-XI ≤1·μx) =0.6827P(/p-P/≤1·μp)=0.6827即,抽样极限误差在1倍的抽样平均误差范围内的可能性为68.27%。也就是说,我们有68.27%的可靠性程度来判断,样本指标与总体指标之间的误差不超过ux或者μp。又有:P(/x-XI≤2·μx)=0.9545P(Ip-PI≤2.μp)=0.9545即,抽样极限误差在2倍的抽样平均误差范围内的可能性为95.45%。也就是说,我们有95.45%的可靠性程度来判断,样本指标与总体指标之间的误差不超过2μx或者2p。所以抽样极限误差的计算公式为:A=t : μ即有:Ax=t·ux和Ap=tμp式中的t表示极限误差范围为抽样平均误差的若干倍,t称为概率度。第三节总体指标的推断一、抽样估计的特点抽样估计就是利用实际调查资料计算出样本指标值来估计和推断相应的总体指标的数值,又称为参数估计。显然,这种估计不同于人们所说的“拍脑袋的

抽样极限误差是抽样指标与总体指标之间,在一定概率保证程度下的,抽样 误差的最大可能范围。总体指标虽然是一个确定的量,但它是未知的,而样本指 标是一个随机变量,其取值是不定的,它是围绕着总体指标左右变动的,因此, 我们只能在一定的概率保证程度下,用一定的范围来控制误差。 我们通常用Δ表示抽样极限误差,设Δx 和Δp 分别表示抽样平均数和抽样 成数的可能误差范围,则有: Δx=|x-X| Δp=|p-P| 根据概率论数理统计原理,样本平均数和样本成数分别渐进地服从于 N(X, μ 2 x)和 N(P,p(1-p))的正态分布。因此有: P{|x-X|≤1·μx }=0.6827 P{|p-P|≤1·μp}=0.6827 即,抽样极限误差在 1 倍的抽样平均误差范围内的可能性为 68.27%。也就是说, 我们有 68.27%的可靠性程度来判断,样本指标与总体指标之间的误差不超过μx 或者μp。 又有: P{|x-X|≤2·μx}=0.9545 P{|p-P|≤2·μp}=0.9545 即,抽样极限误差在 2 倍的抽样平均误差范围内的可能性为 95.45%。也就是说, 我们有 95.45%的可靠性程度来判断,样本指标与总体指标之间的误差不超过 2 μx 或者 2μp。 所以抽样极限误差的计算公式为: Δ=t·μ 即有: Δx=t·μx 和 Δp=t·μp 式中的 t 表示极限误差范围为抽样平均误差的若干倍,t 称为概率度。 第三节 总体指标的推断 一、抽样估计的特点 抽样估计就是利用实际调查资料计算出样本指标值来估计和推断相应的总 体指标的数值,又称为参数估计。显然,这种估计不同于人们所说的“拍脑袋的

估计”。抽样估计具有三个主要特点:1、它在逻辑上运用的是归纳推理,而不是演绎推理。2、它在方法上运用不确定的概率估计法,而不是运用确定的数学分析法。3、抽样估计的结论存在着一定的抽样误差,并且抽样误差总是和抽样估计的可靠程度联系在一起的。二、抽样估计的优良标准对参数进行估计的时候,我们总是希望估计是合理的或者是优良,那么什么是一个好的估计量的标准呢?(一)无偏性。即以抽样指标估计全及指标要求抽样指标值的平均数等于被估计的全及指标本身。就是说,虽然每一次的抽样指标(如x,p等)和未知的全及指标(如X,P等)可能不相同,但在多次反复的估计中各个抽样指标的平均数应等于全及指标,即抽样指标的平均来说与全及指标是没有偏误的(二)一致性。即当样本容量n充分大的时,若样本指标充分地靠近被估计的全及指标,则该样本指标是被估计的全及指标的一致估计量。(三)有效性。即如果一个样本估计量的方差比其他估计量的方差小,则称该样本估计量是被估计的全及指标的有效估计量。三、抽样估计的方法(一)点估计点估计又称定值估计。它是用实际样本指标数值代替总体指标数值,即总体平均数的点估计值就是样本平均数,总体成数的点估计值就是样本成数。这种估计不考虑是否有抽样误差。例如,对一批某种型号的电子元件10000只进行耐用时间检查,随机抽取100只,测试的平均耐用时间为1055小时,合格率为91%,我们推断说10000只电子元件的平均耐用时间为1055小时,全部电子元件的合格率也是91%。点估计方法简单,但不很实用。因为,抽样估计中抽样指标完全等于全及指标的可能性极小。(二)区间估计区间估计所表明的是一个可能范围,不是一个绝对可靠的范围。是用样本指标和它的抽样极限误差构成的区间来估计总体指标,并以一定的概率保证总体指

估计”。抽样估计具有三个主要特点: 1、它在逻辑上运用的是归纳推理,而不是演绎推理。 2、它在方法上运用不确定的概率估计法,而不是运用确定的数学分析法。 3、抽样估计的结论存在着一定的抽样误差,并且抽样误差总是和抽样估计的可 靠程度联系在一起的。 二、抽样估计的优良标准 对参数进行估计的时候,我们总是希望估计是合理的或者是优良,那么什么 是一个好的估计量的标准呢? (一)无偏性。即以抽样指标估计全及指标要求抽样指标值的平均数等于被估计 的全及指标本身。就是说,虽然每一次的抽样指标(如 x,p 等)和未知的全及指 标(如 X,P 等)可能不相同,但在多次反复的估计中各个抽样指标的平均数应等 于全及指标,即抽样指标的平均来说与全及指标是没有偏误的。 (二)一致性。即当样本容量 n 充分大的时,若样本指标充分地靠近被估计的全及 指标,则该样本指标是被估计的全及指标的一致估计量。 (三)有效性。即如果一个样本估计量的方差比其他估计量的方差小,则称该样本 估计量是被估计的全及指标的有效估计量。 三、抽样估计的方法 (一)点估计 点估计又称定值估计。它是用实际样本指标数值代替总体指标数值,即总体 平均数的点估计值就是样本平均数,总体成数的点估计值就是样本成数。这种估 计不考虑是否有抽样误差。 例如,对一批某种型号的电子元件 10000 只进行耐用时间检查,随机抽取 100 只,测试的平均耐用时间为 1055 小时,合格率为 91%,我们推断说 10000 只电子元件的平均耐用时间为 1055 小时,全部电子元件的合格率也是 91%。 点估计方法简单,但不很实用。因为,抽样估计中抽样指标完全等于全及指 标的可能性极小。 (二)区间估计 区间估计所表明的是一个可能范围,不是一个绝对可靠的范围。是用样本指 标和它的抽样极限误差构成的区间来估计总体指标,并以一定的概率保证总体指

标将在所估计的区间内。那么,如何进行区间估计呢?正如我们前面所说的,概率论数理统计理论告诉我们,样本平均数和样本成数分别渐进地服从于和的正态分布。根据这一理论,我们就可以计算出全及指标的估计区间来。下面分别介绍总体平均数和总体成数的估计区间的计算。1、总体平均数的估计区间根据样本平均数的分布特征可知:p(I x-X / ≤△x)=F(t)p(x-x-≤X≤x+△x)=F(t)即:在概率保证程度为F(t),概率度为t的情况下,总体平均数的数值将在x-Ax和+Ax的范围内。其中,一Ax称为估计下限,x+Ax称为估计上限。区间[x-△x,x+△x」称为置信区间,估计可靠性程度称为置信度。2、总体成数的估计区间总体成数的区间估计原理与总体平均数相同,即:p(p-P[≤p)=F(t)p(p-p-≤X≤p+p)=F(t)即:在概率保证程度为F(t),概率度为t的情况下,总体成数的数值将在p-△p和p+△p的范围内。其中p-△p称为估计下限,p+△p称为估计上限。区间[p-△p,p+△p]称为置信区间,估计可靠性程度称为置信度。例如,考察某类人身高分布,随机地抽取该类人1000人,测得平均身高168cm,抽样标准差S=5.92cm,假定要在95%的置信度下,求总体平均身高的区间估计。又例如,为了研究新式时装的销路,在市场上随机对900名成年人进行调查,结果有540名喜欢新式时装,要求以90%的概率保证程度,估计该市成人喜欢时装的比率。四、抽样的组织方式(一)、简单随机抽样简单随机抽样,又称为纯随机抽样,它是按照随机原则直接从总体N个单位中抽取Ⅱ个单位作样本,使每个总体单位都有同等的机会被抽中。简单随机抽样

标将在所估计的区间内。 那么,如何进行区间估计呢?正如我们前面所说的,概率论数理统计理论告 诉我们,样本平均数和样本成数分别渐进地服从于和的正态分布。根据这一理论, 我们就可以计算出全及指标的估计区间来。下面分别介绍总体平均数和总体成数 的估计区间的计算。 1、总体平均数的估计区间 根据样本平均数的分布特征可知: p(|x-X|≤Δx)=F(t) p(x-Δx-≤X≤x+Δx)=F(t) 即:在概率保证程度为 F(t),概率度为 t 的情况下,总体平均数的数值将在 x- Δx 和 x+Δx 的范围内。其中,x-Δx 称为估计下限,x+Δx 称为估计上限。区 间[x-Δx,x+Δx]称为置信区间,估计可靠性程度称为置信度。 2、总体成数的估计区间 总体成数的区间估计原理与总体平均数相同,即: p(|p-P|≤Δp)=F(t) p(p-Δp-≤X≤p+Δp)=F(t) 即:在概率保证程度为 F(t),概率度为 t 的情况下,总体成数的数值将在 p-Δp 和 p+Δp 的范围内。其中 p-Δp 称为估计下限,p+Δp 称为估计上限。区间[p- Δp,p+Δp]称为置信区间,估计可靠性程度称为置信度。 例如,考察某类人身高分布,随机地抽取该类人 1000 人,测得平均身高 168cm,抽样标准差 S=5.92cm,假定要在 95%的置信度下,求总体平均身高的区 间估计。 又例如,为了研究新式时装的销路,在市场上随机对 900 名成年人进行调查,结 果有 540 名喜欢新式时装,要求以 90%的概率保证程度,估计该市成人喜欢时装 的比率。 四、抽样的组织方式 (一)、简单随机抽样 简单随机抽样,又称为纯随机抽样,它是按照随机原则直接从总体 N 个单位 中抽取 n 个单位作样本,使每个总体单位都有同等的机会被抽中。简单随机抽样

是抽样调查中最基本的,也是最单纯的方式,适合于均匀总体。简单随机抽样最原始的抽样方法就是抽签摸球。具体做法是将每一个被抽选总体单位都用一个签或球来代表,然后把它们搅均匀,从中随机摸取,抽中者即为样本单位,直到抽满所需的样本容量为止。显然,这种方法一般适用于总体单位比较少的情况。如果总体单位数目很大,手续比较麻烦则不宜采用。最常用的抽样方法是利用随机数表,这种表是由计算机或其它随机方法制成的,即从0、1、2、……、9这10个数字出现的概率是相同的,但排列的先后顺序则是随机的。在使用随机数表抽取样本之前,首先应将各个总体单位编上号码;然后在随机数表中任意地取数,凡是抽中的数字与相应的总体单位号码相一致时,该单位即为抽中的单位。若抽中的数字无相应的总体单位号码,则该数字被放弃,再重新抽取下一个数,直到抽满预定的样本容量n为止。前面介绍的抽样平均误差的计算公式以及区间估计公式,在简单随机抽样的条件下是完全适用的,或者说前面的公式都是在简单随机抽样的条件下产生的。虽然简单随机抽样从理论上说最符合随机原则,它是其它抽样方式的基础,也是衡量其它抽样方式抽样效果的标准。但是,它在统计实践中受到很大的限制:首先,当总体很大时,编号工作就很困难,对于连续生产的企业产品编号也不可能。另外,当总体各单位标志值之间差异很大时,采用这种抽样方式并不能保证样本的代表性。(二)类型抽样类型抽样,又称为分层抽样。它首先把全及总体各单位按某一标志分成若干个类型组,使各组组内标志值比较接近,然后分别在各组组内按随机原则抽取样本单位。可见类型抽样的特点在于,它把分组法和贯彻随机原则结合起来。类型抽样的优点:(1)它提高了样本的代表性。因为样本单位是从个类型组中抽取得,样本中有各种标志值水平的单位。(2)降低了影响抽样平均误差的总体方差。在总体分组的情况下,总体方差有两部分组成:一部分是组间方差,即各类型组之间标志值差异程度;另一部分是组内方差,即各组组内各单位标志值之间差异程度。在类型抽样的情况下,因为从各类型组都抽取了样本单位,所以,对各类型组来说是全面调查,因此,组间方差是可以不考虑的。影响抽样误差的

是抽样调查中最基本的,也是最单纯的方式,适合于均匀总体。 简单随机抽样最原始的抽样方法就是抽签摸球。具体做法是将每一个被抽选 总体单位都用一个签或球来代表,然后把它们搅均匀,从中随机摸取,抽中者即 为样本单位,直到抽满所需的样本容量 n 为止。显然,这种方法一般适用于总体 单位比较少的情况。如果总体单位数目很大,手续比较麻烦则不宜采用。 最常用的抽样方法是利用随机数表,这种表是由计算机或其它随机方法制成 的,即从 0、1、2、.、9 这 10 个数字出现的概率是相同的,但排列的先后顺 序则是随机的。在使用随机数表抽取样本之前,首先应将各个总体单位编上号码; 然后在随机数表中任意地取数,凡是抽中的数字与相应的总体单位号码相一致 时,该单位即为抽中的单位。若抽中的数字无相应的总体单位号码,则该数字被 放弃,再重新抽取下一个数,直到抽满预定的样本容量 n 为止。 前面介绍的抽样平均误差的计算公式以及区间估计公式,在简单随机抽样的 条件下是完全适用的,或者说前面的公式都是在简单随机抽样的条件下产生的。 虽然简单随机抽样从理论上说最符合随机原则,它是其它抽样方式的基础, 也是衡量其它抽样方式抽样效果的标准。但是,它在统计实践中受到很大的限制: 首先,当总体很大时,编号工作就很困难,对于连续生产的企业产品编号也不可 能。另外,当总体各单位标志值之间差异很大时,采用这种抽样方式并不能保证 样本的代表性。 (二)类型抽样 类型抽样,又称为分层抽样。它首先把全及总体各单位按某一标志分成若干 个类型组,使各组组内标志值比较接近,然后分别在各组组内按随机原则抽取样 本单位。可见类型抽样的特点在于,它把分组法和贯彻随机原则结合起来。 类型抽样的优点:(1)它提高了样本的代表性。因为样本单位是从个类型组 中抽取得,样本中有各种标志值水平的单位。(2)降低了影响抽样平均误差的总 体方差。在总体分组的情况下,总体方差有两部分组成:一部分是组间方差,即 各类型组之间标志值差异程度;另一部分是组内方差,即各组组内各单位标志值 之间差异程度。在类型抽样的情况下,因为从各类型组都抽取了样本单位,所以, 对各类型组来说是全面调查,因此,组间方差是可以不考虑的。影响抽样误差的

共15页,试读已结束,阅读完整版请下载
刷新页面下载完整文档
VIP每日下载上限内不扣除下载券和下载次数;
按次数下载不扣除下载券;
注册用户24小时内重复下载只扣除一次;
顺序:VIP每日次数-->可用次数-->下载券;
相关文档