删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

暨南大学《流行病学》讲义 第四章 现况调查(3)

暨南大学 /2011-11-26

     1.概念  抽样调查(sampling survey)是指从全体被研究对象中,按照一定的方法抽取一部分对象作为代表进行调查分析,以此推论全体被研究对象状况的一种调查。抽样调查的目的是根据调查所得的样本资料估计和推断被调查现象的总体特征,根据抽取样本所调查出的结果可以估计出该人群某病的患病率或某些特征的情况。

     2.基本原理  抽样要遵循随机化原则,且样本必须足够大,这样才能获得有代表性的样本,通过样本信息推断总体。抽样调查中被研究的全部单位的总和被称为总体或母体,分为二种:有限总体和无限总体。

抽样调查的一般步骤:①界定总体;②选择适当的抽样方法;③确定抽样单位,编制抽样框;④确定样本的大小;⑤收集、整理和分析样本资料。

     3.抽样调查的优缺点  优点:①它按随机化原则抽取调查单位,以足够数量的调查单位组成的“样本”来代表和说明总体;②节省人力、物力和时间;③以样本推断总体的误差可以事先估计并加以控制;④调查的精确度高。由于其上述众多的优点,所以在流行病学调查中占有重要地位,是最常用的方法。抽样调查可用于描述疾病的分布、衡量卫生水平、研究影响因素、考核防治效果等。

     缺点:①它毕竟是一种非全面的调查方法,只能提供说明整个总体情况的统计资料;②抽样调查的设计、实施与资料分析比较复杂,存在抽样误差和偏倚,不适用于变异过大的资料;③不适用于患病率过低的疾病等。

     4.抽样方法  依照抽样调查的理论和特点,可将其分为以下几类:

     (1)单纯随机抽样(simple random sampling):是最基本的抽样方法,也是其他抽样方法的基础。它按随机化的原理,直接从含有N个单位的总体中,抽出"个单位作为样本进行调查。这种方法的基本原则是每个抽样单元被抽中选人样本的机会是相等的。

     单纯随机抽样首先要有一份所有研究对象排列成序的编号名单,再用抽签、摸球、随机数字法、电子计算机抽取等方法随机选出进入样本的号码,已经人选的号码一般不能再次列入,直到达到预定的样本含量为止。   

     此法的优点是实施简单、易理解;其缺点是抽样范围较大时,工作量太大难以采用,且当抽样比例较小而样本含量较小时,所得样本的代表性差。

     (2)系统抽样(systematic sampling):又称机械抽样或等距抽样。它是把总体中的全部调查单位按某一标志排列起来,按固定J顷序和间隔抽取样本。例如:拟选一个5%的样本(即抽样比为1/20),可先从1~20之间随机选一个数,如为14,这就是选出的起点,再加上20得34,34力口20得54,......。这样,14、34、54、74、94就是前100号中人选的数字,以后依此类推。

    系统抽样的优点是简便易行,样本的观察单位在总体中分布均匀,抽样代表性较好,抽样误差与单纯随机抽样相似或略小一些。缺点是如果总体各单元的排列顺序有周期性,则抽取的样本可能有偏倚。比如在某街道以门牌号码的顺序抽取调查对象,大多数街道的门牌号码单数在街道的同一侧,双数在另一侧,那么用系统抽样方法时可能出现这样的情况:所抽到的对象均在街道的同一侧,而街道的两侧有许多因素是不同的(如日晒、采光、通风等),如果这些因素对某些疾病的发生有影响,那么抽到的样本的发病情况可能与总体有差异。再比如身份证号码的末位数字男为单数、女为双数,如果以该数字为基础进行系统抽样,那么可能抽到的调查对象均为男性或均为女性。因此必须事先对总体的结构有所了解,才能恰当地应用。

     (3)分层抽样(stratified sampling):先按照某些人口学特征或某些标志(如年龄、性别、住址、职业、教育程度、民族等)将研究人群分为若干组(统计学上称为层),然后从每层抽取一个随机样本。分层抽样又分为两类:一类叫按比例分配分层随机抽样,即各层内抽样比例相同;另一类叫最优分配分层随机抽样(或称不等比例分层随机抽样),即各层抽样比例不同,内部变异小的层抽样比例小,内部变异大的层抽样比例大,此时获得的样本均数或样本率的方差最小。

     从分布不均匀的研究人群中抽取有代表性样本的方法。要求层内变异越小越好,层间变异越大越好,因而可以提高每层的精确度,而且便于层间进行比较。

     (4)整群抽样(cluster sampling):利用现成的集体,随机整群抽取集体单位,加以研究,由此推断总体的情况,称为整群抽样。用此法抽样时,抽样单位不是个体而是群体,如居民区、班级、连队、乡、村、县、工厂、学校等。抽到的样本包括若干个群体,对群体内所有个体均进行调查。群体内个体数可以相等,也可以不等。

     整群抽样要求群间的变异越小越好,否则抽样误差较大,不能提供总体的可靠信息。

     这种方法的优点是便于组织,节约人力、物力,抽样和调查均比较方便,在实际工作中易为群众所接受,因而适合大规模调查。缺点是抽样误差较大,分析工作量也较大。

     (5)两级或多级抽样(two-stage or multi-stage sampling):这是大型调查时常用的一种抽样方法。从总体中先抽取范围较大的单元,称为一级抽样单元(例如省、市),再从抽中的一级单元中抽取范围较小的二级单元(如区、街),这就是两级抽样。还可依次再抽取范围更小的单元,即为多级抽样。

     多级抽样常与上述各种基本抽样方法结合使用。

     5.抽样调查样本大小的确定

     (1)确定抽样调查样本大小时应根据以下几点:①考虑总体与个体之间的差异程度,如果研究单位之间的变异较大,则样本要大些;如单位之间均衡性较好,则样本可以小些。②考虑调查要求达到的精确度和可信度,调查要求的精确度高,样本量就要大;反之,样本量不必过大。③预计所调查疾病的患病率,如现患率低,则样本量要大;反之,样本可小些。④考虑调查的项目和任务的要求情况。

     (2)样本量大小的估计:在此我们仅介绍单纯随机抽样样本量的估计方法。

相关话题/流行病学