读书笔记-《如何抽样》
书籍信息:
名称:《如何抽样》
作者:阿琳.芬克著 黄卫斌译
出版社:中国劳动社会保障出版社 2004
ISBN 7 – 5045 – 4440 – X
2004年5月第一版,2004年5月第一次印刷
延伸阅读:
一、调研工具箱丛书
1、 调查手册 ——阿琳.芬克著
2、 如何设计调查问题——阿琳.芬克著
3、 自填式问卷调查和邮寄问卷调查——琳达.B.鲍克 伊夫.P.菲尔德著
4、 如何实施电话调查——琳达.B.鲍克著
5、 如何实施面访调查——萨拜因.默滕斯.奥伊什著
6、 如何设计调查研究——阿琳.芬克著
7、 如何抽样——阿琳.芬克著
8、 问卷调查心理测验学——马克.S.利特维著
9、 如何管理、分析和解读调查数据——阿琳.芬克著
10、 如何报告调查结果——阿琳.芬克著
二、参考书目
1、american association of public opinion research.(2000). Standard defintitions: final dispositions of case codes and out-come rates for RDD telephone surveys and in – person household surveys. Ann arbor, mi: author
2、babbie, e,(1990).survey research methods. Belmont, ca:wadsworth
3、Baker,t,l(1988).doing social research. New york mcgraw-hill
内容框架
第一章 目标总体和样本
帮助获得一个有代表性的样本的问题清单
一、 概率抽样
1、 简单随机抽样
2、 分层随机抽样
3、 系统抽样
4、 整群抽样
二、 非概率抽样
1、 方便抽样
2、 雪球抽样
3、 配额抽样
4、 小组讨论会
常用的概率抽样和非概率抽样方法
第二章 统计和抽样
一、 抽样误差
简单随机抽样的标准误估计
二、 样本量:多大才足够
计算样本量时需要考虑的因素
三、 计算样本量
确定样本量时需要考虑的问题清单
对计算样本量和把握度有帮助的信息
四、 抽样单位和分析单位
五、 可接受的应答率
提高应答率和最小化回答偏移的指导方法
关键或有启示性的话语
第一章 目标总体和样本
好的样本是总体的缩影,是总体的一部分。
最好的样本是总体的代表或模型。
调查样本本身没有意义。
样本的重要性在于它代表或反应目标总体的精确程度,调查结果将在目标总体中应用和推广。
抽样的原因。抽样考虑的是效率和精准。研究样本比研究目标总体更快、更经济。
对调查人员来说,研究有精确定义特征的样本比试图调查整个总体更合适。
选取样本时,应确保样本是总体目标的可靠代表。
帮助获得有代表性样本的问题清单如下:
(1) 精确地陈述调查目的。调查研究①是为了描述、比较和预测认知、态度与行为。②调查资料评估具体项目或政策是否有效。
(2) 设立清楚明确的被访者合格入选条件
一、 概率抽样
二、 非概率抽样
样本成员显示出代表性或能方便被召集时,采用非概率抽样。
三种情况下非概率抽样正确:
1、 对难以确定人群的调查。
2、 对特定人群的调查。
3、 试访形式的调查。
方法描述 优点 问题
概率抽样 简单随机抽样
(每个对象都有均等的机会被抽取) 操作相对简单 样本中某个 亚群成员所占比例可能不合适。
分层随机抽样
(把研究总体按照有意义的特征分组) 能进行亚群分析;
抽样误差小于随机抽样;
样本更能反映总体。 必须计算每个亚群样本量;
如果分层太多,实施调查会花费更长时间和更多费用。
系统抽样
(从按照一定顺序排列的合格单位中每隔若干抽取一个单位) 方法简便:存在可疑用作抽样框的列表
如果抽样起始点是随机划分的,类似于随机抽样 必须注意抽样框中重复出现的方式
整群抽样及多阶段抽样
(先抽取自然的群,然后调查每个被抽取群的全部成员或对每个被抽取的群进行再抽样) 方法简便,现有的单位可以被利用
非概率抽样 方便抽样
(选用一组容易获得的个人或单位作为样本) 方法使用,依赖于容易得到的单位 样本是自愿的,带有机会性,参与者的构成成分可能与目标总体存在差异。
雪球抽样
(由先前确定的成员来确定目标总体中其他的成员) 当获得一个抽样名单困难不实际时,是一种有用的方法。 介绍成员可能会产生有偏移性的样本;
很难或无法控制谁会被抽取;
配额抽样
(将总体分成亚群,分切从各亚群中抽取相应数量的样本,使样本中各亚群所占百分比与目标总体相等) 如现有资料可靠,可计算出各亚群的比例。 如需要得出准确的比例,数据资料必须是最新的。
小组讨论会
(每小组由6-10人组成,用数个不同的小组代表总体) 对指导调查设计有用 必须确定这个比较小的群体能有效的反映将要调查的大的群体。
第三章 统计和抽样
一 抽样误差
样本中误差的一个主要来源(1)产生于抽样过程之外的程序和状况;(2)非抽样问题与变量和术语的定义以及纳入标准和排除标准有关;(3)非抽样误差的来源是拒访或拒答;(4)测量方法和调查过程本身可能带来误差(选择性的偏移是不知不觉中产生的,避免选择性偏移的最好方法是使用概率抽样);
谨慎看待来自其他调查和样本的数据。虽然其他调查的被访者在某些方面与你的被访者相似,但在另外一些有价值的方面可能会有所不同。
所有的样本都有误差。
用概率抽样的方法,可以计算样本因偶然性产生的变异是多大,即与总体的差异有多大。
从每个样本算出的均值形成的分布被称为抽样分布。
样本均值倾向于随着被测量样本的增多和变异的减小越来越向总体均值聚集。
抽样误差:样本均值围绕总体均值的变异。
均值标准误:描述抽样误差的统计量。
标准差:估计个体间的变异有多大;
均值标准误:均值在抽样分布的标准差,表示在以后的样本中均值的变异程度。
均值标准误=开方(方差/样本量)
比例标准误=开方(比例*(1-比例)/样本量)
95%的置信区间基本包括两个均值/比例标准误,所以可以推断出置信区间。
二 样本量:多大才足够
样本量:为了得到精确可靠的调查结果,需要调查的单位个数。
样本含量增加,标准误减少,调查成本增加。
统计计算是确定正确样本量最合适的方法。
计算样本量时应考虑的因素:
1、 编写并澄清所有的调查目的、研究的问题和假设。
2、 确定亚群
3、 确定调查类型和数据收集的要求
4、 检查调查可利用资源和时间安排
抽样计划表给出了抽样计划的一种图表表现形式。
三、 计算样本量
确定样本量时需要考虑的问题清单
1、 什么是无效假设。
2、 什么是想要的有关总体均值的无效假设的统计意义水平(总体均值而非样本均值,确定α值,P值是指观察结果或统计检验的结果因偶然性而不是因参加计划所产生的概率,统计检验进行后计算得出。)
3、 在检测出实际差别是存在多大的偶然性?或什么是备择假设的把握度(1-β)
4、 检测出的总体均值之间的差别要多大才有意义?即什么是有意义的u1-u2
5、 什么是总体标准差的一个好估计?
四、 抽样单位和分析单位
抽样单位:被选来调查或分配给群组的个体、群体或其他实体。
分析单位:调查数据用来进行统计研究的实体。
当调查的分析单位和抽样单位不同时,常常需要从统计学上和逻辑上说明调查结果与那些分析单位和抽样单位相同的调查是一致的。
五、 可接受的应答率
提高应答率和最小化回答偏移的指导方法
1、 用培训过的访问员。建立质量控制体系来监督调查质量,并更具需要提供再培训。
2、 确定多于所需数量的合格被访者,以防得不到所需的样本量。同时注意控制成本。
3、 只有相当肯定潜在被访者对研究课题感兴趣时才开始调查。
4、 为调查答案保密或采用匿名的形式进行调查。
5、 为邮寄问卷的接收者寄提示信,督促他们完成问卷,反复给潜在电话调查被访者打电话。
6、 给被访者提供礼物或现金激励。
7、 设定合格被访者的条件时应考虑到由于环境或偶然因素不能参加调查的被访者的比例。
名称:《如何抽样》
作者:阿琳.芬克著 黄卫斌译
出版社:中国劳动社会保障出版社 2004
ISBN 7 – 5045 – 4440 – X
2004年5月第一版,2004年5月第一次印刷
![]() |
延伸阅读:
一、调研工具箱丛书
1、 调查手册 ——阿琳.芬克著
2、 如何设计调查问题——阿琳.芬克著
3、 自填式问卷调查和邮寄问卷调查——琳达.B.鲍克 伊夫.P.菲尔德著
4、 如何实施电话调查——琳达.B.鲍克著
5、 如何实施面访调查——萨拜因.默滕斯.奥伊什著
6、 如何设计调查研究——阿琳.芬克著
7、 如何抽样——阿琳.芬克著
8、 问卷调查心理测验学——马克.S.利特维著
9、 如何管理、分析和解读调查数据——阿琳.芬克著
10、 如何报告调查结果——阿琳.芬克著
二、参考书目
1、american association of public opinion research.(2000). Standard defintitions: final dispositions of case codes and out-come rates for RDD telephone surveys and in – person household surveys. Ann arbor, mi: author
2、babbie, e,(1990).survey research methods. Belmont, ca:wadsworth
3、Baker,t,l(1988).doing social research. New york mcgraw-hill
内容框架
第一章 目标总体和样本
帮助获得一个有代表性的样本的问题清单
一、 概率抽样
1、 简单随机抽样
2、 分层随机抽样
3、 系统抽样
4、 整群抽样
二、 非概率抽样
1、 方便抽样
2、 雪球抽样
3、 配额抽样
4、 小组讨论会
常用的概率抽样和非概率抽样方法
第二章 统计和抽样
一、 抽样误差
简单随机抽样的标准误估计
二、 样本量:多大才足够
计算样本量时需要考虑的因素
三、 计算样本量
确定样本量时需要考虑的问题清单
对计算样本量和把握度有帮助的信息
四、 抽样单位和分析单位
五、 可接受的应答率
提高应答率和最小化回答偏移的指导方法
关键或有启示性的话语
第一章 目标总体和样本
好的样本是总体的缩影,是总体的一部分。
最好的样本是总体的代表或模型。
调查样本本身没有意义。
样本的重要性在于它代表或反应目标总体的精确程度,调查结果将在目标总体中应用和推广。
抽样的原因。抽样考虑的是效率和精准。研究样本比研究目标总体更快、更经济。
对调查人员来说,研究有精确定义特征的样本比试图调查整个总体更合适。
选取样本时,应确保样本是总体目标的可靠代表。
帮助获得有代表性样本的问题清单如下:
(1) 精确地陈述调查目的。调查研究①是为了描述、比较和预测认知、态度与行为。②调查资料评估具体项目或政策是否有效。
(2) 设立清楚明确的被访者合格入选条件
一、 概率抽样
二、 非概率抽样
样本成员显示出代表性或能方便被召集时,采用非概率抽样。
三种情况下非概率抽样正确:
1、 对难以确定人群的调查。
2、 对特定人群的调查。
3、 试访形式的调查。
方法描述 优点 问题
概率抽样 简单随机抽样
(每个对象都有均等的机会被抽取) 操作相对简单 样本中某个 亚群成员所占比例可能不合适。
分层随机抽样
(把研究总体按照有意义的特征分组) 能进行亚群分析;
抽样误差小于随机抽样;
样本更能反映总体。 必须计算每个亚群样本量;
如果分层太多,实施调查会花费更长时间和更多费用。
系统抽样
(从按照一定顺序排列的合格单位中每隔若干抽取一个单位) 方法简便:存在可疑用作抽样框的列表
如果抽样起始点是随机划分的,类似于随机抽样 必须注意抽样框中重复出现的方式
整群抽样及多阶段抽样
(先抽取自然的群,然后调查每个被抽取群的全部成员或对每个被抽取的群进行再抽样) 方法简便,现有的单位可以被利用
非概率抽样 方便抽样
(选用一组容易获得的个人或单位作为样本) 方法使用,依赖于容易得到的单位 样本是自愿的,带有机会性,参与者的构成成分可能与目标总体存在差异。
雪球抽样
(由先前确定的成员来确定目标总体中其他的成员) 当获得一个抽样名单困难不实际时,是一种有用的方法。 介绍成员可能会产生有偏移性的样本;
很难或无法控制谁会被抽取;
配额抽样
(将总体分成亚群,分切从各亚群中抽取相应数量的样本,使样本中各亚群所占百分比与目标总体相等) 如现有资料可靠,可计算出各亚群的比例。 如需要得出准确的比例,数据资料必须是最新的。
小组讨论会
(每小组由6-10人组成,用数个不同的小组代表总体) 对指导调查设计有用 必须确定这个比较小的群体能有效的反映将要调查的大的群体。
第三章 统计和抽样
一 抽样误差
样本中误差的一个主要来源(1)产生于抽样过程之外的程序和状况;(2)非抽样问题与变量和术语的定义以及纳入标准和排除标准有关;(3)非抽样误差的来源是拒访或拒答;(4)测量方法和调查过程本身可能带来误差(选择性的偏移是不知不觉中产生的,避免选择性偏移的最好方法是使用概率抽样);
谨慎看待来自其他调查和样本的数据。虽然其他调查的被访者在某些方面与你的被访者相似,但在另外一些有价值的方面可能会有所不同。
所有的样本都有误差。
用概率抽样的方法,可以计算样本因偶然性产生的变异是多大,即与总体的差异有多大。
从每个样本算出的均值形成的分布被称为抽样分布。
样本均值倾向于随着被测量样本的增多和变异的减小越来越向总体均值聚集。
抽样误差:样本均值围绕总体均值的变异。
均值标准误:描述抽样误差的统计量。
标准差:估计个体间的变异有多大;
均值标准误:均值在抽样分布的标准差,表示在以后的样本中均值的变异程度。
均值标准误=开方(方差/样本量)
比例标准误=开方(比例*(1-比例)/样本量)
95%的置信区间基本包括两个均值/比例标准误,所以可以推断出置信区间。
二 样本量:多大才足够
样本量:为了得到精确可靠的调查结果,需要调查的单位个数。
样本含量增加,标准误减少,调查成本增加。
统计计算是确定正确样本量最合适的方法。
计算样本量时应考虑的因素:
1、 编写并澄清所有的调查目的、研究的问题和假设。
2、 确定亚群
3、 确定调查类型和数据收集的要求
4、 检查调查可利用资源和时间安排
抽样计划表给出了抽样计划的一种图表表现形式。
三、 计算样本量
确定样本量时需要考虑的问题清单
1、 什么是无效假设。
2、 什么是想要的有关总体均值的无效假设的统计意义水平(总体均值而非样本均值,确定α值,P值是指观察结果或统计检验的结果因偶然性而不是因参加计划所产生的概率,统计检验进行后计算得出。)
3、 在检测出实际差别是存在多大的偶然性?或什么是备择假设的把握度(1-β)
4、 检测出的总体均值之间的差别要多大才有意义?即什么是有意义的u1-u2
5、 什么是总体标准差的一个好估计?
四、 抽样单位和分析单位
抽样单位:被选来调查或分配给群组的个体、群体或其他实体。
分析单位:调查数据用来进行统计研究的实体。
当调查的分析单位和抽样单位不同时,常常需要从统计学上和逻辑上说明调查结果与那些分析单位和抽样单位相同的调查是一致的。
五、 可接受的应答率
提高应答率和最小化回答偏移的指导方法
1、 用培训过的访问员。建立质量控制体系来监督调查质量,并更具需要提供再培训。
2、 确定多于所需数量的合格被访者,以防得不到所需的样本量。同时注意控制成本。
3、 只有相当肯定潜在被访者对研究课题感兴趣时才开始调查。
4、 为调查答案保密或采用匿名的形式进行调查。
5、 为邮寄问卷的接收者寄提示信,督促他们完成问卷,反复给潜在电话调查被访者打电话。
6、 给被访者提供礼物或现金激励。
7、 设定合格被访者的条件时应考虑到由于环境或偶然因素不能参加调查的被访者的比例。
还没人转发这篇日记