问卷调查法之:信度
信度(reliability),即可靠性,指采用同样的方法对同一对象重复测量时所得结果的一致性程度。换言之,信度指测量结果的一致性或稳定性,即测量工具能否稳定地测量所测的事物或变量。
如拿一台称去称一袋盐,第一次称是0.7千克,第二次是1.3千克,第三次是0.4千克,这三次称的结果的一致性程度很低,这台称不能稳定地测出这一袋盐的重量,我们就说这台称的信度很低(不可靠)。假如称了三次,结果完全一样,我们就说这台称的信度很高(非常可靠)。
信度包括再测信度、复本信度、折半信度、同质性信度、评分者信度等(见下图)。

再测信度,是用同一个量表对同一组对象施测两次所得结果的一致性程度,表示两次测量结果的稳定程度,其大小等于这两次结果的相关系数。如同一台秤称一袋盐,这次称的是2千克,再一称是1.9千克,2与1.9的相关系数就是再测信度系数。
复本信度,是用题目不同但内容相似的两个量表测量同一组对象所得结果的一致性程度。如用不同品牌的称来称同一袋盐,如果用A品牌的称来称是2.01千克,用B品牌的称来称是2.00千克,2.01与2.00的相关系数就是复本信度系数。
折半信度,是按测量项目单双号分为两组,计算这两组项目所得分数之间的相关系数,它反映的是这两组测量项目得分之间的一致性。
同质性信度,也叫内部一致性信度,指题目间的一致性程度。这里的一致性是各题目得分的一致性,不是题目内容或形式的一致性。如果各题目得分有较高的正相关,不论题目内容和形式如何,其一致性程度都高;反之,即使所有题目测的是同一事物或概念,但得分的相关系数为零或负值时,其一致性程度就低。
评分者信度,指多个评分者按照同样的计分规则给同一批答卷进行评分的一致性程度。
在由客观题目组成的考试与心理测验中,问题的答案是固定的(标准答案),不需要考察评分者信度。但在一些答案不固定的考试与测验中,如作文评分、道德判断测验,评分时多少掺杂有评分者的主观判断因素,这种情况下需要考察评分者信度。
如某考生的作文,满分40,三位老师分别给了35分、37分、34分,三个分数之间的一致性程度较高,我们就说评分者信度较高;如果分别是25分、37分、16分,三个分数之间的一致性程度就比较低,我们就说评分者信度不高(这只是粗略判断,正确的做法是:如果只有两位评分者,评分者信度是计算其评分的相关系数;如果有多个评分者,常用肯德尔和谐系数作为评分者信度的估计)。
信度分析常用克龙巴赫(Cronbach)α系数、皮尔森(Pearson)相关系数、斯皮尔曼(Spearman)相关系数。
在对信度要求较为严格的测量中,
信度系数≥0.9,信度较好;
0.8≤信度系数<0.9,信度可以接受;
0.7≤信度系数<0.8,量表需要修订;
信度系数<0.7,量表不能接受。
(张屹,周平红.教育研究中定量数据的统计与分析:基于SPSS的应用案例解析[M].北京:北京大学出版社,2015:266.)
在对信度要求不那么严格的问卷调查中,信度系数>0.7就能接受(见上图)。