1
社会科学方法论
1.9.5.4 四、测量的信度与效度

四、测量的信度与效度

在测量的过程中,如何才能判定测量的精确度呢?有两种评定标准,一种是测量的稳定性即信度(reliability),另一种是测量的真实性,即效度(validity)。

(一)测量的信度

信度是指测量结果的一致性或稳定性。一个测验的信度是指采取同样的方法对同一对象重复进行测量时,其所得结果的一致程度。简言之,信度是指测量工具能否稳定地测量所测的事物。比如,用同一台磅秤去称某一物体的重量,如果称了几次都得到相同的结果,那么可以说这台磅秤的信度很高。如果几次测量的结果各不相同,那么说明它的信度很低,或者说这一测量工具是不可信的。

测量的信度可从两个层面上加以分析:①当我们以相同的测量工具重复测量某物时,能否得到相同的结果?据此可以确定该测量工具的稳定性、可信性或可预测性。②测量工具能否有效地减少随机误差的影响,而提供某物个别差异程度的真实测量?由此可知测量结果的精确性或准确性。

大部分信度指标都以相关系数(r)表示,主要类型有再测信度、复本信度和折半信度三种。①用同一种测验,对同一群受试者前后测验两次,再根据受试者两次测验分数计算其相关系数,即得再测信度。此种信度能表示两次测验结果有无变动,又称为稳定系数。这是一种最常用的信度检查方法。②如果一套测验有两种以上的复本,则可交替使用,根据一群受试者接受两种复本测验的得分来计算相关系数,即得复本信度。用复本来检测信度,所使用的复本必须是真正的复本,在题数、形式、内容以及难度、鉴别度等方面都要完全一致。③在一种测量没有复本且只能实施一次的情况下,通常采用折半法来估计测量的信度。常用的折半法是将受试者的测量结果,按题目的单双数分成两半计分,再根据各人在这两半测验上的分数,计算其相关系数,即得折半信度。

(二)测量的效度

测量的效度又被称为测量的真实性或准确性,它是指用测量工具准确地测量事物属性的程度。换言之,效度是指测量指标准确地反映某一概念真正含义的程度。当测量指标测量了所希望测量的事物时,测量指标就是有效度的,就是一种有效的测量。反之,就称为无效的测量或者测量不具有效度。一个测量的效度愈高,测量结果越能代表所要测量的对象特征。

测量效度有两个条件,第一个条件是,测量指标确实是测量所要探究的概念,而非其他概念。例如,智商测试测量的是智力,而不是忠诚或信念等其他概念。第二个条件是,能够准确地测量出这个概念。例如,智商为100的人,用测量工具所测得的智商就是100。第一个条件是效度的必要条件,但不是充分条件。显然,第一个条件比第二个条件来得更重要。

效度是科学测量工具最基本的必备条件,一个测量工具若无效度,则无论其他优点多么突出,都无法发挥真正的功能。因此,选用测量工具或自行编制测量工具,首先要评价测量工具的效度。在检验测量效度时,必须考虑到测量的目的和功能。一个测量所测得的结果,必须符合该测量的目的,才能成为正确而有效的测量工具。

效度可以分为内部效度(internal validity)与外部效度(external validity)。内部效度是指测量指标真正地测量想要测量的概念或变量的程度。而外部效度是指把测量结果进行推广的能力。内部效度又可以进一步分为内容效度(content validity)、效标效度(criterion-related validity)和结构效度(construct validity)三种类型,它们分别从不同的方面反映测量的准确程度(参见第十二章的相关内容)。

(三)信度与效度的关系

信度和效度是科学测验工具所必备的两项标准。信度是指测量结果是否一致的稳定程度,不涉及测量所得是否正确的问题,而效度则针对测量的目的,考查测验能否发挥其测量功能,而以其确实能测量出所要测量特质的准确程度表示。效度是测验的首要条件,而信度是效度不可缺少的辅助品。效度是信度的充分条件但不是必要条件,有效度必然有信度,但是无效度却未必无信度。信度是效度的必要条件,但不是充分条件,无信度必然是无效度,但有信度未必有效度。不稳定的测验,没有多大的用处,而测验结果不准确,则毫无价值。一个测量手段可能既缺乏稳定性也缺乏准确性,可能具有高度的稳定性但是缺乏准确性,也可能同时具有很高的稳定性与准确性,但是,一个具有很高准确性的量度手段一定同时也是一个稳定的量度手段。