一、效度的功能
(一)预测误差
效度系数的实际意义常常以决定性系数来表示,意旨相关系数的平方,其表达式是rxy2,它表示测验正确预测或解释的效标的方差占总方差的比例。
另一种表达方法是估计的标准误,简写为Sest,它是指所有具有某一测验分数的被试其效标分数(Y)分布的标准差,也即真正效标分数落在某一范围内有多大可能性。
(二)预测效标分数
在测验工作中,人们感兴趣的是从测验分数预测效标成绩,因此最常用的是Y对X的回归方程。
(三)预测效率指数
据预测效标分数的标准误计算公式、无关系数K 的计算公式 ,K反映了测验分数与效标分数的无关程度,它受效度系数的影响。当效度系数等于1时,K=0,测验分数与效标分数有完全的对应关系 ;当效度系数等于 0 ,K=1,测验分数与效标分数100%的无关 ,测验与效标分数完全无关 ,它对效标分数没有任何预测力;当效度系数等于0.90时,可以计算出 K=0.436,即测验分数与效标分数的无关程度是43.6%,预测效率指数就是 56.4%,即使用该测验预测被试的效标分数,较之瞎猜,可以减少56.4%的误差。
二、多种效度系数的要求
智力测验分数与教师对学生的等级评定之间的效度系数一般在0.30~0.50的范围内。相同科目的标准测验成绩与教师对学生名次排列之间的相关系数一般应达到0.60~0.70之间,两种不同的智力测验或标准之间的相关系数应达到0.60~0.80。
对效度系数大小的要求,也受原测验与获得效标的测验的相似性的制约。
三、影响效度的因素
(一)测验本身的因素
1、测验题目的质量。测验的指导语和试题的答案说明要明确,试题编制符合测验的目的,试题难度要适中。
2、测验的长度。一般而言,增加测验的长度通常可以提高测验的信度,而信度又制约着效度,因此增加测验的长度也能提高测验的效度。当组成测验的试题样本没有较好地代表欲测内容或结构时,测量的内容效度或结构效度就必然会不高。同时若题目语义不清、指导语不明、题目太难或太易、题目太少或安排不当等等,都会降低测量效度。
一般而言,增加测验的长度可以提高测量信度,进而为提高测量效度提供了可能。于是,一些研究者便得出了测量长度与效度的公式如下:

试题是构成测验的要素,测验之效度取决于试题性能。凡测验的取材、测验长度、试题的区分度、难度及其编排方式等皆与效度有关。要想提高测验的效度,须谨慎选择测验材料,适当安排测验的长度,使试题具有相当的鉴别力而且难易程度适中。
(二)测验实施中的干扰因素
1、主试的影响因素。测验实施过程中主试的因素会影响效度。对于效标效度,测验与效标二者实施时间间隔时间越长,测验与效标越容易受到很多机遇因素的影响,因此所求的相关必然很低。测验情镜,如场地的布置、材料的准备、测验场所有无噪音和其他干扰因素等也会影响到测验的效度。
2、被试的影响因素。被试在测验时的兴趣、动机、情绪、态度和身心状况、健康状态等都会影响测验的效度。(被试的反应定势也会降低测验的效度。)
测验的实施程序是影响效度的重要因素。若主试能适当控制测验情景,遵照测验手册的各项规定而实施,就能避免外在因素对测验结果的影响。在测验实施的过程中,如果场地的布置、材料的准备、做答方式的说明、时间的限制等任何一方面不遵照标准化的程序进行,都会使效度降低,失去测验的意义。
(三)样本团体的性质
1、样本团体的异质性。如果其它条件相同,样本团体越同质,分数分布范围越小,测验效度就越低;样本团体越异质,分数分布范围越大测验效度就越高。
2、干涉变量。样本团体的性质对效度的影响还表现在:对于同性质的团体,同一测验的效度会有很大的不同。这些样本团体的特质包括:年龄、性别、教育水平、智力、动机、职业和任何有关的特征。由于这写特征的影响,使得测验对于不同的团体具有不同的预测能力,故测量学上称这些特征为干涉变量。
(四)所选效标的性质
由于同一个测验可以有不同的效标,同一个观念效标也可以有不同的效标测量,所以在评价测量效度时,所选效标的性质是很重要的考虑因素。所有这些不同的要求,主要是因为所用效标的不同而提出来的。在考虑效标与分数的相关时,有一个因素是必须重视的,即测验分数与效标之间是否符合线形关系的问题。因为皮尔逊积差相关的前提之一是二变量间具有线形关系,否则会得出错误的效度结论。这就要求我们在选用相关系数的计算公式时,注意各公式的使用条件。
四、提高效度的方法
(一)控制系统误差
系统误差常常由于仪器没有标准,题目和指导语有暗示性,答案有明显的组型等原因产生的。
(二)精心编制量表
1、测验内容要确实能适应测验目的。
2、题目表述必须清楚、简明,所用字、词、句能为学生理解,内容应能引起应试者的兴趣,排列由易到难,但前面的题目不应暗示后面的答案。
3、题目难度合适,有足够的区分度。
4、试卷印刷清楚,无错误和遗漏,并力求精美。
(三)妥善组织测验
严格按照测验手册进行,不作超出规定的解释,掌握好时间。评分时务必遵循评分标准,仔细登记,避免错误。
(四)扩大样本的容量代表性
加大样本容量,可以增加样本对总体的代表性,而且使随机误差趋于相互抵消,使测量更可靠。同样,样本大了,应试者差异也就加大,扩大潜在真分数方差,使效度提高。
(五)合理处理效度与信度的关系
(六)适当增加测验的长度

