第二节 教学测量与评价的方法和技术
教学评价应包括认知、情感和技能三个方面。对于认知和技能领域的学业成就,最常用的教学评价手段是标准化成就测验和教师自编测验。而对于情感以及道德行为表现则常常采用非测验性的评价手段。
一、标准化成就测验
(一)标准化成就测验的含义
标准化成就测验是指由专家或学者所编制的适用于大规模范围内评定个体学业成就水平的测验。它是评价学生学业成绩的重要工具之一。
(二)标准化成就测验的优越性
客观性;计划性;可比性。
(三)标准化成就测验的缺点
第一,与学校课程之间的关系很不协调。在我国,每个地区的教学状况还存在着一定的差距,教师在选用标准化测验前,仔细查阅内容效度,使得测验的目标与评价的目的相匹配。第二,测验结果的不当使用。我们通常利用标准化成就和能力测验对学生分类和贴标签,对个体造成了不良影响。
(四)标准化成就测验的目的
标准化成就测验则用来判断学生与常模相比时所处的水平。
二、教师自编测验
(一)自编测验的含义与特点
教师自编测验是由教师根据具体的教学目标、教材内容和测验目的,自己编制的测验,是为特定的教学服务的。教师自编测验通常用于测量学生的学习状况。
(二)自编测验的优势
1. 操作过程简单
2. 施测手续方便
3. 应用范围一般限于自己所教的学科,在实际教学中颇为有用
(三)测验前的计划
1.确定测验的目的。
2.确定测验要考查的学习结果
3.列出测验要包括的课程内容
4.写下考试计划或细目表
5.选择适合的题型。自编测验包括客观题和主观题两种类型。教师使用哪一种类型的题目是由测验的目的、内容和时间决定的
(四)自编测验的类型
1.客观题
客观题具有良好的结构,对学生的反应限制较多。这类题目包括选择题、是非题、匹配题和填空题等。
2.主观题
主观题则要求学生自己组织材料,并采用合适的方式表达陈述出来。这类题型包括论文题及问题解决题。教师在评分时,对学生的回答需要给出不同量的分值。
(五)命题的一般原则
1.试题要符合测验的目的。测验目的不同,编制测验的取材范围和试题难度也就有所不同
2.试题内容的取样要有代表性,最好能代表该学科的全部内容
3.题目格式应多样化
4.语句要简明、清晰、易懂
5.答案应准确
6.试题应彼此独立,彼此考查知识点不能明显重复
(六)有效自编测验的特征
1.信度
信度是指测验的可靠性,即多次测验分数的稳定、一致的程度。它既包括在时间上的一致性,也包括内容和不同评分者之间的一致性。
信度指标通常以相关系数表示,即用同一被试样本所得的两组资料的相关系数作为测量一致性的指标,称为信度系数。影响信度的相关因素有:①测题数量;②测验难度;③施测对象;④施测过程。
2.效度
效度是指测量的正确性,即一个测验能够测量出其所要测量的东西的程度,它是科学测量工具最重要的质量指标。效度考虑的问题是:测验测量什么?测验对测量目标的测量精确性和真实性有多大?效度的重要性大于信度,但效度并不是绝对的,而是相对的。任何一种测验只是对一定的目的来说是有效的,对其他目的和用途却不一定有效。
3.区分度
区分度是指测验项目对所测量属性或品质的区分程度或鉴别能力。项目的效度越高,其区分度越大,鉴别力越强。它是根据学生对测验项目的反应与某种参照标准之间的关系来估计的。项目区分度高低与测验目的密切相关。
(七)自编测验的常见错误
1.教师过于相信自己的主观判断而忽视测验的信度和效度指标
2.许多教师对测验准备的重要性缺乏足够的认识,对测验准备不够充分,甚至没有准备
3.许多教师编制的测验太简单,题量太小
三、非测验的评价技术
(一)案卷分析
案卷分析是一种常用的评价策略,其内容主要是按照一定标准收集起来的学生认知活动的成果,对学生的作品进行考查分析,并形成某种判断和决策的过程就是案卷分析。
(二)观察
通过教学过程中的非正式观察,教师也能够收集到大量的关于学生学业成就的信息。这种观察不只限于智能的发展,还包括学生生理、社会和情绪的发展。为了确保观察的有效性,教师应注意自然地对学生进行全面系统的观察,然后客观、详细地记录下观察信息。
1.行为检查单
教师可以使用检查单来记录其在教学中的观察结果。检查单一般包括一系列教师认为重要的目标行为,通常采用有/无的方式记录,但有时也记录下次数。行为检查单使用简便易行,对于教师非常有用。
2.轶事记录
轶事记录是描述所观察的事件。它可以提供比较详细的信息,这些记录一般按照发生时间排列的。教师可以在事先有明确的观察目标,就某一方面的行为进行记录;也可以没有明确目的,事后再专门分析或考查某一件事。
它的缺点是:轶事记录比较费时,而且也很难排除主观偏见。
3.等级评价量表
等级评价量表对于连续性的行为,可能更为有效。它可用于判断某种行为的发生频率,以及某种操作或活动的质量,使得观察信息被量化。评价量表是一种间接的观察技术,通过量化所观察的信息,可以迅速简便地获得概括化的信息。评价量表和行为检查单有一定关系。二者都要求教师对学生的行为进行判断,可以在观察过程中或结束后使用。但是它们的评价标准不同,检查单只需要做定性的判断,而等级评价量表是做定量的判断。
(三)情感评价
教师可以自行编写开放式问题、问卷等,对学生的情绪、学习动机、个人观点等进行评价。而在对结果的评价时,教师也需要写一份详细的报告。
四、教学评价结果的处理与报告
(一)测验结果的分析
测验结果的分析主要包括对测验本身的分析和对教学活动的分析两个方面。
1.对测验本身的分析
对每个测验题而言,主要应分析的是其难度和区分度。对于多选题还要分析备选答案的合适度。
对整个测验而言,应分析其信度和效度,并确定其分数的分布。
2.对教学活动的分析
对教学活动的分析首先要对测验中的错误进行登记和分析;然后对错误进行详细分析,以说明教学中存在的问题;最后,针对教学中存在的问题提出改进措施,以促进学习。
(二)评分
评分的标准可分为绝对标准和相对标准两种。绝对标准是以学生所学的课程内容为依据,它强调,由于不同学生的学习起点和背景情况的差异,所以他们的学习结果也是不可比较的。它对应的评价方式是标准参照评价。相对标准是以其他学生的成绩为依据,对应于常模参照评价。相对标准的评价不仅与学生自己的成绩有关,还与其他同学的成绩有关。

