
[课外拓展:10 标准化考试.doc(下载附件 38.5 KB)]
第一节 教学测量与评价的意义和作用
一、教学测量与评价的基本概念
(一 )教学测量与测验
1.测量的含义
测量主要是一种收集资料数据的过程,是根据某种标准和一定的操作程序,将学生的学习行为与结果确定为一种量值,以表示学生对所测问题了解的多少。
2测验的含义
测验是测量一个行为样本的系统程序,即通过观察少数具有代表性的行为或现象来量化描述人的心理特征。
3.教学测量的含义
教学测量就是借助于学业测验来对教学成效进行定量考核的一种方法。
(二)教学评价的概念
1.教学评价的含义
教学评价是指有系统地收集有关学生学习行为的资料,参照预定的教学目标对其进行价值判断的过程。
2.教学评价包含的工作
(1)教学评价必须对成绩测验数据所表明的教学成效作出确切的诊断。
(2)教学评价必须对教学的成败原因进行分析,并对今后教学工作的改进方向作出明确的规定。
3.教学评价的目的
对课程、教学方法以及学生培养方案作出决策。
4.教学评价包括的步骤
教学评价是一种系统化的持续的过程。包括确定评估目标、搜集有关资料、描述并分析资料、形成价值判断以及做出决定等步骤。
(三)教学评价与测验测量的关系
两者既有区别,又有密切的联系。一方面,测量和测验是对学习结果的客观描述,而教学评价则是对客观结果的主观判断与解释,以了解结果的实际意义。另一方面,教学评价这种主观判断和解释必须以客观描述为基础,测量与测验所得到的结果,只有通过教学评价,才能判断这种客观描述的实际意义。
二、教学测量与评价的分类
(一)形成性评价和总结性评价
从实施教学评价的时机而言,有形成性评价和总结性评价之分。形成性评价指在教学过程中为了了解学生的学习情况,及时发现教与学中的问题而进行的评价。它着眼点在于了解教学活动达到教学目标的程度或未达到目标的原因进行的评价。通常在教学过程中实施,一般是由学生完成一些与教学活动密切相关的测验,也可以让学生对自己的学习状况进行自我评估,或者凭教师的平常观察记录或与学生的面谈。
总结性评价,或称终结性评价,通常在一门课程或教学活动结束后进行,是对一个完整的教学过程进行测定,常用期末考试的方式进行。
(二)常模参照评价和标准参照评价
根据教学评价资料的处理方式,有常模参照评价和标准参照评价之分。常模参照评价是指评价时以学生所在团体的平均成绩为参照标准(即所谓常模),根据其在团体中的相对位置(或名次)来报告评价结果,主要用于选拔或编组、编班。标准参照评价是基于某种特定的标准,来评价学生对与教学密切关联的具体知识和技能的掌握程度。
(三)配置性评价和诊断性评价
从教学评价的功能看,有配置性评价与诊断性评价之分。配置性评价,或称准备性评价,一般在教学开始前进行,摸清学生的现有水平及个别差异,以便安排教学。通过配置性评价,教师可以了解学生对新学习任务的准备状况,确定学生当前的基本能力和起点。诊断性评价,有时指了解学生的学习基础与个体差异;有时指对经常表现学习困难的学生所做的评价,多半是在形成性评价之后实施。
(四)正式评价和非正式评价
根据教学评价的严谨程度,有正式评价与非正式评价之分。正式评价指学生在相同的情况下接受相同的评估,且采用的评价工具比较客观。非正式评价则是针对个别学生的评价,且评价的资料大多是采用非正式方式收集的。
三、教学测量与评价的功能
教学测量与评价是检验教学成效,确定学生学习结果和教师教学效果的有效手段,它的根本作用在于了解学生的学习状况,改进教师教学,从而促进学习效果的提高。
(一)为师生调整和改进教学提供充足的反馈信息
(二)是学校鉴别学生学业成绩、家长了解学生学习情况的主要方式
(三)是教学过程的一个重要组成部分
(四)作为教育评价和决策的依据
第二节 教学测量与评价的方法和技术
教学评价应包括认知、情感和技能三个方面。对于认知和技能领域的学业成就,最常用的教学评价手段是标准化成就测验和教师自编测验。而对于情感以及道德行为表现则常常采用非测验性的评价手段。
一、标准化成就测验
(一)标准化成就测验的含义
标准化成就测验是指由专家或学者所编制的适用于大规模范围内评定个体学业成就水平的测验。它是评价学生学业成绩的重要工具之一。
(二)标准化成就测验的优越性
客观性;计划性;可比性。
(三)标准化成就测验的缺点
第一,与学校课程之间的关系很不协调。在我国,每个地区的教学状况还存在着一定的差距,教师在选用标准化测验前,仔细查阅内容效度,使得测验的目标与评价的目的相匹配。第二,测验结果的不当使用。我们通常利用标准化成就和能力测验对学生分类和贴标签,对个体造成了不良影响。
(四)标准化成就测验的目的
标准化成就测验则用来判断学生与常模相比时所处的水平。
二、教师自编测验
(一)自编测验的含义与特点
教师自编测验是由教师根据具体的教学目标、教材内容和测验目的,自己编制的测验,是为特定的教学服务的。教师自编测验通常用于测量学生的学习状况。
(二)自编测验的优势
1.操作过程简单
2.施测手续方便
3.应用范围一般限于自己所教的学科,在实际教学中颇为有用
(三)测验前的计划
1.确定测验的目的。
2.确定测验要考查的学习结果
3.列出测验要包括的课程内容
4.写下考试计划或细目表
5.选择适合的题型。自编测验包括客观题和主观题两种类型。教师使用哪一种类型的题目是由测验的目的、内容和时间决定的
(四)自编测验的类型
1.客观题
客观题具有良好的结构,对学生的反应限制较多。这类题目包括选择题、是非题、匹配题和填空题等。
2.主观题
主观题则要求学生自己组织材料,并采用合适的方式表达陈述出来。这类题型包括论文题及问题解决题。教师在评分时,对学生的回答需要给出不同量的分值。
(五)命题的一般原则
1.试题要符合测验的目的。测验目的不同,编制测验的取材范围和试题难度也就有所不同
2.试题内容的取样要有代表性,最好能代表该学科的全部内容
3.题目格式应多样化
4.语句要简明、清晰、易懂
5.答案应准确
6.试题应彼此独立,彼此考查知识点不能明显重复
(六)有效自编测验的特征
1.信度
信度是指测验的可靠性,即多次测验分数的稳定、一致的程度。它既包括在时间上的一致性,也包括内容和不同评分者之间的一致性。
信度指标通常以相关系数表示,即用同一被试样本所得的两组资料的相关系数作为测量一致性的指标,称为信度系数。影响信度的相关因素有:①测题数量;②测验难度;③施测对象;④施测过程。
2.效度
效度是指测量的正确性,即一个测验能够测量出其所要测量的东西的程度,它是科学测量工具最重要的质量指标。效度考虑的问题是:测验测量什么?测验对测量目标的测量精确性和真实性有多大?效度的重要性大于信度,但效度并不是绝对的,而是相对的。任何一种测验只是对一定的目的来说是有效的,对其他目的和用途却不一定有效。
3.区分度
区分度是指测验项目对所测量属性或品质的区分程度或鉴别能力。项目的效度越高,其区分度越大,鉴别力越强。它是根据学生对测验项目的反应与某种参照标准之间的关系来估计的。项目区分度高低与测验目的密切相关。
(七)自编测验的常见错误
1.教师过于相信自己的主观判断而忽视测验的信度和效度指标
2.许多教师对测验准备的重要性缺乏足够的认识,对测验准备不够充分,甚至没有准备
3.许多教师编制的测验太简单,题量太小
三、非测验的评价技术
(一)案卷分析
案卷分析是一种常用的评价策略,其内容主要是按照一定标准收集起来的学生认知活动的成果,对学生的作品进行考查分析,并形成某种判断和决策的过程就是案卷分析。
(二)观察
通过教学过程中的非正式观察,教师也能够收集到大量的关于学生学业成就的信息。这种观察不只限于智能的发展,还包括学生生理、社会和情绪的发展。为了确保观察的有效性,教师应注意自然地对学生进行全面系统的观察,然后客观、详细地记录下观察信息。
1.行为检查单
教师可以使用检查单来记录其在教学中的观察结果。检查单一般包括一系列教师认为重要的目标行为,通常采用有/无的方式记录,但有时也记录下次数。行为检查单使用简便易行,对于教师非常有用。
2.轶事记录
轶事记录是描述所观察的事件。它可以提供比较详细的信息,这些记录一般按照发生时间排列的。教师可以在事先有明确的观察目标,就某一方面的行为进行记录;也可以没有明确目的,事后再专门分析或考查某一件事。
它的缺点是:轶事记录比较费时,而且也很难排除主观偏见。
3.等级评价量表
等级评价量表对于连续性的行为,可能更为有效。它可用于判断某种行为的发生频率,以及某种操作或活动的质量,使得观察信息被量化。评价量表是一种间接的观察技术,通过量化所观察的信息,可以迅速简便地获得概括化的信息。评价量表和行为检查单有一定关系。二者都要求教师对学生的行为进行判断,可以在观察过程中或结束后使用。但是它们的评价标准不同,检查单只需要做定性的判断,而等级评价量表是做定量的判断。
(三)情感评价
教师可以自行编写开放式问题、问卷等,对学生的情绪、学习动机、个人观点等进行评价。而在对结果的评价时,教师也需要写一份详细的报告。
四、教学评价结果的处理与报告
(一)测验结果的分析
测验结果的分析主要包括对测验本身的分析和对教学活动的分析两个方面。
1.对测验本身的分析
对每个测验题而言,主要应分析的是其难度和区分度。对于多选题还要分析备选答案的合适度。
对整个测验而言,应分析其信度和效度,并确定其分数的分布。
2.对教学活动的分析
对教学活动的分析首先要对测验中的错误进行登记和分析;然后对错误进行详细分析,以说明教学中存在的问题;最后,针对教学中存在的问题提出改进措施,以促进学习。
(二)评分
评分的标准可分为绝对标准和相对标准两种。绝对标准是以学生所学的课程内容为依据,它强调,由于不同学生的学习起点和背景情况的差异,所以他们的学习结果也是不可比较的。它对应的评价方式是标准参照评价。相对标准是以其他学生的成绩为依据,对应于常模参照评价。相对标准的评价不仅与学生自己的成绩有关,还与其他同学的成绩有关。

