第2节 物理学业成就的评价
一、对学生学业成就评价的基本理念和目标
1.评价的基本理念
(1)学生的学习评价旨在促进学生的发展
(2)既要评价成绩又要评价学生参与学习的机会
(3)倡导过程评价,淡化等级评价
(4)重视自我评价
(5)突出真实性评价
2.评价的目标
学生学习评价的目的是促进学生在知识与技能,过程与方法,情感态度与价值观方面的发展,发现学生多方面的潜能,了解学生发展中的需求,使每一个学生通过评价都能看到自己在发展中的长处,增强学习的信心。评价应全面客观地反映教学的真实情况,为改进教学提供真实可靠的依据。
二、评价的内容和方法
(一)评价内容
1.对科学探究过程的评价
2.对物理知识与技能的评价
3.对科学态度、情感与价值观的评价
4.对科学技术与社会关系认识的评价
(二)评价方法
1.连续观察与面谈
2.实践活动评价
3.书面测试
4.个人成长记录
三、物理学业成就测验的编制
编制试卷的一般步骤如下:
1.确定测验的目的
2.确定测验的目标
3.确定试题的形式
4.制订命题计划
5.编制试题
6.集合成测验试卷
7.试做
8.编制标准答案,规定评分标准
四、测量的质量分析与评价
(一)信度
1.信度的概念
信度是同一组考生测验成绩的稳定性程度,多次测验所得成绩的一致性程度,是衡量测验质量高低的一个重要指标。
2.信度的估计方法
估计信度的方法很多,如表8-3。
表8-3 估计测验信度的方法比较
| 方法 | 意义 | 程序 | 一致性 |
| 重测法 | 稳定性量数 | 以相同的测验对同一批考生在不同的时间内测量两次 | 同一测验不同时间所得结果的一致性 |
| 复本法 | 等值性量数 | 以等值的两个测验在同一时间内测量同一批考生 | 等值的两个测验在同一时间所得结果的一致性 |
| 重测复本法 | 稳定及等值性量数 | 以等值的两个测验在不同时间内测量同一批考生 | 等值测验在不同时间所得结果的一致性。 |
| 折半法 | 内部一致性量数 | 实施一次测验,将测验分成等值的两半,计算这批考生在两半测验上所得分数相关性,并用公式加以校正 | 同一测验中在所包含的各试题上所得成绩的一致性 |
| 库理法 | 实施一次测验,计算每个题目的难易度和考生得分的方差,代入公式 | ||
| α系数法 | 实施一次测验,计算每题的方差和考生得分的方差,然后代入公式 |
上表中前三种方法均需测试两次,并用两次测试结果的相关系数表示信度;而后三种方法是比较常用的方法,可从一次测试中求得信度。
(1)分半信度估计
①当假定两半测验分数的方差相同时,可用斯皮尔曼—布朗(Spearman—Brown)公式:
![]()
来计算整个测验的信度。
式中,
为整个测验信度的估计值,r为半测验的信度。
②当两半测验分数的方差不相等时,可用卢朗(Rulon)公式或盖特曼(Guttman)公式直接求得测验的信度
=1-![]()
式中,Sx2为学生在整个测验中总分的方差,Sd2为两半测验分数之差的方差。
卢朗公式又可转化为盖氏公式
=2(1-
)
式中,Sa2与Sb2分别表示两半测验分数的方差。
(2)Kuder—Richardson估计法
当试题全为二值性(指答案只有对、错两种情形)的试题且试卷无法分成等效的两半时,可采用Kuder—Richardson公式中之一来估计整个测验的信度。K-
和K-
是常用的两个公式。
K-
:
=
[1-
]
K-
:
=
[1-
]
式中,n表示测验的题数;p表示某题答对的比率(即难度);q=1-p表示某题答错的比率;pq表示二分值记分题目的方差;Σpq是求和符号,表示所有题目的pq的乘积相加;Sx2表示总分的方差;
表示整个测验的平均数。
(3)α系数法
rα=
(1-
)
式中n表示题数,Si2表示考生在各题上得分的方差,Sx2表示测验总分的方差,i=1,2…,n。
3.影响信度的因素
(1)试卷的长度
(2)受分数分布的影响
(3)试题难度的影响
(4)评分者的影响
(5)命题过程的影响
(6)测验实施过程的影响
(7)考生本身因素的影响
4.目标参照测验的信度—复本估计法
以等值的两份测验对同一考生群体进行测试,但不计算考生在这两份测验中得分之间的相关系数,而是计算这两份测验中都通过及都未通过的人数之和,与样本总数的人数之比作为测验的信度。
=![]()
其中a表示两测验中都通过的人数,d表示两测验中都未通过的人数,n表示样本容量。
(二)效度
1.效度的概念
效度是衡量测验结果的有效性或准确性的质量指标,是反映测量结果与所要测量的结果相符合的程度,是一个测验对于它所欲测量的行为特征,能够测量到的程度。
2.内容效度
(1)内容效度的概念及其意义
内容效度是指测验内容对所要测量的内容的代表性程度。也就是说测验的内容范围、材料与所要测量的内容范围、教学目标是否符合,测验中的试题所引起的行为是不是所要测量的属性的明确反应,测验的结果是不是一个具有代表性的行为样本。
(2)提高内容效度的方法
①对教材中所包含的内容和教学目标进行系统的逻辑分析,并对所欲测量的内容范围及能力加以界定,在此基础上将各部分的内容和教学目标分类,使之明确化、具体化。
②根据各部分内容及教学目标各个层次的重要性,确定其比重。
③编制命题双向细目表。
④根据命题双向细目表编制有代表性的试题,并按表中的比例恰当分配试题,组成整个测验。
(3)检验内容效度的方法
①逻辑判断法;②相关法;③再测法
3.影响效度的因素
①试题的组成方面;②考试的实施及评分方面;③考试的心理和情绪方面;④信度的影响
(三)难度
1.难度的涵义
难度是指测验题的难易程度,它是试题对学生的知识和能力水平的适合程度的质量指标。表示难度的数量指标叫做难度指数,用P表示。
2.估计难度的方法
(1)用试题的答对率(或通过率)计算难度
用公式可表示为 P=
式中,P表示试题难度指数,R表示答对某题的人数,n表示参加测验的总人数。
(2)用考生答对某题的百分比表示难度
用公式可表示为 P=![]()
式中,P表示试题的难度指数,
表示所有考生在该题得分的平均数,ω表示该题的满分值。
(3)用“两端分组法”估计试题的难度
用两端分组法来计算试题的难度的步骤是:首先把考生的总分进行由高分到低分的排列;其次从最高分开始向下取27%的考生作为高分组,从最低分开始向上取27%的考生作为低分组;然后计算高分组答对该题的百分比PH,低分组答对该题的百分比PL;最后由下式计算该题的难度。
P=![]()
3.评判试题难易的一般标准
在实际运用中,人们通常把试题的难度划分为5个等级,并以此作为判断难易程度的标准。
表8-6 评判试题难易的一般标准
| 评判 等级 | 难 | 较难 | 一般 | 较易 | 易 |
| 难度 指数 | 0.00--0.19 | 0.20—0.29 | 0.30—0.59 | 0.60—0.79 | 0.80—1.00 |
4.影响难度的因素
①考查知识点的多少。
②考查能力的复杂程度或层次的高低。
③考生对题目(或内容)的熟悉程度。
④命题的技巧性(题目中的信息与干扰)。
(四)区分度
1.区分度的涵义
试题的区分度是指试题对不同知识和能力水平的考生的区分程度和鉴别能力。
2.用“两端分组法”计算试题的区分度
两端分组法用统计某题的高分组通过率(或百分比)
与低分组的通过率(或百分比)
之差表示某题的区分度,即
D=
-![]()
式中,D称为区分度指数。-1≤D≤+1。当D=+1时,表示高分组全部答对,而低分组全部答错;反之,D=-1;若两组答对的百分比相同,则D=0。
3.评价标准
D值越大,试题的区分度越大。艾贝尔(1965)提出了根据区分度指数D值的大小对试题质量进行评价的标准。
表8-7 区分度指数与试题质量之间的对应关系
| 区分度指数D | 评价 |
| 0.40以上 | 非常良好 |
| 0.30—0.39 | 良好,如能改进更好 |
| 0.20—0.29 | 尚可,用时需作改进 |
| 0.19以下 | 劣,必须淘汰或加以修改,以提高区分度 |
五、选择题的选项分析
选择题的选项分析是指对选择题后面所提供的几个备选答案进行的统计分析。考查正确答案是否对的太明显,错的答案是否起到了干扰的作用,分析的结果可作为修改试题的依据。其分析的方法是将所有考生的测验总分,从高到低排列,并从高、低两端各取27%(或33%)个测验分数,组成高分组和低分组,然后再根据高分组和低分组的考生对每一个试题的选项人数加以分析。
六、学生学业成就的评价的一种质性评价方法:档案袋评定
1.档案袋评定的涵义
档案袋评定法就是通过汇集学生作品的样本来展示学生的学习和进步状况。
2.档案袋评定的意义
档案袋评定的主要意义,在于它为学生提供了一个学习机会,使学生能够学会自己判断自己的进步。
3.档案袋评定的类型
表8-8 档案袋的类型
| 类 型 | 构 成 | 目 的 |
| 理 想 | 作品产生和入选说明,系列作品,以及代表学生分析和评定自己作品能力的反思。 | 提高学习质量。通过一段时间的成长,帮助学习者成为自己学习历史的思索者和非正式的评价者。 |
| 展 示 | 主要由学生选择出来的学生最好和最喜欢的作品集。自我反思与自我选择比标准化更重要。 | 给由家长和其他人参加的展览会提供学生作品的范本。 |
| 文 件 | 根据一些学生的反映以及教师评价、观察、考查、轶事、成绩测验等得出学生进步的系统性、持续性记录。 | 以学生的作品、量化和质性评价的方式,提供一种系统的记录。 |
| 评 价 | 主要由教师、管理者、学区所建立的学生作品集。评价的标准是预定的。 | 向家长和管理者提供学生在作品方面所取得成绩的标准化报告。 |
| 课 堂 | 由三个部分组成:①依据课程目标描述所有学生取得的成绩的总结;②教师的详细说明和对每一个学生的观察;③教师的年度课程和教学计划及修订说明。 | 在一定情境中与家长、管理者及他人交流教师对学生成绩的判断。 |
4.应用举例:物理学习记录

