摘要:本文结合学生的考试成绩,用数理统计的方法对试卷质量进行项目分析和整体分析评价。项目分析着重分析了难度和区分度,整体分析评价着重分析了考生成绩是否服从正态分布, 以及试卷质量的信度,效度和覆盖度。
关键词:试卷,难度,区分度 ,数理统计
中图分类号: 文献标识码:
Abstract : According to the results of a test paper for all students of a class ,we should analyze and evaluate the test paper in the way of statistical analysis.The importance of test-paper quantitative analysis to increase teaching quality and promote course construction is elaborated.
Key words: test-paper difficulty discrimination.
考试是教育测量的一种工具,是教育结果的反馈,也是智力开发不可缺少的手段.传统的考试没有注意到测量的两个基本点:一是等值单位,二是准确性与可靠性。因此,每次考试后,教师依据考试成绩用数理统计方法对试卷进行项目整体分析,调整试题难度和区分度、 提高考试的信度和效度 、强化试卷的质量、完善教学工作皆有指导意义.
本文以一个教学班的期末考试“概率统计“为例对试卷进行定量评估.该试卷共8道题,考生3 8人.满分1 0 0分.最高分数 9 5分,最低分数6 2分,总分3 0 1 1分,平均分数7 9.2 3分,标准差8.2分.
1 试卷质量项目表达与分析
试卷的基础是试题.它的内容与形式好坏直接影响试卷品质的(信度和效度)优劣.其质量的常用指标主要为难度与区分度两项.
1.1 难度
表示难度的数量指标叫难度指数,即: Pi= Qi /Fi (1)
(1)式中Pi表示第i题的难度指数,Fi表示第i题满分分数,Qi表示考生在第i题得分的平均数,难度指数愈大。考生通过的百分比愈大,试题愈容易。Pi值0.7~0.8为宜,小于0.3为难题,大于0.8为容易题,在0.5右左为中等难度。
经计算,各题的难度指数见表1
表1 8道题试题的难度指数/ Pi

1 2 3 4 5 6 7 8 平均难度指数

0.75 0.80 0.60 0.60 0.88 0.80 0.87 0.73 0.78
平均难度指数为各题难度指数的加权平均数,也叫总难度指数.难度指数愈接近0.5其区别力愈高,但各题难度指数都是0.55未必是好试卷。表1看出,试卷第5,7题Pi偏低,应加深其难度.
1.2 区分度
区分度表示为 di =(Hi-Li)/ Fi (2)
(2)式中 di表示区分度, Hi,Li分别表示高分组,低分组(一般各取27%,本例各取10名)第i题得分的平均值。
教育测量学告诉我们试题的区分度在0.40以上为好,在0.30~0.39为良,0.20~0.29尚可,0.19以下为差,好的试题能从分数上把学生拉开用功的挡次。 经计算,各题的区分度见表2
表2 8道试题的区分度/ di

1 2 3 4 5 6 7 8 平均区分度

0/16 0.03 0.43 0.47 0.21 0.31 0.19 0.33 0.25
各题区分度的加权平均数也叫总区分度。从表2看出,试卷第1、2、7题区分度较差,其中第7题太简单,应增加其难度。第l题是填空题,属基本内容,应当保留,第2题是选项题,因选项诱惑力相近,多数考生凭猜测答题,答错人数高分组反比低分组多,此题应淘汰。
2试卷质量整体分析 检验考生成绩是否服从正态分布 由教育学和心理学得知,智力应服从正态分布, 经计算

≈30 11 , ≈241143

=-≈2560.868
![]()
所以参数的估计值 m≈79.23 , ≈67.39 ,得≈8.2
![]()
现在检验原假设H0:X~N(79.23, )

经计算≈0.915
![]()
对α=0.05,分7组,自由度k=4,查表=9.48
![]()
因为<,所以接受原假设H0 ,认为考试成绩服从正态分布。
2.2 试卷质量信度
信度是对考试结果可靠性评价,这里用柯氏公式的α系数表示信度.

α= (5)
![]()
其中I是总题数,是第i题分数的方差,为总分方差.经计算试卷品质信度见表3
表3 8道题试卷品质信度

题 号 1 2 3 4 5 6 7 8 平均值

平均分 13.47 9.55 4.18 13.32 8.84 9.58 8.74 11.66 79.24
方 差 3.82 3.88 3.29 5.42 2.64 4.96 2.09 7.44 66.91

由(5)式计算得系数α=0.65,表示了可靠方差在考试总方差中所占的比例。
标准化考试要求信发在0.90以上,自编试题的信度要求在0.60~0.80之间,本试卷信度尚可。
2.3 分数与内容效度的应用
考试分数的总方差中随机误差越小越好,表达着无关考试的因素影响越小而有效性越高。美国大学入学考试的标准考试效度在0.4~0.7之间.用来测量教学后学生学习状况,学生全部学会最理想,但这时分数的方差为零。照此统计,以考分为依据所得的试卷效度为0.25,试题的真正效度出现“未必性”。需用内容效度来替代衡量试题水平才更加实际。按照教学大纲要求,前述项目分析表明了教师编制命题题量功夫基本到位,照顾了各知识层次,难易试题比例设计照顾了大面,然而选题不当,甚至缺少难度,出现好差学生成绩倒挂。由此看来,本试卷不是教材内容理想的代表性样本,应修改部分题目。
《仪器仪表标准化与计量》
《河南商业高等专科学校学报》
《分析测试技术与仪器》
《新疆农业科技》
编辑QQ
编辑联络
