当前位置

当前位置:首页<<课程学习<<第六章<<第一节项目的难度
	三、测验难度水平的确定如何确定适宜的难度水平？一个测验的难度是有组成测验的各个题目的难度决定的。整个测验的难度水平的确定可以从两个方面考虑。（一）项目的难度进行难度分析的主要目的是为了筛选项目，项目的难度多高合适，取决于测验的目的，性质以及项目的形式。大多数的标准测验，都希望能准确测量个体的差异。如果在某题上，被试全答对或全打错，则该题无法提供个别差异的信息，也不会影响测验分数的分布，因此对测验的信度和效度没有多大的作用。对题目难度来说，如果项目过难或过易，就会造成被试基本上都答错或基本上都答对了，也就是P值接近0或1，这样也就不能区分被试能力的差异。大体而言，项目难度为0.50时最理想，此时项目具有最大鉴别力。为了使测验具有更大的鉴别力，应该选择难度在0.50左右的试题比较合适。但是在实际工作中并非如此简单。举一个例子，假如某测验各试题间的相关均在为1.00，项目难度均在0.50，那么有可能使50%的被试答对所有的题目的得满分：另外50%的被试无法通过任何试题，而全部的0分。所以在实际操作时，一般只需使项目的平均难度接近0.50而各个项目的难度在0.50±0.20之间变化。如果测验是用于选拔或诊断，则最好多选一些难度与录取线接近的项目。例如测验是要辨别或选择少数优秀的被试，测验就应该有相当的难度，P值应该较小。如果录取率为20%，那么难度最好确定为20%,恰好使得20%的优秀被试通过；假如测验是要筛选出少数较差的被试，则测题P值应该高，使得只有少数被试不能通过。在项目选择上还有一个要注意的问题是：当项目形式是选择题时，要考虑到让P值大于概率水平，否则项目是无效的。当P值等于概率，说明题目可能过难或题意不清，被试凭猜测作答。P值小于概率无意义，说明题目质量有问题。例如，对于是非题而言，其难度值应为0.75最为合适。对于四选一的项目，其难度值为0.63是最为合适。（二）测验的难度测验的难度直接依赖于组成测验的项目的难度。通过考察测验分数的分布，可以对测验的难度做出直观检验。由于人的心理特性基本上是呈常态分布的，而我们目前所采用的统计方法又多以正太分布为前提，因此大多数测验在设计时希望分数呈现常态分布的模型。如果被试样本具有代表性，对于中等难度的测验，其测验总分应该是接近常态分配。获得分数若正态分布，则测验属于中等难度。当然，也不是所有测验都要求测验分数呈常态分布。有些测验，如掌握性测验或标准参照测验，分数分布出现偏态是允许的，这类测验的难度可根据实际需要来确定。若呈正偏态分布，则大多数分数集中在低端，测验难度较大，增加容易项目。正偏态分布适合于筛选性测验(选拔性，竞争性测验)，如大学入学考试、数学竞赛，或者一个单位从近百人中招聘5人；若负偏态分布，则大多数分数集中在高分端，测验难度较小，增加困难项目达标考试属于负偏态分布的情况。比如中学会考，大部分题目都是比较简单的。难度的指标是根据样本水平来确定参照点的，具有相对性。P值所反映的是项目的相对难度，即心理难度，而不是绝对难度。一个项目的P值大小，除了与内容或技术本身的难易有关外，可能是因为表述不清或受测者没有学习过相关知识而变难；一个很难的内容，也可能因为答案过于明显或由于受测者学过相关的知识而变的容易，也就是“难着不会，会者不难”。因此，仅仅依靠主观判断或定性分析来确定项目难度是不可靠的，这也是测验需要预测的原因之一。

1 2 3 4