当前位置:首页<<课程学习<<第六章<<第一节 项目的难度
 

三、测验难度水平的确定

如何确定适宜的难度水平?一个测验的难度是有组成测验的各个题目的难度决定的。整个测验的难度水平的确定可以从两个方面考虑。

(一)项目的难度

进行难度分析的主要目的是为了筛选项目,项目的难度多高合适,取决于测验的目的,性质以及项目的形式。

大多数的标准测验,都希望能准确测量个体的差异。如果在某题上,被试全答对或全打错,则该题无法提供个别差异的信息,也不会影响测验分数的分布,因此对测验的信度和效度没有多大的作用。对题目难度来说,如果项目过难或过易,就会造成被试基本上都答错或基本上都答对了,也就是P值接近01,这样也就不能区分被试能力的差异。大体而言,项目难度为0.50时最理想,此时项目具有最大鉴别力。

为了使测验具有更大的鉴别力,应该选择难度在0.50左右的试题比较合适。但是在实际工作中并非如此简单。举一个例子,假如某测验各试题间的相关均在为1.00,项目难度均在0.50,那么有可能使50%的被试答对所有的题目的得满分:另外50%的被试无法通过任何试题,而全部的0分。所以在实际操作时,一般只需使项目的平均难度接近0.50而各个项目的难度在0.50±0.20之间变化。

如果测验是用于选拔或诊断,则最好多选一些难度与录取线接近的项目。例如测验是要辨别或选择少数优秀的被试,测验就应该有相当的难度,P值应该较小。如果录取率为20%,那么难度最好确定为20%,恰好使得20%的优秀被试通过;假如测验是要筛选出少数较差的被试,则测题P值应该高,使得只有少数被试不能通过。在项目选择上还有一个要注意的问题是:当项目形式是选择题时,要考虑到让P值大于概率水平,否则项目是无效的。当P值等于概率,说明题目可能过难或题意不清,被试凭猜测作答。P值小于概率无意义,说明题目质量有问题。例如,对于是非题而言,其难度值应为0.75最为合适。对于四选一的项目,其难度值为0.63是最为合适。

(二)测验的难度

测验的难度直接依赖于组成测验的项目的难度。通过考察测验分数的分布,可以对测验的难度做出直观检验。由于人的心理特性基本上是呈常态分布的,而我们目前所采用的统计方法又多以正太分布为前提,因此大多数测验在设计时希望分数呈现常态分布的模型。如果被试样本具有代表性,对于中等难度的测验,其测验总分应该是接近常态分配。

获得分数若正态分布,则测验属于中等难度。当然,也不是所有测验都要求测验分数呈常态分布。有些测验,如掌握性测验或标准参照测验,分数分布出现偏态是允许的,这类测验的难度可根据实际需要来确定。若呈正偏态分布,则大多数分数集中在低端,测验难度较大,增加容易项目。正偏态分布适合于筛选性测验(选拔性,竞争性测验),如大学入学考试、数学竞赛,或者一个单位从近百人中招聘5人;若负偏态分布,则大多数分数集中在高分端,测验难度较小,增加困难项目达标考试属于负偏态分布的情况。比如中学会考,大部分题目都是比较简单的。

难度的指标是根据样本水平来确定参照点的,具有相对性。P值所反映的是项目的相对难度,即心理难度,而不是绝对难度。一个项目的P值大小,除了与内容或技术本身的难易有关外,可能是因为表述不清或受测者没有学习过相关知识而变难;一个很难的内容,也可能因为答案过于明显或由于受测者学过相关的知识而变的容易,也就是“难着不会,会者不难”。因此,仅仅依靠主观判断或定性分析来确定项目难度是不可靠的,这也是测验需要预测的原因之一。

 

1 2 3 4