被试的反应及其影响因素
在测验标准化过程中必须考虑被试可能的反应和可能的影响因素,这里着重讨论影响认知能力测量的各种心理因素。
1.测验的技巧与练习因素
每个测验基本上测量的都是被试学习的结果,只是由一般学习经验或发展变化所引起的分数差异,在大多数情况下被认为是恒定的,而且每个被试在一定限度内基本相同。这种假设在实际中并不尽然。
①测验的技巧
显然,如果某个被试熟悉测验程序及题目形式,而另一名被试是面对全然陌生的实验材料,其测验结果是无法比较的。已经知道这样的情况:具有某种测验技巧的被试,他们能够察觉正确答案与错误答案的细微差别,知道合理分配时间以及适应测题形式等。通过应用这些技巧,他们时常比那些与他们能力相等但是测验技巧较差的被试获得更高的测验分数。因此,在测验标准化时应尽量设法使每个被试对测验材料的步骤和所需技巧有相同的熟悉程度。有人发现,中学阶段的被试可以教导、训练他们的应试技巧,这对没有经验的被试在施测编制不佳的题目时会提高分数,但对编制较好的标准化试题的分数则无影响。
②练习的效应
许多研究者发现参加相同或重复的测验,都会有练习效应而使测验成绩提高。罗杰尔(A.G.Rodger)对一组学生实施六种不同的智力测验,结果是最后一次测验的IQ较第一次的增加8分(约0. 5个标准差)。另有学者在间隔5个月期间,对三年级学生实施4次智力测验,结果IQ平均增加7分(约0.4个标准差)。然而,有人调查中学生重复参加AGCT的分数变化,发现,2个月后的第一次重测,平均成绩增加10分(0.1个标准差);第二次重测,平成绩又增加10分,但第三次重测时分数不再变化。另有学者间隔3个月重测AGCT,结果发现:语文和数学倾向测验平均仅增加约20分(0.2个标准差)。
研究还发现,同样是参加卡特尔非文字智力测验,墨西哥人受训练影响的程度要大于美国人。速度测验受练习因素的影响大于难度测验,尤其是墨西哥人少有参加测验的经验,故练习因素的影响更大。
综述各种研究结果,可将练习因素的影响归纳如下:
●教育背景较差和经验较少者,其受练习因素的影响较为显著;
●着重速度的测验,练习效果较为明显;
●重复实施相同的测验,受练习影响的程度要大于施测复本的测验;
●练习的影响仅限于第一次及第二次重测,第二次以后的影响微不足道或根本无影响。
●平均而言,练习因素影响的幅度约在0.2个标准差以下。
③教学与辅导因素
教学与辅导的作用表现在两方面:一种是可能增加被试对测验包括的领域的知识,另一种可能是只提高了测验分数。显然我们关心的是第二种作用的辅导。
教学和辅导对测验分数的影响常常被人们误解。许多人认认为,通过辅导,测验分数很容易改变,但一系列研究证明,这种作用在与测验内容类似程度很高时才会出现。一般情况下,辅导只会降低被试焦虑和使被试熟悉测验程序。
格林1928年以实验法研究教学与辅导对测验成绩的影响。他将被试分为三组:第一组为控制组,不接受辅导,只重复参加二次斯坦福-比内测验,结果重测时平均IQ增加2~3分(约0.2个标准差);第二组接受两小时的辅导,辅导的内容与测验相似而不相同,结果在重测时平均IQ增加7~8分(约0.5个标准差);第三级不但接受辅导,而且其辅导的内容完全和测验相同,结果平均IQ增加30分(约2个标准差)。上述三级差异经过三年以后已不显著,表明教学辅导的效果仅是暂时的。另有学者发现,未接受教学和辅导的被试,在第一次重测时其平均IQ增加2~3分(约0.2个标准差);到第三次重测时约增加6分(约0.4个标准差),此后即不再增加;接受辅导的学生在第一次重测时,其平均IQ增加5~6分(约0.4个标准差),至第三次重测时,增加至8~10分(约0.6标准差),其后即不再增加。
美国大学入学考试委员会(CEEB, 1968)曾进行几个有关"教学和辅导对学术倾向测验的影响"的研究。结果显示,特殊辅导的影响不大,约在5~20分(0.05~0.2个标准差)之间。弗兰克(Flankel,1960)发现受过辅导者增加的分数高出未受辅导者不足10分(约0.1个标准差)。
综述教学对测验的影响如下:
①一般而言,教学和辅导对测验的影响,仅稍高于练习(重复测验),而且经常可以归诸练习效应;
②除非教学和辅导的内容与测验完全相同,否则辅导的影响很少超过0.2个标准差。
2. 焦虑和动机因素
①应试动机
毫无疑问,被试参加测验的动机不同,自然会影响其回答问题的态度、注意力、持久性以及反应速度等。但对不同测验,应试动机的影响方面与影响程度是不相同的。根据克伦巴赫(1970年)的测量区分标准,我们分别谈谈在测量最高作为和典型作为时动机的不同影响。
在测量成就、智力和能力倾向等变量时,如果被试动机不强烈,就不会尽力回答。某些社会经济地位不高的被试,对测验的动机不强烈,则其能力往往被低估。研究报告发现,如果被试本身已有强烈的动机,则象金钱或其它特殊的强化物所能产生的影响很小或根本没有影响。如果测验的内容无法引起被试的兴趣,或是被试不关心其测验成绩,则外在强化物有显著的影响。
动机效应在测量态度、兴趣和人格等典型行为表现时也有影响。例如,被试可能为给人留些好印象,就会考虑主试的期望或社会赞许的行为,而不按照自己的实际情况回答。
被试动机的影响如果使其在测量中以一种恒定的方式进行反应,则会导致系统误差,使测量的有效性降低。如果被试的动机引起偶然的不稳定的反应,这是随机误差,测量的有效性、可信性都会降低。
②测验焦虑
焦虑是一种不愉快的、表现为焦急、恐惧和紧张的情绪体验,大多数被试多在测验前和测验中经历过这种测验焦虑。它是应激情绪引起的可观察到的反应。一般认为,这种心理上的应激源于挫折、冲突和压抑。而且这种焦虑的大小,如同其它情绪反应一样,取决于被试所感知的产生应激的刺激的强度:如情境的伤害、危险性大小等。
测验焦虑除影响自主神经系统的活动如心跳加速、呼吸加剧外,还会产生其它影响测验成绩的结果。一般说来,适度的焦虑会使人的兴奋性提高,注意力增强,反应速度加快,从而对智力和学术性能力倾向有积极影响;过度的焦虑会使工作能力降低,注意力分散,思维变得狭窄、刻板;毫无焦虑,则往往源于对测验的动机不强,因而成绩大多偏低。
国外有许多学者进行了"焦与测验成绩关系"的研究。几乎所有的研究均发现焦虑(以纸笔或自陈量表测得)与智力和成就都有些微的负相关(-0.1~-0.3 ),但孰因孰果,有待验证。另外有些学者用随机方法将被试区分为几组,分别接受"增加焦虑"(anxiety-inducing)和"减低焦虑"(anxiety-reducing)的实验处理。实验结果均显示,"因实验情绪所引起的焦虑,并不会降低测验成绩。"然而,那些同时需要认知技能两种能力的测验(如迷津)中,被试的表现会受到焦虑的影响。
研究还表明,测验焦虑受到如下因素的影响:
①能力和测验焦虑成负相关:能力高的人,测验焦虑一般较低;而对自己能力没有把握的人,测验焦虑较高;
②抱负水准与焦虑成正相关;抱负水准过高,求胜心切的人,测验焦虑较高。
③具有某种人格特点如缺乏自信,情绪不稳的人易产生测验焦虑。事实上,焦虑可以有状态焦虑(state
anxiety)和特质焦虑(trait
anxiety)两种。特质焦虑就是一种人格特性,具有这种特质的人对应激的情绪反应频率和强度与他人不同。
④测验成绩与被试的关系重大时容易使其产生测验焦虑。
⑤对测验程序不熟悉或者主试错误实施测验时,被试也会产生测验焦虑。
3.反应定势
反应定势亦称反应的方式或反应风格(response
sets or styles),是指独立于测验内容的反应倾向,即由于每个人回答问题习惯的不同,而使得有相同能力的被试获得不同的分数。
定势的产生既有心理的原因,也有生理的原因。例如处于某种特定生理状态的被试如饥饿、疲劳等,会产生某种单调消极的反应定势。心理因素的影响主要是由于态度、价值观和人格的不同。
兹将各种不同的反应定势对测验的影响分述如下:
(l)求"快"与求"精确"的反应定势
某些被试反应特别谨慎,另外有些人则特别快而且粗心大意。根据多位学者的研究结果,发现作答的速度与能力的相关很低。某些被试,不管试题的内容和难度如何,总是答得比别人慢。如果纯粹是难度测验(power
tests),则这种反应定势的影响很小。如果测验有时间限制,则这两种反应定势对测验成绩会有影响。老年人的反应速度通常比年轻人慢,因此看来有些早期的研究高估了老年人智力衰退的速度。
为了避免这两种反应定势的出现,除非"反应速度"本身即为重要的研究目标(如打字、阅读等),否则应让被试有充分的反应时间(90%以上被试可以答完所有的试题),同时应该注明反应的时间,以减少"速度-准确"反应定势的影响。
(2)偏好正面叙述的反应定势
克伦巴赫(1942,1950)发现,被试在无法确定"是非题"的正确答案时,选"是"的人多于选"非"的人。另有学者发现有62%的大学生,选答"是"的题数多于实际上应为"是"的题数。特别有趣的是,有些编制者在编制是非题时,也有"是"多于"非"的倾向。这种定势又可称为肯定定势。实际生活中人们经常是肯定一事物比否定一事物来得容易。因此往往那些"是"的题目来得容易,也比较缺乏鉴别力。
(3)偏好特殊位置的反应定势
吉尔福特(1965)认为,被试如果完全不知道选择题的正确答案,则不会以完全随机的方式来决定该选择哪一个选项,而有偏好某一个位置的选项的倾向。但是有许多研究者(如Hopktins等)的研究结果并未能支持吉尔福特的看法。
不过,在有些测验编制者身上也同时存在偏好某个位置的反应定势。例如很少将正确答案安排在第一个选项或最后一个选项。
(4)偏好较长选项的反应定势
有人发现被试在无法确定正确答案时,有偏好选择较长选项的反应定势。只要我们在测题编制时,尽量使选项的长度一致,就不难避免这类问题。
(5)猜测的反应定势
研究发现:有些被试不愿猜测,即使事先告诉他要答完所有的题目,也无法使他改变;相反,另外有些被试即使告诉他答错要倒扣分数,还是无法阻止其猜测的行为。因此如果不对猜测进行修正的话,那些敢于猜测的被试将比谨慎的被试更容易得高分。
戴维斯(F.B.Davis,1951)曾研究猜测因素所能影响的幅度。他以400名中学生为对象,实施标准化的阅读测验,然后从中挑选百分等级在12以下的47名被试,告诉他们:如果答完所有的题目,将会得到较好的成绩,即使不知道答案也要求回答。接着再以另一份复本来测量。结果发现,这些被试的平均分数由原来的25.53提高到46.32。如果与五年级常模对照,则这些学生第二次测验成绩比第一次增加2.7个等级。
猜测的反应定势与能力没有什么关系,但与某些人格特质有关。例如较内向和自卑的人,其未回答的题目较多,甚至某些知道正确答案的题目也略去不答。
在绝大多数的测验中,被试猜对的分数均高于纯粹机遇的分数。因为:①在某些题目中,虽然不能肯定正确答案,但因具有部分知识,被试可以先淘汰已经不是正确答案的选项,然后再就剩下的项目进行猜测,猜中的机率自然较高;②许多试题的诱答无法达到设计要求,错得太明显,被试即使不具备回答该题应有的知识,也可以先淘汰几个明显的错误选项,故猜对的机率也会高于纯粹的猜测。已有学者如李特尔(E.Little)和克里塞(J.Creaser)以三择一的选择题来测量被试,然后要求被试指出:哪些题目是猜的?那些是不太确定的?哪些是确定的?结果发现,上述三类题目答对的百分比分别为55、67及93。如果被试完全不具备任何知识,只按随机原则来猜测,则在理论上答对的百分比应该是33(l/3)而不是55。同样,杰克逊(R.A.Jacks-on)也发现被试在五择一的选择题中,猜对的机率为1/3,高于纯粹机遇的1/5。
|