2015考研:心理学测量笔记(4)

 时间:2024-10-30 11:25:19

  第四章 心理测量的误差

  前面我们已经讨论了什么是测验,以及如何编制测验,现在转入研究什么是一个好的测验。

  无论何种测量工具,我们对它起码的要求是稳定,准确。用心理测量学的术语来说,就是要可信和有效。所谓可信是指多次测量的结果是一致的,所谓有效是指正确地测量了所要测的东西。信度是测量一致性程度的估计,效度是测量准确性程度的估计。

  关于测量的信度和效度问题,下边有专章分别讨论。为了考察测量的信度和效度,首先要了解测量的误差。

  第一节 什么是误差

  一、误差的定义和种类

  误差是在测量中与目的无关的变因所产生的不准确或不一致的效应。

  这个定义包含两层意思,1)误差是由与测量目的无关的变因引起的,2)误差是不准确或不一致的测量结果。

  定义的后一部分又从准确性和一致性两方面对误差做了区分。准确性与一致性的关系可以用射击靶环来说明。假设有A、B、C三支枪,对准靶面中心固定位置后各放9枪,所得结果如图4—1。

  A枪弹着点十分分散,说明准确性和一致性都不好,B枪弹着点虽然比较集中,但偏离靶心,说明一致性好,准确性差:枪弹着点全部集中在靶心,说明一致性和准确性都好。

  图4—1的A和B显示了两种主要的误差形式。 一种是随机误差,又叫可变误差,这是由与测量目的无关的偶然因素引起而又不易控制的误差,它使多次测量产生了不一致的结果。此种误差的方向和大小的变化完全是随机的,无规律可循。例如几个人用同杆秤称同一件东西,由于秤杆高低掌握的不同,所产生的不一致即属随机误差。另一种是系统误差,又叫常定误差,这是由与测量目的无关的变因引起的一种恒定而有规律的效应,稳定地存在于每一次测量中,此时测值虽然一致,但不正确。如有的奸商在秤盘或秤砣上搞鬼,一斤多(或少)一两,二斤多(或少)二两,这就是系统误差。可见,系统误差只影响测值的准确性,而随机误差既影响准确性又影响一致性。这就是说,系统误差只与效度有关,而随机误差与效度、信度都有关。

  二、真分数

  在测量理论中,真分数是个重要概念。所谓真分数就是一个测量工具在测量没有误差时, 所得到的纯正值。这实际上是个循环定义,因为一个量具若测得真值,便没有误差。真分数的操作定义是,经过无数次测量所得的平均值。可见,真分数是一个在理论上构想出来的概念,在实际测量中是得不到的,因为一个测量工具无论多么精确,也会有误差,我们只能通过改进量具来接近真值,而不能完全得到它。

  真分数的定义表明,一个人在一个测验上所得的分数,既是他的真分数的函数,也是测量误差的函数,用公式表示如下:X=T+E (4.1)

  这里X为实得分数或观测分数,T是假设的真分数,E是测量误差。

  需要说明的是,这里的测量误差(E)指的是引起测量不一致性的变因产生的效应,即指随机误差,不包括系统误差,后者不引起分数的改变,因而包含在真值中。

  在公式4.1中,E可能是正的,也可能是负的。这就是说,一个人的实得分数可能大于真实量,也可能小于真实量,总是围绕着真值上下波动。

  关于测量误差(E)有以下假设:

  1)如果对一个人测量无数次,其平均误差为0,即 =0

  2)真分数和测量误差是相互独立的,即rTE=0

  3)误差分数和实得分数的相关为0,即rEX=0

  公式4.1只表明了在一个特定人身上实得分数、真分数和测量误差之间的关系。在一个团体中,由于每个人的误差都是随机的,方向不同,只要团体足够大,其误差便会互相抵消。因此,一个团体的平均真分数T等于该团体中所有被试实得分数的平均值X。证明如下:

  (T=X—E) (ΣE=)0

  对于一个团体来说,实得分数,真分数和测量误差之间有如下关系:

  即实得分数的变异数:真分数的变异数加上误差变异数。

  公式4.2并不难证明:

  以上推导过程。可参看统计学中求和方差的公式。当X=Xl+X 2时,如果Xl 和X 2均为正态分布,则 和数的方差为 公式。

  公式4.2只涉及到随机误差的变异,系统误差的变异包含在真分数的变异中。这就是说,真变异数还可以分成两个部分,与测量目的有关的变异和与测量目的无关的变异,即

  (4.3)

  式中的 是与测量目的有关的(亦即有效的)变异数, 是与测量目的无关但却是稳定的变异数。 是由所要测量的变因引起的, 是由其它变因引起的。将公式(4.3)代入公式•(4.2)得到如下公式:

  (4.4)

  这就是说,一组测验分数之间的变异性是由与测量目的有关的变异数、稳定的但出自无关来源的变异数和潞盛误鏊盛异数所决定的。

  第二节 误差的来源

  一个测验要准确可靠,必须控制各种误差,为此首先要了解误差的来源。

  根据误差定义,任何变因只要与测量目的无关,并使得结果不准确、不一致,便可认为是一种误差因素。在心理测量中,

  常见的误差来源于三个方面:测验内部,施测过程,受测者本身。

  一、测验内部引起的误差

  测验内部的误差主要来源于题目取样:当测验题目较少或取样缺乏代表性时,被试的反应受机遇影响较大,(譬如一次考试碰巧准备到或没准备到某题),当几个测验复本不等值时,接受不同的题目,就会获得不同的分数。

  除题目取样不当可引起误差外,其它一些因素,如题目用词的模棱两可,对反应步骤说得不清,题目过难引起猜测,时限短使被试仓促作答等,也都可能成为误差的来源。

  二、由施测过程引起的误差

  在三种误差来源中,与施测过程有关的误差可能是最容易控制和检验的。通过长期实践,测验的标准化水平越来越高,大部分施测条件能够得到控制。但由于心理现象的复杂性,许多意想不到的偶然因素仍可能影响测验分数,使人防不胜防。

  (一)物理环境

  施测现场的温度。光线,声音、桌面好坏,空间阔窄等皆具有影响。

  (二)主试者方面:

  主试者的年龄、性别、外表,施测时的言谈举止、表情动作等均能影响测验结果。倘若不按照规定实施测验,如制造紧张气氛,给予特别协助或暗示,以及计时错误等,都会带来较大误差,特别是当测验具有复杂步骤和说明,或测验题本身是模糊不确定的形式时,当主试者在安排测验条件上有较多余地(例如个别施测)时,当测验是对幼儿,有情绪困扰者以及对测验程序不熟悉的人施测时,主试者的影响更大。

  (三)意外干扰:

  在测验环境复杂,特别是当受试人数较多时,容易发生出乎预料的干扰或分心事件。例如:停电、有人生病,有人作弊,计价表停了、临时发现题目或作答纸印刷不清或装订错误等,无论哪种情况都会引起不安和扰乱,导致成绩不准确、不一致。

  (四)评分计分,

  评分不客观以及计算登记分数出错等也是常见的误差。一般选择题的评分较为客观。而问答题、论文题等自由反应型的题目,评分标准很难掌握,加之阅卷者的偏好各不相同,因而难以保证分数的一致性.

  早在几十年前,国外就有人对旧法考试的评分误差做过研究。斯达奇(D•storch)和埃立奥特(E•C•Elliott)将一份英文考卷请142位英文教员评阅,所得分数从50分到98分应有尽有。某国教育界还有一件引为笑谈的事,1920年夏季,许多大学教授在评阅历史试卷时,有一位教授为评分便利起见,自己写了一份标准答案,不料和其它考卷混在一起,经另一位教授评阅竟然不及格。为慎重起见,由其它教授重复评定,结果所得分数以10分到90分不等。1961年美国教育测验中心由53个评判员组成专门小组。对大学一年级学生写的200篇作文按九个等级评分,结果有1/3的文章得到了九个等级,有60%的文章得到了七个或八个等级,没有一篇文章少于五个等级。一般理科评分要比文科客观些,但也不尽然。罗雪(Ruch)将—道地理题的解答请91位教员评阅,满分为20分,结果给17种分数,全距为2—20,给各种分数的人次见表4—1,斯达奇和埃立奥特将一份几何考卷请115位中学教员评立,所得分数为28—92分,全距60多分。我国1979年高考数学试卷第四题叙述并证明勾股定理,对于

  表4—1 91位教师对于一个地理题的回答所给分数的分布

  分数 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

  人次 0 0 1 2 0 1 4 3 7 5 24 5 14 8 2 10 2 1 1 0 1

  用余弦定理进行循环论证的答卷,有的阅卷教师不给分,有的却给满分(6分)。不仅各教师间有此差异,即使同一教师一次评许多卷,受情绪,疲劳,外界干扰;卷面整洁、试卷前后位置引起的对比效应以及对学生成见的影响,标准也可能不统一,甚至同一张试卷隔一段时间再评,前后给分也可能不一致。至于学校之间,地区之间的差别就更大了。1980年,清华大学受教育部委托对新生进行数学复试,并与高考数学成绩对照。将各省市学生按两次考试的平均成绩分别排队。G省学生的高考平均成绩居第11名,而复试成绩降到第28名,T市学生成绩次序由第8名降到第23名。相反H省和S省考生的名次由第15名和第18名分别升至第3名和第7名,产生这种变化的原因很多,其中很重要的一条是各省评分标准掌握不同,宽严不一。这就使得学生分散的差异在一定程度上反映的是评分者的差异,而不完全是学生水平的差异。

  对于论文题、问答题要多少人评分,平均分数才能相对稳定和客观呢?国外有人对此做了研究,结果如下:哲学论文127人,作文78人,物理16人,数学13人。

  为了控制与施测过程有关的误差,主试者必须严格遵循标准化程序施测和评分,不得任意改动和发挥,同时要机智地处理各种意外情况。

  • 2015考研:心理学测量笔记(5)
  • 2015考研:心理学测量笔记(1)
  • 2015考研:心理学测量笔记(2)
  • 2015考研:心理学测量笔记(3)
  • 2015考研:实验心理学笔记(6)
  • 热门搜索
    欢庆六一手抄报 我读书我快乐手抄报 关于六一儿童节的手抄报 手抄报边框 防溺水手抄报内容 建党节手抄报 抗击疫情手抄报 儿童节手抄报 廉洁手抄报 手抄报设计