副标题#e#
原载:《考试与招生》2008年第4期
胡锦涛总书记在党的十七大报告上指出:“更新教育观念,深化教学内容方式、考试招生制度、质量评价制度等改革,减轻中小学生课业负担,提高学生综合素质。”
教育部考试中心“十一五”事业发展规划提出:“拓展服务空间,构建考试评价服务体系”“探索开发个性化、多样化考试评价服务,为个人学习与职业发展提供咨询服务;积极探索初等、中等、高等教育的相互衔接问题,为各级各类教育机构提供教育测量、评价及咨询服务。”“加强考试制度、考试的标准体系、考试信度和效度、自适应性考试、诊断性考试等方面的研究,建立公正、科学的考试评价体系。”
教育评价是对教育活动满足社会与个体需要的程度做出判断的活动,是对教育活动现实的(已经取得的)或潜在的(还未取得,但可能取得的)价值做出判断,以期达到教育价值增的过程。教育评价具有鉴定、导向、激励、诊断、调节、监督和管理功能。教育评价的功能决定了,它既能为领导决策提供参考依据,在教育发展中发挥积极的促进作用,引导教育活动朝正确方向发展;又可以调节、控制、规范我们的行为,以此保证教育评价实施者的目标实现;同时,它还可以使被评价者充分了解自己,找出存在的问题及原因,使被评价者更加努力更加主动,以保持或取得更大的成绩。
评价=测量(量的记述)或非测量(质的记述)+价值的判断
教育测量属于事实判断的范畴,而评价是在此基础上,进一步做出好与坏、对与错、优势与劣势的判断。
1.为决策提供依据。教育政策的调整,人力、财力的补充,都需要充分了解教育现状,通过评价,决策者才能清楚地了解教育的现状和问题,才能有目的地调整教育决策,才能在人力和财力上更合理地布局。
2.为教师改进教学提供参考。教师是教育计划的执行者,他们需要了解学生已经掌握什么和没有掌握什么,教学的薄弱环节以及学生存在的问题是什么。通过评价,教师才能准确地了解教与学中的问题,从而改进教学。
3. 为家长提供咨询。家长需要了解学生在学校的学习状况,但是由于他们不能直接参与学校教育,不能看到学生在教学中的反应。通过评价,他们才能了解学生在校学习的状况,才能更好地配合学校教育。
4.为学生提供服务。一段教学之后,学生需要了解自己学习的情况,需要知道今后努力的方向,评价可以更好的帮助学生了解和认识自我。
作者简介:作者系教育部考试中心评价处处长,中国教育学会统计测量分会常务理事、秘书长。曾任教育部考试中心科研处副处长、处长,办公室副主任(正处级)。从事教育考试科研、评价工作多年。发表论文几十篇,其中核心期刊发表论文8篇,编著学术图书6部。
1.以测量为标志的第一代教育评价(1900-1930)
第一代教育评价出现在十九世纪后期至20世纪30年代。英国的高尔顿通过对个体差异的长期研究,于1869年发表了《遗传的天才》一书,揭开了教育测量的序幕。1879年,德国的冯特在莱比锡首创了心理实验室,实验心理学家逐步摸索出了一套测量方法,对教育测量的发展产生了积极影响。十九世纪最后十年,各种测量随着心理实验的发展层出不穷。1897年,美国的莱斯发表了他对20个学校的1600名学生所作的拼字测验的结果,更引起了人们对测验方法的普遍关注,对后来教育测量的发展产生了深远的影响。在这种背景下,1904年,美国的桑代克发表了《心理与社会测量导论》一书,系统地介绍了统计方法和编制测验的基本原理。该书提出了“凡存在的东西都有数量,凡有数量的东西都可以测量”的基本观点,为教育测量奠定了理论基础,对教育测量学的建设与发展做出了巨大贡献。以后的几年中,比纳·西蒙智力量表、斯坦福·比纳量表等心理测验的日趋定型对教育测量的标准化也产生了极其深刻的影响。所以,这时期评价就是选择测量工具、组织和实施测量、提供测量数据。为此,这一时期被称为“测量”时期。
2.以描述为标志的第二代教育评价(1930-1940)
第二代教育评价盛行于20世纪30到40年代。30年代以前,现代教育评价的概念尚未形成,教育测量与教育评价几乎是同义语。无论是我国的科举,还是西方的心理测验和教育测量,所关心的仅是个体学力状况,追求的是量的大小,而对人的全面了解和把握对学校乃至整个教育成就的评价并未正式提出来。1933年罗斯福实行了“经济的社会化政策”,这一经济政策的实行导致了大批青年没有就业的机会,只能涌向中学。而当时美国的高中课程都是为升大学服务的,于是,中学课程和失业青年的需要之间产生了尖锐的矛盾。为了促进和保证课程改革的进行,美国进步主义教育协会进行了一项课程内容改革的实验研究,从1932年到1940年历经八年完成,史称“八年研究”。为了评价其研究成果,组成了以泰勒为领导的教育评价委员会。通过这场研究,泰勒和他的同事们正式提出了教育评价的概念,即教育评价就是衡量实际活动达到教育目标的程度,测量是它的手段。同时,还提出评价的原则和方法,即“泰勒模式”。“八年研究”实际上宣告测量运动的终结,使人们在思想上和行动上接受了采用教育评价方法来描述教育效果这一观点,形成了一个以“描述”为特征的评价时代。
3.以判断为标志的第三代教育评价(1940-1970)
第三代教育评价出现在20世纪40年代末50年代初到70年代。1957年,前苏联第一颗人造卫星上天使美国大为震惊,促使美国投入大量的人力和财力进行大规模的教育改革,从而对教育评价也提出了新的要求。政府十分关注教育评价的开展,民众也迫切要求对学校的办学成效进行鉴定和报告,使教育评价成了官方和民间共同关心的课题。1963年,克龙巴赫发表了一篇题为《通过评价改进课程》的文章,1967年斯克里芬发表了《评价方法论》。他们一方面对原先的评价理论与方法提出质疑,同时对评价理论与方法进行了更广泛和更深刻的研究和开拓。他们认为评价不仅要以目标为中心,而且更要注重对决策的评价。也就是说,评价者不仅要关心课程制定者规定的目标,检验这些目标达到的程度,更应注意对目标的合理性的判断,关心所作的决策和决策的依据。1967年,斯泰克发表了《评价的面貌》一文,肯定了判断是评价的两大基本活动之一,同时提出了一个完整的、包含描述与判断两个方面的评价模式。这样,判断就成了第三代教育评价的标志。正如著名教育评价专家顾巴所说的:“60年代或者更确切地说1967年以后,判断成了第三代评价的标记。”
4.以同构为标志的第四代教育评价(1970-至今)
20世纪80年代,由美国印第安纳大学教育学院枯巴教授和维德比尔大学高等教育学院副教授林肯创立了“第四代教育评价”理论。“第四代教育评价”的初步思想最早出现在他们合写的《有效的评价》(1981)和《自然主义的研究》(1985)两篇重要文章中。经过几年的潜心研究,1989年他们出版了名为《第四代教育评价》的专著。在这本书中,枯巴和林肯较为系统地阐述了这种新理论的基本观点和理论构架。“第四代教育评价”理论提出后,在美国引起了很大的反响,整个教育界几乎都为之震动了。主要内容包括以下几点:
①把评价看作是所有参与评价活动的人们,特别是评价者与评价对象双方交互作用、共同建构统一观点的过程,评价结果也是其双方交互作用的“产物”。
②提倡在评价中形成“全面参与”的意识和气氛。主张让参与评价的所有人都有机会发表自己的意见,并要求评价者在评价中充分尊重每个人的尊严、人格与隐私,所有参与评价的人都应是平等、合作的关系。
③他们提出在评价中存在“价值差异”。认为,参与评价的人们的价值观是各不相同的、价值标准是存在差异的。这种“差异”观点将纠正传统评价理论价值是一致的、单一的观点。第四代评价观点的提出,在全世界教育领域中产生了很大的反响。