副标题#e#
教育部考试中心 王蕾
(原载:《当代教育科学》2007年第3-4期)
教育评价是教育活动的一个重要组成部分,它是以教育目标为依据,运用有效的技术和手段,对教育活动的过程和结果进行测定、分析、比较,并给以价值判断的过程。教育评价工作越来越受到世界各国考试机构的重视,教育评价工作开展的好坏已经成为一个衡量考试机构的水平标志,反映出考试机构的竞争能力。教育部考试中心“十一五”事业发展规划中提出要把教育部考试中心建成“国内领先、国际知名、服务教育、面向社会的专业化考试与评价服务机构”,并将评价工作列为今后工作的重点,从学习和借鉴国际上先进的评价经验入手,目标为建立适合中国的教育制度的评价项目,为国家教育决策服务,为考试命题和管理服务,为考生提高学习水平服务。根据这一目标,教育部考试中心2006年引进并启动了学生能力国际评价(PISA)试测研究项目。围绕PISA先进的考试评价理念、理论、技术及中国试测研究的实践,我们将从不同的视角展开系列研讨,以期透过跨越国界的评价比较研究,了解国际教育评价趋势和成果,让教育研究学者能够从国际角度,监测教育现状及教育改革的成效;教育决策者可因全球教育发展制定当地政策,以适应新形势的要求;教师及家长亦可从更广博的视野审视本地区、中国乃至世界各地的教育情况,让教育领域内不同的成员更能以可信的理论和数据作出理性的决策与行动,为学生的未来共同努力。
学生能力国际评价(The Program for International Student Assessment, PISA)是经济合作与发展组织(The Organization for Economic Cooperation and Development, OECD)发起并组织实施的考试评价研究项目,该考试评价研究的目的是建立常规的、可靠的,与政策相关的学生成就评价指标,帮助各国政府和决策者评价和监控国家的教育体系。
OECD/PISA于1997年创立,它体现了OECD各成员国政府的一项承诺:从学生学习成绩的角度,在一个共同的国际框架之内监测各国教育体系的工作成果。OECD/PISA是一个协作项目,它汇集了各参与国的专业人员和技术力量,并且在参与国政府共同的、政策驱动的关注基础之上,接受它们的联合指导。各参与国对该项目在政策层面承担责任。同时,来自各参与国的专家效力于PISA协作组织,他们的职责是把OECD/PISA的政策目标与在国际比较评价领域里最有效的专业知识和技术结合起来。通过PISA协作组织,各国可以保证OECD/PISA的考试评价既在国际上具有效度,又能兼顾到各参与国之间在文化和课程背景方面的差异,同时还可以保证这些考试具备良好的测量性能,并注重真实性和教育效度。
PISA在2000年首次开始评价,其后每三年进行一次,根据评价年命名。PISA2000和PISA2003已经完成。PISA2006正在进行数据分析,2009年将对9岁和15岁学生分别评价并将评价结果建立链接,从而检查各国学生的学习进程。2000年的评价有32个国家参与,包括OECD30个成员国中的28个国家和其他四个非OECD国家。2003年有41个国家和地区参与,PISA2006有56个国家和地区正式参与,教育部考试中心开展PISA2006中国试测研究项目不代表国家正式参与该评价项目,试测只在国内小范围做科研性质的研究,目的在于学习、借鉴PISA先进的考试评价理念、理论、技术,了解国际的情况,通过实践锻炼队伍,构建符合中国国情的评价标准、手段、技术和方法体系;促进考试内容和形式的改革,特别是对命题环节的改进,有利于全面推进素质教育。
PISA应用了一系列目前世界上先进的教育测量理论和成熟的操作模式来评价15岁在校生进入未来社会所必需的知识、技能的获得情况。PISA 2006参与国家和地区已近60个,所评价国家与地区的国民生产总值之和占全世界国民生产总值(GDP)的9/10,是一个持续和长久的纵向和横向的国家教育成效评价和比较研究项目。PISA评价的领域包括阅读、数学和科学素养。评价不仅仅涵盖对学校课程的掌握情况,更侧重于未来生活中所需要的重要知识技能。在PISA的三大评价领域中,2000年主要评价的是阅读素养,2003年评价的重点是数学素养,并引入了一个新的领域——问题解决能力,即15岁学生运用认知过程来解决真实的跨学科的日常生活问题的能力。2006年评价的重点将是科学素养。各领域包括三个方面:学生应当学到的知识的内容和结构;一系列涉及应用的过程;运用或汲取知识和技能的情境。
PISA对于“素养”的定义为:评定、整理、整合、评价书面信息,以发展个体知识和潜能,参与社会并对社会做出贡献。这一关于素养的定义包括四个方面的延伸:1)对书面信息的分析、比较、对比和评价;2)将知识运用于实际生活;3)有效地交流思想与观点;4)富于想象力地思考。PISA将核心素养区分出三大类别:1)互动式地使用工具参与社会生活;2)自主的反应(如,有全局观念,学习策略,担负责任,了解权利和义务限制);3)在多样化的团体中相互作用(如,与他人友好相处、合作,团队协作,处理和解决冲突)。
OECD/PISA是建立在终身学习的动态模型基础上设计的测试。在终身学习过程中,为成功地适应不断变化的社会,那些必不可少的知识和技能是通过终身学习不断获得。OECD/PISA关注的是15岁的学生将来需要的东西,并试图评价他们用所学到的知识和技能能够做些什么。评价的内容以参与国家教学大纲的共同基本要求为依据,但并不仅仅局限于这种要求。因此OECD/PISA在确实对学生的知识进行评价的同时,也考查他们的反思能力和把知识和经验运用到实际问题中的能力。因为OECD/PISA测评的目的是评估义务教育阶段教育体系的累积成果,所以测试将集中在15岁的在校生身上。在每个国家或地区,将从至少150所学校,每所学校35名学生中选择5000到10000名学生作为典型进行测试,从而提供一个良好的基础样本,从中可以根据不同类型的学生特征,分析所得到的考试评价结果。
PISA项目标准测试共有13套试题册,每名学生只要求作答其中的一套,依据随机原则将每名学生分配到每套试题册。每套试题册两小时的作答时间。完成标准测试之后,每名学生要求作答一份约半小时的学生问卷;学校样本的校长要求作答一份约20分钟的学校问卷。PISA把测试结果与通过问卷调查收集到的有关学生个人、家庭和学校的背景信息联系在一起。PISA评价关注四个子目标的实现:学习成果的质量;学习成果的等价性和学习机会的均等性;教育过程的有效性和效率;以及教育对社会经济的影响。OECD/PISA评价保障的基础是:(1)高质量保证的命题、取样和数据收集机制;(2)保证评价工具文化和语言覆盖面的措施,尤其是不同国家参与命题和修订过程的措施。(3)最新的数据分析方法。这些措施结合在一起就产生出高质量的考试评价以及高效度、高信度的考试评价结果,使人们对教育体系和学生获得更好的了解。对于政策制定者而言,通过对比自己国家和其他国家教育系统的成就表现,总结已有政策的经验,改善教育体制,并基于PISA提供的指标更好地评价和监控教育体制的效力与发展。