首页> 详情

PISA2006中国试测研究的实践与启示

2012-08-31 |浏览:3783次 | 编辑: 加载失败
分享到: 
副标题#e#

教育部考试中心 王蕾

(原载:《当代教育科学》2007年第34期)

教育评价是教育活动的一个重要组成部分,它是以教育目标为依据,运用有效的技术和手段,对教育活动的过程和结果进行测定、分析、比较,并给以价值判断的过程。教育评价工作越来越受到世界各国考试机构的重视,教育评价工作开展的好坏已经成为一个衡量考试机构的水平标志,反映出考试机构的竞争能力。教育部考试中心“十一五”事业发展规划中提出要把教育部考试中心建成“国内领先、国际知名、服务教育、面向社会的专业化考试与评价服务机构”,并将评价工作列为今后工作的重点,从学习和借鉴国际上先进的评价经验入手,目标为建立适合中国的教育制度的评价项目,为国家教育决策服务,为考试命题和管理服务,为考生提高学习水平服务。根据这一目标,教育部考试中心2006年引进并启动了学生能力国际评价(PISA)试测研究项目。围绕PISA先进的考试评价理念、理论、技术及中国试测研究的实践,我们将从不同的视角展开系列研讨,以期透过跨越国界的评价比较研究,了解国际教育评价趋势和成果,让教育研究学者能够从国际角度,监测教育现状及教育改革的成效;教育决策者可因全球教育发展制定当地政策,以适应新形势的要求;教师及家长亦可从更广博的视野审视本地区、中国乃至世界各地的教育情况,让教育领域内不同的成员更能以可信的理论和数据作出理性的决策与行动,为学生的未来共同努力。

学生能力国际评价(The Program for International Student Assessment PISA)是经济合作与发展组织(The Organization for Economic Cooperation and Development OECD)发起并组织实施的考试评价研究项目,该考试评价研究的目的是建立常规的、可靠的,与政策相关的学生成就评价指标,帮助各国政府和决策者评价和监控国家的教育体系。

OECD/PISA1997年创立,它体现了OECD各成员国政府的一项承诺:从学生学习成绩的角度,在一个共同的国际框架之内监测各国教育体系的工作成果。OECD/PISA是一个协作项目,它汇集了各参与国的专业人员和技术力量,并且在参与国政府共同的、政策驱动的关注基础之上,接受它们的联合指导。各参与国对该项目在政策层面承担责任。同时,来自各参与国的专家效力于PISA协作组织,他们的职责是把OECD/PISA的政策目标与在国际比较评价领域里最有效的专业知识和技术结合起来。通过PISA协作组织,各国可以保证OECD/PISA的考试评价既在国际上具有效度,又能兼顾到各参与国之间在文化和课程背景方面的差异,同时还可以保证这些考试具备良好的测量性能,并注重真实性和教育效度。

#p#副标题#e#

PISA2000年首次开始评价,其后每三年进行一次,根据评价年命名。PISA2000PISA2003已经完成。PISA2006正在进行数据分析,2009年将对9岁和15岁学生分别评价并将评价结果建立链接,从而检查各国学生的学习进程。2000年的评价有32个国家参与,包括OECD30个成员国中的28个国家和其他四个非OECD国家。2003年有41个国家和地区参与,PISA200656个国家和地区正式参与,教育部考试中心开展PISA2006中国试测研究项目不代表国家正式参与该评价项目,试测只在国内小范围做科研性质的研究,目的在于学习、借鉴PISA先进的考试评价理念、理论、技术,了解国际的情况,通过实践锻炼队伍,构建符合中国国情的评价标准、手段、技术和方法体系;促进考试内容和形式的改革,特别是对命题环节的改进,有利于全面推进素质教育。

PISA应用了一系列目前世界上先进的教育测量理论和成熟的操作模式来评价15岁在校生进入未来社会所必需的知识、技能的获得情况。PISA 2006参与国家和地区已近60个,所评价国家与地区的国民生产总值之和占全世界国民生产总值(GDP)的9/10,是一个持续和长久的纵向和横向的国家教育成效评价和比较研究项目。PISA评价的领域包括阅读、数学和科学素养。评价不仅仅涵盖对学校课程的掌握情况,更侧重于未来生活中所需要的重要知识技能。在PISA的三大评价领域中,2000年主要评价的是阅读素养,2003年评价的重点是数学素养,并引入了一个新的领域——问题解决能力,即15岁学生运用认知过程来解决真实的跨学科的日常生活问题的能力。2006年评价的重点将是科学素养。各领域包括三个方面:学生应当学到的知识的内容和结构;一系列涉及应用的过程;运用或汲取知识和技能的情境。

PISA对于“素养”的定义为:评定、整理、整合、评价书面信息,以发展个体知识和潜能,参与社会并对社会做出贡献。这一关于素养的定义包括四个方面的延伸:1)对书面信息的分析、比较、对比和评价;2)将知识运用于实际生活;3)有效地交流思想与观点;4)富于想象力地思考。PISA将核心素养区分出三大类别:1)互动式地使用工具参与社会生活;2)自主的反应(如,有全局观念,学习策略,担负责任,了解权利和义务限制);3)在多样化的团体中相互作用(如,与他人友好相处、合作,团队协作,处理和解决冲突)。

OECD/PISA是建立在终身学习的动态模型基础上设计的测试。在终身学习过程中,为成功地适应不断变化的社会,那些必不可少的知识和技能是通过终身学习不断获得。OECD/PISA关注的是15岁的学生将来需要的东西,并试图评价他们用所学到的知识和技能能够做些什么。评价的内容以参与国家教学大纲的共同基本要求为依据,但并不仅仅局限于这种要求。因此OECD/PISA在确实对学生的知识进行评价的同时,也考查他们的反思能力和把知识和经验运用到实际问题中的能力。因为OECD/PISA测评的目的是评估义务教育阶段教育体系的累积成果,所以测试将集中在15岁的在校生身上。在每个国家或地区,将从至少150所学校,每所学校35名学生中选择500010000名学生作为典型进行测试,从而提供一个良好的基础样本,从中可以根据不同类型的学生特征,分析所得到的考试评价结果。

PISA项目标准测试共有13套试题册,每名学生只要求作答其中的一套,依据随机原则将每名学生分配到每套试题册。每套试题册两小时的作答时间。完成标准测试之后,每名学生要求作答一份约半小时的学生问卷;学校样本的校长要求作答一份约20分钟的学校问卷。PISA把测试结果与通过问卷调查收集到的有关学生个人、家庭和学校的背景信息联系在一起。PISA评价关注四个子目标的实现:学习成果的质量;学习成果的等价性和学习机会的均等性;教育过程的有效性和效率;以及教育对社会经济的影响。OECD/PISA评价保障的基础是:(1)高质量保证的命题、取样和数据收集机制;(2)保证评价工具文化和语言覆盖面的措施,尤其是不同国家参与命题和修订过程的措施。(3)最新的数据分析方法。这些措施结合在一起就产生出高质量的考试评价以及高效度、高信度的考试评价结果,使人们对教育体系和学生获得更好的了解。对于政策制定者而言,通过对比自己国家和其他国家教育系统的成就表现,总结已有政策的经验,改善教育体制,并基于PISA提供的指标更好地评价和监控教育体制的效力与发展。

#p#副标题#e#

OECD/PISA是以三年为一次,每三次(九年)为一个循环,以迅速、有效地收集信息而设计的评价,报告有关学校范围内和有关国家或地区范围内的学生在阅读、数学和科学素养方面的数据,帮助深入理解家庭和学校中影响技能发展的各种因素,研究这些因素是如何相互作用、以及对政策改进有什么启示。

PISA除测验之外,还包括了学生问卷和学校问卷,目的是收集有关社会、文化、经济和教育因素的指标,这些指标与学生的成就相联系。因此,PISA超越了对各参与国家或地区在三个主要领域的相对排名,涉及更广范围的教育成果,如学生的学习动机、对自己的自信心以及学习策略等,以期获得来自学生、教师、学校和家长的综合看法和观点。

PISA从社会、文化、经济以及教育因素等方面考查学生和学校的特征。个体学习者层面的因素包括性别、社会背景等,有关自我的认知(自我效能感、自我概念),动机因素(学习兴趣、参与程度、自信心)以及教育期望等。教学设置层面的因素包括教师教学策略,学生知觉到的课堂纪律气氛、教师支持、教材使用以及班级大小、学校组织和结构等因素。学校层面的因素包括学校类型、学校结构、学校资源(人文、教育和物质资源的质量;教师和电脑的可用性)、学校风气(学生及教师的行为和道德)、学校管理以及课堂实践(活动、学生评价、教学时间、教师监控)等。

PISA2006中国试测研究按国际规范和国内试点地区报送信息情况,200611PISA国际协作组织协助教育部考试中心在北京、天津和山东潍坊三个试点地区1400余所学校,16万学生样本中抽取出150所学校样本。每所学校样本15岁学生又经过国际统一设计抽样软件随机抽取了35名学生共约5000余名学生样本参加测试。

PISA中国试测研究在中国国内操作层面上实行两级管理体系,即教育部考试中心负责研究工作在全国的实施管理,试点机构在统一要求下负责本地区的组织实施,包括本地区抽样信息提供、学校样本和学生样本落实、人员培训、测试及调查问卷实施管理,并要求对测试的题册和数据严格保密。教育部考试中心统一评判编码试题册和问卷,统一录入信息,保证编码评分和数据录入的信度和效度。数据分析由考试中心自主完成。通过PISA试测,研究教育部考试中心不但完成了三个试点地区的教育成效评价报告,还利用PISA协作组织提供的题目国际参数进行标定分析,为各级教育决策者提供国际评价参考信息。

#p#副标题#e#

教育部考试中心在开展学生能力国际评价(PISA)中国试测研究实施了PISA2006除命题外全环节的评价工作,取得了在中国实地操作大型国际评价项目的经验。教育部考试中心组织数学、科学、阅读学科、教育测量与评价、教育管理、数理统计等领域的专家学者多角度、深层次地剖析了PISA国际评价对中国自我评价教育发展水平的启示和意义。从管理标准上,教育部考试中心可借鉴OECDPISA协作组织发起并实施PISA国际评价经验,利用教育部考试中心现有考试资源探索实现国家、省市、地区和学校各层级的教育成效测量与评价,为各级教育决策部门服务。从技术标准上,无论是命题环节中能力框架制定、建构图开发、题目设计、试测调整,评分环节中采意赋分、编码评判和编码评卷者信、效度分析;分层抽样环节中学校样本、学生样本选取和权重计算;数据分析环节中测量模型选择,似真值标定,还是数据解构环节中问卷设计与测试数据的衔接都对已有的考试质量提高和数据深挖掘提供了有益的参考。从数据标准上,PISA试测研究的数据可实现与国际横向的比较,奠定了未来纵向跟踪研究的数据库基础。参与PISA试点地区可获得一个多层次评价教育成效的系统:获得本地区教育在国际教育体系中的成效对比数据;评估本地区基础教育的有效性和优缺点;提供义务教育结束后,学生应该具有的知识和技能的基本标准;加强本地区学者有效评价学生的行为和学校的能力。

本文后续的系列研讨将从学校样本与学生样本的取样设计与权重分析、PISA2006试题命制和本地适应化的质量保证与借鉴、阅读素养的评价方式与能力量表的界定、数学素养的评价方式与能力量表的界定、科学素养的评价方式与能力量表的界定、PISA评价编码的阅卷模式对于评卷分析的整体改进、中国试点地区学生在各评价领域的总体表现及与国际的比较、成就表现的社会经济背景解析、学生学习方式和兴趣对成就表现的影响、学校之间学生表现的数据解构、统计分析如何实现评价框架所定义的能力测量、如何在同一尺度上对学生能力进行横向和纵向的比较等。

[1] 经济合作与发展组织OECD/PISA 网站:http://www.pisa.oecd.org.

[2] 香港学生能力国际评价中心(HKPISA Center 网站:http://www.fed.cuhk.edu.hk/~hkpisa/.

[3] 澳大利亚教育研究院ACER PISA协作 网站:http://pisaweb.acer.edu.au/.


(责任编辑:王翔)


声明:文章版权归原作者所有,本文摘编仅作学习交流,非商业用途,所有文章都会注明来源,如有异议,请联系我们快速处理或删除,谢谢支持。


(原文章信息:标题:,作者:王蕾   ,来源:转载    ,来源地址:)

上一篇: 中考物理新能源试题赏析

下一篇: 培养科学素养――中考物理试题的价值取向

专题

-----主办-----

河南省乡村振兴协会

-----承办-----

河南省乡村振兴协会产业与信息化专业委员会

河南金农达供应链管理有限公司

河南全息农业科技有限公司 

-----协办-----

全息数字科技