首页> 详情

PISA科学素养评价工具的建构

2012-08-31 |浏览:5103次 | 编辑: 加载失败
分享到: 
副标题#e#

原载:《中国教育学刊》2007年第9

开发评价工具首先要明确所要测量的目的,制定建构图,再根据建构图编写题目。通过学生能力国际评价(Programme for International Student AssessmentPISA2006中国试测研究的实践,分析和展示了PISA科学素养评价工具建构的过程。PISA科学素养评价工具的建构对于研究如何考查学生综合能力,改进我国基础教育评价工具有十分重要的启示和借鉴意义。

PISA;素养;建构;建构图

随着教育的普及和发展,教育质量日益受到关注,教育评价也得到越来越多的重视和运用。教育评价活动中如何建构精准的评价工具,有效监测教育成效更是教育评价研究的难点和热点问题。尽管我国高考和中考命题已经从单纯的知识考核发展到能力与知识考察并重,但如何通过纸笔测试考察学生的科学综合素养,目前在我国还缺乏系统的理论研究和成功的实践。

选择评价工具第一要考虑的是使用这一工具的目的和背景,即工具所要测量的建构construct)。[1]2建构可以看作是认知理论模型的一部分,如人们对一个特定概念集合的理解,或者他们对某些事情的态度,以及其他心理变量。评价工具的建构应有一个非常简单的形式——从一个极端延伸到另一个极端,如从高到低、从强到弱、从积极到消极等。测量最感兴趣的是作答者在两个极端之间的位置,尤其是两个极端之间会有什么不同的质性水平即层次等级。每一个新的评价工具的开发抑或一个旧的评价工具的修订都必须清楚测量的建构是什么。只有考虑清楚测量的建构,依据建构开发的评价工具的内容和使用背景才有意义。

国外的综合能力测试都非常重视测量建构的界定,并将其贯彻到具体的试题中。在此,笔者以国际上颇具影响力的学生能力国际评价PISA科学素养评价工具为例,分析和展示科学综合能力评价工具的建构,以期对我国不同层次教育评价工具的开发有所启示和借鉴。

#p#副标题#e#

学生能力国际评价(Programme for International Student Assessment)是经济合作与发展组织发起并组织实施的教育成效评价研究项目。PISA利用高品质的试卷测试义务教育结束阶段15岁学生在阅读、数学和科学领域运用知识和技能解决现实问题的能力。PISA除试卷测试外,还通过收集学生、学校的背景信息,从个体学习者、教学、学校和教育体制4个层面对测试结果进行深层次分析。PISA已发展出常规的、可靠的,与政策相关的学生成就指标。基于PISA提供的指标,各参与国可以更好地评价和监控本国教育体制的效力与发展,从而达到国家教育体制的质量、公平性和效率的发展目标。

PISA2000年首次进行,每3年开展一次,以评价年命名。在PISA的三大评价领域中,PISA2000主要评价的是阅读素养,PISA2003评价的重点是数学素养,PISA2006评价的重点是科学素养。PISA200656个国家和地区正式参与。[2]8教育部考试中心为了学习与研究PISA先进的考试评价理念、理论、技术,了解国际情况,促进考试内容和形式的改革,特别是命题环节的改进,在200610月引进并启动了PISA2006中国试测研究项目。

PISA为各参与国提供了精准的测试工具,以测量义务教育结束阶段15岁在校生科学、数学、阅读素养。PISA测量的“素养”是指学生为迎接当今不断变化的现实世界挑战,应用知识和技能解决问题的能力,以及在日常生活情境下做出良好判断和决策的能力。[3]它不同于且高于对学校课程所设置的学科相关知识的理解或记忆能力。

根据PISA2006评价框架,科学素养主要包括:应用科学知识识别问题,获取新知识,科学地解释现象,并基于证据给予与科学有关的问题以相应的结论;理解科学作为人类知识和探究的一种形式的典型特征;意识到科学和技术如何塑造了我们的物质、精神和文化环境;作为一个有思想的公民,积极参与与科学有关的议题(见表1)。[2]12

1 PISA2006科学素养评价工具的主要构成要素[2]43

能力

知识

态度

识别科学问题

科学地解释现象

使用科学证据

科学知识:

物理系统

生命系统

地球和空间系统

关于科学的知识:

科学探究

科学解释

科学兴趣

支持科学探究

对资源和环境的责任感

PISA试题注重提炼各学科课程的内在联系,同时结合学科的特点,设计了具有深厚学科理论背景的问题,要求学生采取应用和探索的方法,在对学科知识融会贯通的基础上解决实际问题。PISA试题充分发掘了学科知识的内涵,在将学科知识作为思考材料和介质的同时,展示了学科知识广泛应用的工具作用。PISA2006经过56个参与国家和地区大规模的实地试测,排除了不同文化背景和语言翻译的影响,精心选用了题库中测量属性良好的108道科学题目,完成了参与国和地区的15岁学生科学素养测试并进行了测试结果的国际比较与分析。

#p#副标题#e#

PISA评价的目的是通过考察义务教育结束阶段15岁学生科学、数学、阅读的状况来了解各参与国、地区的教育成效,进而把学生培养成积极的、善于思考的、有智慧的公民。为了达到这个目的,PISA创设了科学、数学、阅读评价量表,评价的焦点是确定学生运用所学知识的能力水平。PISA项目自1997年以来就在世界范围内汇集专家,其建立的评价框架是不断努力的结果。PISA描述的15岁在校生科学素养从高到低的6个能力水平,也即PISA科学素养的建构。处于最高水平(水平6)的学生能够识别科学问题、解释科学现象,能够在各种复杂的生活情境中应用科学知识和关于科学的知识;他们能够将各种不同的信息来源与解释联系起来,并使用这些信息源的证据证明自己决策的正确性。而处于最低水平(水平1)的学生科学知识有限,仅能够将这些科学知识应用于少量的熟悉情境;他们能够提供较为明显、能够直接从给定证据中推理出的科学解释。

建构是潜在的而不是外显的,同时,这种潜在的建构是连续的。事实上,许多建构可能是多维度的。例如:PISA科学素养又分为“识别科学问题”“科学地解释现象”和“使用科学证据”3个能力维度。

建构图(construct map[1]3是比“建构”更加精确的概念。一个建构图可以被看成是一个一维的潜在变量。制定建构图是测量工具开发的第一步。我们必须清楚地界定我们所要测量的变量。在此变量上(如识别科学问题)发展良好的学生会有怎样的外显行为?发展普通的学生会有怎样的行为?发展欠佳的学生又会怎样?理清了这个变量的意义和行为后,就要规划题目:哪些题目可以反映出发展良好的学生的水平?哪些题目可以反映出发展一般或欠佳的学生的水平?然后将行为与题目放在一起,之后,评价者必须考虑使用一些方法使得理论上的建构可以在现实世界的情境中显现出来,而题目就是建构的实现形式。

行为表现:每个水平上学生应该达到的精熟程度

处于水平6的学生在研究设计时能够理解并且清楚地说明复杂模型的内在联系。

 

处于水平5的学生理解科学研究的本质元素,能够通过分析给定的实验,识别正在研究的问题,解释方法与问题的联系。

处于水平4的学生能够识别研究中所改变和测量的变量和至少一个被控制的变量。

处于水平3的学生能够判断某个议题是否可以采用科学测量,是否可以进行科学研究。在给出一个研究的描述时,可以识别出改变的和被测量的变量。

处于水平2的学生能够确定在一项研究中是否可以将科学测量应用于给定变量。能够识别正在操控的变量,能够选择关键词搜索。

处于水平1的学生能够选出合适信息。能够意识到一个数量在实验过程中经历了变异。在具体情境下,能够识别变量是否采用熟悉的测量工具进行了测量。

高熟练

程度

#p#副标题#e#

PISA试题设计科学,不但从知识与技能,而且从过程与方法、情感与态度等方面考察了学生的素养。尤其是重点评价科学素养的PISA2006,从命题环节上真正体现了从生活走向科学、从科学走向社会的思想。

PISA试题包括单项选择题、复合多选题和开放式回答题。试题以单元的形式成组编排,同时每个单元创设一个真实的生活情景。PISA测试的单元是由特殊的刺激材料组成的,这些材料可能是一段简短的文字或是带有图表的文本,同时再加上一系列各种类型的独立评分的问题。PISA之所以使用这种单元结构,是因为要尽可能地接近现实的背景情境,同时在有效利用测试时间的同时体现现实情境的复杂性。在一个情境下呈现多个问题,而不是就很多情境询问单个问题,这样节省了学生熟悉每个问题材料的时间。PISA还在科学素养单元题目中通过嵌入“科学兴趣”和“支持科学探究”态度题目实现了对学生情感态度的测量。

以下以PISA2006科学素养测试真题“酸雨”[4]为例,展示PISA单元题目形式、单元中各个问题与建构图的对应关系以及嵌入态度题目的考察方式。PISA所有需要较多阐释的开放式回答问题,都通过由培训合格的评卷员根据评分标准给出相应编码的方式来评分。其中,编码所代表的分数有3种:满分、部分得分、零分;编码有双位编码和一位编码两种形式。双位编码的第一位数字代表学生应得的分数,第二位数字代表学生的作答反应类型。因此,通过双位编码,不但可以知道学生的得分,还可以知道其不同的作答反应类型。即使是得零分,也可以通过学生错误作答类型的信息,为学生做出个体诊断。[5]

题干:以下是超过2500年前建造于雅典卫城名为女像柱的雕像照片。这些雕像是用一种名为大理石的岩石制造。大理石由碳酸钙组成。1980年,原始的雕像被迁移到卫城博物馆内,并由复制品取代。因为原始的雕像受到了酸雨的侵蚀。

问题1:正常的雨水略带酸性,因为它从空气中吸收了一些二氧化碳。酸雨比正常的雨水更酸,因为它还同时吸收了如硫氧化物和氮氧化物之类的气体。空气中的硫氧化物和氮氧化物是从哪里来的?

问题2:一片大理石薄片在被浸泡在醋里一整夜之前的质量是2.0克。隔天大理石薄片被取出并且干燥,干燥后大理石薄片的质量将会是多少?

A.少于2.0    B.精确的2.0    C.2.0克至2.4克之间     D.多于2.4

问题3:进行这项实验的学生也将一些大理石薄片在纯净(蒸馏)水中放置了一整夜。请解释学生为什么要在他们的实验中设计这个步骤。

#p#副标题#e#

问题4:对于下列问题,你感兴趣的程度有多少?请在每一行内只勾选一个方格。

 

高度兴趣

中等兴趣

少量兴趣

没有兴趣

a)知道哪些人类活动造成的酸雨最多

1

2

3

4

b)得知减少导致酸雨的气体排放的科技

1

2

3

4

c)了解修复遭酸雨破坏的建筑物的方法

1

2

3

4

问题5:对于下列陈述,你同意的程度有多少?请在每一行内只勾选一个方格。

 

非常同意

同意

反对

非常反对

a)古老遗迹的保存应该建立在与破坏原因相关的科学证据的基础上

1

2

3

4

b)关于酸雨原因的陈述应该建立在科学研究的基础上

1

2

3

4

酸雨单元题以自然界中大气污染现象为切入点,通过介绍酸雨的成因,考查学生对于碳酸钙与醋酸反应的了解,进而通过创设情景,模拟自然现象,在实验室中设计实验,让学生亲身感受环境污染的严重性,培养学生的社会责任感,从而有效地激发了学生研究和学习减少酸雨方法的求知欲。其命题立意及其建构图见表2

2酸雨命题立意与建构图的对应

题目

题目形式

能力及其层次

问题1

问题2

问题3

问题4

问题5

开放式回答

单项选择题

开放式回答

等级评定

等级评定

科学地解释现象(水平3

使用科学证据(水平2

识别科学问题(满分水平6,部分得分水平3

科学兴趣

支持科学探究

PISA对于科学素养的测评,反映了西方发达国家对科学教育的理解,体现了科学教育的发展方向。PISA注重测试学生未来发展的潜能,关注学生的人文素养、运用知识的能力、探究能力、实践能力和情感态度,而不仅仅局限在鉴别学生当前掌握知识的状况,这对于解决我国教育评价改革中的难题具有借鉴意义。当前基础教育课程改革也倡导提高我国全民科学素养。PISA测试对于我们研究如何改进我国中考、高考等各类教育考试,考查学生的科学探究能力,改进我国基础教育教学评价提供了有益的启示和借鉴。

[1]Wilson Mark. Constructing measures An Item Response Modeling Approach[M]. Hillsdale NJ Lawrence Erlbaum Associates2005.

[2]OECD. Assessing Scientific Reading and Mathematical Literacy A Framework for PISA 2006[M].Paris OECD2006.

[3]OECD.Learning for Tomorrow's WorldFirst Results from PISA2003[M].ParisOECD200425.

[4]OECD.First Results from PISA2006[M].ParisOECD200730-75.

[5]OECD.PISA2003 Technical Report[M].ParisOECD2005135-156.


(责任编辑:王翔)


声明:文章版权归原作者所有,本文摘编仅作学习交流,非商业用途,所有文章都会注明来源,如有异议,请联系我们快速处理或删除,谢谢支持。


(原文章信息:标题:,作者:王蕾   ,来源:转载    ,来源地址:)

上一篇: PISA2006天津试测的实施及其启示

下一篇: 一个中考物理试卷命题者的反思:以促进学生的发展为本

-----主办-----

河南省乡村振兴协会

-----承办-----

河南省乡村振兴协会产业与信息化专业委员会

河南金农达供应链管理有限公司

河南全息农业科技有限公司 

-----协办-----

全息数字科技