每个水平上学生应该达到的精熟程度
处于水平 6 的学生能够通过检查支持性的证据,比较并区分几个竞争性的解释。他们能够综合多个来源的证据形成自己的观点。
处于水平 5 的学生能够解释以各种形式呈现的来自相关数据集的数据。他们能够识别并且解释数据集中的相异与相似之处。并且基于这些数据集中所呈现的联合的证据做出结论。
处于水平 4 的学生能够通过总结数据,解释相关模式来理解通过多个形式表达的数据,例如表格的,图表的和图样的。他们能够使用数据得出相关结论。学生还能够确定数据是否支持关于某个现象的论断。
处于水平 3 的学生在回答问题,证明或否定某个给定的结论时,能够从数据中选择一个相关的信息。他们能够从数据集不复杂的、简单的模式中做出结论。在简单的情况中,如果信息充分的话,他们还能够支持某个结论。
处于水平 2 的学生,在给出合适线索的情况下,能够识别出图标的一般特征;在给出陈述的情况下,能够指出图标或简单表格的某个明显特征。在对日常用品的功能进行选择时,他们能够识别出这些物品的功能。
处于水平 1 的学生从与日常生活背景相联系的事实表或图标中抽取相关的信息。当需要对柱状图中柱子的高度进行简单比较时,他们能够从中抽取信息。在常见的、经验性的情境中,处于这个水平的学生能够进行归因。
高熟练
程度
PISA 测试强调在现实生活中的能力考查。 PISA 测试不在集中于学校里传授的知识和技能的考查,而是重在测量学生在实际生活中创造性地运用学校教授的知识和技能的能力。 PISA 测试更加关注学生的能力的提高,关注学生的可持续发展,评价学生能否积极参与社会活动,关注那些有利于成为终身学习者的知识和技能以及与未来生活有关的基本知识和技能的考查。
#p#副标题#e#
PISA 测试题目多项选择题,复合多选题,开放性回答题目各占 l/3 。测试题目通过单元的形式成组地编排为题组,每个单元创设了一个真实的生活情景。
PISA 所有开放性回答题目,都由培训合格的编码评分员根据评分标准给出相应编码的方式来评分。其中,编码所代表的分数有三种:满分、部分得分、零分;编码有双位编码和一位编码两种。编码的评分方式有利于把握学生解题思维的性质和学生对于更高层次的思维方法的掌握情况。其双位编码首位给出了学生应得的分数,末位则按照学生在解决给定问题的过程中所使用的策略、或是按照阻碍学生得出正确解决方案的错误概念给出特定代码,这种评分方式有利于后期数据分析的进行以及最终评价结果报告的生成。
PISA 开放性回答的命题和编码评分,题目设计精巧,评分标准宽泛,不是简单地检查知识的记忆,而是考查学生在题目背景信息下,运用自己的知识和技能可不可以最方便地解决实际的问题。 PISA 的试题和编码评分设计体现让利于学生原则,重视学生的思维品质,不同的思维过程,值得我们在能力测试中借鉴和应用。
以下以 PISA2006 科学素养测试真题温室效应 [9] 为例,展示 PISA 单元题目形式,单元中各个问题与建构图的对应关系、双位编码的考查方式。评分标准每个编码后均有大量学生反应样例,在此,限于篇幅略过。
阅读下文并回答问题。
温室效应:事实还是幻想?
生物需要能量才能生存,而维持地球生命的能量来自太阳。太阳非常炽热,将能量辐射到太空中,但只有一小部分的能量会到达地球。
地球表面的大气层,就像包裹着我们的星球表面的毯子一样,保护着地球,使它不会像真空的世界那样,有极端的温差变化。
大部分来自太阳的辐射能量,会穿过大气层进人地球。地球吸收了部分能量,其他则由地球表面反射回去。部分反射回去的能量,会被大气层吸收。
由于这个效应,地球表面的平均温度比没有大气层吸收能量时的温度高。大气层的作用就像温室一样,因此有了“温室效应”一词。
温室效应在 20 世纪越来越显著。
事实表明,地球大气层的平均温度不断上升。报刊杂志上常说,二氧化碳排放量增加,是 20 世纪气温上升的主要原因。
小德有兴趣研究地球大气层的平均温度和地球上二氧化碳排放量之间的关系。
他在图书馆找到下面两幅曲线图。
#p#副标题#e#
曲线图中有什么数据支持小德的结论?
满分
编码为 11 :指出(平均)温度与二氧化碳排放量均上升。
编码为 12 :指出一般而言,气温与二氧化碳的排放量有正相关。
零分
编码为 01 :指出(平均)温度或二氧化碳排放量其中一项有上升。
编码为 02 :指出气温与二氧化碳之间有关系,但没有清楚表明两者有什么关系。
编码为 99 :没有作答。
小德的同学小妮却不同意他的结论。她比较两幅曲线图,指出其中有些资料并不符合小德的结论。
请从曲线图中举出一项不符合小德结论之处,并说明理由。
满分
编码为 2 :能够指出两幅图中,有哪一部分的曲线不是同时上升或下降,并作解释。
部分得分
编码为 1 :指出了正确的时期,但没有给予解释。
或
举出了证据,证明小德的结论不是正确的,但却写错了时期。
零分
编码为 0 :仅仅就其中一条曲线的改变趋势作出描述,而没有把改变与两幅图联系在一起。
编码为 9 :没有作答。
#p#副标题#e#
小德坚持自己的结论,即地球平均温度的升高,是由于二氧化碳排放的增加而引起的,但小妮则认为他的结论太草率。她说:“在接受这个结论之前,你必须确定在大气层内其他会影响温室效应的因素维持不变。”
请写出小妮所指的其中一个因素。
满分
编码为 11 :能够写出一个因素,该因素与太阳发出的能量或辐射有关。
编码为 12 :写出一个自然成分,或污染物。
零分
编码为 01 :写出影响二氧化碳浓度的因素。
编码为 02 :不够明确或不够具体的因素。
编码为 03 :其他错误因素或其他答案。
编码为 99 :没有作答。
本题以当前世界上日益严重的环境问题——温室效应为入手点,考查了观察图像并从图中获取信息,以及对图形、数据进行分析并得到相关结论的能力。具体情况如下表所示:
题目
题目形式
能力及其层次
科学知识
关于科学的知识
问题 l
问题 2
问题 3
开放性回答
开放性回答
开放性回答
使用科学证据(水平 3 )
使用科学证据(水平 5 )
科学解释现象(水平 6 )
地球和空间系统
科学解释
科学解释
( l )试题突出考查了学生从图中获取信息的自学能力。
题中所有的证据都是以图像的形式给出的,学生需要在读懂图像的基础上,发挥自己进行比较、归纳,分析得出自己的结论,因此本题较好地考查了学生的思维能力。
( 2 )试题鼓励学生的创造性思维。
本题的问题 1 和问题 3 都是双位编码,其特点是学生作答的情况虽然均可得满分或零分,但可清晰地反映出其思维过程的差异性,对科学证据理解的差异性。这种编码方式区分度较高,可使优秀学生脱颖而出或深入挖掘未答对题目的学生的问题所在,在一定程度上鼓励了学生的创造性思维。
PISA 题库采用建构图这一形象的标淮将学生和题目归入各个能力水平同一把量尺。以图 2 使用科学证据建构图简单比喻,建构图直线左边是学生,右边是题目,题目就是这把量尺的刻度,题目要在量尺上均匀分布。 PISA2000 打磨的是阅读素养“提取信息”、“解释说明”、“反思并评估” [l0] 量尺; PISA2003 打磨的是数学素养的“变化和关系”、“数量”、“空间和形状”、“不确定性” [11] 量尺; PISA2006 打磨的是科学素养的“识别科学问题”、“科学地解释现象”、“使用科学证据”量尺。而拥有精确刻度,覆盖所有量尺的就是 PISA5000 多道由各参与国家与地区贡献,并经过现代教育测量理论检定的题库。
建构图显示出 PISA 如同测量学生身高一样,用通过现代教育测量理论建构的试题题库打造了测量学生素养的精准量尺。 PISA 打造的是一把钢性的量尺,试题难度不会像传统测试的弹性量尺随受试人群样本的能力不同而变化。各参与国一致认同 PISA 客观等距量尺测量出的学生素养,其高品质保障的取样、测试管理机制和最新的数据后期分析使 PISA 跨国和跨年度的比较具有高度的有效性和可信性,同时又如同比较学生身高一样简单明了。
能力测试题库建设是一项巨大的系统工程,要集中大量的学科专家和教育测量专家进行能力测试测量目的的制定,建构图的描述,试题和评分标准的编制、审定、预试和调整等。 PISA 的经验来看,加强测量专家、学科专家和命题人员的结合,发挥各自所长,是加速能力测试题库建设的关键因素。
#p#副标题#e#
[1][3]OECD. Learning for Tomorrow's World : First Results from PISA2003[M]. Paris : OECD , 2004.23-25.
[2][4][5] OECD. Assessing Scientific , Reading and Mathematical Literacy : A Framework for PISA 2006[M].Paris : OECD. 2006.8-44.
[6]Wilson , M. Constructing measures : An item response modeling approach [M]. Hillsdale , NJ : Lawrence Erlbaum Associates , 2005.3.
[7][8][9] First Results from PISA2006 [M]. Paris : OECD , 2007.30-75.
[10]OECD. Measuring Student Knowledge and Skills : The 2000 PISA Assessment of Reading , Mathematical and Scientific Literacy [M]. Pans : OECD. 2000.17.
[11] OECD. The PISA2003 Assessment Framework : Mathematics , Reading , Science and Problem Solving knowledge and Skills [M].Paris : OECD , 2003.8.
(责任编辑:王翔)
声明:文章版权归原作者所有,本文摘编仅作学习交流,非商业用途,所有文章都会注明来源,如有异议,请联系我们快速处理或删除,谢谢支持。
(原文章信息:标题:,作者:王蕾 ,来源:转载 ,来源地址: )
上一篇:
我国大规模教育评价项目探究与实践
下一篇:
抓住机遇 迎接挑战 寻求发展――考试评价的探索与展望
您的浏览器不支持 HTML5 video 标签。