福建师范大学教育科学与技术学院 黄慧娟 王 睎 许 明
(原载:《福建师范大学学报》(哲学社会科学版)2004年第4期)
全国教育进展评价(简称NAEP)、第三次国际数学和科学教育的再研究(简称TIMSS-R)和国际学生评价项目(简称PISA)是当前国际间最为著名的学生评价项目,本文拟就2000年NAEP的8年级评估、TIMSS-R的8年级评估和PISA三项评价项目的数学和科学领域评估做一比较,以便我们了解这些评估的实施背景、基本框架和评估内容。
全国教育进展评价(NAEP);第三次国际数学和科学教育的再研究(TIMSS-R);国际学生评价项目(PISA)
由美国全国教育进展评议中心组织的全国教育进展评价(简称NAEP)、国际教育成就评价协会(IEA)主持的第三次国际数学和科学教育的再研究(简称TIMSS-R)以及国际经济合作与发展组织(OECD)主持的国际学生评价项目(简称PISA),是当前国际间最为著名的学生评价项目,它们所提供的指标在国际上具有广泛的影响,已经引起世界各国的高度重视。这些评价项目分别涉及数学、科学、阅读等领域,代表国际学生评价的最先进水平。如何认识这些评价并合理使用其数据,就成为人们关注的课题。因此,充分地理解不同的评价所确定的评估目标,明确这些评估之间的相似点、不同点,以及各自在不同的内容、知识类型上相对强调的重点,有助于我们更好地使用这些评估的结果。本文拟就2000年NAEP的8年级评估、TIMSS-R的8年级评估和PISA三项评价项目的数学和科学领域评估做一比较,以便我们了解这些评估的实施背景、基本框架和评估内容。
NAEP是从1969年起定期实施的评估,测评美国学生各种主题领域的知识和技能,为教育者和政策制定者提供当前美国学生成就水平的最新状况,并基于以前评估比较分析得出学生成就的变化趋势。NAEP以4年级、8年级和12年级的学生为测评对象,主要评估学校课程和国家课程共同包括的知识和技能,即特定的内容主题和广泛的思考技能。在4年级和8年级的阅读、写作、数学、科学评估中,参与的各州可以对有代表性的样本进行建构,将评价结果与州的目标相比较,与其它州或国家的学生平均水平相比较。2000年, NAEP对数学、科学和阅读领域实施评估,对8年级实施的科学评估总共有195个题目,数学评估总共有165个题目,每个学生只做其中的一部分题目,科学和数学评估主要采用笔试,科学评估中有些题目要求学生进行实验,数学评估中有些题目允许学生使用计算器、直尺和量角器等。2001年, NAEP实施的是美国历史和地理领域的评估,2004年评估的是数学和科学领域。由于PISA的研究对象只有一个学生群体,所以下文中如无特殊说明,本文提供的是8年级学生群体的评估资料。
TIMSS-R是1999年IEA实施的第三次国际数学和科学教育的再研究。1995年, IEA在世界41个国家开始实施数学和科学评价,即第三次国际数学和科学教育研究(TIMSS),测评对象包括三类:第一类是9岁的学生(多数国家是3年级和4年级),第二类是13岁的学生(多数国家是7年级和8年级),第三类是中学最后一个年级的学生。TIMSS-R有38个国家参加,主要是研究第二类学生群体,其基本评价框架与TIMSS一样,科学评估共有144个题目、数学评估有164个题目,其中约有三分之一的测评题目与TIMSS第二类学生群体的测评题目是一样的。与NAEP一样,被TIMSS-R测评的学生只需做其中的一部分题目,但TIMSS-R与NAEP不同的是, TIMSS-R是综合测评科学和数学,而NAEP的科学和数学评估则是独立进行的。
PISA是于2000年起第一次开始,面向32个国家的15岁学生实施的教育评价。它的目标是为了测量教育系统的“积累成果”,即测量学生在临近初中毕业时的知识和能力,关注的是学生在一个数字化的文化社会中、成人生活的情境中生存并发挥作用的能力,而不是学生对各个具体课程内容的掌握。PISA的特征是在阅读素养、数学素养和科学素养领域内有各自的评估,每轮PISA评估都在这三个领域中选择一个确定为主要领域,并用三分之二左右的时间评估主要领域。2000年PISA评价中,阅读素养是主要领域, 2003年数学素养是主要领域, 2006年科学素养是主要领域。由于用于评估次要领域的时间较少,次要领域的评估不会包括已有评估框架的各个方面。如数学素养包括系列的6个“主要观点”,但2000年PISA评估中只涉及“空间和形状”、“变化和增长”2个。同时,数学领域和科学领域在这轮PISA评估中的题量远比NAEP和TIMSS-R中的少。PISA与NAEP、TIMSS-R的不同在于它是根据由文本、表格或图形组成的材料提出2个到4个不等的问题,这些问题的难度或复杂性是逐步提高的。



