首页> 详情

中学生科学假设质量评价量表的制定

2012-08-31 |浏览:4859次 | 编辑: 加载失败
分享到: 
副标题#e#

原载:《教育科学》,2008年第3

猜想与假设(下文中多数情况简称为假设)是科学探究教学中一个复杂的内容。该内容不仅要求教师自身以敏锐的眼光迅速对学生提出的假设进行价值上的判断,而且要求教师以宽广的视角引导学生提出高质量的假设并对不同假设做出科学的分析和评估。然而要达到上述要求在实际教学中尚存在着一定的难度,主要原因在于中学生提出假设是在比较开放的情境下进行的,生成性强,复杂程度高,教师难以在有限时间内对其进行及时、合理的评价。

有关学生假设质量的评价研究还较少,研究者主要包括M.E.QuinnJia Chi LiangS.M.Hoover&J.F.Feldhusen等人。Quinn1975)在小学六年级学生假设形成教学的研究中指出可接受的假设至少需要满足下列标准之一:有意义的、基于经验的、充分的、精确的、有检验阐述的。在此基础上Quinn制定了假设质量的六级评价量表:没有解释、没有科学解释、部分科学解释、科学解释(至少包含两个相关变量)、精确的科学解释(包含所有的相关变量)、对假设检验的清晰陈述;基于Quinn的标准Jia Chi Liang2002)在对台湾十一年级学生假设质量的评价中建立了三级评价量表:没有科学解释、部分科学解释(变量考虑不完全)、科学解释(至少考虑两个变量);Hoover&Feldhusen1990)在对有天赋的九年级学生的科学假设形成能力研究中建立了假设质量的十级评价量表。Quinn研究认为在假设形成领域需要开展更多更广泛的研究,而他制定的假设质量评价标准和假设质量评价量表的适用性有待进一步深人研究。从目前取得的研究成果看来,上述三个做法的本质在于评价分级的细致程度不同(三点、六点、十点量尺),因而在学生假设质量的评价上并没有取得实质性进展。

相比之下,人们对于科学家提出的猜想与假设已进行了大量的评价研究并取得了重要的研究成果。比如在猜想与假设的可信性或可接受性方面,卡尔·波普尔和C.G.亨佩尔的研究结论就很有影响力。通过对科学上出现的大量猜想与假设进行科学分析、总结和归纳,前者认为猜想应满足简单性、可独立检验性、不容易被证伪的三个要求;后者则认为支持性证据的数量、多样性和精确性、新的检验推论给出确认、理论性支持、简单性、假设的概率是假设的五个可接受性判据叫。另外,在假设的选择上,B.N.戈什认为:1)在我们拥有一个以上的假设的情况下,我们宁愿选择具有强大预见功能和能够说明推论的假设;2)如果关于同一问题有两个假设,如果它们同样能够用证据确证,那么一般选择比较简单的假设。这些结论在后来被广泛应用在评价和选择科学家提出的猜想与假设甚至科学理论当中,并在科学界得到了广泛的认可。

本研究拟从人们对科学家提出的猜想与假设的研究成果入手,重新审视当前人们对于学生假设质量评价的优势和不足,旨在制定一个切实可行的、操作性强的中学生科学假设质量评价量表,为当前中学科学教育研究与教学中对于学生假设质量的分析和评估提供一些有益的参考。

#p#副标题#e#

本研究拟采用PTA量表法来对中学生科学假设质量的评价进行研究。PTA量表法中PTA英文全名为Primary Trait Analysis即基本要素分析,为美国教师沃尔佛德和安迪生以及他们的同事用于学生作业特别是开放性作业的评分方法。使用基本要素分析法来对学生的作业进行评分,沃尔佛德和安迪生认为评价者必须要做到:首先,要确定可能对评价起重要作用的基本要素。这一步要求评价者首先必须对即将进行评价的要素有一个大致的了解,之后,评价者还要和同事交流、讨论及通过作业分析法来不断地修改、完善评价要素;其次,评价者要编制针对每一个基本要素的评价量表。评价者要根据评价的目的为每一个基本要素编制2~5个水平的量表,然后用文字准确描述每一个表现水平;最后要对量表进行试测与修改,直到这个量表和评分者之间的一致性都达到了预定的要求。

为此,本研究拟确定了如下主要研究程序来制定中学生科学假设质量的评价量表:1)确定中学生科学假设质量评价的基本要素;2)确定各基本要素的权重;3)编制每一个基本要素的评价量表;4)将各基本要素的评价量表整合成假设质量的评价量表;5)评价量表的初步应用。

(一)基本要素的确定

本研究采用文献法和头脑风暴法共收集到了假设质量评价的12个要素:预见性、相关性、可检验性、支持性证据的数量、多样性和精确性、理论性支持、假设的概率、支撑性证据的简单性、独创性、新颖性、不容易证伪的、基于经验的、有价值的。经科学教育方面的专家间多次交流与讨论之后,将上述要素分成如下三类:A(预见性、相关性、有价值的);B(可检验性、支持性证据的数量、多样性和精确性、理论性支持、基于经验的、支撑性证据的简单性、不容易证伪的);C(假设的概率、独创性、新颖性)。考虑到现代教育评价理论中的体系内指标相互独立性原则以及可接受性原则,我们把上述三类指标合并为三项指标,即预见度、支撑度以及独创性。由此,本研究确定了预见度、支撑度和独创性为中学生科学假设质量评价的基本要素。进一步理由如下:

猜想与假设是人们通过抽象和判断推理等科学思维方法,对已存在和已发现的事物现象做出的假定性解释和说明,以及对未发现和尚未存在的事物现象做出的预见和推测,预见性是科学假设能够有实际价值的原因所在,靠着这种预见功能,可以揭示很多自然界的奥秘,掌握其中的规律性。比如俄国化学家门捷列夫根据他对元素周期律的科学假设,大胆预见当时还未发现的新元素镓、钪、铢的存在及其性质,使化学研究方式发生了重大变革。在科学探究活动中,猜想与假设是对解决问题方案的一种预见性思考,为制定计划、设计实验方案奠定了必要的基础,为收集信息、分析和解释信息提供了一个大致的框架,它能帮助探究者明确探究的内容和方向,指导探究沿着预定目标展开,避免探究的盲目性。在教学中我们常常遇到这样的情况,有些假设的预见度不高,没有触及问题的本质,这非常不利于问题的解决和探究活动的进一步展开,因而质量不高。所以预见度应该成为中学生科学假设质量评价的基本要素。

然而,对假设而言,仅有预见度也是不够的。科学假设还必须建立在一定的事实材料和科学知识基础之上。缺乏科学根据的假设,无论表面上多么动人,也不能说是科学假设。探究教学中常常会出现这样的情况,有些学生尽管提出了假设,但却不能说明合理的理由或即使说明了理由但并不充分,这影响到了假设的所谓科学上的可接受性或可信性,因而质量也不高。所取得的相关证据的广泛程度、证据的性质以及这些证据给予假设的支持所达到的强度是评价假设的所谓科学上的可接受性或可信性的重要要素。若用支撑度来表示这种证据给予假设的支持所达到的强度,那么,支撑度也应该成为中学生科学假设质量评价的另一个基本要素。

最后,应考虑思维的独创性也就是思维的创造性,它是指具有某种价值的新颖思维。在科学的道路中,许许多多伟大的发现均来自于这种有价值的新颖思维,因而可以说独创性也是思维结果质量的重要表现。假设是科学探究的核心要素之一,它是使学生思维发散的最为活跃的阶段,大量超乎寻常的、独特新颖的见解常常在这里产生。我们完全有必要让学生相信,假设越是新颖、独特,则其质量越高。这样,独创性也就应该成为中学生科学假设质量评价的第三个基本要素。

#p#副标题#e#

(二)基本要素权重的确定

构建一个完整的中学生科学假设质量的评价体系还需要确定各基本要素的权重。权重的大小表明它们在中学生科学假设质量中所处的地位。确定权重的方法很多,其中特尔斐法(Delphi Method)是研究人员普遍采用的一种方法。特尔斐法是美国兰德公司于1964年提出并首先用于技术预测的。它是一种广为适用的方法,是为了达到对所要调查事物的认识,利用专家的知识、经验、智意等无法量化的信息,通过讨论、通讯的方式进行交流,在不断的反馈与修正中达到意见的相对统一,得出关于调查对象的特征和本质的方法。

本研究也采用特尔斐法,设计了权重意见专家咨询表,通过电子邮件的方式和全国范围内的18位科学教育方面的专家就中学生科学假设质量的三个基本要素的权重进行了多轮的交流和讨论,得出各基本要素的平均权重分别为0.3810.3940.225。考虑到中学科学探究教学中假设质量评定的可行性,最终将各基本要素的权重近似取为0.40.40.2

(三)基本要素的评价量表的制定

为制定基本要素的评价量表,本研究设计了中学生科学假设质量的预调查测试卷。测试卷由两道开放性科学问题组成,具体的是:

试题1:运动物体所受空气阻力与哪些因素有关?

试题2:在美丽的太阳系中,有一颗非常特别的行星金星。它本身虽然并不发光,但从地球上看,它却是夜空里无数星星当中最亮的一颗,犹如一颗闪亮的钻石,你知道金星的亮度到底与哪些因素有关吗?

要求被试根据生活经验和已有知识对问题提出尽可能多的假设,并尽可能详细地说明每个假设的理由(或依据)。用该测试卷对某县普通中学高一学生施测,收集学生提出的假设及相应理由,并以此为材料对中学生科学假设质量的基本要素的评价量表进行具体探讨。

1)预见度评价量表的制定

在对被试提出的不同假设进行分类整理和归纳之后,多名评分者用作业分析法分别对这些不同假设的预见度水平进行等级评定,然后集中起来对评定的结果进行交流和讨论,对分歧较大的评定结果专门听取了科学教育专家们的意见,并在专家的引导下制定了详细的预见度要素的五级评价量表(见表1中的预见度要素一栏)。

2)支撑度评价量表的制定

Quinn1971)和Jia-Chi Liang2002)在实验中制定的评分方法对本研究中被试的真实表现进行了试评,我们深入分析了这些评分方法的优势和不足,并对两人的评分方法进行整合、补充和完善,经过反复多次的交流和讨论,同样在征求了专家的意见之后,建立了适用于本研究的支撑度要素的五级评价量表(见表1中的支撑度要素一栏)。

3)独创性评价量表的制定

独创性的记分比较复杂,一般可以根据统计偶发率来确定。考虑到本文得到的独创性要素的权重大小,本研究借鉴了董奇(2001)所阐述的独创性记分方法,最后形成了独创性要素的三级评价量表(详见表1中的独创性要素一栏)。

#p#副标题#e#

(四)假设质量的PTA评价量表的制定

在制定了各基本要素的评价量表之后,本研究把各基本要素的评价量表整合成假设质量的PTA评价量表,建立了质量的等级评定方法,就量表的使用作了相应说明。经过多次公开报告、师生集体讨论评议等程序,最后制定了假设质量的PTA评价量表(见表1)。

预见度

假设与问题的相关程度

0.4

涉及预见到问题的主要影响因素(符合生活经验和科学知识,具有深刻性、抽象性、整合性中的部分或全部特征)。

水平A

4

涉及预见到问题的相关影响因素(符合生活经验和科学知识,但不太具备水平A所阐述的特征)。

水平B

3

涉及预见到问题的部分相关影响因素(只与部分生活经验或科学知识相符,容易被反驳)。

水平C

2

涉及预见到问题的无关影响因素或对问题不能正确理解而做出了错误的猜测性结论。

水平D

1

不能做出任何猜测性结论。

水平E

0

支撑度

证据给予假设的支持所达到的强度

0.4

1)  明确陈述了正确检验猜测性结论的方法和步骤。

2)  对猜测性结论做出了精确的科学解释,考虑了两个以上的主要变量,使用了简单有效的证据,推理正确,明确了变量与变量之间的关系。

水平A

4

1)  所陈述检验猜测性结论的方法和步骤基本可行,但忽略了某个重要的变量。

2)  对猜测性结论做出了科学解释,考虑了两个主要相关变量,使用了简单有效的证据,推理和因果关系明显。

水平B

3

1)  猜测性结论只能得到部分检验。

2)  对猜测性结论做出解释,但是只考虑了一个主要的相关变量(漏掉了重要的相关变量,或使用了复杂的证据,或很容易被反驳)

水平C

2

1)  猜测性结论无法得到检验。

2)  对猜测性结论做出了无关或错误的解释。

水平D

1

对所提出的猜测性结论不能做出任何解释

水平E

0

独创性

与众不同的、新颖的、独特的

0.2

相关假设提出的频率在总人数的2%以下

水平A

2

相关假设提出的频率在总人数的2%到5%以内

水平B

1

相关假设提出的频率多于总人数的5

水平C

0

#p#副标题#e#

在对评价量表的初步应用中,作者采用自编的中学生科学假设质量调查测试卷,对所抽取的七、八、九年级、高一和高二年级共250名学生施测,两名评分者根据评价量表对测试中被试提出的2277个假设及其相应理由进行了评分。结果表明该评价量表具有良好的评分者一致性信度(Pearson相关系数为0.936),整体可操作性较强,可以在更大范围内用于中学生科学假设质量评定的探索。作为进一步具体的评价过程描述,下面通过对表2中四个代表性假设的质量的评定来详细说明该PTA评价量表的运用。

运动物体所受空气阻力与哪些因素有关?

1.与物体和空气的相对速度有关

一个人骑自行车,在同样的条件下,速度越大收到的阻力越大。如果迎着风骑,阻力更大。

1

2.与物体的迎风面积有关

面积大的物体,从高空坠落,肯定要比面积小的物体用时更长,根据这一原理,人们制成了降落伞。

2

3.与空气中的灰尘有关

空气中灰尘越小,物体所受阻力越小。

5

4.与老师的爱心有关

平时老师爱心多一些,阻力就少一些。

1

评价说明:假设1同时考虑了物体与空气两个维度,提出了相对速度这一抽象概念,具有一定的整合性和抽象性特征,属于预见到问题的主要影响因素的假设,理由考虑了两个主要相关变量(同样的人,同样的事),说得合情合理,属于精确的科学解释,且提出的频率在总人数的2%以下,因此,各指标都可以被评定为水平A,综合起来可以得到该假设的质量得分10分,评定等级为

假设2同时考虑到了物体和空气这两个维度,具有一定的整合性特征,属于预见到了问题的主要影响因素的假设,预见度可以被评定为水平A;理由中所陈述检验假设的方法和步骤基本可行,但没有控制其中最为重要的变量(同一高度),容易被反驳,还好后面提供的证据(降落伞)具有较好的说服力,故支撑度可以被评定为水平B,另外,提出的频率在总人数的2%5%以内,独创性可以被评定为水平B,综合起来可以得到该假设的质量得分为8分,评定等级为较高

假设3预见到了空气中的灰尘这个单一维度,不是影响物体阻力的主要因素,但还是属于相关影响因素,预见度可以被评定为水平B,理由仅说明了变量间关系,故支撑度被评定为水平C,由于提出这一假设的人数比较多,频率大于总人数的5%,故独创性被评定为水平C,综合起来可以得到该假设的质量得分为5分,评定等级为一般

假设4是一种毫无根据的主观臆造,无任何证据表明老师的关心与空气的阻力可以取得一丝联系,预见度与支撑度都只能被评定为水平D。又由于该假设与问题毫不相关,所以即使提出的频率非常低,其独创性也只能被评定为水平C层次,给0分。综合起来,该假设的质量得分为2分,评定等级为

对于未知的科学问题情境学生提出的假设一般具有复杂性、多样性等特点。要在科学探究教学中对学生提出的假设进行及时、合理的评价,引导学生对不同假设做出科学的分析和评估,引导学生提出高质量的假设,比较合理的做法是事先对学生在具体的科学问题情境中可能提出的假设、说明的理由有充分的了解,并在此基础上建立假设的质量评价量表。本文通过理论分析和实践研究,确立了中学生科学假设质量评价的基本要素及其相应权重,制定了各基本要素的评价量表,最终形成了具体的中学生科学假设的质量评价量表。笔者期望该量表的制定能为当前科学教育研究与教学中学生科学假设的质量评价提供一些有益的参考。


(责任编辑:王翔)


声明:文章版权归原作者所有,本文摘编仅作学习交流,非商业用途,所有文章都会注明来源,如有异议,请联系我们快速处理或删除,谢谢支持。


(原文章信息:标题:,作者:罗筑华 罗星凯  &,来源:见正文    ,来源地址:)

上一篇: PISA在中国:教育评价新探索

下一篇: 水平吹出的肥皂泡能上升吗?——对一道中考题的探讨

专题

-----主办-----

河南省乡村振兴协会

-----承办-----

河南省乡村振兴协会产业与信息化专业委员会

河南金农达供应链管理有限公司

河南全息农业科技有限公司 

-----协办-----

全息数字科技