教育管理论文栏目提供最新教育管理论文格式、教育管理硕士论文范文。详情咨询QQ:1847080343(论文辅导)

关于三项著名国际学生评价项目的比较

日期:2018年01月15日 编辑: 作者:无忧论文网 点击次数:1949
论文价格:免费 论文编号:lw201004130923226433 论文字数:8000 所属栏目:教育管理论文
论文地区:中国 论文语种:中文 论文用途:职称论文 Thesis for Title

   摘   要: 全国教育进展评价 (简称 NAEP) 、第三次国际数学和科学教育的再研究 (简称 TIMSS - R)和国际学生评价项目 (简称 PISA) 是当前国际间最为著名的学生评价项目 , 本文拟就 2000 年 NAEP 的 8年级评估、TIMSS - R的8 年级评估和 PISA三项评价项目的数学和科学领域评估做一比较 , 以便我们了解这些评估的实施背景、基本框架和评估内容。

   由美国全国教育进展评议中心组织的全国教育进展评价 (简称 NAEP) 、国际教育成就评价协会 ( IEA) 主持的第三次国际数学和科学教育的再研究 (简称 TIMSS- R) 以及国际经济合作与发展组织 (OECD) 主持的国际学生评价项目 (简称 PISA) , 是当前国际间最为著名的学生评价项目 , 它们所提供的指标在国际上具有广泛的影响 , 已经引起世界各国的高度重视。这些评价项目分别涉及数学、科学、阅读等领域 , 代表国际学生评价的最先进水平。如何认识这些评价并合理使用其数据 ,就成为人们关注的课题。因此 , 充分地理解不同的评价所确定的评估目标 , 明确这些评估之间的相似点、不同点 , 以及各自在不同的内容、知识类型上相对强调的重点 , 有助于我们更好地使用这些评估的结果。本文拟就2000 年 NAEP的 8 年级评估、TIMSS - R 的 8 年级评估和 PISA三项评价项目的数学和科学领域评估做一比较 ,以便我们了解这些评估的实施背景、基本框架和评估内容。

一、NAEP、TIMSS - R、PISA的评估背景

NAEP是从 1969 年起定期实施的评估 , 测评美国学生各种主题领域的知识和技能 , 为教育者和政策制定者提供当前美国学生成就水平的最新状况 , 并基于以前评估比较分析得出学生成就的变化趋势。NAEP以 4 年级、8 年级和 12 年级的学生为测评对象 , 主要评估学校课程和国家课程共同包括的知识和技能 , 即特定的内容主题和广泛的思考技能。在 4 年级和 8 年级的阅读、写作、数学、科学评估中 , 参与的各州可以对有代表性的样本进行建构 , 将评价结果与州的目标相比较 , 与其它州或国家的学生平均水平相比较。2000 年 , NAEP 对数学、科学和阅读领域实施评估 , 对 8 年级实施的科学评估总共有 195 个题目 , 数学评估总共有 165 个题目 , 每个学生只做其中的一部分题目 , 科学和数学评估主要采用笔试 , 科学评估中有些题目要求学生进行实验 , 数学评估中有些题目允许学生使用计算器、直尺和量角器等。2001年 , NAEP实施的是美国历史和地理领域的评估 ,2004年评估的是数学和科学领域。由于 PISA 的研究对象只有一个学生群体 , 所以下文中如无特殊说明 , 本文提供的是 8 年级学生群体的评估资料。TIMSS - R是 1999 年 IEA 实施的第三次国际数学和科学教育的再研究。1995 年 , IEA 在世界 41 个国家开始实施数学和科学评价 , 即第三次国际数学和科学教育研究 ( TIMSS) , 测评对象包括三类: 第一类是 9 岁的学生 (多数国家是 3 年级和 4 年级) , 第二类是 13 岁的学生 (多数国家是7 年级和8 年级) , 第三类是中学最后一个年级的学生。TIMSS - R有 38 个国家参加 , 主要是研究第二类学生群体 , 其基本评价框架与 TIMSS一样 ,科学评估共有 144 个题目、数学评估有 164 个题目 , 其中约有三分之一的测评题目与 TIMSS第二类学生群体的测评题目是一样的。与 NAEP一样 , 被 TIMSS - R 测评的学生只需做其中的一部分题目 , 但 TIMSS - R 与NAEP不同的是 , TIMSS - R 是综合测评科学和数学 ,而 NAEP的科学和数学评估则是独立进行的。PISA是于 2000 年起第一次开始 , 面向 32 个国家的15岁学生实施的教育评价。它的目标是为了测量教育系统的“积累成果” , 即测量学生在临近初中毕业时的知识和能力 , 关注的是学生在一个数字化的文化社会中、成人生活的情境中生存并发挥作用的能力 , 而不是学生对各个具体课程内容的掌握。PISA 的特征是在阅读素养、数学素养和科学素养领域内有各自的评估 , 每轮PISA评估都在这三个领域中选择一个确定为主要领域 ,并用三分之二左右的时间评估主要领域。2000 年 PISA评价中 , 阅读素养是主要领域 , 2003 年数学素养是主要领域 , 2006 年科学素养是主要领域。由于用于评估次要领域的时间较少 , 次要领域的评估不会包括已有评估框架的各个方面。如数学素养包括系列的 6 个“主要观点” , 但 2000 年 PISA 评估中只涉及“空间和形状” 、“变化和增长”2 个。同时 , 数学领域和科学领域在这轮PISA评估中的题量远比 NAEP 和 TIMSS - R 中的少。PISA 与 NAEP、TIMSS - R 的不同在于它是根据由文本、表格或图形组成的材料提出2 个到4 个不等的问题 ,这些问题的难度或复杂性是逐步提高的。

二、NAEP、TIMSS - R、PISA的评估框架

NAEP、TIMSS - R、PISA 的评估都建立了多维度的工作框架 , 这些框架概括了评估所包含的重要事实、观点、技能以及题目的可描述性特征。  在每个评估框架中 , 都包括由主题和次主题组成的 维度 , 如 NAEP科学领域评估中 , 科学维度包括地球科学、物理科学和生命科学 3 个主题 , 地球科学包括土壤、水、空气和地球空间 4 个次主题 , 而且每个评估框架至少有一个描述性、与主题内容无关的认知方法的维度 ,如 PISA数学领域评估中的各个数学能力等级。不同维度使评估框架显得有些复杂 , 但同时反映了任何主题的重要性不仅来自于它自身的事实和观点 , 而且来自于与之相联系的方法和技能 , 即在要求学生掌握科学的事实和观点的同时 , 要求他们应用其科学知识去建构逻辑的推理方法。评估框架的不同维度有助于形成测评题目 ,即每个维度包含的不同主题必须在测评题目中有均衡的分布 , 如 NAEP的 8 年级数学评估中“测量”占 15 % ,这些题目是平均分配在数学能力的 3 个种类中。同时 ,由于评估框架内的主题和认知技能一般是相互联系的 ,三项评价项目中的题目都包含着不止一个主题或认知技能。比较三个评估框架 , 除了发现许多相似之处外 , 也有许多不同。首先 , 在评估目标上 , NAEP、TIMSS - R主要是测评学生对知识、技能、观点的掌握程度 , PISA则是关注学生在校内外应用数学和科学的情况 , 关注学生科学地推理和思考的能力 , 学会阅读和解释可能在报纸或其它传媒中看到的文章、图表或图形等。其次 , 表现为在不同评估目标影响下 , 评估框架中的不同维度在评估中的具体作用不同。NAEP 和 TIMSS - R 评估框架中 , 详细阐释与学生应掌握内容相关的维度 , 这些维度是形成测评题目的主要依据; PISA 则不同 , 其评估框架中没有详细阐释与学生应掌握内容相关的维度 , 且在形成测评题目时这些维度也不作为重要的依据。如就数学而言 , 它们是形成测评题目时考虑的次要因素。PISA 中形成测评题目的主要依据是包括技能和能力的维度 , 这些维度的具体内涵在评估框架中得到详细阐释。最后 ,虽然每个评估框架都有几个相似维度 , 但各有其特征 ,如 PISA的情境维度是 NAEP 和 TIMSS - R 所没有的 ,即使有相同的维度 , 但在评估它们时各自所包含的内容也是不完全相同的 , 在评估中发挥的作用也是不完全一样的。

三、NAEP、TIMSS - R、PISA的评估题目分布与比例

NAEP、TIMSS - R、PISA 由于其各自的评估目标不同 , 形成的评估框架不同 , 所以三项评价项目在评估的内容上 , 如题型的选择、题目难度的确定、题目在所要评估的各个领域的分布及其比例等都有明显的不同。(一) NAEP、TIMSS - R、PISA的题型NAEP、TIMSS - R、PISA 书面评估的主要题型是多项选择题、简答题、问答题及画图或其它非文字问答 ,选择题型的主要根据是要求学生掌握的知识及评估实施时的实际情况。一般地 , 对于多数学生来说 , 简答题总体上是简单的 , 多项选择题则要求较高层次的推理。但那些要求学生运用较高层次的推理技能去解释或证明自己所提出的观点并需要充分予以表达的题目 , 大多不会使用简答题或多项选择题。因为这些题目要求学生不仅会推理或猜测正确答案 , 而且要求学生对他们认可的正确答案做出解释。因此 , 选择不同题型的依据在于 , 不同的题型对应不同要求的思考技能。此外 , 题目的表达方式即题目的文本是否用数学或科学研究中特有的形式来表达 , 或是否使用了与校外生活相关的情境、语言或直觉信息等 , 也会直接影响学生对题目的理解 , 从而影响题目的难度。因为 , 如果文本要求学生将题目转化为科学或数学的术语或观点 , 那么 , 这与直接陈述的题型相比 , 就需要更多的思考。学生如果主要用学术化语言陈述的文本学习 , 通常在处理与现实世界相联系的文本时 , 容易产生困难 , 但如果与现实世界相联系的文本表达的内容是学生所熟悉的 , 那么这种文本就能帮助学生更好地解决问题 , 客观上降低了题目的难度。另一方面 ,那些使用与现实世界相联系的文本 , 及关注特定情境的富有实践内涵的题目 , 与主要关注潜在的科学观点和理论的题目相比 , 学生除了必须加工科学知识