国际学生评价项目是由全球性的国际经济与合作发展组织发起、 组织实施的国际性比较评价项目。该项目以 15岁年龄的学生为取样 ,通过对阅读素养、 科学素养和数学素养三个领域的测试 ,以便于人们进行比较。至今 ,国际经济与合作发展组织已在社会、 经济、 教育、 公共政策、 环境等多个领域进行研究 ,并为许多国家的政策制定和发展提供参考。
一
国际学生评价项目是一种概况调查形式的评价考试 ,是基于终身学习的动态模型而设计的。它假定学生到 15 岁时已形成了一系列的体验 ,这些体验可能来自校内也可能来自校外。当然 ,正规教育对于学生的成绩具有重要的作用 ,其它因素(如家庭教育和学习途径)也能起一定的作用。这些体验使学生在阅读、 科学、 数学上达到了一定的水平。国际学生评价项目评价的就是15岁学生这一累积性的教育体验 ,而不论学生处在什么年级、 什么学校读书。通过对学生现实生活和终身学习所必须的知识和技能领域的评价 ,提供了一种在关键年龄阶段为进入未来生活所做准备的信息 ,即学生是否具有了终身学习的能力 ,是否准备好了应对未来挑战所必需的能力。这与国际学生评价项目所提出的“评价学生现实生活和终身学习所必须的知识和技能” 的口号是吻合的。同时 ,国际学生评价项目也试图提供一种国家教育系统整体的或总体的指标 ,以及关于影响这一测试成绩的其它因素的信息。由此 ,我们认为国际学生评价项目是一种前瞻性的测试而不是回顾性的测试。国际学生评价项目主要从三个维度展开评估。即所提供评估材料的形式、 内容的选择、 建构或使用的情境等 ,这些因素依托于阅读素养、 数学素养、 科学素养等领域。阅读素养。国际学生评价项目认为 ,阅读素养是学生为取得个人奋斗目标 ,形成个人知识和潜能及参与社会活动 ,而理解、 运用书面材料的能力 ,强调对文章的全面理解是该测评考虑的主要因素。为此 ,它从形成广义上的、 总体的理解、 寻找信息、 解释原因、 思考文本内容、 思考文本形式等五个方面展开评估。这项评估由连续文本和间断本文两种材料形式所构成。该项目还强调在不同情境下的评估 ,并按情境的用途、 相关人员和内容 ,将情境分为以下四类予以评估:为了个人应用而阅读;为了公共应用而阅读;为了工作而阅读;为了教育而阅读。数学素养。国际学生评价项目认为 ,数学素养是学生能确定并理解数学在社会中所起的作用 ,得出有充分根据的数学判断和能够有效的运用数学的一种个人能力。由此 ,该项目从数学技能、 主要的数学概念、 数学课程因素、 数学情境等领域展开测评。同时 ,将准备考核的数学能力分为三个等级进行。即 ,再现、 定义、 计算;为解决问题而建立联系;数学思维和概括的能力。强调在各种不同的情境中解答数学问题 ,运用数学知识。该项目将评估集中在个人生活的情境、 教育的情境、 职业(工作)的情境、 公共(社区生活)的情境、 科学的情境等方面。科学素养。国际学生评价项目认为 ,科学素养是应用科学的知识来确定问题 ,得出(或提出)基于证据的结论的能力 ,以便理解并帮助做出关于自然世界的决定 ,并且通过人类的活动做出调整。该项目从科学概念、 科学方法和科学情境等角度展开评估。主要考核与此相关的能力 ,即科学地确定可研究的问题 ,并将科学知识运用于与现实生活相关的领域中的能力;在科学调查中确认证据的能力;得出或评价结论的能力;对科学概念的理解 ,并给出建构性回答的能力。同时 ,将科学情境主要选择在以下层次:个人和家庭;社区(公共的)情境;世界生活(全球的)情境;历史相关性的情境。因此 ,国际学生评价项目十分关注学生习得的技能的价值 ,强调在实际的生活情境中 ,培养学生解决问题和实际操作的能力。
二
目前 ,国际上对学生成绩的评价已有不少的形式 ,如国际数学与科学学习趋势测评、 国际阅读素养进步研究、 以测量成年人阅读素养为主要内容的成人素养与生活技能调查等。此外 ,美国还有一套已存在 30 多年的评价国内学生成绩的国家教育进展评价计划。即便如此 ,国际学生评价项目的出现仍然以其独特的贡献引起世界各国(尤其是工业化国家)的关注 ,这与该项目所具有的鲜明特点有着密切关系。评价的内容。现存的测试大多与学校课程有密切的联系 ,试图测量的是学生对具体知识、 技能和概念的掌握程度。国际学生评价项目则侧重于测量广义的 “素养” ,评价内容取自于更广泛的领域 ,即不局限于在校学习的基于课程的已经掌握的单一知识 ,而是强调知识在不同情境中的应用和形成面对实际生活挑战的能力。如数学测试的内容之一为空间与形状 ,这与具体的基于课程内容的几何、 代数的测试有很大的不同。在测试的题型方面 ,与国际数学与科学学习趋势测评、 美国的国家教育进展评价计划测试不同的是 ,它要求学生更多的进行多步骤的推理 ,关注并致力于评价学生在日常生活情境中的阅读 ,掌握数学、 科学方面的知识和技能。国际学生评价项目中数学、 科学的题型 ,便包括了解释图表或其它 “真实” 的世界。这些试题是基于国际学生评价项目的一种预想而设计的 ,即当 15 岁的学生开始向成年生活过渡的时候 ,他们不仅需要知道如何去阅读或理解特定的数学公式或科学的概念 ,而且还要知道如何掌握这些知识和技能 ,并在未来面临的不同的生活中加以运用。测试对象的取样。国际学生评价项目以同一年龄(即15岁)为依据取样 ,而不以年级为取样。如国际阅读素养进一步研究收集的阅读素养是以四年级学生为取样 ,国际数学与科学学习趋势测评对科学的测试则取样于八年级的学生 ,国家教育进展评价计划收集的则是不同年级的学生的数据。国际上也有以年龄为取样的 ,如成人素养与生活技能调查是以 16 岁 - 65 岁为取样对象 ,收集阅读素养的数据。成人素养与生活技能调查对阅读素养的测试 ,与国际学生评价项目略有不同 ,它尝试将 15 岁学生评价的成绩与成年人的测评相联系 ,以便于观察素养与劳动力市场的关系。国际学生评价项目之所以选择以 15 岁年龄为取样 ,是因为国际学生评价项目的目的在于体现一个教育系统以及所有学习体验的累积影响的总体结果 ,而不是纯粹的学校教育的结果。通过强调年龄的取样 ,显示出学生在校内外的学习情况 ,这种学习情况应是学生多年累积的。以 15 岁为代表的这一年龄段的学生大部分都在学校中 ,而且其广泛的学习结果可以被测量。由于学校教育的年限各国不尽相同 ,无法用同一的年级进行取样 ,以年龄为取样标准 ,使得对测试的结果进行国家间的比较 ,更为容易、 简便。评价获得的信息类型。以往的测试多半指向于学校 ,如国际数学与科学学习趋势收集的信息是用来帮助提供了解不同国家的教师是如何进行教学的 ,并提供一种了解这些教学对学生的成绩可能产生的不同的影响 ,甚至还提供现场录像的研究。国际学生评价项目则不然 ,它反映出较为广泛的政策目的。它收集的仅是一种与学校的普通背景、 学生的人口统计学的背景(如家庭、 种族等)相关的信息。因此 ,2000年的测试不包含任何对教师的问卷 ,也不提供任何改革课堂教学的直接信息 ,其目的是应用测试的结果提供一种成绩排名的有用的指标 ,从而为国家的政策提供信息。2000年 ,第一次测评结果发布后引起了各国的广泛重视。在这次测试中 ,芬兰、 韩国、 加拿大的成绩最好 ,卢森堡、墨西哥、 巴西的成绩最差。最令人震惊的是德国 ,其三个科目的平均排名是第20名 ,大大低于经合组织成员国的水平 ,这显然不符合一向以产生学术流派而著称的德国教育的形象 ,德国对此予以了反思。由此 ,人们普遍认为 ,德国在教育制度、 教师培养模式、 教学方式上都必须进行彻底的改革。
三
基于对国际学生评价项目的测评目标、 测评特点的阐述 ,我们试做如下分析。第一 ,国际学生评价项目所检验的仅仅是学生的单项知识或能力 ,还无法为学生的终身学习所必备的技能和知识做全面、 有效的测评。德国的本纳教授认为 ,国际学生评价项目所能检验的仅仅是学生的单项知识或能力 ,而缺乏对学生切换观察问题视角的能力。如学生是否能够以及如何从口头语言角度转向书面语言角度观察问题 ,是否能够从日常数学思维角度解决问题转向从形式数学思维角度解决问题。这些视角转换能力 ,恰恰是进行终身学习的基础 ,而国际学生评价项目并未能就此做出实质性的突破。显然 ,这一评价是中肯的。确实 ,国际学生评价项目吸纳了终身教育思想 ,其评估重点并不在于检验学生是否很好的掌握了学校的常规课程内容 ,而主要是在于评价学生是否作好了应对未来挑战的准备。它选择阅读、 数学、 科学素养的三个领域作为其评估对象 ,认为这是现代生活所必须具备的基本知识和基本技能 ,也是人们应对生活所需的关键能力。但是 ,这一测评是否可以包容终身学习的所有层面 ,或者说对终身学习的能力是否做出其合理且有效的建构 ? 终身教育的概念虽然已经被普遍接受 ,但更多的是作为一种理想而存在 ,而且在大家的认同中 ,有明显的泛化现象 ,从而使原本较为清晰的基本思想变的含混不清。其主要原因是 ,终身教育作为理念容易被人接受 ,但难以将其具体化。如终身学习的能力具体的应包含哪些方面 ,依托于哪些学科来完成 ,其可操作性如何 ,应如何渗透于当代的制度化教育中等等 ,目前仍然不明确。由此 ,我们有理由认为 ,对于终身教育的应用是较为复杂的过程 ,国际学生评价项目基于终身学习的动态模型的建构 ,应有效的对终身学习的具体指标做出回应 ,并以此作为改革制度化教育的指标。这些 ,都有待于我们做出进一步的思考。第二 ,国际学生评价项目仅是为各成员国政府研究制定教育政策提供参照 ,不能作为学校教育质量反馈的重要指标。国际学生评价项目的核心是应对公共政策 ,希望通过