课程标准一致性
课程标准一致性(精选10篇)
课程标准一致性 第1篇
随着教育评价研究领域的不断推进,基础教育学业质量监测成为衡量洞悉课程改革实施质量的重要途径。《国家中长期教育改革和发展规划纲要(2010~2020年)》提出“提高义务教育质量。建立国家义务教育质量基本标准和监测制度。严格执行义务教育国家课程标准……”。各地纷纷开发各种学业监测工具对区域教育质量进行评价,如何保证区域监测工具的科学有效性、其是否体现国家课程标准的思想内容,成为基础教育质量评价的关键问题。因此,开展学业质量监测与课程标准的一致性研究成为当前重要议题。在本研究中,一致性研究特指对学业监测工具与其所依据的课程标准之间的一致性、匹配性程度的研究,属于效度研究范畴。
自20世纪80年代美国发起“由标准驱动并基于标准”的基础教育课程改革,许多研究者和研究机构开始关注并提出学业质量监测与课程标准一致性分析模式,其中以韦伯模式、Achieve模式和SEC模式最具代表性。韦伯模式主要以内容重点为核心,从内容领域一致性、知识深度一致性、知识广度一致性、分布平衡性四个维度评价学业成就测验与课程标准内容要素的匹配程度;[1]Achieve模式主要从向心性、挑战性、均衡性三个方面构建综合性较强的新型“学业评价-课程标准”一致性研究工具。[2][3]SEC模式以计划课程调查(Survey of Enacted Curriculum,简称SEC)数据为基础强调一致性研究的整体化,主要用于进行课堂教学与学业评价之间的一致性比较。[4]此外,威克森模型、斯坦福国际研究所SRI模式、2061计划等也有效弥补各研究工具的实施方法。[5]同时,一致性研究在国际大型测验项目中开始应用,例如TIMSS(国际数学和科学评测趋势项目)于2008年开展“测验-课程”匹配分析,调查TIMSS测验与各国课程的相关程度,及其包含本国课程相关题目的测验对其成绩的影响。[6]
我国自21世纪初借鉴国际理论与实践开展基于标准的学生学业评价以来,[7]逐渐关注学业质量监测与课程标准的一致性研究,主要集中在对国际一致性分析模式的介绍,[8][9][10]以及相应的学科应用研究———既包括学科监测工具与课程标准的一致性分析,[11][12][13]也包括学科教材与课程标准的一致性分析。[14]此外,我国大规模学业成就测验领域也开始应用一致性研究框架分析学业质量监测工具的内容效度状况,例如:北京分别于2002年和2009年从测验内容效度分析的角度,邀请专家开展对初中毕业/升学试卷内容与国家课程标准一致性的研究,以及普通高中会考自主命题学校学科试卷内容与国家课程标准一致性的研究,并将评价结果作为衡量评价工具质量的关键指标之一进行反馈与问责。[6]同时,我国目前正处于考试改革的关键时期,虽然对学业水平考试、高考等关键考试的命题理念和技术有相关的研究和探讨,[16][17]但如何基于一致性分析的实证研究,从中获取有效信息促进我国命题技术改进,成为当前面临的重要议题。
综上所述,目前国内关于一致性的研究大多局限于对某个学科的探索性学术研究,而同时应用于分析比较区域多个学科多套大规模测验内容效度的本土化研究还不多见。本研究即依据国家课程标准,充分借鉴国内外一致性分析的理论与实践,结合我国实际教育教学评价情况,开发本土化一致性分析工具,以更加科学有效地分析学业质量监测与课程标准一致性状况,推动学业质量评价的有效顺利开展。
二、研究方法
(一)研究对象
北京市17个区域小学阶段学业质量监测工具(用于期中或期末考试、区级监测等)共147套,其中语文学科44套,数学学科44套,英语学科43套,科学学科9套,品德与社会学科7套。这些工具均含试题和评分标准,68.7%的工具含有测验框架、细目蓝图和试题分析等内容。
(二)研究工具
借鉴韦伯模式、Achieve模式和SEC模式分析框架,构建学业质量监测与课程标准一致性研究框架(如图1所示)。
基于研究框架编制研究工具,包括试卷内容评定问卷和试题内容评定表。前者从试卷的整体角度,通过命题思想与依据、试卷结构、试题评价、试卷导向性、试卷实效性、试卷学科特色(1)等方面的评定,采用李克特量表的形式,从完全不符合到完全符合五点计分;后者从试题的角度,逐题评定与课程标准内容目标、能力目标的匹配程度,与细目蓝图内容目标、能力目标的匹配程度等,从完全不匹配到完全匹配五点计分。
(三)研究方法与设计
采用专家评价判断法,聘请专家在前期集体培训的基础上,依据国家课程标准及相关命题技术要求等,结合区域教材版本和教育教学实际情况对学业质量监测工具进行逐卷、逐题评价。其中,小学语文、数学、英语学科各18名;小学科学5名;小学品德与社会学科4名。
同时,采用双盲实验设计,即在研究准备阶段对各区域材料进行匿名处理,研究过程中专家不知道所评资料的来源,各区域也不知道由哪位专家评价。
(四)分析方法
采用定量方法通过SPSS20.0对专家评定量表的数据进行描述统计和频次分析;基于各区域评价工具和专家建议,采用质性方法进行文本分析。
三、研究结果分析
(一)总体结果
由表1和图2可以看出,试卷的综合评价达到3.97分,整体处于一般偏上水平。分别来看,试题命制指导思想依据、试卷结构、试题评价、试卷导向性、试卷实效性、试卷学科特色等均在3.90左右,只有试卷导向性偏低(3.77分)。结合专家文本分析可以看出,大多监测工具采用纸笔测查方式,而与课程标准内容要求相符合的实践类测查方式,例如英语听说测试、科学现场实验测试等还未出现。评价形式过于单一,可能是导致评价工具在试题导向性和学科特色维度得分偏低的原因之一。
由表1和图3可以看出,试题与课程标准、细目蓝图的匹配程度均达到4.5分以上,处于较高水平。进一步分析发现,试题与课程标准的匹配程度显著低于与细目蓝图的匹配程度(4.56<4.72,t=-5.032,p<0.01),试题与内容目标的匹配程度显著高于与能力目标的匹配程度(4.67>4.51,t=5.562,p<0.01)。同时,结合专家文本分析来看,有些监测工具存在超过课程标准要求或课程标准未涉及的题目,例如:某区四年级科学质量监测试卷中有道填空题“像大豆,月季,国槐等植物的叶,叶柄上有2片或2片以上的小叶叫___”,考查学生对单叶、复叶的理解。但小学科学课程标准仅要求学生“能说出周围常见植物的名称,并能对常见植物进行简单分类”,而没有关于单叶、复叶的具体要求。
(二)分年级结果
由表2、表3和图4可以看出,从各年级试卷评定结果来看,五、六年级在各维度上得分均较高,且年级越低,维度指标得分越低。从各年级试题评定结果来看,一、三年级学科学业评价工具没有相应的细目蓝图,其余年级学业评价与课程标准的一致性程度随年级增长,即年级越高,一致性程度越高,表明高年级在工具编制上能更好地贯彻国家课程标准的要求。
结合专家文本分析可以看出,高年级学科确实具有一定的命题经验和技巧,在具体题目的命制方面体现了专业性和科学性。某区五年级语文期末学业质量监测试题,借鉴国际大型测验项目PISA的测试理念,结合实际生活经验,考察学生的非连续性文本[18]
另一方面,有些试题对青少年认知思维发展规律重视不足,死记硬背题目偏多,缺乏问题解决等高级思维能力方面的考查。例如:某区六年级品德与社会测试卷共有51道题目,其中39道题目(占76.5%)考查的内容偏于机械记忆,情景的新颖性与生活化程度较低。此外,学科教师的专业化程度,学科测查的熟练程度等也有可能影响监测工具的科学性和一致性。
四、讨论与启示
(一)基于课程标准开发学业质量标准,保证监测工具的一致性
课程标准是贯穿于课程、教材、教学和评价的主轴,是保证学业质量监测科学公平的基础。研究发现,虽然学业质量监测工具与课程标准的匹配程度较高,但较之内容目标,其在能力目标上的匹配程度较低。国内研究也发现了监测工具与课程标准未能完全保持一致,目标领域下的能力水平界定模糊,无具体学业标准可参照等问题。[11][12]具体而言,课程标准体现的是国家对中小学生在各学科领域所应具备的基本素养与要求,是对课程内容的高度概括,是指导整个基础教育系统诸要素(如教材编写、教学、评估和考试命题)改革的依据。[21]考虑到国家课程标准在全国范围内的普适性,且多为分学段目标阐述,有些学科甚至没有明确能力目标的现状,故在省级层面基于地方教学实际对课程标准进行细化尤为迫切。
因此,研究带来的第一个启示是要建立省级学业质量标准。这是落实国家中长期教育改革和发展规划的重要举措,而学业质量标准是指学生在完成各学段基础教育时应该具备的基本素养及其应该达到的具体水平的明确界定和描述。[22]它是依据国家课程标准的目标、内容,以及学生身心发展和认知水平特点所设定的总体和各学科的具体质量指标,是进行学业质量监测与评估的标准参照。[23]
建议各省市在国家课程标准的基础上,根据本省教育发展的实际情况开发学业标准,作为学业监测的直接可操作依据。目前,北京市正开展首都义务教育阶段学业标准研究,研究内容主要包括背景、目的意义、框架说明、内容标准、学业成就水平描述、评价方式、评价样题、教学设计评价示例等方面,同时增加基于实证的数据支撑。[24]此外,也有学者探究采用基于认知诊断的学习进阶方法,开展学业质量标准建立的新途径。[25]这些都能为学业质量标准的开发和建构提供理论和方法学支撑,以使课程标准更好地得到落实和观察,进而保证学业质量监测的科学性和公平性。
(二)规范命题流程,注重框架建设和细目蓝图编制
规范化的命题流程,是学业质量监测结果科学性的基本保证。研究发现,所有监测工具均包含试题和评分标准,但框架、细目蓝图或质量分析等重要内容有部分缺失。31.3%的监测工具没有细目蓝图,且一年级、三年级的监测工具均没有细目蓝图。结合专家文本分析可以看到,有些区域命题环节比较完备,而有些区域仍停留在凑题阶段。国内研究也发现了教育命题流程不完整,命题技术欠缺等现象。[13]
因此,研究带来的第二个启示是建立规范化的命题流程,注重框架建设和细目蓝图编制,保证命题的科学性。命题是一项复杂的多环节系统化工程,题目与试卷是对人的复杂能力进行科学精准测量的工具。国际学者Downing.S依据《教育与心理测试标准》提出测验设计与开发的十二个步骤,[6]国际大型测验项目均有规范化测验开发流程,其中框架和细目蓝图占有重要的基础性地位。国内研究者借鉴国际经验也总结出一套学业水平测验开发的流程,且在命题环节从框架建设到细目蓝图编制、主客观题及评分标准命制、审题、一致性效度分析等关键环节均有明确阐述。[28]另有研究者从基于标准命题的角度,重点关注从双向细目表到测验设计框架,[29]表明框架和细目蓝图已成为命题流程的关键和核心,是保证与课程标准一致的根本和基础。
建议保证命题工作环节的完整性,使命题流程更加完善、科学、规范。成立命题小组,明确职责,杜绝科学性错误,规范化使用图表及语言表述。对于命题制度和流程不规范的区域,建议推行审校制度,尤其关注框架建设和细目蓝图编制环节。此外,一定要保证命题把关的有效性,通过预测试、专家审题、一致性评定、效度研究等技术手段对命题质量进行追踪评价,以全方位保障学业质量监测的有效性。
(三)开展系统化命题培训,全面提升命题技术水平
基于标准的命题能力是教研员和教师应具备的重要专业技能。研究发现,虽然在试题评价维度得分较高,但结合专家文本分析,还存在内容缺乏新意或死记硬背题目较多而考查高级思维能力题目偏少的现象,同时整体测评方式单一,缺乏实践类测试。
因此,研究带来的第三个启示是要开展系统化、专业化的命题培训,将全球学业质量监测命题的成熟经验与实践引入培训课程。学业质量监测属于跨校的大规模考试范畴,题目不仅要体现教育质量评价导向,也应体现国内外在命题方面的发展趋势,特别是在评价内容与方式方面。命题能力作为教研员和教师所应具备的专业技能,除要求教研员和教师掌握一定的理论知识外,更要求进行科学化的实践和应用。
建议依据美国缅因州国家训练实验室研究成果———学习金字塔理论[30]为当前的考试命题改革提供新的思路。
摘要:学业质量监测是否能够体现课程标准的主旨精神,对于教育质量评价方向与结果具有重要影响。借鉴国际一致性分析理论与实践,结合国内实际教育教学状况,开发本土化一致性分析模式,对小学语文、数学、英语、科学、品德与社会等学科学业质量监测工具进行一致性分析,结果表明学业质量监测工具的导向性偏低,且与课程标准的能力目标的匹配程度有待提升。由此得到启示:命题改革是开发基于国家课程标准的学业标准;规范命题流程,注重框架和细目蓝图编制;开展系统化专业命题培训,关注多元评价方式和高级思维能力测查。
课程标准一致性 第2篇
本帖最后由 IsaacZ 于 2010-1-28 16:01 更新
QUOTE: 本版块另一篇教程(普通700M光盘上刻录360分钟VCD视频的方法(KVCD))中有以下解说: 第六步,用nero刻成VCD光盘。
由于kvcd编码的mpeg文件是非标准vcd格式,所以在nero中添加文件时,它会提示“不是建立标准vcd的有效文件”这时要注意,必须选择“关闭标准一致性并继续”,否则活就白干了。后面就可以按照正常流程刻录vcd光盘了。
不过,原文作者撰写此文时使用的可能是旧版NERO,新版的(6.0版以上的)NERO程序已经不能再收到如上提示。那么怎么解决NERO对我们转好的KVCD文件进行强行编码的问题呢?请按如下步骤解决:
1.从开始菜单中打开Nero Burning ROM(不是Nero vision)。
如果你使用 NERO 7.0 以上版本,不要使用 Nero Vision 导入用KVCD模板编码好的MPEG文件,这样你将找不到以下第二步提到的设置选项。
注意!下图中不要点“制作视频光盘”,它可能会把你带到NERO VISION中去。
2.在“新编辑”对话框中点一下左边的“Video CD”,然后右边的标签中第一个标签变成Video CD。此标签上的第一个勾选框名称为“创建标准兼容光盘”,请把原来打上的勾去掉。然后右上角点一下“NEW”。
汉化得比较完整的NERO版本可能是以下界面:
3.接下来的工作就是添加文件,此时NERO将不再强行对非标准VCD编码的MPEG-1文件进行重新编码。
4.问题解决!
课程标准一致性 第3篇
摘要:学业评价与课程标准一致性问题一直是教学评价领域研究的关注点。采用美国学者波特提出的SEC模式,通过量化分析方法的研究表明,2015年江苏省高考政治试题在内容主题分布上与《普通高中思想政治课程标准(实验)》一致性不够,在部分领域存在明显的差异性。考试评价要与课程标准保持一致,应树立课程标准意识,明确考试评价功能,构建一致性评价标准。
关键词:高考;政治;试题;课程标准;一致性;SEC模式
中图分类号:G632.474 文献标志码:A 文章编号:1673-9094(2016)01A-0056-05
国家课程标准是我国新一轮课程改革的重要文件,是我国素质教育在相应阶段的质量标准,“是教材编写、教学、评估和考试命题的依据,是国家管理和评价课程的基础”[1]。但国家课程标准本身只是一种政策性文本,并不能确保我们的教育教学实践与学业评价就能严格依据国家课程标准而展开。只有当学业评价与课程标准相一致的时候,教学才能很好地贯彻课程标准,达成课改目标。高考作为学生学业评价的重要组成部分,其试题内容与国家课程标准是否一致?一致性水平如何?考试评价是否符合国家课程标准的理念,是否贯彻了课程标准的要求?……这些都成为大家关注的问题,同时也是评价新课程实施情况的重要指标。基于这样的认识,本文选择2015年江苏省高考政治试题与《普通高中思想政治课程标准(实验)》(以下简称课程标准)作为研究对象,力图通过量化分析,探究两者间的一致性水平,以期促进高中思想政治课改的推进与深化。
一、研究模式与方法的选择
研究结论一般与研究模式及其方法的选择之间存在逻辑上的关联性,选择不同的研究模式与方法,研究结论也会有所不同。因此,研究模式及其方法的选择对研究活动及结论的获取具有重要影响。
(一)研究模式
研究高考试题内容与课程标准的一致性问题,需要通过统计学意义上可接受的量化指标来衡量课程标准与测验项目之间的一致性程度。在国际上,基于课程标准的学业评价研究中,较有代表性的一致性研究模式主要有Webb模式、SEC模式、Achieve模式等三种。本研究采用美国学者波特(Porter)于2002年提出的SEC模式,又称“二维矩阵法”[2],从内容主题与认知水平两个维度来衡量高考试题和课程标准之间的一致性程度。
(二)研究方法
研究方法是人们在研究中发现新事物或提出新理论,揭示事物内在规律的手段。根据研究手段的不同,研究方法有定性研究与定量研究之分。在我国高考试题分析研究中,以往的研究者主要从命题理念、试题特点及其结构等几个方面进行定性研究,少有学者采用统计学意义上的信度、效度、区分度、标准差等指标进行定量研究。本研究选择2015年江苏省高考政治试题(共同必修部分)与课程标准作为分析对象,尝试采用SEC模式下的定量分析方法探究高考试题与课程标准之间的一致性水平。
SEC模式下的分析需要将高考试题与课程标准采用相同的方法编码到一个“内容主题×认知水平”的二维矩阵中。对两个二维矩阵表格中的单元格赋值后进行的系统计算结果即为任意两个变量之间的一致性。为保证变量之间的可比性,需要对每个单元格赋值进行总和为1的比值的标准化处理,之后根据SEC模式下的波特一致性系数计算课程标准与高考试题之间的一致性水平,其中波特一致性系数P的数学计算公式为:1-■。在波特一致性系数P的数学计算公式中,n表示矩阵中的单元格数,i表示矩阵中某一指定单元格,1≤i≤n。Xi表示矩阵X中的第i个值,Yi表示矩阵Y中的第i个值。波特一致性系数P的数值介于0和1之间,P=0时,表示两者间不存在一致性,也即两者间差异性最大,P=1时,表示两者间的一致性达到完美水平,即一致性水平最高。
二、具体研究流程
(一)内容与认知水平的分类
本文采用SEC模式的通用编码框架,即“内容主题×认知水平”二维矩阵对课程标准和2015年江苏省高考政治试题进行编码。编码之前,首先需要完成对内容主题和认知水平的分类。
根据课程标准,将内容主题分为十六个领域:生活与消费;生产、劳动与经营;收入与分配;发展社会主义市场经济;公民的政治生活;为人民服务的政府;发展社会主义民主政治;当代国际社会;文化与生活;文化传承与创新;中华文化与民族精神;发展中国特色社会主义文化;生活智慧与时代精神;探索世界与追求真理;思想方法与创新意识;认识社会与价值选择。
《江苏省普通高中思想政治课程标准教学要求(修订稿)》是根据《普通高中思想政治课程标准(实验)》,并结合江苏省的教学实际,为教师教学制定的一份指导性文件。在深入阅读《江苏省普通高中思想政治课程标准教学要求(修订稿)》的基础上,研究者将知识与技能的认知水平分为三个层次:了解水平、理解水平、应用水平,具体分类如表1所示。
(二)内容与认知水平的编码
在确定内容主题与认知水平分类之后,研究者开始对课程标准和高考政治试题进行编码。
1.课程标准编码
编码者为两位学科教学(思政)专业教育硕士。两人分别对课程标准从内容主题和认知水平两个维度进行编码,编码结束后用SPSS18.0软件对得到的编码数据结果进行信度分析,计算得出斯皮尔曼相关系数为0.965,说明本次研究具有良好的一致性。
编码以课程标准中的条款数目为计量单位,对“内容主题×认知水平”的二维矩阵的每个单元格进行赋值,得到表2。
对表2中的数据进行标准化处理,得到表3。
2.高考政治试题编码
与上述编码方法类似,本文对2015年江苏省高考政治试题的分析是将每一道试题按其参考答案所设定的分值,以及对课程标准编码时采用的编码标准,分析试题内容所对应的内容主题,从内容主题与认知水平两个维度,将高考政治试题编码到“内容主题×认知水平”的16×3的矩阵中得到表4。然后与上述方法类似,对其进行标准化处理,以便与课程标准矩阵进行比较。endprint
对表4中的数据进行标准化处理得到表5。
3.计算波特一致性系数
根据表3和表5的数据以及波特一致性系数计算公式,得出P=0.448,表明2015年江苏省高考政治试题与课程标准在统计学意义上一致性不显著。
三、研究结果与数据分析
研究发现,波特一致性系数P反映的是高考试题与课程标准在内容主题及认知水平之间的绝对差值,并没有很好地说明试题考核的内容与课程标准中的内容标准相比是多还是少,也没有说明试题考察的认知水平与课程标准提出的认知要求相比是高还是低。为了更为深入地比较分析,研究者通过直观的图形从内容主题与认知水平两个方面进行具体说明。
(一)高考试题与课程标准间的内容主题比较
从图1中可以看出,整体上,2015年江苏省高考政治试题内容主题强调“探索世界与追求真理”“思想方法与创新意识”这2个领域,而课程标准则强调“发展社会主义民主政治”“思想方法与创新意识”这2个领域。2015年江苏省高考政治试题与课程标准在“当代国际社会”“文化传承与创新”“发展中国特色社会主义文化”这3个领域上比较一致。
我们还发现,2015年江苏省高考政治试题考察的内容主题所占比例明显超过课程标准内容主题所占比例的领域有“发展社会主义市场经济”“公民的政治生活”“为人民服务的政府”“探索世界与追求真理”“思想方法与创新意识”“认识社会与价值选择”这6个领域。2015年江苏省高考政治试题考察的内容主题所占比例明显低于课程标准内容主题所占比例的领域有“生活与消费”“生产、劳动与经营”“收入与分配”“发展社会主义民主政治”“文化与生活”“生活智慧与时代精神”这6个领域。总体说明,2015年江苏省高考政治试题在内容主题分布上与课程标准的一致性程度不强,且在部分领域存在着明显的差异性。
(二)高考试题与课程标准间的认知水平比较
从图2中可以看出,2015年江苏省高考政治试题的认知水平强调“理解”,而课程标准的认知水平则强调“了解”和“理解”。2015年江苏省高考政治试题与课程标准在“应用”这一认知水平上比较一致。课程标准在“了解”这个认知水平上所占比例最高,而2015年江苏省高考政治试题在这一认知水平上几乎为0,但在“理解”这一认知水平上远远超过了课程标准的要求。总体上看,2015年江苏省高考政治试题与课程标准在认知水平上的契合度不明显,且高考试题考察的认知水平有明显的超标趋势,针对课程标准三维目标中的过程与方法、情感态度与价值观目标的检测不够到位。
四、思考与讨论
本次研究的目的不是要分辨高考政治试题质量的好与坏,而是希望为新课程改革背景下的思想政治课教学与考试评价工作提供参考。研究结果显示,2015年江苏省高考政治试题与课程标准之间的一致性水平不显著,表明在考试评价与课程标准保持一致,且在推动课程教学贯彻落实课程标准的理念和策略上还需多方面努力的。
(一)树立课程标准意识,增强高考试题的科学性
研究结果显示,2015年江苏省高考政治试题在内容主题分布上与课程标准一致性不够,在部分领域存在明显的差异性。众所周知,考试评价是一线教师开展教学的“风向标”。一份高考试题中的内容分布对教师教学工作的影响不仅会表现在高三的复习课,同时也会影响到高一、高二教学中重点的确定以及由此而产生的课时的划分。如果高考试题在内容主题分布比例上与课程标准偏离到一定程度,就会误导一线教师,导致其在课堂教学中让学生反复练习个别内容主题,忽视其他内容主题的学习,不利于课程标准的贯彻落实。
此外,2015年江苏省高考政治试题在认知性学习目标上,理解和应用水平均超过课程标准的水平,尤其以理解水平最为明显,这反映了2015年江苏省高考政治试题在认知水平上有向高处发展的趋势。这势必会导致一线教师在实际教学中会相应地提高教学内容的认知水平,给学生的学习带来不必要的负担。实现学业评价与课程标准的一致,要求高考试题的命题者在试题的内容选择与认知水平上要充分考虑课程标准的具体要求,强化执行课程标准的意识,进而通过高考试题的达标准性来引导一线教师真正实施基于课程标准的教学。
(二)明确考试评价功能,促进三维目标均衡发展
透过数据,我们发现无论是课程标准还是2015年江苏省高考政治试题在三种不同认知水平的分布上较不平衡。在课程标准的认知性学习目标中,以了解水平和理解水平为主,而应用水平较少。2015年江苏省高考政治试题在认知性学习目标中,了解水平几乎没有,主要集中在理解水平,其次是应用水平。两者在应用水平的要求上较低,对学生运用、分析、创造水平的考察较少,未能充分体现新课改的三维目标。
高考通过纸笔测验的方式进行,检查学生对知识掌握的情况,对较高认知水平的检测具有一定的局限性。新课改倡导发展性评价理念,强调终结性评价应建立在形成性评价的基础上,与形成性评价相结合,才能保证评价的真实性、准确性与全面性。思想政治学科学业评价应转变纸笔测验的单一评价方式,构建多元评价机制,将高考成绩与平时的社会实践有机结合,并合理分配平时成绩与高考成绩的比例,全面考察学生的分析、创造和运用水平,促进学生知识、能力及情感、态度与价值观三维目标的均衡发展。
(三)构建一致性评价标准,实现评价模式的本土化
本研究借助SEC模式,从内容主题与认知水平两个维度,通过定量研究考察2015年江苏省高考政治试题与课程标准之间的一致性,研究过程较为顺利,研究结论也是可信的。国内学者刘恩山[3]和王磊[4]的相关实证研究也证明了该模式的有效性。定量研究是现代科学的重要特征,此种研究模式为以后的国际比较乃至我国课程改革等研究提供了重要范式。而我国在试题分析的研究中恰恰欠缺更为有效的定量分析模型以及相应的分析手段。国际上开发的一致性评价标准的成果和经验,为我国研究如何依据国家课程标准改进学业评价提供了新的路径。基于课程标准的学业评价,说明国家课程标准在教学活动中占有重要地位,课程标准不是一个口号意义上的概念,而是一个实质意义上的评价工具。因此,学术界应该积极进行基于课程标准的学业评价模式的本土化研究,为检测学业评价的有效性提供科学的方法与手段。endprint
基于课程标准的学业评价旨在落实教育领域的规则意识,也是我国“依法治国”理念在教育领域的具体表现。在呼唤基于课程标准的学业评价的今天,形成基于课程标准的学业评价的意识并不困难,让基于课程标准的学业评价进入决策层面也较为容易,但真正的要在实践中落实基于课程标准的学业评价,就需要将课程标准置于课程体系的核心地位,真正发挥课程标准的纲领性指导作用,实现有“标”可依、有“标”必依、执“标”必严、违“标”必纠。希望通过本研究,我们对高考试题与课程标准能有更加直观和可信的认识,树立课标意识,执行课程标准,推进新课改革背景下的高中思想政治课教学和考试评价的有序、有信、有效、有度!
参考文献:
[1]中华人民共和国教育部.基础教育课程改革纲要(试行)[DB/OL].http://www.moe.edu.cn/publicfiles/business/htmlfiles/moe/moe_309/200412/4672.html.
[2]Porter, A. C. Measuring the content of instruction: Uses in research and practice .Educational Researcher,2002,31(7):3-14.
[3]刘恩山,卢群,张颖之.2010年高考生物试题与课程标准的一致性分析[J].基础教育课程,2010(9).
[4]王磊,黄琼,刘东方.中考命题与化学课程标准的一致性研究[J].基础教育课程,2010(3).
责任编辑:杨孝如
Research on Consistency between 2015 Jiangsu CEPE
and Curriculum Criterion: SEC Mode
PU Xiang & GONG He-fa
(School of Politics and Public Administration Suzhou University, Suzhou 215123, China)
Abstract: Consistency between academic assessment and curriculum criterion has always been the focus of teaching evaluation research. This author employs the mode of SEC by American scholar Porter to conduct quantitative research on the consistency between 2015 Jiangsu College Entrance Politics Examination (CEPE) and curriculum criterion, finding that they two lack consistency in content, and in some area there exists significant difference. To achieve the consistency between them, we should establish the awareness of curriculum criterion, clarify the function of exam evaluation, and construct consistent criterion of evaluation.
课程标准一致性 第4篇
一、研究方法
1. 一致性分析模型
本研究采用SEC模型[1]从内容匹配和认知程度匹配两个维度来检验课程标准和高考试题之间的一致性。研究者将课程标准和高考试题用相同的方法分别编码到一个“内容标准×认知要求”的二维矩阵中。为了使两个矩阵具有可比性, 将表格中所有数据都进行标准化处理, 即进行归一化处理。将所得数据代入波特一致性指数计算公式:
其中, n是每个表格的单元格数;i代表的是表格中一个具体的单元格, 范围是1到n。例如, 对于一个3×10的表格, 总共有30个单元格, 则n=30。Xi代表的是X表格中第i个单元格的数值 (X表格为内容标准的表格) ;Yi代表的是Y表格中的第i个单元格的数值 (Y表格为高考试题的表格) 。一致性系数P的范围是0到1。P=0表示差异性最大, P=1表示完全一致。
2. 研究对象
本研究以浙江省近四年 (2009、2010、2011、2012年) 高考理综化学试题中“化学反应原理”模块为研究对象。需要说明的是浙江省高考采取理科综合的方式, 有关化学的试题数并不多, 涉及“化学反应原理”则更少。因此, 本研究没有将每年“化学反应原理”试题作为单位研究对象, 因为这样势必会有较大误差, 而是将四年“化学反应原理”试题作为一个整体进行研究。
3. 编码框架
编码框架依据内容主题和认知要求两个维度建立, 构成“内容主题×认知要求”矩阵。在进行高考化学试题和课程标准编码前, 需要对内容主题和认知要求进行分类。因课程标准中有关化学反应原理的内容标准描述过于笼统, 本研究参照苏教版高中化学教材[2]、省学科教学指导意见[3], 将高中化学反应原理内容划分为化学反应热效应、化学能与电能、金属腐蚀、化学反应速率、化学反应方向与限度、化学平衡移动、弱电解质电离平衡、溶液的酸碱性、盐类的水解、沉淀溶解平衡等10个主题。
依据考试说明对各部分知识内容要求的程度, 将认知水平要求划分为了解、理解 (掌握) 、综合应用三个层次。其中了解对应于课程标准中知道、说出、识别、描述、举例、列举、区分、比较等行为动词;理解 (掌握) 对应于课程标准中解释、说明、判断、分类、归纳、概述等行为动词;综合应用对应于课程标准中应用、设计、评价、优选、解决等行为动词。[4]
4. 编码结果
(1) 课程标准的编码结果
课程标准的编码由两位教师完成。表1为课程标准化学反应原理知识编码结果。
在此基础上, 我们计算各内容主题在课程标准化学反应原理知识中的比率, 如表2所示。
(2) 高考“化学反应原理”试题的编码结果
高考“化学反应原理”试题的知识点编码由两位教师独立完成。对编码结果进行信度分析, 计算编码的相关系数为0.79 (P<1.000) , 说明编码具有良好的内部一致性, 对分歧点一一进行讨论。知识点的编码完成之后, 把对应的分值填入相应的表格中, 然后将每个单元格的分值除以总分值, 得到结果如表3所示。
二、研究结果与数据分析
1.“化学反应原理”试题与课程标准间一致性的总体比较
以表2的数据作为基准, 将表3中的比率数值减去表2中相应单元格的数值, 就可以获得高考试题与课程标准有关化学反应原理知识的比率差异, 见表4。
注:“↑”表示比率增加, “↓”表示比率下降
利用一致性公式计算得到“化学反应原理”试题与课程标准间的一致性系数为0.57, 而95%水平的P参考值为0.63, 高考试题与课程标准的一致性指数低于95%水平的P参考值, 表明高考试题与课程标准之间不存在统计学意义上的显著一致性[4]。
从表2可以看出, 课程标准中所占比例较大的为化学反应热效应、化学能与电能、盐类水解等内容主题, 金属腐蚀、沉淀溶解平衡等内容主题所占的比例较小。从表3来看, “化学反应原理”试题中所占比例较大的为化学能与电能、化学反应方向与限度、沉淀溶解平衡等内容主题。相反, 化学反应热效应、盐类水解等内容主题在近四年高考化学试题中所占的比重较小。表4显示, 在化学反应速率、溶液的酸碱性等主题上高考“化学反应原理”试题与课程标准之间的差别较小, 是试题与课程标准比较一致的内容主题。但在化学能与电能、沉淀溶解平衡等主题上, 高考“化学反应原理”试题与课程标准之间的差异比较大, 是试题与课程标准差异较大的部分。
2.“化学反应原理”试题与课程标准间内容主题知识广度比较
知识广度即知识点的数量和范围, 是直接影响课程标准与化学试题之间一致性的主要因素。从表2、表3可以看出, 在主题范畴上高考“化学反应原理”试题并未涉及课程标准规定外的学习内容, 与课程标准有较高程度的一致性。在知识点所占比重上, 高考“化学反应原理”试题与课程标准在化学能与电能、弱电解质电离平衡、盐类的水解等内容主题上基本一致, 相差不大;化学反应的热效应、金属腐蚀、溶液的酸碱性等内容主题在课程标准中所占的比重要大于在高考“化学反应原理”试题所占的比重, 例如金属腐蚀在课程标准中共有7个知识点, 而在近几年的高考试题中仅在选择题选项中出现过1次;而化学反应方向与限度、化学平衡移动、沉淀溶解平衡等内容主题在高考“化学反应原理”试题中所占的比重要大于其在课程标准中所占的比重, 例如沉淀溶解平衡的知识点所占比重较小, 但其在近四年的高考化学试题中年年出现, 而且所占的分值也较多。
3.“化学反应原理”试题与课程标准间内容主题认知比较
除了知识点的数量和比重之外, 课程标准与高考“化学反应原理”试题对各知识点的认知要求也是影响两者之间一致性的重要因素。研究结果表明:课程标准与高考“化学反应原理”试题在认知要求上的一致性程度还是比较高的, 达到了0.79左右;与课程标准相比, 高考“化学反应原理”试题认知要求降低的比重为0, 而认知要求拔高的比重却占到0.21左右。认知要求拔高的内容主题主要为弱电解质电离平衡、沉淀溶解平衡。
三、讨论
1. 关于高考试题内容的分布
从高考“化学反应原理”试题与课程标准一致性情况来看, 试题与课程标准之间的不一致主要问题在于高考考查内容分布不均:在课程标准中所占比例较大的为化学反应热效应、化学能与电能、盐类水解等内容主题, 而高考“化学反应原理”试题所占比例较大的为化学能与电能、化学反应方向与限度、沉淀溶解平衡, 而化学反应热效应、金属腐蚀、盐类水解则涉及较少, 特别是金属腐蚀近四年只考查过一次。可以看出, 某些内容的考查如化学平衡常数、沉淀溶解平衡几乎每年被考查, 受到命题者的青睐。从知识本身来看, 重要性程度本应是没有区别的, 课程标准对知识的重要性程度也没有特别说明。如果高考试题内容分布与课程标准的要求偏离较大, 会导致教师在教学中反复让学生练习占据较大比重的内容主题的题目, 而教学总课时是一定的, 这样势必会给课程标准规定内容的真正落实打了折扣, 期望能够引起命题者的重视。
2. 关于高考试题的认知要求
从认知水平的要求上来看, 高考化学试题与课程标准能够保持较高程度的一致性。因考试大纲是高考命题的直接依据, 所以研究者也查阅了考试说明。以沉淀溶解平衡为例, 考试说明要求“了解难溶电解质的沉淀溶解平衡, 了解溶度积的含义”, 认知水平也为“了解”, 而从表3中可以看出, 有相当一部分“沉淀溶解平衡”的试题认知要求达到“理解”, 要求学生能够运用溶度积常数进行相关计算和判断, 考试说明与高考试题的认知要求出现了偏差, 偏差的出现或许可以用考试说明中“以上各部分知识的综合应用”得到解释。[6]但笼统的表述会给一线教师的教学带来不利的影响, 到底要教到什么程度?这一问题的根源在于课程标准、省学科指导意见、考试说明等文件重在对知识本体的描述, 忽略对学生行为的描述, 导致命题者难以把握认知水平。而教师为了使学生取得较好的成绩, 只能提高教学要求, 给学生的学习带来了不必要的沉重负担。由此可见, 如何加强课程标准对考试命题指导的可操作性是一个亟待解决的问题。
四、研究结论
本研究表明, 浙江省新课程高考化学试题“化学反应原理”内容与课程标准之间具有较好一致性, 特别是没有出现严重的深广度超标现象, 发挥了课程标准标准化、规范化的作用, 体现了高考命题的严肃性、科学性。但是我们也应注意到, “化学反应原理”高考试题与课程标准在内容主题的侧重上出现较大程度的差异性, 且部分内容主题的认知要求过高, 不利于教师主题内容教学时间的分配和深度把握。
参考文献
[1]PORTER A C.How SEC measures alignment[J].Educational Researcher, 1997 (5) .
[2]王祖浩.普通高中化学课程标准实验教科书.化学反应原理[M].南京:江苏教育出版社, 2009.
[3]浙江省普通高中新课程实验工作专业指导委员会.浙江省普通高中新课程实验化学学科教学指导意见[M].杭州:浙江教育出版社, 2010.
[4]LIU X, ZHANG B H&LIANG L.Alignment between the physics content standard and the standardizedtest:comparisonamongUS-NY, Singapore and China—Jiangsu[J].Science Education, 2008, 22 (12) .
课程标准一致性 第5篇
一、研究方法
在教育测量与评价领域,目前国内外一致性研究的主要工具有韦伯、Achieve、SEC(Survey Of Enacted Curriculum)等分析方法。为能在难度、广度和深度上更直观地反映研究结果并适应我国教育情况,本文拟采用我国学者史宁中等提出的难度模型进行量化研究。
孔凡哲等认为影响课程难度的基本要素至少有三个:课程深度、课程广度和课程时间。其中,课程深度泛指课程内容所需要的思维的深度,课程广度指课程内容所涉及的范围和领域的广泛程度,可用通常所说的“知识点”多少进行量化;课程时间指课程内容完成所需时间,可用通常所说的“课时”多少进行量化。他们提出的课程难度量化模型得到许多学者的认同,本文也认可用课程深度、课程广度和课程时间来确定课程难度。
公式:N=αS/T +(1- α)G/T。其中,α满足0<α<1,称为加权系数,反映课程对于“可比深度”或“可比广度”的侧重程度。N表示课程难度,S表示课程深度,G表示课程广度,T表示课程时间。S/T和G/T分别称之为“可比深度”和“可比广度”。考虑基础教育课程基础性、普及性和发展性的要求,系数α应取0.5为宜,即课程不宜过广过浅,也不宜过窄过深。
本文对上述模型进行一定的修订以适应地理课程活动部分的量化需要。α取值为0.5;S课程深度本文用布鲁姆教育目标分类学修订版中的分类学表对活动要求进行赋分,对知识点进行分类然后赋分。对知识类别分别赋1~4分,认知过程类别分别赋1~6分,然后两者相加即得到一个知识点所得分值(表1);T为课程进行时间;G则是每个活动所涉及的知识点个数。
二、研究样本
根据分析,在人教版教材众多栏目中,“读图思考”、“活动”、“问题研究”等栏目具有活动意义,所以将对这些栏目与课标“活动建议”部分的难度、广度、深度等维度进行一致性分析(表2)。
三、计算与讨论
经统计和计算,课标“活动建议”的深度值得分为110,共14个活动(第7个活动分属3个知识点,分3个活动进行),涉及16个知识点。教材活动深度值得分为281分,共53个活动,涉及44个知识点。
由于活动课程时间在现阶段并没有统一的规定,故在此采用估值。利用人教版教师用书建议的课时数(36课时)与教材活动所占课文篇幅确定教材活动的课程时间,经估算,展开教材活动的课程时间约为15课时。同样,利用课程标准规定的必修1课时数与活动建议所占内容标准篇幅确定活动建议所需课程时间,经估算开展活动建议的课程时间约为13课时。
根据公式,课标“活动建议”的难度值为N课标= 0.5×(110/13+16/13)=4.85。教材活动的难度值为N教材=0.5×(281/15+44/15)=10.83(表3)。
从表3分析可知,课程标准的活动建议与教材中实际编写的活动在难度、广度、深度等维度存在差异,教材活动在三个维度的比较上几乎都高于课标一倍多。因此,从课程难度视角,课程标准的活动建议与教材活动编写的一致性存在一定程度的差异。
课标指出,在建立教科书内容结构时,需要理解课程标准与教科书的不同。课程标准给出的是高中阶段地理课程的宏观框架、必学内容和学习标准,在此基础上编写的教科书可以有不同的结构。钟启泉和崔允漷教授则形象地称课程标准是“下要保底,上不封顶”。由此可看出,人教版必修1教材基本以课标为依据,在可比深度、可比广度和难度上达到了保底但不封顶的要求。
四、原因分析
教材活动编写秉承以课标为指导的思想,既忠于课标又高于课标。在满足所有学生最低发展的基础上,还为学生的不同学习需求满足了条件。
可比广度:因人教版教材的活动承担一部分课文正文的职能,不仅体现能力训练也为学生提供知识来源。从表1可知,教材具有活动意义的栏目达53个,不仅覆盖了课标活动建议里几乎所有内容,有些知识点教材也以活动栏目出现。所以活动在广度(知识点)上会比课程标准高。
可比深度:“活动建议”部分是这次课程改革的一个亮点,目的是为了改变以往以接受为主的学习方式,为培养学生的地理技能提供了一个很好的平台。相对于以接受为主的课文正文知识,活动栏目则在积极引导学生自主探究和发现,学生限于已有的知识水平和学习习惯,活动栏目更具挑战性,属于较高层次的认知水平。
整体难度:从整体难度看,活动建议采取的是“窄而深”的建议方式,活动数量较少,涉及的知识点也不多,但要求比较高。教材则是“广且深”的编写方式,活动栏目较多,很多知识点也以活动的方式呈现,其中有些活动要求也很高。所以,虽然两者课时数相当,教材这种“广且深”的编写方式在难度值上更胜一筹。
五、反思
首先,虽然教材活动的课标广度比活动建议高出一倍多,所覆盖的知识点远远多于课程标准活动建议的要求,但同时也要看到,教材并没有完全符合课程标准的要求,有几个知识点没有包含进去。特别值得一提的是关于自然灾害部分,人教版必修教材在正文和活动里都没有体现,而自然灾害知识是为了满足学生的生存需要,尤其在我国多灾多难的国情背景下。这种情况何以体现“培养现代公民必备的地理素养”的课改理念?又何以体现地理学科的价值?基于这样的考虑,自然灾害部分可考虑在必修教材中增设。
其次,教材活动难度值如此之大,教材活动承担课文功能,但是所安排的课时却没有因此增加。活动形式虽好,但是没有时间保证,很多教师都不敢贸然在活动上下功夫,导致很多活动流于形式未真正发挥它应有的功能。所以,编写教材活动时应协调好课时与活动的矛盾。
课改背景下的教材编写体制倡导“一标多本”,以满足不同地区不同学生群体的多样化学习需求。在此背景下,课程标准对教材的编写起着指挥棒的作用,课改颁布的课程标准在“教科书编写建议”中明确指出:“地理教科书的编写,应以地理课程标准为依据。”在课程标准里增加“活动建议”是本次课程改革的亮点之一,也是课改理念的重要体现之处。所以,研究课程标准中“活动建议”与教材活动的一致性具有重要意义。本文从难度视角出发,对人教版高中地理必修1的活动部分与课程标准中活动建议部分的一致性问题进行研究,考查两者的契合度,并对结果进行原因分析以及对教材编写略作讨论。
一、研究方法
在教育测量与评价领域,目前国内外一致性研究的主要工具有韦伯、Achieve、SEC(Survey Of Enacted Curriculum)等分析方法。为能在难度、广度和深度上更直观地反映研究结果并适应我国教育情况,本文拟采用我国学者史宁中等提出的难度模型进行量化研究。
孔凡哲等认为影响课程难度的基本要素至少有三个:课程深度、课程广度和课程时间。其中,课程深度泛指课程内容所需要的思维的深度,课程广度指课程内容所涉及的范围和领域的广泛程度,可用通常所说的“知识点”多少进行量化;课程时间指课程内容完成所需时间,可用通常所说的“课时”多少进行量化。他们提出的课程难度量化模型得到许多学者的认同,本文也认可用课程深度、课程广度和课程时间来确定课程难度。
公式:N=αS/T +(1- α)G/T。其中,α满足0<α<1,称为加权系数,反映课程对于“可比深度”或“可比广度”的侧重程度。N表示课程难度,S表示课程深度,G表示课程广度,T表示课程时间。S/T和G/T分别称之为“可比深度”和“可比广度”。考虑基础教育课程基础性、普及性和发展性的要求,系数α应取0.5为宜,即课程不宜过广过浅,也不宜过窄过深。
本文对上述模型进行一定的修订以适应地理课程活动部分的量化需要。α取值为0.5;S课程深度本文用布鲁姆教育目标分类学修订版中的分类学表对活动要求进行赋分,对知识点进行分类然后赋分。对知识类别分别赋1~4分,认知过程类别分别赋1~6分,然后两者相加即得到一个知识点所得分值(表1);T为课程进行时间;G则是每个活动所涉及的知识点个数。
二、研究样本
根据分析,在人教版教材众多栏目中,“读图思考”、“活动”、“问题研究”等栏目具有活动意义,所以将对这些栏目与课标“活动建议”部分的难度、广度、深度等维度进行一致性分析(表2)。
三、计算与讨论
经统计和计算,课标“活动建议”的深度值得分为110,共14个活动(第7个活动分属3个知识点,分3个活动进行),涉及16个知识点。教材活动深度值得分为281分,共53个活动,涉及44个知识点。
由于活动课程时间在现阶段并没有统一的规定,故在此采用估值。利用人教版教师用书建议的课时数(36课时)与教材活动所占课文篇幅确定教材活动的课程时间,经估算,展开教材活动的课程时间约为15课时。同样,利用课程标准规定的必修1课时数与活动建议所占内容标准篇幅确定活动建议所需课程时间,经估算开展活动建议的课程时间约为13课时。
根据公式,课标“活动建议”的难度值为N课标= 0.5×(110/13+16/13)=4.85。教材活动的难度值为N教材=0.5×(281/15+44/15)=10.83(表3)。
从表3分析可知,课程标准的活动建议与教材中实际编写的活动在难度、广度、深度等维度存在差异,教材活动在三个维度的比较上几乎都高于课标一倍多。因此,从课程难度视角,课程标准的活动建议与教材活动编写的一致性存在一定程度的差异。
课标指出,在建立教科书内容结构时,需要理解课程标准与教科书的不同。课程标准给出的是高中阶段地理课程的宏观框架、必学内容和学习标准,在此基础上编写的教科书可以有不同的结构。钟启泉和崔允漷教授则形象地称课程标准是“下要保底,上不封顶”。由此可看出,人教版必修1教材基本以课标为依据,在可比深度、可比广度和难度上达到了保底但不封顶的要求。
四、原因分析
教材活动编写秉承以课标为指导的思想,既忠于课标又高于课标。在满足所有学生最低发展的基础上,还为学生的不同学习需求满足了条件。
可比广度:因人教版教材的活动承担一部分课文正文的职能,不仅体现能力训练也为学生提供知识来源。从表1可知,教材具有活动意义的栏目达53个,不仅覆盖了课标活动建议里几乎所有内容,有些知识点教材也以活动栏目出现。所以活动在广度(知识点)上会比课程标准高。
可比深度:“活动建议”部分是这次课程改革的一个亮点,目的是为了改变以往以接受为主的学习方式,为培养学生的地理技能提供了一个很好的平台。相对于以接受为主的课文正文知识,活动栏目则在积极引导学生自主探究和发现,学生限于已有的知识水平和学习习惯,活动栏目更具挑战性,属于较高层次的认知水平。
整体难度:从整体难度看,活动建议采取的是“窄而深”的建议方式,活动数量较少,涉及的知识点也不多,但要求比较高。教材则是“广且深”的编写方式,活动栏目较多,很多知识点也以活动的方式呈现,其中有些活动要求也很高。所以,虽然两者课时数相当,教材这种“广且深”的编写方式在难度值上更胜一筹。
五、反思
首先,虽然教材活动的课标广度比活动建议高出一倍多,所覆盖的知识点远远多于课程标准活动建议的要求,但同时也要看到,教材并没有完全符合课程标准的要求,有几个知识点没有包含进去。特别值得一提的是关于自然灾害部分,人教版必修教材在正文和活动里都没有体现,而自然灾害知识是为了满足学生的生存需要,尤其在我国多灾多难的国情背景下。这种情况何以体现“培养现代公民必备的地理素养”的课改理念?又何以体现地理学科的价值?基于这样的考虑,自然灾害部分可考虑在必修教材中增设。
其次,教材活动难度值如此之大,教材活动承担课文功能,但是所安排的课时却没有因此增加。活动形式虽好,但是没有时间保证,很多教师都不敢贸然在活动上下功夫,导致很多活动流于形式未真正发挥它应有的功能。所以,编写教材活动时应协调好课时与活动的矛盾。
课改背景下的教材编写体制倡导“一标多本”,以满足不同地区不同学生群体的多样化学习需求。在此背景下,课程标准对教材的编写起着指挥棒的作用,课改颁布的课程标准在“教科书编写建议”中明确指出:“地理教科书的编写,应以地理课程标准为依据。”在课程标准里增加“活动建议”是本次课程改革的亮点之一,也是课改理念的重要体现之处。所以,研究课程标准中“活动建议”与教材活动的一致性具有重要意义。本文从难度视角出发,对人教版高中地理必修1的活动部分与课程标准中活动建议部分的一致性问题进行研究,考查两者的契合度,并对结果进行原因分析以及对教材编写略作讨论。
一、研究方法
在教育测量与评价领域,目前国内外一致性研究的主要工具有韦伯、Achieve、SEC(Survey Of Enacted Curriculum)等分析方法。为能在难度、广度和深度上更直观地反映研究结果并适应我国教育情况,本文拟采用我国学者史宁中等提出的难度模型进行量化研究。
孔凡哲等认为影响课程难度的基本要素至少有三个:课程深度、课程广度和课程时间。其中,课程深度泛指课程内容所需要的思维的深度,课程广度指课程内容所涉及的范围和领域的广泛程度,可用通常所说的“知识点”多少进行量化;课程时间指课程内容完成所需时间,可用通常所说的“课时”多少进行量化。他们提出的课程难度量化模型得到许多学者的认同,本文也认可用课程深度、课程广度和课程时间来确定课程难度。
公式:N=αS/T +(1- α)G/T。其中,α满足0<α<1,称为加权系数,反映课程对于“可比深度”或“可比广度”的侧重程度。N表示课程难度,S表示课程深度,G表示课程广度,T表示课程时间。S/T和G/T分别称之为“可比深度”和“可比广度”。考虑基础教育课程基础性、普及性和发展性的要求,系数α应取0.5为宜,即课程不宜过广过浅,也不宜过窄过深。
本文对上述模型进行一定的修订以适应地理课程活动部分的量化需要。α取值为0.5;S课程深度本文用布鲁姆教育目标分类学修订版中的分类学表对活动要求进行赋分,对知识点进行分类然后赋分。对知识类别分别赋1~4分,认知过程类别分别赋1~6分,然后两者相加即得到一个知识点所得分值(表1);T为课程进行时间;G则是每个活动所涉及的知识点个数。
二、研究样本
根据分析,在人教版教材众多栏目中,“读图思考”、“活动”、“问题研究”等栏目具有活动意义,所以将对这些栏目与课标“活动建议”部分的难度、广度、深度等维度进行一致性分析(表2)。
三、计算与讨论
经统计和计算,课标“活动建议”的深度值得分为110,共14个活动(第7个活动分属3个知识点,分3个活动进行),涉及16个知识点。教材活动深度值得分为281分,共53个活动,涉及44个知识点。
由于活动课程时间在现阶段并没有统一的规定,故在此采用估值。利用人教版教师用书建议的课时数(36课时)与教材活动所占课文篇幅确定教材活动的课程时间,经估算,展开教材活动的课程时间约为15课时。同样,利用课程标准规定的必修1课时数与活动建议所占内容标准篇幅确定活动建议所需课程时间,经估算开展活动建议的课程时间约为13课时。
根据公式,课标“活动建议”的难度值为N课标= 0.5×(110/13+16/13)=4.85。教材活动的难度值为N教材=0.5×(281/15+44/15)=10.83(表3)。
从表3分析可知,课程标准的活动建议与教材中实际编写的活动在难度、广度、深度等维度存在差异,教材活动在三个维度的比较上几乎都高于课标一倍多。因此,从课程难度视角,课程标准的活动建议与教材活动编写的一致性存在一定程度的差异。
课标指出,在建立教科书内容结构时,需要理解课程标准与教科书的不同。课程标准给出的是高中阶段地理课程的宏观框架、必学内容和学习标准,在此基础上编写的教科书可以有不同的结构。钟启泉和崔允漷教授则形象地称课程标准是“下要保底,上不封顶”。由此可看出,人教版必修1教材基本以课标为依据,在可比深度、可比广度和难度上达到了保底但不封顶的要求。
四、原因分析
教材活动编写秉承以课标为指导的思想,既忠于课标又高于课标。在满足所有学生最低发展的基础上,还为学生的不同学习需求满足了条件。
可比广度:因人教版教材的活动承担一部分课文正文的职能,不仅体现能力训练也为学生提供知识来源。从表1可知,教材具有活动意义的栏目达53个,不仅覆盖了课标活动建议里几乎所有内容,有些知识点教材也以活动栏目出现。所以活动在广度(知识点)上会比课程标准高。
可比深度:“活动建议”部分是这次课程改革的一个亮点,目的是为了改变以往以接受为主的学习方式,为培养学生的地理技能提供了一个很好的平台。相对于以接受为主的课文正文知识,活动栏目则在积极引导学生自主探究和发现,学生限于已有的知识水平和学习习惯,活动栏目更具挑战性,属于较高层次的认知水平。
整体难度:从整体难度看,活动建议采取的是“窄而深”的建议方式,活动数量较少,涉及的知识点也不多,但要求比较高。教材则是“广且深”的编写方式,活动栏目较多,很多知识点也以活动的方式呈现,其中有些活动要求也很高。所以,虽然两者课时数相当,教材这种“广且深”的编写方式在难度值上更胜一筹。
五、反思
首先,虽然教材活动的课标广度比活动建议高出一倍多,所覆盖的知识点远远多于课程标准活动建议的要求,但同时也要看到,教材并没有完全符合课程标准的要求,有几个知识点没有包含进去。特别值得一提的是关于自然灾害部分,人教版必修教材在正文和活动里都没有体现,而自然灾害知识是为了满足学生的生存需要,尤其在我国多灾多难的国情背景下。这种情况何以体现“培养现代公民必备的地理素养”的课改理念?又何以体现地理学科的价值?基于这样的考虑,自然灾害部分可考虑在必修教材中增设。
课程标准一致性 第6篇
一、美国研发“成功一致性分析模式”的缘起
(一)基于课程标准的教育改革的驱动
20世纪80年代以来,美国基础教育一直受到学生基础知识薄弱、学业能力水平低下等问题的困扰。例如,1988年,在一项18岁至24岁青年参加的国际测试中,美国青年的成绩为倒数第一。[1]这使得美国有识之士开始反思国家基础教育的发展问题。为改变美国国民素质难以适应国际社会竞争的现状,2000年,在全国数学教师委员会(NCTM)等教师专业组织推动下,联邦政府启动“基于课程标准的教育改革”。之后,几乎每个州都设计和采纳了某种形式的课程标准。许多州都以课程标准为基础开发评价工具。2001年,美国颁布了《不让一个孩子掉队》法案(NCLB),进一步强化了基于学科内容标准进行评价的重要性。目前,美国已有49个州制定了学科内容标准,已经有48个州依据这些标准进行学业评价,这充分反映了美国基于课程标准的教育改革方向。
(二)学业评价实践的需求
1965年美国各州在联邦教育部的资助下,开始要求学校使用国家的常模测试,这意味着学生的表现应当参照国家的常模样本,但是由于忽视测试是否与课程标准相一致的分析,因而导致常模测试不能提供足够的、反映学生知识和技能掌握情况的信息。在这一背景下,美国学者布鲁姆(B.S.Bloom)在研究学业评价问题时开始关注学业评价任务和行为目标一致性的分析和认识。但进入20世纪90年代,一致性分析理论还停留在布鲁姆时代只要设计或选择评价工具时在某种程度上考虑到了学习目标,就认为评价和课程标准之间具有较高一致性水平的认识;而且绝大部分州缺少判断评价与课程标准一致性程度的系统程序和方法,这无疑给分析评价与课程标准的一致性水平状况带来了困难。适应学业评价实践的需求,研制学业评价与课程标准一致性分析模式成为美国基础教育课程领域中的重要课题。为此,在美国各级政府的资助下,各州先后进行了学业成就评价与课程标准一致性的研究与实验。目前,已经开发、研制出“成功分析模式”等各种一致性分析模式,为进一步拓展学业评价与课程标准一致性的研究和实践,提供了框架性理论基础。
二、“成功分析模式”的基本框架
Achieve公司(全美教育高级议会建立的非营利性组织的简称)是美国采用评价与课程标准一致性分析方法较早的研究机构。其所研究的成功分析模式的核心思想主要包括以下方面:
(一)研发“成功分析模式”的目的
Achieve公司研发一致性分析模式的目的,可以概括为三个方面:[2]
1. 基准测试的目的
主要希望通过基准测试帮助各州回答以下问题:(1)我们的课程标准的执行水平与那些高度执行的州和国家相比如何?对我们学校和学生的要求足够高吗?(2)我们的评价很好地测量了课程标准中要求的知识和技能吗?
2. 剖析课程标准的适切性
基于上述目的,“成功分析模式”把一个州的课程标准与其他州、国家和国际的参照课程标准进行比较,并回答如下问题:(1)课程标准详细说明了一个面向全体学生的综合的、便于管理的核心课程内容吗?关键的概念和技能在课程标准中没有遗漏吗?(2)课程标准体现了学生应该掌握的知识与技能的广度和深度要求了吗?确定了对学生来说哪些是最重要的学习内容以及何时去学习的要求了吗?(3)课程标准是严格的吗?州的课程标准要求能有效地与所要参照的课程标准进行比较吗?(4)课程标准详细说明了学生应该掌握什么(如知识内容)和学生应用这些知识能做什么吗?学生的推理能力和问题解决能力得到充分发展了吗?或者是在忽略其他内容的情况下过于强调某一方面的内容了吗?(5)课程标准是明确、清楚的吗?教育者和家长能够理解和使用它提高学生的学习成绩吗?
3. 分析评价与标准的一致性
“成功分析模式”下的学业评价与课程标准的一致性分析是为了回答以下问题:[3](1)每项学业评价只是测量了课程标准中要求的内容,还是评价内容与标准不同?测试中的每项内容都涵盖在州课程标准中了吗?(2)每项学业评价都测量了课程标准中的知识技能的广度和深度了吗?每项学业评价都测量了一个年级水平的关键性知识和技能了吗?(3)随着年级的变化,学业评价项目对学生有足够的挑战性吗?
(二)厘定一致性判定标准
“成功分析模式”的评价者按照课程标准或目标审查测试的每一个项目,如果州或测试公司没有测试方案,“成功分析模式”的评价者会提出一个新的测试方案。如果测试开发者提出的方案没有通过审查,“成功分析模式”的评价者会通知该州。“成功分析模式”的一致性判定标准的主要框架如下:[4]
1. 内容一致标准
这个标准检验每个测验项目的内容和相关标准的内容之间的一致程度。评价者判断测验项目的内容和相关标准联系的紧密程度,然后确定这个测验项目是从“不一致”到“非常一致”四类中的哪一类。
2. 表现一致标准
每个评价项目都代表对学生某一认知类型的要求(如学生要进行“辨别”或“分析”),如果某一个测验项目要求学生进行“辨别”,而相应的标准却是要求学生进行“分析”,这两个表现就不一致。评价者根据一致性程度判断每个项目是从“完全一致”到“不一致”三类中的哪一类。
3. 挑战性标准
这条标准可以应用于测量单独评价项目和一整套的评价项目,目的是确定是否把这些评价项目作为学生要掌握的挑战性的学科内容。在单独项目水平上,Achieve的评价者考虑了两个因素:知识来源的挑战性水平和认知要求的水平;在一整套项目水平上,评价者考虑了评价项目整体的挑战性水平。
(三)“成功分析模式”的分析方法
“成功分析模式”是分析学业评价和课程标准之间一致性的深度质性研究方法。“成功分析模式”是由教师、课程专家、学科专家来参与分析的。“成功分析模式”中编码专家作为一个整体进行内容分析。具体包括三个阶段:[5]
1. 第一阶段:检测评价项目和课程标准的匹配程度
在这一阶段,检测评价项目和课程标准的匹配程度的具体步骤如下:(1)关注知识、技能(content centrality)。编码专家判断评价项目的知识、技能与课程标准中要求的知识、技能的匹配程度。(2)关注认知要求(performance centrality)。编码专家比较评价项目的认知要求与标准中的认知要求的匹配程度。例如,评价项目的认知要求是选择、(鉴别、比较、分析、应用等)应用该标准时编码专家编码情况同上,即关注知识、技能标准。
2. 第二阶段:对评价项目的难度(challenge)进行判断
在这个阶段,编码专家应该通过两个步骤进行:(1)判断单个评价项目的难度来源(source of challenge)。判断评价项目的难度来源的标准包括:第一,恰当的难度来源,即评价项目的最大难度是标准中知识、技能、认知要求所要求的;第二,不恰当的难度来源:知识、技能和认知要求与课程标准不一致;评价项目在技术方面有缺陷,通常的情况是多个正确答案或没有答案或出现数字错误等。(2)判断评价项目的难度水平。编码专家从整体上来判断该测试对一定年级的学生是否难易合适。检测是否大部分评价项目的难度水平与标准中要求的相吻合。
3. 第三阶段:检测知识分布平衡性和评价项目涉及的知识广度
在这个阶段,具体通过两个步骤进行:(1)编码专家基于课程标准判断哪些具体课程目标被过多地评价;哪些具体课程目标在学业评价中很少或未被评价。(2)知识广度检测的是评价项目涉及知识的范围(coverage),即每个课程标准至少有一个相关的评价项目与之相对应。知识广度值高于0.67就是很好的,0.50-0.66被认为是可以接受的。
三、“成功分析模式”的启示
“成功分析模式”为我们研究评价与课程标准的一致性提供了系统的分析工具和方法,这对提高教学策略和实施的水平很有价值。“成功分析模式”对我国构建评价与课程标准一致性分析模式的启示在于:
(一)一致性分析策略是调适学业评价效能偏差的重要方法
从国外构建一致性模式的成果与经验看,有效实施评价与课程标准一致性分析是调适评价效能的重要过程与方法。从美国的经验来看,检视评价与课程标准一致性是美国改进课程实施质量的政策性策略。美国许多州借助“成功分析模式”的一致性程序和方法,分析评价与课程标准之间的一致性水平,进而为教育决策者提高课程评价的有效性提供了可靠的信息。我国在新课程改革中学业评价的命题者往往从对课程标准的领悟和自己的专业水平出发,采用纸笔测验等方式了解学生的知识掌握状况和能力发展水平。但是由于他们只是依据自己对课程标准的领悟去设计学业评价量具,因而难以判断该检测工具是否与课程标准所规定的学习内容相吻合:评价项目是否偏离了课程标准?是否遗漏了课程标准的某些重要内容?是否超出课程标准的要求?这使人们对学业评价所反馈的学习成果信息是否可靠、有效提出质疑。所以,在评价实践中就需要对这种偏差加以不断地调适。以往我们通过对教师的培训,提高教师的专业评价知识和技能,增强教师对课程标准的领悟水平,期望缩小评价与课程标准之间的偏差,但是实际效果并不理想。美国在课程政策层面上借助一致性分析程序与工具,检视评价与课程标准之间的一致性状况,引导评价者基于课程标准实施评价的经验,为我们提供了改善评价与课程标准之间偏差的新途径。借鉴美国的经验,我国应从改进评价政策、改善评价实践出发,积极进行一致性程序与工具的研究,为检视评价的有效性提供科学的方法与手段,推动课程系统的和谐运行。
(二)基于标准实施学业评价,必须构建本土化的一致性分析模式
美国通过研发学业评价与课程标准一致分析模式,为教育决策者检视不同地区的学业评价与课程标准之间的匹配性提供了有效分析方法,进而推动美国基于课程标准进行改革。但是,我国开发和研制学业评价与课程标准一致性分析模式,应该考虑我国与美国基础教育存在的差异性,从本土化的视野研制适应我国教育体制与政策的一致性分析方法。
第一,美国是教育分权型国家,没有国家课程标准,因此,美国执行州课程标准是不统一的,因此美国学者致力于在政策上引导学校遵循州课程标准进行教学。美国研发的一致性成功分析模式目的在于推动美国学校教学能够回到州课程标准上来。而我国是教育集权型国家,全国基本执行统一的课程标准,这规定了学生必须达到的最低学业要求。但是,在实际课程实施中发现,多数学校主观上都努力争取达到课程标准的所要求的上限,而较少考虑学校的实际条件是否适合,唯恐自己的学校教少了,学生学少了,担心学校在教学质量评比中吃亏,纷纷超纲教学,瞄准供选择的拓展性的较高要求。其结果只有少数“精英”学生能达到课程标准的上限要求,牺牲了中下等学生的发展。就是说,一些学校本来通过努力可以使学生达到课程标准的基本要求,许多学生却难以达到。因此,我国研发检视评价与课程标准一致性程序与工具的主要目的应定位于推动学校执行课程标准的公平性,为全体学生提供达到《国家课程标准》最低要求的机会。
第二,美国各州的课程标准一般都包括课程内容标准、评价标准、机会标准等多项标准,这为其分析学业评价与课程标准一致性提供了具体的参照依据。我国国家课程标准既有内容标准,也有课程实施建议,包括教学建议、评价建议和教材编写建议。教材的内容编写得比较详细且与课程内容标准之间的联系比较紧密,这为构建本土化的学业评价与课程标准一致性分析模式奠定了基础。
摘要:美国研究“评价与课程标准一致性分析模式”缘于其基于标准的课程改革以及学生学业水平偏低的现实。罗伯特(Robert Rothman)和思莱特(Jean B.Slattery)主持的“成功(Achieve)一致性分析模式”的研发,旨在提高学生的学业要求和学业水平。“成功分析模式”的基本框架主要包括:研发“成功分析模式”的目的,厘定一致性判断标准“,成功分析模式”的分析方法等。从国外构建一致性模式的成果与经验看,有效实施评价与课程标准一致性水平分析是提高学业评价效能的重要过程与方法;而构建一致性分析模式,应该从我国的课程评价实践出发,立足本土化。
关键词:评价,课程标准,一致性,成功分析模式
参考文献
[1]钟启泉,张华.世界课程改革趋势研究——课程改革国别研究[M].北京:北京师范大学出版社,2001.300.
课程标准一致性 第7篇
一般来讲, 产品合格率主要受以下因素影响:原材料、图纸、工艺、员工技能、检验标准。所以, 合格率可以表示成如下的公式:
合格率=原材料图纸工艺员工技能检验标准
2 低级错误的原因分析
我们分别与不同的供应商进行座谈, 深入其生产一线进行调查, 包括操作者、工艺、研发和质量部门等, 结果发现, 机加尺寸超差, 是因为外协供应商不知道这些尺寸如何配合, 操作者认为这个尺寸并不重要, 对公差的保证也心不在焉, 检验人员同样如此;对于铸件, 由于铸造本身的特殊性, 尺寸超差、铸造缺陷等不能完全避免, 所以外协供应商认为这是正常的, 经过他们检验合格后交货, 实际上并不能满足主机厂的要求。这说明, 除了技术实力、管理和质保体系不健全等原因外, 还有一个重要的原因就是, 供应商所采用的合格标准与主机厂的合格标准不一致。
标准一致性从根本上说是一种合作双方信息交流的结果, 相信很多人参加过信息传递方面的培训, 一份信息经过4~5个人的传递后就变得大相径庭了, 原因就是, 发出信息的人和接受信息的人, 对信息本身的理解不一致。生产、生活中这种因信息传递出现失误的例子不胜枚举, 几乎每个人都遇到过。一般情况下, 每经过一个环节的信息传递, 大约只传递信息有效性的80%。
所以, 为了使外协方能够按照主机厂的要求提供产品, 就必须要认真对待外协过程中标准不一致的问题。统计发现, 大约有一半的低级不合格项是由于标准不一致导致的。
这个结论完全可以使用合格率的数学模型来解释, 在供应商符合诚信要求的情况下, 合格率的公式简化为:
合格率=员工技能检验标准
如果供求双方检验标准完全统一, 其值为1, 如果检验标准只达成了50%, 那么合格率就降低了一半。从外协零部件制造到主机厂检验, 至少要经过:主机厂外协方操作者外协方检验主机厂检验等三个环节, 也就是说, 有效信息变为:80%80%80%=51.2%, 这就是我们统计发现的有一半的低级不合格项发生的原因。
3 对策
首先, 在主机厂与外协供应商签订各种技术文件的标准中, 一般包含几个方面的内容:交付及时率、包装要求、工件自身质量参数和售后服务等, 所有的要求一定要全面、清晰, 各文件之间不能有相互矛盾的地方。提高标准一致性, 验收标准全面、明确是首要的。
其次, 质量管理部门要根据外协用的图纸、技术协议、工艺、生产现场以及曾经出现的售后故障等信息, 综合编制一份检验标准培训材料, 不仅对公司内部的质检人员进行标准一致性培训, 更为重要的是对外协供应商的生产、质检等人员进行标准一致性培训。要让外协供应商清楚我们的要求和为什么这样要求, 令其知其然, 知其所以然。
再次, 在与外协方谈判过程中, 技术交底一定要充分, 在不泄露商业机密的前提下, 讲述清楚各部位的工况, 哪些是关键尺寸, 物理性能必须满足的程度以及如何达到等。同样, 工艺人员要对外协供应商采取必要的指导, 促进其对产品实现过程的掌握。
最后, 质量管理部门要及时对外协供应商进行预防性的控制, 定期对外协供方进行质量体系的相关审核, 对其管理人员尤其是高层进行质量意识宣贯, 让外协供应商在质量意识和质量体系上保持高度的一致性。
4 结论
课程标准一致性 第8篇
随着检验医学的发展, 临床实验室凝血项目检查也从手工操作向自动化仪器普及。凝血酶原时间国际标准化比值 (INR) 已作为临床上重要的监测外源性凝血功能和血栓抗凝治疗项目[1-3], 但在不同医院或仪器上还存在着较大的差别。美国临床病理家学会 (CAP) 实验室认可标准中要求, 每年要对凝血仪至少进行2次比对研究。本文根据美国临床实验室标准化协会 (CLSI) 颁布的EP9-A2文件, 即《用患者样本进行方法学比对及偏倚评估》的要求, 对我科使用的2台不同厂家、不同测试方法的凝血仪进行INR测试比对分析, 评估其一致性, 以保证患者检查质量。同时也使同行对现有凝血仪的使用情况有清楚认识。
1 资料与方法
1.1 分析资料
本实验每天选取10 例做凝血INR检查的门诊病人样本, 连续选取6 天一共60 例不同病人样本, 50% 以上的样本结果在参考范围之外。每台仪器标本测量顺序为1、2、3~10, 再倒过来按10~3、2、1 的顺序重复测量1 遍, 2 h内测量完毕。
1.2 分析仪器
以法国STAGO compact型凝血仪为参比仪器, 日本Sysmex CA7000 凝血仪为试验仪器, 试剂为STAGO公司的原装配套试剂, Sysmex CA7000 凝血仪所用试剂也为厂家指定的配套试剂Dade (德灵) 凝血试剂。2 台仪器每天均按照厂商配套的高低两个水平进行质控, 统计分析样本前两水平质控均在控。
1.3 统计学处理
所有统计数据均在Excel表格内进行计算处理, 并计算均值 (x_) 及标准差 (s) 。
2 结果
对我科两台凝血仪所测的INR值进行比对, 见表1。
2.2 方法内双份测定值的离群值检查
计算绝对差值均值和相对差值均值, 对测量值同时均超过绝对差值均值和相对差值均值的4 倍为离群点。结果有一个标本4101 号 (数据表内用斜体加粗表示) 为离群值, 按EP9-A2 文件内容可以删除一个离群值, 删除此点后余下59 例数据重新检查离群值 (无离群值) 。以下统计分析均是删除离群点后的结果。
2.3 数据作图绘制散点图和偏倚图 (图1~4)
2.4 方法间离群值检查
计算两种方法的绝对差值均值和相对差值均值, 任何一点同时超过两种方法的绝对差值均值和相对差值均值的4 倍为离群点, 59 例数据无方法间离群值。
2.5 X取值合适范围的检验
计算两种方法均值间的相关系数r2=0.978, r2>0.95, X取值范围合适。
2.6 计算线性回归方程
两种方法均值的回归方程为y=0.987x+0.0319
2.7 计算预期偏倚及可信区间
预防深静脉血栓形成INR值控制在1.5~2.5, 治疗静脉血栓形成、肺栓塞、心脏瓣膜病INR值控制在2.0 ~ 3.0, 治疗动脉血栓栓塞、心脏机械瓣膜置换、复发性系统性栓塞症INR值控制在3.0~4.5。在此INR值的医学决定水平Xc取1.5、2.5、3 和4.5。INR值各医学决定水平Xc处的预期偏倚及95% 可信区间, 见表2。
2.8 t检验分析
参比仪器INR值的均值和标准差x_±s =1.6885±0.6953, 实验仪器INR值的均值和标准差x_±s =1.67±0.6939, 经配对资料的t检验得P>0.5, 按 α=0.05 水准, 2 台仪器INR值差异无统计学意义。
3 讨论
凝血酶原时间 (PT) 的检测, 因组织凝血活酶、制备方法、检测方法, 使用仪器等不同, 使各实验室及每批试剂之间的PT测定结果差异较大, 可比性差。同一病人在用药治疗上可能因不同仪器检测而得出相反的用药情况。因此世界卫生组织要求, 对口服抗凝剂的患者必须使用国际标准化比值INR作为PT结果报告形式, 并用以作为抗凝治疗监护的指标[4]。INR由凝血酶原时间与国际敏感指数 (ISI) 换算而来, INR= (患者PT/ 正常人平均PT) ISI。美国临床实验室改进法修正案CLIA’88中规定PT的允许总误差为靶值 ±15%, 基于平均个体内和个体间变异的凝血试验的生物学变异中PT允许总误差要求:最低值为7.9%, 期望值为5.3%, 最佳值为2.6%[5]。两者都未规定INR误差限, 因INR由PT计算而得, 本比对分析INR误差限引用PT误差限要求。本实验所用的仪器STAGO (法国思塔高) 为磁珠法 (粘度法) , Sysmex (日本希森美康) 为光学法, 使用仪器及方法均不同。ISO15189《医学实验室质量和能力认可准则》文件指出:当同样的检验应用不同程序或设备, 或在不同地点进行, 或以上各项均不同时, 应有确切机制以验证在整个临床适用区间内检验结果的可比性[6]。我国卫生部要求同一项目不同仪器每年要至少进行2 次比对试验, 但我国的临床实验室还未有国家部门的标准比较程序, CLSI-EP9-A2文件为我国实验室的改进提供了一个很好的标准指导。由于临床上监测抗凝治疗INR是参考同一水准, 所以为保证不同检测仪器之间结果的可比性, 必须对不同仪器测定的同一结果进行一致性评价。不同凝血仪器若要得到一致的INR结果, 参考INR计算公式可知各仪器在PT测定时必须统计出所用仪器的正常人平均PT时间, 更关键的是在各凝血仪上所使用的凝血活酶试剂ISI必须用国际参考品凝血活酶试剂进行校正。本实验STAGO系统为原装配套试剂及Sysmex仪器所使用的原装德灵 (Dade) 试剂均可溯源到国际参考品ISI值, 实验比对分析严格按照CLSI-EP9-A2 文件内容和流程进行, 并经配对资料的t检验统计分析, 两仪器结果一致, 偏倚< 1/2CLIA’88Tea, 并且<新的生物学变异中要求期望的允许总误差TEa。两仪器INR值一致, 完全能满足临床要求。本统计分析中的标本4101 号出现离群值, 可能是标本数量没有足够多或样本存在未知的干扰, 如增加和扩大标本数, 可减少离群值的出现。朱文元等人[7]研究不同凝血检测系统测定PT、APTT结果的比对分析时, 以美国贝克曼ACL-7000 检测系统为比较方法, 法国思塔高Start-4 检测系统为实验方, PT在医学决定水平低值处的相对偏倚 (SE% ) > 1/2 CLIA’88 TEa, 中值和高值处的SE%< 1/2 CLIA’88 Tea, 本研究与其稍有差别, 其PT在低水平有偏倚原因可能在于没有用INR值进行比较。王静[8]研究两个不同凝血分析仪 (Stgo-Revolution和Sysmex CA1500) 检测PT结果, 比对结果一致, 相关性良好, 与本研究基本相符。
参考文献
[1]白雪丽.XT-4000i多功能全自动血细胞分析仪在体液细胞检测中与手工法的应用比较[J].中国医疗设备, 2012, 27 (1) :75-76.
[2]王碧松, 王志斌, 高阳, 等.血凝仪-APTT法测定肝素的效价[J].药物分析杂志, 2012, (7) :1154-1157.1154-1157
[3]张学英, 冯志军, 李小燕.全自动血凝仪Sysmex CA 1500性能评价[J].现代诊断与治疗, 2009, (1) :15-16.
[4]熊立凡.临床检验基础[M].3版.北京:人民卫生出版社, 2003:88-90.
[5]何法霖, 王治国, 钟堃, 等.两种来源的允许总误差质量规范在凝血室间质量评价中的应用[J].检验医学, 2012, 27 (6) :513-515.
[6]蔡培.根据NCCLS-EP9-A评价半自动与全自动血凝仪结果的一致性[J].吉林医学, 2013, 34 (4) :624-626.
[7]朱文元, 廖昆灵, 姜莉, 等.不同凝血检测系统测定PT、APTT结果的比对分析[J].海南医学, 2012, 23 (1) 88-90.
论语文课程内容与课程目标的一致性 第9篇
语文课程内容是语文课程层面的概念, 是语文课程的基本问题之一, 回答的是语文课程“教什么”这一问题;从学生学的角度, 它是学习的对象, 因而也是对“学什么”的规定。然而, 对这样的基本问题, 在2001年颁布的全日制义务教育《语文课程标准》 (实验稿) 中没有作明确的、具体的阐述, 在“前言”中也没有作概要的解说, 只是在《附录》中提出了“关于优秀诗文背诵推荐篇目的建议”、“关于课外读物的建议”、“语法修辞知识要点”, 显得比较笼统, 不像1992年国家教委颁布的《九年制义务教育初级中学语文教学大纲 (试用) 》那样除“总纲”外, 设有“教学目的”“教学内容”等部分, 具体规定了教学内容的范围。这使人禁不住要问:难道《语文课程标准》忽略了对属于语文课程基本问题的“教什么”或“学什么”的规定了吗?当我们在研读《语文课程标准》的时候, 我们还会发现它的显性线索是各个学段的识字与写字、阅读、写作、口语交际及综合性学习等五大学习领域, 隐性线索是知识与能力、过程与方法、情感态度与价值观三维目标, 而且《语文课程标准》对“总目标”和“阶段目标”作了较为详细的“规定”, 我们禁不住又会发问:语文课程目标和课程内容是不是一回事呢?有没有内在的一致性?
一、《语文课程标准》中课程内容与课程目标的一致性
语文课程内容和语文课程目标虽然不是一回事, 但在《语文课程标准》关于“课程目标”的具体表述中二者在很大程度上具有内在的一致性。
首先, 巢宗祺先生在《〈语文课程标准〉解读》中说道:“从义务教育语文课程的特点考虑, 语文课程标准不设内容标准’这一部分。《语文标准》包含前言’课程目标’实施建议’三个部分, 课程的内容结合在目标’中叙述。”这就说明《语文课程标准》中的目标与内容是混同在一起的。
其次, 董蓓非博士认为:“语文课程内容属于语文课程层面的概念, 在课程标准中得到明确规定和表达, 其终极目标就是学生语文课程的习得素质语文素养。它具体描述了学生经过一个阶段学习后, 在知识与技能、过程与方法、情感态度价值观三个领域的学习结果。”显然, 他也认为课程标准中“得到明确规定和表达”的课程内容指的是课程标准中的“总目
筅河南新乡学院段全林
标”和“阶段目标”, 指的是“知识与能力、过程与方法、情感态度价值观三个领域”。
第三, 河南师范大学王文彦、蔡明先生认为:“语文教学内容是非常复杂的, 纵向有情感态度价值观、知识与能力、过程与方法的三个维度, 横向有识字写字、阅读、写作、口语交际及综合性学习的五个领域。”“阅读教学有以下主要内容:指向情感、态度、价值观目标的阅读习惯态度, 指向知识与能力目标的阅读能力, 指向过程和方法目标的阅读方法。”这是从语文教学乃至阅读教学的角度谈的, 但反映出语文课程内容与目标在某种程度上是一致的。
二、为什么说完整意义上的语文课程内容与三维目标具有一致性
事实上, 完整意义上的语文课程内容是由三维结构组成的。倪文锦先生在《新编语文课程与教学论》中引用夏特的研究结果, 认为“语文课程内容由学习语言、通过语言学习、关于语言的学习 (这里的“语言”与我们的“语文”是同义词) 三个部分组成”。这三个组成部分构成了语文课程内容的三维结构。语文课程内容的三维结构与语文课程的三维目标是一致的。让我们来作以下剖析:
“学习语言”是由语文学科的工具性决定的, 是指对识字写字、阅读、写作、口语交际和语文综合性学习等五大领域的学习, 是通过言语实践活动, 让学生掌握听、说、读、写方面的知识, 培养学生正确理解和运用祖国语言文字的能力。显然, “学习语言”主要指向的是“知识与能力”目标。
“通过语言学习”是由语文学科的人文性决定的, 是指通过语言中介对文学、文化和语言本身的学习。中国的文化, 体现了我们民族的情感、习俗、习惯、传统, 是积淀在每个中国人身上的“性”。中国人历来讲究修身养性。语文教育要使学生移情修心养性, 传承中华文化的血脉, 让成长的新一代把生命之根深深扎进民族文化之中, 这是语文教育义不容辞的责任。“通过语言学习”以“关于语言的学习”、“学习语言”为基础, 以语文学习过程中掌握的语文知识和形成的语文能力为依托, 通过文学、文化的学习, 使学生具有高尚的情操、坚强的信念、深厚的文化底蕴、高雅的审美情趣。显然, “通过语言学习”主要指向的是“情感态度价值观”目标。
“关于语言的学习”是关于语文的元学习。元学习是旨在改善语文学习品质的活动, 包括语文策略、语文态度 (含兴趣、动机、意志、习惯、情感等) 等方面的改善, 这些策略、态度的改善, 有助于学习者有效发挥自身语言能力, 也是学习者在品味文学作品、学习本民族和多元文化过程中所需具备的语文方面的策略、态度。显然, “关于语言的学习”主要指向的是“过程与方法”目标。
通过以上分析, 可看出“学习语言、通过语言学习、关于语言的学习”三维结构与语文课程的三维目标大体上是一致的。当然, 正如三维目标是彼此渗透、相互交融的一样, “学习语言、通过语言学习、关于语言的学习”三者之间也是不可分离的。
三、正确理解关于语文课程内容的不同说法
语文课程内容是个复杂的问题。目前各种版本的《语文课程与教学论》著作或诸如此类的著作对它的解说各不相同。
说法一:“将综合性学习跟识字与写字、阅读、写作 (写话、习作) 、口语交际相提并论, 它同样既是语文课程的内容, 也是语文教材的内容。”
说法二:“总体来看, 各国的语文教育都离不开语言、文学、文化的学习。”“无论是从语文教育的实际出发, 还是从语文课程理论来看, 语文课程由语言、文学、文化三个组成部分来构成是被国内外研究者所普遍认可的。”
说法三:“语文科的课程内容, 大致可归纳为两大块:一块是形成一定的文学、文化素养而必须研习的作家、作品及学术界对它们的权威阐释, 用定篇’ (语文课程标准规定的篇目) 来指称;第二块是达到《标准》所规划的阅读、写作、口语交际等能力目标而必须教与学的概念、原理、技能、策略、态度、价值观等。”
如果我们根据语文课程内容的三维结构来作具体分析的话, 我们会发现前两种说法分别从不同角度概括了语文课程内容的不同维度, 但不能概括语文课程内容的全部:说法一主要是从工具性角度提出来的, 工具性着眼于语文课程培养学生运用能力的实用功能和课程的实践性特点, 侧重的是识字与写字、阅读、写作、口语交际中的基本知识以及听、说、读、写的能力训练内容。显然, 说法一属于“学习语言”这一维度。说法二是从人文性角度提出来的, 文学、文化和语言本身所折射的人文性着眼于语文课程对于学生的思想感情的熏陶感染的文化功能和课程所具有的人文学科的特点。显然, 说法二属于“通过语言学习”这一维度。说法三是从工具性和人文性相统一的角度提出来的, 其中“定篇”是课文, 学生在学习“定篇”的过程中同时要学习事实、概念、原理、技能、策略、态度、价值观等, 这里的“事实、概念、原理”是语言、文学、文化中的事实、概念、原理, 这属于“通过语言学习”;而“技能”是听、说、读、写的技能, 即在识字与写字、阅读、写作、口语交际、综合性学习中应该掌握的技能, 这是“学习语言”;“策略、态度、价值观”显然是在学习语言、文学、文化中的策略、态度、价值观, 是听、说、读、写过程中的策略、态度、价值观, 这些显然属于“关于语言的学习”这一维度。因此, 这一说法与语文课程内容的三维结构相吻合, 是从整体意义上对语文课程内容的解说。
通过对上述三种说法的分析, 我们可看出完整意义上的语文课程内容是由多侧面组成的复合体, 单从某一个侧面看, 构不成语文课程内容的全部, 完整的语文课程内容应当从三个维度来看, 即“学习语言”维度、“通过语言学习”维度、“关于语言的学习”维度。
总之, 语文课程内容和语文课程目标虽然不是一回事, 但在《语文课程标准》关于“课程目标”的表述中在很大程度上二者有内在的一致性, 二者是融合在一起的。这种把内容标准和目标标准合二为一、融为一体的做法, 显然是一种创新。即使这样, 笔者仍然认为《语文课程标准》的缺陷在于在“前言”中少了些对课程内容的概括说明, 少了些必要的解释。也许正是如此, 导致各种版本的语文课程与教学论著作以及诸如此类的著作对语文课程内容的解说众说纷纭。语文学科乃至研究语文学科的课程与教学论要走科学化道路, 课程内容作为语文课程的基本问题之一, 《语文课程标准》如果能够给出一个概要的解说, 或者作出必要的解释, 对促进其科学化会大有裨益的。
参考文献
[1]语文课程标准解读.武汉:湖北教育出版社, 2002.
[2]董蓓非.语文教育心理学.上海:上海教育出版社, 2006.
[3]王文彦, 蔡明.语文课程与教学论 (第二版) .北京:高等教育出版社, 2006.
[4]倪文锦.新编语文课程与教学论.上海:华东师范大学出版社, 2004.
[5]周庆元.语文教育研究概论.长沙:湖南人民出版社, 2005.
[6]王荣生.语文课课程论基础.上海:上海教育出版社, 2003.
课程标准一致性 第10篇
关键词:数据质量,一致性测试,信息资源
1 引言
针对目前农产品物流领域现存的质量安全问题多、信息集成度低、协同性差、溯源力弱等问题建设的农产品安全流通信息化平台, 为实现农产品安全生产、加工、流通、销售全程监控提供了信息化支撑, 并为农产品质量安全溯源提供信息服务。
在农产品质量安全溯源信息公共服务能力建设的过程中, 信息资源类标准的研制是信息化平台建设的基础。信息资源类标准围绕农产品安全流通业务定义了各类信息要素, 如信息分类编码、数据元、接口交换格式、数据模型等基础共性标准, 这些标准的制定和实施有助于信息资源在规定范围内的共享、交换与整合, 通过构建完整可靠的农产品物流中心数据库, 提高农产品物流领域信息资源开发利用的规范化水平。
为确保信息资源标准在农产品安全流通信息化平台中实施和应用有效落实与实施, 最大限度保障农产品流通过程中企业与消费者的利益, 促进农产品溯源数据资源在各业务系统中的共享利用, 需要建立一套代码和数据元标准的一致性测试体系, 来保障信息化平台实施与标准规范设计的一致性。
2 标准一致性测评需求
2.1 一致性测评对象、主体及基准
标准一致性测评的目的是为产品、技术、服务或相关知识产权的功能性、安全性、实用性等提供测试, 是一种标准规范的验证服务。农产品安全流通信息化平台的数据一致性测评属于标准一致性测评的范畴。
安全流通信息化平台中的农产品数据涉及农产品质量安全, 关乎人民群众健康安全和社会和谐稳定, 事关农业产业的健康稳定和社会经济的持续发展。信息化系统中数据与信息资源标准的一致性、有效性和完整性, 将是数据质量评价的关注重点。
业务数据是信息化平台建设的基础资源, 信息的共享和利用是以系统中具备业务逻辑的数据为载体, 系统间数据的交换是实现用户业务价值的重要途径。在农产品安全流通信息化平台中, 数据一致性测评的评价对象也正是平台中承载业务信息的数据结构模型和各类实体数据。
根据信息化平台建设实施情况, 农业物联网数据标准一致性测评的评价主体, 既可以是具有专业评价知识和科学方法的信息化系统用户, 也可以是信息化平台承建方的质量控制或测试部门。此外, 承担信息资源类标准制定的第三方机构, 对标准的内容和用户业务需求有着深入的理解, 是完成标准一致性测评工作的极佳选择。
农产品安全流通信息化平台数据标准一致性测评的基准依据是辅助信息化建设而制定的各类信息资源标准。信息资源标准是不同于产品标准的特殊测评基准, 其测评对象是信息化系统中的数据结构和实体数据, 具有数据类型多样、数据体量大、数据价值差异性大等特点。
2.2 一致性测评需求
农产品安全流通数据资源评价指标体系的建立, 将重点考虑以下农产品数据资源标准的测评需求。
2.2.1 分类和编码一致性
信息分类是根据信息内容的属性或特征, 将信息按一定的原则和方法进行区分和归类, 并建立起一定的分类体系和排列顺序的基础规范。信息编码是将事物或概念赋予具有一定规律、易于计算机和人识别处理的符号, 形成代码元素集合。农产品安全流通信息化平台中, 需要测评信息化系统中嵌入的各类信息分类编码与标准规范的一致性, 测评范围包含系统引用的国标、行标、地标等信息分类编码标准的一致性测评, 以及系统建设过程中制定的信息分类编码标准测评。通过对信息分类编码标准中名称、代码、数字码、字母码、计量单位等要素与信息化系统中嵌入数据的比对, 避免信息化系统中存在多码、漏码、重码、错码等问题, 提高信息资源规划实施的准确性和一致性。
2.2.2 语法语义一致性
在信息化系统建设过程中, 元数据是信息化系统的最小数据单元, 元数据标准用于对信息资源进行统一约束, 对系统中数据的名称、定义、类型、值域等多个属性进行规范和约定, 可以保证信息化系统中, 以及信息化系统之间, 对同一个数据对象描述和表达的一致性。在农产品安全流通信息化平台中, 元数据标准的制定有助于保证业务系统中数据的语义和语法的内在一致性, 便于各业务系统之间的数据交换共享、系统集成以及互操作实现。对农产品安全流通信息化平台开展数据一致性测评, 需要以元数据标准为测试基准, 对业务系统中的数据模型, 数据字段的实现一致性进行检测, 保证数据字段的定义与元数据标准一致, 同时需要对业务实体数据进行抽检, 保证数据字段的名称、数据类型、值域、约束条件与元数据标准中约定的要求保持一致。
2.2.3 模型结构一致性
信息化系统的数据结构设计包括概念模型、逻辑模型、物理模型等, 农产品安全流通信息化平台建设过程中制定的数据模型标准, 从农产品流通典型业务活动展开分析, 对过程中涉及的数据进行组织和抽象, 形成数据实体, 并用实体-关系图 (E-R图) 的方式描述实体间的关联关系, 再根据实体间的相关性和聚合程度对实体进行逻辑分类, 将逻辑相关的实体包装在一起形成具有特定含义和用途的主题。标准在上述分析的基础上形成农产品安全流通信息化平台中集主题、实体关联关系、属性描述为一体的, 多层次的立体化数据模型, 并将数据模型作为信息化系统数据库设计的参考模型。
数据模型标准规定了业务系统数据库建设的基本原则, 包含主题域、概念模型、逻辑模型和物理模型各阶段数据模型设计的技术要求, 涵盖不同阶段的数据模型的定义、描述等基本要求。为保证业务系统中数据库的逻辑结构设计和物理结构实现与数据模型标准的一致性, 减少数据库中字段冗余, 保证数据表关联关系的准确性, 需要以数据模型标准为测试基准, 对业务系统中的数据库进行数据模型抽取, 并对主键、外键等模型关联要素进行标准一致性测评。数据模型的一致性测评能够规避信息系统实现过程中数据结构不一致和界定不清的问题, 有利于业务人员对数据库物理模型实现的理解和后续维护, 能够辅助业务人员对信息资源的有效管理、利用与开发, 确保信息资源的有效性、可用性和安全性。
3 标准一致性测评原则及评价指标
3.1 标准一致性测评原则
结合农产品安全流通信息化平台建设要求, 信息系统数据库生产过程和验收阶段的数据标准一致性检查和评价应遵循以下原则。
3.1.1 明确性
数据标准一致性测评的结果应该正确反映数据资源的质量状况, 评价指标的选择要有明确的指代性, 能够完成信息化系统中各数据项的完整性检查、准确性检查和规范性检查要求。明确的评价指标选择是运用方法进行科学合理评价的基础, 以保证评价结果不会脱离实际而存在。
3.1.2 客观性
数据标准一致性测评应提供符合实际、客观可信的评价结果。评价指标的选择需考虑当前信息化系统中信息资源管理的总体水平, 同时需要根据信息化系统应用单位对数据完整性、准确性和规范性的要求。此外, 评价指标的选择不可能穷尽所有数据项要素, 指标的选择需要做到目标集中, 同时能够客观全面地反映各评测要素。
3.1.3 可信性
针对农产品安全流通信息化平台的数据一致性测评, 涉及的数据项种类繁多且数据量大、结构复杂, 同时系统中实体数据的时效性和连续性较强, 对系统中数据进行标准一致性测评, 需要使用多项评价指标从不同层面进行衡量, 要考虑指标间可能存在的相互联系、相互制约的因素, 选取具有代表性、独立性、特征区分度强的指标, 避免指标的选取存在冲突, 以增强测评结果的可信性。
3.1.4 可操作性
数据标准一致性评价指标应该是切实可行、操作方便的, 指标的设计应避免过于繁琐, 需考虑指标体系所涉及指标的量化情况, 以及数据获取的难易程度, 同时指标项可以为后续决策提供有针对性的快速判断依据。此外, 要选择能够反映农产品安全流通信息化数据质量状况的具有代表性的指标, 并根据当前信息资源管理水平, 以及对数据一致性程度要求的高低, 适度对指标进行筛选和调整, 以增强测评的可操作性。
3.2 信息资源标准一致性评价指标
GB/T 21337-2008/ISO19113:2002《地理信息质量原则》标准中给出了数据质量元素的定义和指标选择, 包括衡量数据质量的定量元素和定性元素两部分。此外, ISO/IEC 25010:2011《系统和软件工程系统和软件质量要求和评估》标准也给出了信息化系统质量要求和评估要素, 标准给出的数据质量元素分为两个级别, 一级数据质量元素是具有相同本质的二级质量元素的集合, 二级质量元素是数据质量的具体特性。
评价指标是信息系统数据质量检查与评价的基础。参照上述标准规范, 同时结合农产品安全流通信息化平台建设的具体需求, 农产品安全流通信息化平台中的数据标准一致性评价的评价指标应包含数据的完整性、逻辑一致性、准确性等衡量维度, 本文针对农产品安全流通信息信息化系统中实体数据对信息资源标准的一致性要求, 给出数据标准一致性测评指标体系, 体系中各级指标元素见表1。
4 结语
信息资源标准是信息化系统建设的重要基础, 代码和数据元标准的一致性测试方法能够为农产品安全流通信息化平台中农产品安全生产、加工流通、销售的各环节的数据一致性提供保障, 本文介绍了农产品安全流通信息化平台中信息资源标准一致性测评的需求、原则及标准一致性评价指标上述工作是开展一致性测评工作的基础, 标准一致性测评还需要辅之以科学测评方法和合理的测评流程, 最终完成测评的准备和实施, 并将测评结果报告提供给用户作为信息化系统的验收依据, 以保证农产品安全流通信息化平台的数据质量符合标准规范要求。
参考文献
[1]James A.Thomas.标准一致性原则标准制定活动应避免冗繁和重复[J].中国标准化, 2011, (10) .
[2]施颖, 丁日佳等.标准符合性测试初探[J].科技管理研究, 2013, (06) :135~137.
[3]方俊, 付淑云.IEC发展中国家符合性评定介绍[J].信息技术与标准, 2009, (4) :57~61.
课程标准一致性
声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。如若本站内容侵犯了原著者的合法权益,可联系本站删除。


