考试数据库范文
考试数据库范文(精选10篇)
考试数据库 第1篇
数据仓库技术[1]是涉及人工智能、机器学习和数据库等多学科的一个相当活跃的研究领域。随着技术发展,如何更好地将数据仓库技术应用于教育领域,已成为目前教育领域应用研究的重点问题[2]。
1 考试评价指标
本文从教学及考试的目的出发,建立的评价指标包括:试卷质量分析、试题分析、知识点分析、考生分析[3]。
考试分析是教育测量学的重要内容,传统的考试评价指标,从试题的角度讲,有难度、区分度、覆盖度等,从试卷的角度讲,还有信度、效度等[4]。
在数字化学习平台中,学生的考试是通过试题库随机抽取试题来进行的,而试题库的建设需要组织优秀的教师进行,但在编写试题时每个教师对某个章节内知识点的权重把握又存在差别,为了使得每次抽取的试题所报含的知识点更加合理,该文对如何确定某个章节内知识点的权重建立了如下算法:
假如某章节共有n个指标(在此我们将知识点用指标表示),认为最重要的就记为1,认为第二重要的就记为2,,最不重要的指标记为n。每一个指标排在第几位的顺序号数叫做该指标的秩。把参加编写试题的所有教师(设共有m位教师)对某个指标给予的秩加起来,所得结果叫做该指标的秩和,用字母R表示。第j个指标的秩和用Rj来表示。如果用aj表示第j个指标的权重,则权重的计算公式是
其中n为指标(知识点)个数,m为教师人数。j=1,2,3,⋯,n
为了保障学生考试成绩的合理性,该文拟对所产生试卷的信度进行检测,建立如下试卷信度检测算法:
假设收集了n位学生的成绩,用x表示奇数号题目得分,具体得分是x1,x2,x3,⋯,xn;用y表示偶数号题目得分,具体得分是y1,y2,y3,⋯,yn。用rxy表示x和y的相关系数,用r表示信度,当两部分的总体方差σx2和σy2相同时,则信度计算公式为
当两部分的总体方差σx2和σy2不同时,信度计算公式为
式中sx2和sy2为两部分的样本方差,sT2为x和y之和x+y的样本方差(T=x+y)。
2 考试评价数据仓库的构建
数据仓库设计的核心是构建多维数据模型。多维数据模型将数据看做数据方形式,数据方允许以多维对数据建模和观察。它由维和事实定义。一般地,维是透视或关于一个组织想要记录的实体。每一个维都有一个表与之相关联,该表称为维表。维表可以由用户或专家设定,或者根据数据分布自动产生和调整。通常,多维数据模型围绕中心主题组织。该主题用事实表示。事实是数值度量的,我们可根据数据分析维之间的关系。事实表包括事实的名称或度量,以及每个相关维表的关键词[5,6]。
目前,多维数据模型主要有星型模式和雪花模式两类[7]。
本文采用星形模式来构建多维数据模型,以考生分析主题为例,其数据模型如图1所示。
3 结束语
本文是在各学校纷纷建立数字化学习平台的大背景下进行研究的。数字化环境为考试评价分析提供了大量的数据支持,该文提出了建立试题库时的知识点权重分配算法和试卷信度检测算法,以保障所生成试题的合理性和有效性;从教学及考试的目的出发,提出了考试评价的指标,基于数据仓库技术建立了多维数据模型,决策者可以使用多维分析的方法从多个角度、多个层次对数据进行挖掘和分析,以获取有效的考试评价信息。
摘要:考试评价与分析是教学过程中的重要环节。在各学校纷纷采用数字化学习、数字化考试的背景下,基于数据仓库技术对考试评价各指标进行了研究。首先研究了考试评价指标,提出了建立试题库时的知识点权重算法和试卷信度检测算法,然后基于数据仓库技术对考试评价的各指标建立了多维数据模型,以便于对考试信息进行挖掘与评价分析。
关键词:数字化学习,数据仓库,考试评价,试卷信度
参考文献
[1]Inmon W H.Building the data warehouse[M].2nd ed.JohnWiley,1996:50-93.
[2]陈京民.数据仓库原理、设计与应用[M].北京:中国水利水电出版社,2004:150-200.
[3]蔡敏.网络教学的交互性及其评价指标研究[J].电化教育研究,2007.11:40-44..
[4]魏华忠,周仁来,马健生.教育统计与测量[M].辽宁师范大学出版社,2003.
[5]康博创作室.SQL Server2000数据仓库设计和使用指南[M].北京:清华大学出版社,2001:100-150.
[6]陈启买,贺超波,刘海.基于OLAP的高校教学协同决策[J].计算机应用,2009(1)
考试数据库 第2篇
基本要求
1.掌握数据库技术的基本概念、原理、方法和技术。
2.能够使用SQL语言实现数据库操作。
3.具备数据库系统安装、配置及数据库管理与维护的基本技能。
4.掌握数据库管理与维护的基本方法。
5.掌握数据库性能优化的基本方法。
6.了解数据库应用系统的生命周期及其设计、开发过程。
7.熟悉常用的数据库管理和开发工具,具备用指定的工具管理和开发简单数据库应用系统的能力。
8.了解数据库技术的最新发展。
考试内容
一、数据库应用系统分析及规划
1.数据库应用系统生命周期。
2.数据库开发方法与实现工具。
3.数据库应用体系结构。
二、数据库设计及实现
1.概念设计。
2.逻辑设计。
3.物理设计。
4.数据库应用系统的设计与实现。
三、数据库存储技术
1.数据存储与文件结构。
2.索引技术。
四、数据库编程技术
1.一些高级查询功能。
2.存储过程。
3.触发器。
4.函数。
5.游标。
五、事务管理
1.并发控制技术。
2.备份和恢复数据库技术。
六、数据库管理与维护
1.数据完整性。
2.数据库安全性。
3.数据库可靠性。
4.监控分析。
5.参数调整。
6.查询优化。
7.空间管理。
七、数据库技术的发展及新技术
1.对象数据库。
2.数据仓库及数据挖掘。
3.XML数据库。
4.云计算数据库。
5.空间数据库。
考试方式
上机考试,120分钟,满分100分。
1.2016全国计算机三级数据库技术考试大纲
2.全国计算机等级考试三级数据库技术考试历年真题
3.三级(数据库技术)样题
4.2003年4月全国计算机等级考试三级(数据库技术)笔试试卷
5.2004年4月全国计算机等级考试三级(数据库技术)笔试试卷
6.计算机等级考试三级数据库技术样题
7.全国计算机等级考试三级嵌入式系统开发技术考试大纲
8.计算机三级考试数据库技术试题(2016)
9.2016年计算机三级《数据库技术》预测题
考试数据库 第3篇
对技校现行课程考试业务进行详细了解,通过认真调查后得知,原有的人工操作在考试工作中占的比重较大,考试流程是这样的:教导处下发考试通知→老师出卷→安排考场→组织考前宣传以及公布考场地点→印刷试卷→正式考试→阅卷→出成绩→张榜公布成绩等。根据调查结果,得到考试工作的组织机构设置如图所示。
通过了解详细情况之后并结合现行考试模式,而确定本系统的业务流程如图1-2所示。
技校考试系统的功能结构设计
系统功能结构。根据需求分析可知,技校学生考试系统是由三大模块组成:后台管理模块、考试功能模块以及领导审核功能模块,如图2-1示。
数据库设计。在Oracle数据库服务器上建立名为exam的数据库。该考试系统包括的数据表有:考生信息表(XS),成绩表(CJ),学生档案表(DA),题库表(TK),班级表(BJ)等表,因编幅有限而略去。
Oracle数据库优化技术在考试系统中的应用
SQL语句的优化是作为Oracle数据库系统中最为重要的一个组成部分。随着考试系统数据库的日渐增大,系统最为突出的问题就是数据访问的响应速度。因此,这里对考试系统中的Oracle数据库查询技术进行优化是十分有必要的。
从上面的Oracle中的SQL语句我们能够发现学生考试记录查询语句中对SQL语法使用存在错误,而最终使得某些字段索引出现失效的现象,即and to_char(c.dt,'yyyy-mm')=to_char(sysdate,'yyyy-mm')这一句,因为索引列在函数中,那么索引将会失去原有的作用,这样的一种SQL语句错误的做法,使得在考试系统数据库建立时就被忽略掉了,其实这样的忽略会使访问速率造成较大的影响,那么我们可以改成这样:andc.dt=trunc(sysdat e.'yyyy-mm')and c.dt<=last_day(sysdate)。另一个语句a and b.id(题号)In(Select id From TK t With t.id=b.id Connect By t.id=Prior sj_b.id)中的in能够用exists来取代替,这样能够在很大程度上提高考生信息记录查询的速率,优化后完整的SQL语句是这样的:
考生成绩信息查询优化
select*from CJ a,DA b where a.id=b.sno order by sno,km
该语句主要是实现了考生各个科目成绩的查询和排序,由于技校考生人数较多,且每个考生又对应着多个考试科目。虽然SQL语句很简单,但是查询速度却是十分的慢。主要原因是由于这个语句中,有两个关联表中的两个字段都没有建立索引,从而使得查询速度十分的慢,如果对这些字段全面建立起索引,那么就能够全面有效地提高这个语句的查询速率。具体做法是:成绩表(cj)的科目字段km索引名为km_idx,档案表(DA)的学号sno的索引名为sno_idx。所以需要在Oracle数据库中创建两条索引来进行优化,下面通过两条语句来建立数据表的相应索引:CREATE INDEX km_idx ON Exam.CJ(km)
CREATE INDEX sno_idx ON Exam.DA(sno)
优化效果。通过对考生考试信息查询和考生成绩信息查询页面SQL语句的优化,以此来提高查询速度,下表3-1是优化前和优化后所用的时间:
《数据结构》专业课程考试改革研究 第4篇
《数据结构》课程不仅是计算机专业的核心课程,也是部分非计算机专业的选修或必修课程,这门课程对于培养学生利用计算机解决现实问题的能力,以及理解计算机的实质,都有极其重要的意义。加强对该课程的建设。除了要改革教学内容、教学方法和教学手段外,还必须对考试方案进行必要的研究与改进。实践证明,传统的考试方法,特别是单一的笔试,或一次考决定结果的方法在对学生素质培养方面有着天生的缺陷。
通过对考试手段的改革促进学生对该门课程的学习的积极性与主动性,通过灵活的考试评价机制可以促进该门课的教学质量的提高。
2. 灵活的考试方案选择
选择考试方案的基本原则是要能促进学生的学习积极性与主动性,要能够配合教师高质量地完成教学任务,要有利于学生创新能力的培养。
2.1 与学生协商考试形式
学生是教学中学的主体,学生对课程的关心程度高低,直接影响课程的教学效果。让学生参与到考试形式的协商中来,不仅体现了对学生的关怀,让学生参与到所有教学过程的设计,客观上拉近了教师与学生之间的距离,让考试更亲近学生,激发学生的学习动力。在近三年的教学实践中发现,与学生协商考试形式,起到了预期的效果,学生在学习过程中,有的放矢,抓住学习重点,考试成绩较为理想。
2.2 加强实践和过程考试
作为程序设计的核心基础课,数据结构课程本身实践性很强。学生通过数据结构课程的实践学习可以加强学生对程序设计的能力,特别是对数据抽象和组织的能力,反过来也可以使学生对语言的词法、语法和语义有更深入的把握。考核方案分四个部分:(1)平时作业,占1 0%,主要督促学生注意平时学习;(2)实验和报告,占20%,目的是加强学生实践动手能力;(3)期中考试,占2 0%,巩固学生的阶段学习成果;(4)期末考试,占5 0%,主要考察基本理论知识。可以看出,方案制定的主导思想主要突出以过程考核为主,以理论考试为辅。考核方案在某种程度上限制了部分学习愿望较差的学生,使他们在教学过程中不致太散漫,对学校要求的到课率的提高也起到了一定的作用。
3. 考试方案的实施
考试方案是否合理,是否达到初步设想,必须通过具体实施来验证。为保证考试方案的顺利实施,重点抓住和解决好以下几个问题,最后取得了较为满意的效果。
3.1 加强平时作业和平时小测验
由于平时作业成绩计入考试,所以学生做作业的积极性明显提高,学生之间相互讨论问题时间增加,通过课堂、课间或网络途径与老师交流增多。每两章进行一次小测验,使学生复习教学内容成为常态,客观上要求学生平时多下工夫,解决了学生考前突击,考后还给老师的情况。
3.2 实验中严格要求,实验后规范实验报告
数据结构实践考试占据20%的成绩,导向明确,就是让学生高度关注和认真对待每一个实验。一般要求在实验课前能自觉提前准备实验内容,在实验课中能集中精力调试和分析算法与程序,与老师商量困难的实验题目的做法。
学生不仅要会准备和完成实验,还应该做好实验报告。这样,既锻炼了学生写作能力及分析问题能力,也养成严谨的研究作风。一般要求实验报告中除了常规的实验目的、实验内容等项目外,还借鉴了软件工程学中问题求解的一般过程。
以往在实验课中很多学生不知道该干什么,或知道该干什么但是干与不干的结果都一样,所以大部分学生经常玩游戏、上网聊天、甚至干脆不来。实验纳入考核后,大部分学生都能认真地完成实验。
3.3 加强期中考试
加强期中考试的目的是要加强对平时学习的相关知识进行巩固,强化半学期以来学过的东西。加强期中考试还有另一个作用,让那些试图通过一次作弊就通过的想法不能如愿,对于端正学习考风大有益处。
3.4 精心设计期末考试
期末考试是对所学课程的全面总结,一般情况下,期末考试采取闭卷或开卷考试。闭卷考试不利于学生应用能力的培养,学生需要记忆大量的概念和知识点,但是闭卷可以促使学生多看书,多思考。开卷题目过于灵活,主要偏重考察学生的基本应用能力,考试成绩不容乐观,主要是学生对开卷的准备不够。在数据结构考试改革中,倾向采用闭卷方式,原因在于已经采取了过程化的考试,因此,考试题目就不必追求灵活度和难度等,重点是考查学生对概念掌握情况。
在题目类型设计上除了要体现对一些基本概念和常识的考核外,还要求学生掌握数据结构的模型设计、数据结构算法设计思想,最高要求学生能够对具体的问题设计合适的算法,并分析算法的时间和空间效率。
4. 试题库与智能组卷系统
为了确保试卷中题目分布合理,考察客观。在学校重点课程的支持下,构建了《数据结构》课程试题库系统,初期试题容量为800道,包含了目前所能见到各种题型。该系统还允许创造新的题目类型,支持作业布置、平时测验、期中考试和期末考试等题目的组织,而且可以在相同题型、相同知识点及难度系数的情况下自动完成AB卷的出卷工作,试卷最后可以直接通过W o r d输出。
系统分别采用了贪心算法和遗传算法进行智能组卷,大大提高了组卷的效率,减轻了教师组卷工作负担的同时,确保了试卷的难度、信度和效度等达到预期的目标。
5. 实施效果分析
通过对《数据结构》的考试方案的改革,学生学习积极性明显提高,考试成绩上升。在289人的考试中,及格率达到74.3%,较以前有较大提高,中等比例28.4%,优良率也达到了13.8%。
不难看出,《数据结构》考试方案的设计与实施效果基本达到了预定的目标。但是也存在一些不足与遗憾,如有些学生有较强的抵制情绪,对教师的要求比较反感,如果教师无法面对,改革不可能继续下去;教师不仅要考虑如何进行教学,平时还要对学生进行监督与考核,通过电子邮件回答学生的问题,工作量付出过大,没有奉献精神不可能坚持下去。
参考文献
[1]王力.西部大开发中地方高校大学生计算机文化素质的研究[J].贵州工业大学学报(社科).2000,(3):36-39.
[2]王力.面向21世纪地方普通高校计算机基础课程体系改革探索[J].贵州工业大学学报(社科).1999.(3):52-55.
[3]于信凤编.考试理论研究[M].沈阳:辽宁人民出版社.1989.
[4]王建新,姜秀英,董冀等.考试方法[M].哈尔滨:黑龙江科学技术出版社.1990.
数据库考试题及答案 第5篇
学备注:答案请用红色字体写出。
数据库名:学生成绩数据库
学生信息表(学号 char(6),姓名,性别,民族,身份证号)课程信息表(课号 char(6),名称)成绩信息表(ID,学号,课号,分数)
一、用SQL语言实现下列功能的sql语句代码。
1.创建数据库[学生成绩数据库] 的方法有哪几种,分别是什么?(9分)。答:有SSMS T—SQL 2.创建数据表[课程信息表]代码;(8分)
课程信息表(课号 char(6),名称)要求使用:主键(课号)、非空(名称)答:Use 学生成绩数据库 go create table 学生信息表
(课号 char(6)not null primary key)3.创建数据表[学生信息表]代码;(8分)
学生信息表(学号 char(6),姓名,性别,民族,身份证号)要求使用:主键(学号)、默认(民族)、非空(民族,姓名)、唯一(身份证号)、检查(性别)答:Use 学生成绩数据库 go create table 学生信息表
(学号 char(6)not null primary key, 性别 varchar(2)check constraint(性别 in(‘男’,‘女’)),姓名 char(8)not null 民族 varchar(20)default ‘汉族’not null,身份证号 char(20)unique)go
4.创建数据表[成绩信息表];(8分)成绩信息表(ID,学号,课号,分数)要求使用:外键(学号,课号)、检查(分数),自动编号(ID)答: use 成绩数据库 go create table 成绩信息表(ID char(8)学号
课号
分数 int cheak(分数 in)
5.将下列课程信息添加到课程信息表的代码(8分)
课号 名称 100101 西班牙语
100102 大学英语
修改 课号为100102的课程名称:专业英语
删除 课号为100101的课程信息
6.创建视图[成绩信息表视图]的代码;(8分)
成绩信息表视图(学号,姓名,课号,课程名称,分数)答: create view view1 as select 学号,姓名,课号,课程名称,分数 from 成绩信息表,学生信息表,成绩信息 where 学生信息表,学号=成绩信息表,学号 and 课程信息表,课号=成绩信息表,课号
7.从学生信息表中查询姓刘的女同学的情况:姓名、性别、民族。(5分 答: Select 姓名、性别、民族 From学生信息表
Where姓名=‘刘%’ and 性别=‘女’
8.查询有一门或一门以上课程成绩小于60分的所有学生的信息,包括学号、姓名。(6分)
9.创建带参数的存储过程[某门课程高低均分]、执行该过程的代码(20分)存储过程功能:查询某门课程的最高分、最低分、平均分; 执行该过程,查询所有修’专业英语’这门学生的最高分、最低分、平均分;
二、创建一个存储过程,利用传入参数传入班级编号,查询该班级编号的学生的学号,姓名,入学成绩,班级编码,班级名称,所属系部,并执行它。(20分)表说明:
学生信息表(学号 char(6),姓名,性别,民族,身份证号, 入学成绩)班级信息表(班级编码char(6),学号char(6),班级名称)系部信息表(系部号,学号char(6),系部名称)Creat proc proc1 @班级编号 As Select 学号,姓名,入学成绩,班级编码,班级名称,所属系部 From学生信息表,班级信息表,系部信息表 Where 学生信息表,学号=系部信息表,学号
计算机考试成绩的数据挖掘分析 第6篇
关键词:计算机考试系统,考试成绩,统计分析
0 引言
计算机的广泛使用, 促进了传统考试形式的转变, 使用计算机进行考试已经越来越受师生欢迎。客观题及操作题类型为主的课程, 比如数理统计及计算机应用类课程非常适用计算机考试的形式。计算机考试的数据资源地有效利用, 能够更好地为教育评价、决策提供科学依据。
1 研究意义
对理论与实践操作并重的课程, 教学安排既包括理论讲解也包括实例演练, 通过上机操作, 达到更好的理解和运用理论知识进行统计分析的目的, 培养学生的实际操作能力, 使学生的理论和实践更好的结合。在课程的考核上, 采用计算机考试系统考试, 学生直接调用计算机上的专业软件进行操作, 一方面考察了学生对理论知识的理解能力, 另一方面, 也考察了学生对应用能力即专业软件的使用。本研究的目的是基于计算机考试系统, 对考试中的获取的学生作答信息做深层的挖掘分析, 目标是获取学生对某些知识点的掌握程度、专业软件解题操作中存在的问题, 从而更好地指导教学。
传统的学生试卷分析, 提供的是基于学生最终作答分数的分析, 如获取标准差、平均分、最高分、最低分、各分数段的数量等, 可用于分析试卷整体的难易程度, 如果要精细化考察学生对于某一知识点的掌握程度, 将是非常困难。设计和实现满足要求计算机考试系统达到对试卷整体以及对章节知识点的难易程度的考察。
计算机考试系统的题库按照章、节、知识点细化的方式进行设计的, 考试中根据考察的内容设定考试范围, 在考试结束后除可以实现传统的试卷统计分析外, 还可根据知识点细化分析。综合试卷整体分析和知识点细化分析结果, 可分析学生对某类题目的理解程度、学生对专业软件的应用能力、试卷难易程度等。即可获得更多的有助于教学的信息, 而且非常高效的实现, 并没有增加教师的工作量。
2 设计与实现
计算机考试系统的构成由学生考试客户端系统及教师管理系统构成。学生考试客户端系统为学生考试界面, 学生通过身份验证后从教师管理系统获取试卷, 试卷作答完成, 试卷结果提交到教师管理系统;教师管理系统包括学生信息管理、题库管理、组卷管理、试卷分析等几部分构成。
学生作答客户端系统为通常考试系统常见部分, 包括学生身份验证、试卷发卷及作答、交卷几部分。本文主要侧重于教师管理系统内子模块的介绍。
教师管理系统的子模块学生信息管理实现对学生基础信息的管理, 学生考试时用于身份验证以及考试后成绩分析。该模块实现如学生院系、班级、学号、姓名等信息的维护, 包括添加、删除、编辑学生信息等操作。
教师管理系统的子模块题库管理是试卷构成以及评价的基础。经过多年的计算机考试, 在多年的实践中摸索出题库设计细化的重要性, 对题库的类型及组织形式都有较为深入的了解, 并有了大量的习题资源积累。正是基于科学的题库设计基础上, 对题库细化为由章、节、知识点多级构成覆盖面广、难度系数清晰的题目数据库。教师可以通过对题库的操作, 如添加、编辑、删除题目等操作实现对题库的管理。
教师管理系统的子模块组卷管理依托题库管理模块, 组卷规则灵活, 可根据考察范围定位题库中的级别, 如在组卷规则中要求考察到某章、某节以及某知识点;可指定组卷中试题数量、分值、难度系数和考试时间等;可随机在题库中抽取题目组卷, 随机生成的试卷数越多, 越有利于防止考试舞弊行为发生。
教师管理系统的子模块试卷分析实现系统自动阅卷以及输出数据挖掘分析报告。自动阅卷根据试卷中学生作答的答案与题库中对应题目的参考答案比对, 并根据分值汇总形成学生的成绩。
试卷分析模块通过考试系统记录学生的题目作答对错率、知识点作答情况等数据信息, 对这些数据进行数据挖掘分析, 可获知学生对某一知识点的掌握程度、作答偏好等有效信息, 从而更科学、更微观的展现学生的作答情况, 便于老师们根据统计分析结果获取学生对知识点的掌握情况, 有利于日后的教学。试卷分析模块可实现如下考试数据处理:
(1) 成绩基本统计分析:1试卷总体的平均分、最高分、最低分、标准差, 可按班级和授课老师分别统计;2成绩分布情况。人数各分数段布局, 可按班级和授课老师分别统计。
(2) 深入数据挖掘分析, 适用于同一门课多个班级考试的情况, 也适用于一门课、一个班级但是采用多份试卷即随机出卷的情况:1单题统计:统计单个题目的出现次数、错误率、出题人;可提供按班级单题统计, 按授课老师单题统计以及全部单题统计。2按章、节、知识点统计:按照章、节、知识点统计出现的次数、错误率, 并进行排序;可提供按照班级或者授课老师进行统计。
(3) 生成数据分析报告。综合基础统计和深入统计结果, 生成详细的试卷分析报告。
3 总结
对于理论知识和专业软件应用结合紧密的课程, 采用计算机考试方式对学生进行考核, 能真实考察学生的理论和实践相结合的能力, 而对学生机考过程中的数据进行挖掘和分析, 获得对学生对课程理解、软件操作能力更深入的了解, 有助于教师对日后教学中课程的难点重点把握、更好地改进教学方法, 提高教学质量, 这也延伸了考试的作用。在此基础上, 还可以做进一步深入研究和分析。继续深入细化机考的过程, 采集更多的操作数据, 比如考试过程中每道题目的完成时间;比如题目完成的过程, 是一次正确, 还是经过修改才正确, 还是正确又修改成错误;比如按照时间曲线绘制得分情况, 可以分析学生对课程的掌握情况。
参考文献
[1]王丽.基于三层C/S结构的计算机类课程考试系统[J].电脑知识与技术.2007:1132-1133
[2]崔园.数据挖掘技术在机考系统中的应用[J].电子设计工程.2012, 20 (1) :1-3.
[3]刘奇付, 邵换峥.学生成绩信息管理系统的探索与实践[J].软件开发与设计.2011:23-25.
[4]李秀娟, 田川, 冯欣.数据挖掘分类技术研究与分析[J].现代电子技术.2010 (20) :86-88.
[5]武学斌, 赵学军.计算机基础课程机考系统的设计与实现[J].实验技术与管理.2007, 26 (7) :95-97, 106.
[6]宋小景.基于网络的学生成绩管理系统的设计与实现[J].电脑知识与技术.2013 (26) .
构建招生考试就业服务大数据平台 第7篇
在经过几年的改革和创新后,招生数据库已逐渐形成规模,各类招考工作初步实现系统化信息管理,但在数据分析,和趋势预测方面没有太大的发展。在接触就业数据后发现,历年来数据没有规范的、完整的归纳,仍实行分人管理,数据信息分散在各工作人员手中,数据间难以实现最大化的共享、贯通,就业服务工作还停留在事务性、“处理问题”的层面,没有达到为学生、单位、学位提供“服务”的层面。自招生与就业工作合并以来,招生就业联动的重要性凸显出来,而现有的招生与就业数据平台并未将招生与就业很好的契合,招生考试就业服务大数据平台的构建应尽早提上议程。
2建立招生考试就业服务大数据平台的新思路
2.1注重招生就业的过程记录
2.1.1各学历招生数据库。完整的记录学校各学历各类型招生数据,包括考生网上报名数据信息统计,无论是艺术类考试还是分类考试可进行网上报名,下载打印准考证,可准确收集考生信息,录取过程中考生回访记录,录取数据、信息实时记录,录取结果的查询、公布、推送,合格证、通知书的下载打印,以及考生报到注册、休学退学、调转专业等招考记录。
2.1.2在校生建设动态数据库。新平台基于互联网技术,能够实时进行信息共享。因此,各个高校可以建设动态数据库,加强在校学生各类信息的收集、统计和分析,建立动态跟踪机制,多个角度考虑招生质量指标。同时通过这个新平台可以加强招生数据整合,指导专业建设,加强专业建设与地方经济发展的耦合度,力争所有数据的关联性增强,力争全方位提供教育招生与教育成果的关联数据,可通过全程记录分析得出专业设置预警。
2.1.3就业服务校友数据库。大数据平台不仅不能缺少就业资源,而且要促进招生、就业、校友彼此在大数据平台的有效“互动”。开展就业服务包括毕业生信息采集,毕业生离校手续办理,就业报到派遣,毕业生追踪,回访调查等。重视校友“终身”数据库的建立,母校凝聚校友力量,充分利用信息资源,有效地指导毕业生。加强校友资源和校友就业网络建设,这也是毕业生就业的准介绍平台,单位可以通过数据提前了解学生,形成“招生—就业—招生”的良性循环,使招生、培养和就业工作能够相互促进,母校的建设及校友持续的个人发展实现合作双赢。
2.2通过大数据分析为毕业生就业指明方向
2.2.1通过职业岗位长效跟踪数据,提供人才现存量的分析。高校需要建设招生考试就业大数据平台,整合学校内部和外部资源的信息量,实现人才现存量的统计分析。大数据平台建立学生动态长期跟踪机制,获得第一手大数据,了解就业市场的人才供给与需求状况,有效地进行人才资源状况的预测,同时了解学生就业行业的薪酬水平、人才精确度,帮助专业进行规划与发展。也能帮助招聘单位通过大数据平台进行人才状况的了解,让招聘单位对于学生有一个比较直观、个性化的了解。加强就业长效跟踪数据分析,输入需要获取的数据指标,从而可以获得毕业生的学历、性别和籍贯等其他个性心理、家庭因素对择业、收入和职业发展的期望,毕业生的岗位离职率、失业率、劳动安全度和满意度等相关性影响。
2.2.2提供人才现需求量,预测未来某行业、某地区的人才需求量。大数据可提供的预测数据包罗万象,我们的招生考试就业服务平台也要有这样的预测功能,对市场岗位需求及就业趋向进行数据分析,提出招生就业发展趋势预测、预警,可为调整招生计划和专业设置提供依据,提前减少过剩人才的培养。同时建议拓展就业服务的定义,通过开设短期培训、校友回炉培训或职业资质证书考试等形式获得“短缺”急需的人才,扩大我校就业服务内容。
2.3将专业设置与人才市场需求的信息全面对接
市场经济的发展对于人才的需求不断发生变化,高校的专业设置应该紧跟市场需求,满足地方经济发展的需要。招生考试就业服务平台集纳全校专业设置清单,专业在校生数、毕业生就业方向和就业单位基本用工状况等,教育主管部门可以直接并及时地看到这些数据的关联结果,在人才培养方面可有效帮助于学校调整学科建设和人才培训方案。根据这些数据测算结果形成的专业设置预警报告,招生与就业指导中心调整专业计划投放比例,对社会需求量大的专业,适当扩大招生比例,对就业困难、供大于求的专业要缩减培养规模。同时可调整招生宣传方案倾向就业需求量大的地区,选择经济发展迫切需要的新专业,缓解大学生“求职难”和用人单位“招聘难”两难并存的结构性矛盾。
总之,构建考试招生就业服务大数据新平台,不仅限于依赖网络技术平台的开放,而应以“建立大数据平台”的理念与集纳、整合我们的招生与就业数据,提升招生与就业的服务水平,实现“数据信息管理+”在我校招生与就业领域的落地。
摘要:招生考试、就业服务是招生与就业指导中心自合并以来承担的首要工作。招生解决的是生源质量问题,就业解决人才培养质量问题。这两者关系紧密,对于学校发展意义重大。因此,通过建立全新的招生考试就业服务大数据平台进行招生与就业信息的整合对于高校意义重大。本文首先分析现有招生考试与就业服务情况,然后提出建立招生考试就业服务大数据平台的新思路。
关键词:招生考试,就业服务,大数据平台
参考文献
[1]周晶.构建招生考试就业服务数据大平台[J].中国教育学刊,2015(11).
[2]刘畅,于超.大学毕业生就业跟踪调查工作长效机制构建[J].中国教育技术装备,2015(01).
招生考试信息数据备份的方式和管理 第8篇
一、数据备份的概念
数据备份就是将数据以某种方式加以保留, 以便在系统遭受破坏或其他特定情况下, 重新加以利用的一个过程。数据备份的根本目的, 是重新利用, 也就是说, 备份工作的核心是恢复, 一个无法恢复的备份, 对任何系统来说都是毫无意义的。一个成熟的备份系统能够安全、方便而又高效地恢复数据。
数据备份作为存储领域的一个重要组成部分, 其在存储系统中的地位和作用都是不容忽视的。对一个完整的IT系统而言, 备份工作是其中必不可少的组成部分。其意义不仅在于防范意外事件的破坏, 而且还是历史数据保存归档的最佳方式。换言之, 即便系统正常工作, 没有任何数据丢失或破坏发生, 备份工作仍然具有非常大的意义——为我们进行历史数据查询、统计和分析, 以及重要信息归档保存提供了可能。
简单地说, 通过数据备份, 一个存储系统乃至整个网络系统, 完全可以回到过去的某个时间状态, 或者重新“克隆”一个指定时间状态的系统, 只要在这个时间点上, 我们有一个完整的系统数据备份。从实质上来说, 数据备份是指数据从在线状态剥离到离线状态的过程, 这与服务器高可用集群技术以及远程容灾技术, 在本质上有所区别。虽然从目的上讲, 这些技术都是为了消除或减弱意外事件给系统带来的影响, 但是, 由于其侧重的方向不同, 实现的手段和产生的效果也不尽相同。集群和容灾技术的目的是为了保证系统的可用性。也就是说, 当意外发生时, 系统所提供的服务和功能不会因此而间断。对数据而言, 集群和容灾技术是保护系统的在线状态, 保证数据可以随时被访问。备份技术的目的, 是将整个系统的数据或状态保存下来, 这种方式不仅可以挽回硬件设备坏损带来的损失, 也可以挽回逻辑错误和人为恶意破坏的损失。但是, 数据备份技术并不保证系统的实时可用性。也就是说, 一旦意外发生, 备份技术只保证数据可以恢复, 但是恢复过程需要一定的时间, 在此期间, 系统是不可用的。在具有一定规模的系统中, 备份技术、集群技术和容灾技术互相不可替代, 并且稳定和谐地配合工作, 共同保证着系统的正常运转。
随着存储技术的进步和发展, 在SAN和NAS这些新的存储系统结构中, 传统的备份技术在结构上也得到了长足的发展。从LAN Free备份到Serverless备份, 这些备份领域里的新兴技术正在日渐成熟和完善。另外, 一些系统基本工作机制也在逐步更新。例如, “块级增量”技术, 就是一个典型的底层技术变革。
二、数据备份的技术
备份不能仅仅通过拷贝完成, 因为拷贝不能留下系统的注册表等信息;也不能留下历史记录保存下来, 以做追踪;当数据量很大时, 由于手工拷贝的实时性和效率性的限制, 是无法完全实现的。当前备份的技术还没有完全统一, 这里就根据招生考试信息的实际, 结合当前主流的备份技术作一些介绍。
1、磁盘阵列
磁盘阵列 (RAID) 是采用若干个硬磁盘驱动器按一定要求组成一个整体。其中有一个热备份盘, 其余是数据盘和校验盘。整个阵列由阵列控制器管理, 使用上与一个硬磁盘一样。磁盘阵列有许多优点。首先是提高了存储容量, 单台硬磁盘的容量是有限的, 组成阵列后形成的“一台”硬磁盘容量将是单台的几倍或几十倍。现在用于服务器的磁盘阵列容量已达TB数量级。其次, 多台硬磁盘驱动器可以并行工作, 提高了数据传输率。第三, 由于有校验技术, 提高了可靠性。如果阵列中有一台硬磁盘损坏, 利用其他盘可以重组出损坏盘上原来的数据, 不影响系统正常工作, 并且可以在带电状态下更换坏的硬磁盘, 阵列控制器自动把重组的数据写入新盘, 或写入热备份盘而使用新盘作热备份。可见, 磁盘阵列不会使还没有来得及写备份的数据因盘损坏而丢失。
随着磁盘驱动器价格的日益走低, 磁盘阵列的实现成本并不高, 适合普及推广, 成为各级招考办的基本配置。需要注意的是, 虽然磁盘阵列的可靠性很高, 但不等于不需要再另备份。因为一是磁盘总会损坏, 一个盘坏了可以重组, 两个盘同时坏了则无法重组。这种情况的概率并不等于零。因此, 为了以防万一, 重要的数据要及时另做备份。二是磁盘阵列容量虽然大但也有限, 在阵列上长期保存不用的数据, 既影响工作效率, 同时也是浪费。
2、双机热备份
双机热备份技术是国内对于相关技术的俗称。在国外, 一般称为高可用系统 (High Availability System) , 它的基本原理是指同一个计算机应用软件系统, 采用两个或两个以上的主机/服务器硬件系统来支持。当主要的主机/服务器发生故障时, 通过相应的技术, 由另外的主机/服务器来承担应用软件运行所需的环境。因此, 它主要解决的问题是保持计算机应用软件系统的连续运作。
用作双机热备份的主机/服务器里还可使用磁盘阵列, 因此安全性要大于磁盘阵列, 但同时实现成本也提高了。一般在市级招考办实施, 有条件的县级招考办也可考虑实施。
3、LAN-free备份
数据不经过局域网直接进行备份, 即用户只需将磁带机或磁带库等备份设备连接到SAN中, 各服务器就可以把需要备份的数据直接发送到共享的备份设备上, 不必再经过局域网链路。由于服务器到共享存储设备的大量数据传输是通过SAN网络进行的, 局域网只承担各服务器之间的通信 (而不是数据传输) 任务。
4、无服务器备份
无服务器备份 (S e r v e r l e s s) 是LAN-free的一种延伸, 可使数据能够在S A N结构中的两个存储设备之间直接传输, 通常是在磁盘阵列和磁带库之间。这种方案的主要优点之一是不需要在服务器中缓存数据, 显著减少对主机C P U的占用, 提高操作系统工作效率, 帮助系统完成更多的工作。
无服务器备份与LAN-free备份有着诸多相似的优点。源设备、目的设备以及SAN设备是数据通道的主要部件。因为备份过程在专用高速存储网络上进行, 而且决定吞吐量的是存储设备的速度, 而不是服务器的处理能力, 所以系统性能将大为提升。此外, 如果采用无服务器备份技术, 数据可以数据流的形式传输给多个磁带库或磁盘阵列。
LAN-free备份和无服务器备份的解决方案不仅可以全面实现混合系统平台的全自动化数据备份工作, 支持各种大型数据库应用, 实现7x24小时的不停机数据在线备份, 在这一应用层次上, 备份系统已经被作为一个独立的系统来看待, 备份工作已经是整个系统正常运行不可缺少的一个组成部分。
但LAN-free备份和无服务器备份的实施比较复杂, 而且需要大笔软、硬件采购费。一般在省级招生考试部门实施。
三、数据备份的方式
目前常用的备份方式有完全备份、增量备份、差异备份等。
1、完全备份
完全备份 (full backup) , 是指对整个系统进行包括系统和数据的完全备份, 每个档案都会被写进备份档去。这种备份方式的好处是, 当发生数据丢失的灾难时, 只要用灾难发生前的一份备份, 就可以恢复丢失的数据。但它也有不足之处:如果备份之间, 数据没有任何更动, 那么所有备份数据都是一样的。这问题出自备份系统不会检查自上次备份后, 档案有没有被更改过, 它只是机械性地将每个档案读出、写入, 不管档案有没有被修改过。备份全部选中的文件及文件夹, 并不依赖文件的存盘属性来确定备份哪些文件。这些重复的数据占用了大量的空间, 这对用户来说就意味着增加成本;其次, 由于需要备份的数据量相当大, 因此备份所需时间较长。
2、增量备份
增量备份 (Incremental Backup) , 是指每次备份的数据只是相当于上一次备份后增加的和修改过的数据。使用增量备份的优点是节省了磁盘空间, 又缩短了备份的时间。缺点则是如果要恢复一个档案, 您必须把所有增量备份都找过一遍, 直到找到为止。如果您要复原整个档案系统, 那就得先复原最近一次的完整备份, 然后复原一个又一个的增量备份。
3、差异备份
差异备份 (Differential Backup) , 是指每次备份的数据是相对于上一次全备份之后新增加的和修改过的数据。差异备份跟增量备份一样, 都只备份更动过的数据。但前者的备份是累积 (cumulative) 的, 一个档案只要自上次完整备份后, 曾被更新过, 那么接下来每次做差异备份时, 这个档案都会被备份 (当然, 直到下一次完整备份为止) 。
这表示差异备份中的档案, 都是自上次完全备份之后, 曾被改变的档案。如果要复原整个系统, 那么只要先复原完全备份, 再复原最后一次的差异备份即可。所以, 差异备份的大小, 会随着时间过去而不断增加 (假设在完全备份间, 每天修改的档案都不一样) 。以备份空间与速度来说, 差异备份介于增量备份与完全备份之间;但不管是复原一个档案或是整个系统, 速度通常比较快。
基于这些特点, 结合招生考试工作对恢复时间要求比较严格的特点, 通常采用完全备份和差异备份。比如, 在星期日进行完全备份, 在星期一至星期六进行差异备份。如果在星期五数据被破坏了, 则你只需要还原上星期日的完全备份和星期四的差异备份。这种策略备份数据需要较多的时间, 但还原数据使用较少的时间。
四、数据备份的管理
数据备份工作是一项长期不懈的工作, 日积月累, 备份会越来越多。这时进行合理的备份管理, 就显得尤为重要。
1. 制定备份进度:
在制定备份进度时, 需要考虑众多因素, 首先, 需要考虑备份方式, 如选择完全备份加差异备份方式;其次, 要确定备份频率和时序, 为保证备份数据的无误, 必须定时定期、准确地备份, 为避免进度混乱, 应清楚记录所有步骤, 并且, 必须为实施备份的所有人员提供此类信息, 以免在发生问题时束手无策。此外, 还应该建立一个计划并严格遵守, 让服务器执行更新日志, 当网站数据在崩溃后需要恢复时, 更新日志将将会派上用场。
2. 原则上完全数据备份应至少保留两
份, 一份是最近的, 一份是在它之前的, 而至少要有三个以上备份, 才可以把早期的删掉。
3. 对备份的数据进行分级, 最重要的数据不但要经常备份, 还要进行异地远程容灾备份。
4. 使用一种统一的和易理解的备份文件命名机制。
选择采用数据名和日期构成备份文件名会为实施数据恢复带来很大的方便, 因为默认的备份文件名本身没有什么特别的意义, 当实施恢复时, 很可能会浪费大量的时间去找出文件里是什么东西, 而由数据名和日期所构成的备份文件名, 文件里备份的是什么就一目了然了。
5. 妥善的保管备份数据。
一定要定时清洁和维护磁带机或光盘, 要把磁带和光盘放在合适的地方, 过热和潮湿对磁带和光盘是有害的, 备份的磁带和光盘最好只容许网络管理员和系统管理员访问他们, 要完整、清晰地做好备份磁带和光盘的标签, 避免与其他不重要的混在一起。
6. 适时地进行数据恢复和故障演习。
如果发生数据丢失, 应确保可从备份介质中快速、完整地恢复所有数据, 适时地演习恢复过程, 确保在真正需要的时候不会出现差错或意外故障。
俗话说得好, 有备无患!在当今的信息化时代, 我们要充分认识到数据备份重要性的同时, 更要加强数据的备份工作, 综合考虑更方面的因素, 再根据实际情况正确选择适合的备份方案, 建立合理的备份管理制度, 防患于未然, 保障招生考试信息工作的顺利进行。
参考文献
[1] 牛云, 徐庆, 辛阳等编著.数据备份与灾难恢复.机械工业出版社.2004年06月
[2] 顾锦旗, 胡苏太, 朱平编著.实用网络存储技术.上海交通大学出版社.2002年02月
考试数据库 第9篇
基于Internet的考试是随着计算机技术的深入和普及,尤其是Internet的应用普及而产生的。但是随着计算机及网络技术的发展,计算机安全已是当前社会非常关注的突出问题。而数据库系统担负着存储和管理计算机系统中数据信息的任务,因而,如何保证和加强数据库的安全性和保密性,已成为目前迫切需要解决的热门话题。作为一个良好的考试系统,如何保证考试成绩的客观性和公正性尤为重要。因此,基于Internet的考试系统的安全问题非常值得人们关注。
当前,一般流行的大型数据库系统都提供了许多安全技术,它基本能够满足一般的数据库应用需求。但考试系统的数据库安全性不同于其它系统,尽管在系统功能上设计了不同用户的使用权限,也不能保证敏感数据的保密性。例如DBA拥有最高权限,可知晓试卷的内容。为了保证考试的公正性,这就需要有进一步的安全措施数据加密。
1 密码算法综述
1.1 密码学
所谓加密就是利用密码学的方法对信息进行变换,使得未授权者不能识别和理解其真正的含义,也不能伪造、篡改和破坏数据。
在密码学中,伪装前的原始信息称为明文(Plaintext),伪装后信息称为密文(Cippertext),伪装的过程称为加密(Encryption)。加密在加密密钥(Key)的控制下进行,加密和解密组成加密系统。
对于每一确定的密钥k=(ke, kd),加密算法将确定一个具体的加密变换,解密算法将确定一个具体的解密变换,解密变换是加密变换的逆过程。
(1)加密算法:在加密密钥ke的控制下,将明文M加密成密文C。
C=E (M, Ke)
(2)解密算法:在解密密钥Kd的控制下,从密文C中解出同一个明文M。
M=D (C, Kd)=D (E (M, Ke), Kd)
信息加密系统的示意图如图1所示。
1.2 DES对称加密算法
DES算法的明文和密文的长度均为64位,密钥长度为56位。实现算法步骤为:
(1)初始置换IP。对给定的64位比特的明文m,首先通过一个置换IP表来重新排列m,从而构造出64位比特的m0, m0=IP (m)=L0R0,其中L0表示m0的前32比特,R0表示m0的后32位。
(2)乘积变换(16轮)。换完之后,若经过第n层处理后的左、右32比特分别为Ln和Rn,则Ln和Rn可作如下定义:
Kn是向第n层输入的48比特的密钥;Ln-1和Rn-1分别是第n-1层的输出;f是Rn-1和Kn以为变量的输出32比特的函数。第n层的加密变换如图2所示。
(3)逆置换IP-1。对L16、R16利用初始置换IP作逆置换IP-1,就得到了密文y。这就是DES加密的结果。
1.3 RSA非对称加密算法
RSA算法是目前非对称加密领域内最为著名的算法。它的安全性是基于大整数质因子分解的困难性。
起算法过程为:建立RSA公钥密码系统时,选取一对不同的大素数p和q,令n=pq;用户公布n,但将q和p保密;然后,选取正整数d,使其满足gcd (d,Φ(n))=1,这里的Φ(n)是欧拉函数,且准(n)=(p-1) (q-1);最后,根据公式ed≡1 (mod准(n))计算出e,用户公布e,但将d保密。
RSA方法是一种分组密码系统。加密时,首先将明文表示成0到n-1之间的整数。如果明文太长,可将其变为n进制数的形式,即令M=Mo+M1n+K+Msns,然后分别加密(M0, M1,Ms),得出密文(C0, C1,Cs)。加密公式为:
如果已知密钥d,解钥是容易的。我们只需计算:
即可恢复明文M。
RSA涉及大数的计算,无论硬件实现还是软件实现的效率都比较低,其中硬件实现的效率是DES的1/1000,软件实现的效率是DES的11i0U9,因此它不适用于对长的明文进行加密,常用来对密钥进行加密,即与对称密码算法结合使用。
1.4 数字签名
所谓数字签名就是采用一种数据交换协议,使收、发数据的双方能够满足两个条件:接受方能够鉴别发送方所宣称的身份;发送方以后不能否认发送过数据这一事实。
数字签名一般采用非对称加密技术(如RSA),发送方对整个明文进行加密变换,得到一个值,将其作为签名。接收方使用发送方的公开密钥对签名进行解密运算,如结果为明文,则签名有效,证明对方的身份是真实的。
2 考试系统数据库的加密要求
对于一个考试系统的安全性而言,仅靠访问控制是不够的。因为这些安全措施存在一个致命的弱点:原始数据以可读的形式存储在数据库中。这样,高明的入侵者可以从计算机系统的内存中导出所需的信息,或者采用某种方式进入考试系统,从系统的后备存储器上窃取数据或篡改数据。要彻底解决考试系统的安全保密,除了在传输过程中控制非法访问之外,还必须对存储数据进行加密保护。
一个考试系统数据库的加密要求有:
(1)考试系统试题库信息保存时间要长,不可能采取一次一密的方法进行加密,因而选用其它的加密方式,使其达到实际不可破译的程度。
(2)实际加密后,存储空间不应明显增大。
(3)加密和解密速度要快,尤其是考试过程中解密要快,使考生感觉不到解密带来系统性能的变化。
(4)加密系统要有尽可能灵活的授权机制。考试系统数据库在Internet环境中使用时,每个考生只使用其中小部分数据。因此数据库系统应有很强的访问控制机制,并辅以很灵活的授权机制,这样既能增加系统的安全又能方便用户的使用。
(5)加密系统应提供一套安全、灵活的密钥管理机构。
(6)对数据库的加密不应影响考试系统的原有功能,而应保持对数据库操作的灵活性和简便性。
(7)加密后的数据库仍能允许用户以不同的粒度对之进行访问。
在考试系统中,一次考试的流程大致可以分为这么几步首先,由出题老师出好试卷,存入数据库中;然后当考试时间到了后,由监考老师取出试卷,学生进行答题,交卷;最后由阅卷老师进行试卷评判。其中,老师出好的试题和答案需要加密保护,而学生的答题数据和老师的批改成绩,只需保证其数据的完整性和不可否认性就可以了。
结合以上数据库加密的要求和考试系统的实际情况,来选择合适的加密算法对存储在数据库中的考试信息进行加密。在各种加密算法中,DES对称加密算法加解密速度快,加密强度高,密钥分发与管理困难,可满足系统对数据快速高效加解密处理的要求;非对称加密算法的加解密速度慢,不能适应数据库加密的速度要求,而其密钥管理简单,正好用于生成传递对称加密算法使用的密钥的数字签名,保障了密钥传递的安全性。将两者相结合,可以有效地提高加密效率,并能简化对密钥的管理。所以本考试系统选择了对称加密算法DES对数据库的敏感数据加密;采用了非对称加密技术(如RSA)的数字签名来保证试卷由合法的考试者提供,且试卷的内容未被修改。
3 考试系统中的加密处理
考试系统中,需要保密的环节较多,如考前的试卷需要防泄密、考后的答卷需要防篡改,等等。在本考试系统中采用DES分组加密策略进行加密。
(1)试卷的加密和解密处理。根据加密理论,出题者可设置密钥以维护试题的保密性,在正式考试时,再用密钥解开试题供考试时使用。采用加密的试卷加密和解密过程如图3所示。出题者在生成试卷后给定加密密钥,明文用该密钥经加密算法处理后送入试卷库;一旦试卷启封使用,由密钥持有者提供解密密钥用解密算法将试卷解密得到试卷明文以供考试使用。
(2)答卷的加密处理。在本系统中,除了试卷需要加密保护以增强数据的保密性以外,考生的答卷也有必要进行一定的加密处理,因为答卷也属于敏感数据,若答卷中答案不加掩护则可被轻易的篡改从而无法保证考试的公平与合法。加密后的答卷存在答卷数据库中,阅卷时系统管理员再解密成明文批阅。
(3)用户档案及题库的加解密处理。用户的档案涉及到个人隐私,尤其是管理员及教师的资料,这些数据都要加密处理。试题库为了防止泄密,也要求加密存储。档案及试题库的加解密方法相似,因为两者只需存储在数据库中,不用在服务器间传输。管理员输入完数据后将其加密存储在相应数据库中,需要修改及查询时,先解密成明文再进行相应操作。
(4)答卷提交的数字签名。在考试系统中采用数字签名技术,一是要保证考生的答卷是合法的未经篡改的有效答卷;二是要保证它经过正常的考试过程。
采用数字签名技术主要是防止恶意篡改考卷和保证考卷的合法性。考试系统中的数字签名技术用在考生试卷的提交,签名是答卷的信息摘要和考生TD的函数。由于收方在收到附加在答卷后的信息摘要后无需还原,只要将收到的答卷内容做信息摘要后做比对,故在此我们采用简单的信息校验和作为信息摘要函数,实现起来非常简单。虽然可能会出现不同的数据序列会产生相同的校验和结果,但校验是与传送过来的原文相比,发生篡改而不被发现的可能性很小。当然对于校验和计算应是保密的。
本考试系统实现数据库加密后,具有较强的稳定性、可靠性和适应性,基本达到实用水平。
参考文献
[1]中国信息安全产品测评认证中心.信息安全理论与技术[M].人民邮电出版社, 2004.
[2]朱鲁华, 陈荣良.数据库加密系统的设计与实现[J].计算机工程, 2002 (8) .
[3]谷利泽.数据库应用中安全技术的设计与实现[D].北京:北京邮电大学, 2001.
[4]彭湃, 戴一奇, 李武军.网络密文数据库的设计[J].清华大学学报, 2001 (1) .
考试数据库 第10篇
一份好的试卷须有好的测量指标来表明它的优良程度, 试题有难度和区分度指标, 试卷有效度和信度指标, 这些是评价考试最主要的测量指标, 但是仅有这些指标不足以反映一份试卷的实际测量效果, 考试研究人员希望从考生的试卷统计分析中获取更多的信息来评价一份试卷。在计算机未普及的年代, 考试成绩统计主要依靠人工阅卷, 考试数据无法电子化存储, 对考试数据分析统计难以实现。随着计算机的普及和信息化的推广, 各种分析数据的软件应运而生, 这些软件中汇集了统计学和测量学的分析工具, 使得应用电子信息技术分析统计考试成绩数据成为可能, 这些统计信息可以为教研部门、考试行政部门进行行政决策等提供非常重要的帮助。在众多的统计分析软件当中, SPSS是应用最多、影响最广泛的分析工具之一。在本文中, 我们以SPSS软件为工具, 对教育招生考试成绩的数据进行统计分析, 分析主要着重于考试数据的相关性、假设检验等几个方面。
2. SPSS分析软件简介
“SPSS统计分析软件”的英文名称为“Statistical Package for the Social Science”, 中文名称为“社会科学统计软件包”, 它是世界著名的统计分析软件之一, 在自然科学、社会科学的各个领域均有非常广泛的应用。SPSS是一个组合式软件包, 它集数据整理、分析于一身, 主要功能包括数据管理、统计分析、图表分析、输出管理等, 该软件的统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类。
下面我们利用SPSS软件对考试数据的相关性、检验假设进行统计分析, 介绍使用SPSS进行统计分析的一般方法和步骤。
3. 相关性分析
教育考试中, 考试结果的信度, 试题的区分度, 每个题目得分与试卷总分的关系, 以及题目之间的关系, 等等, 都是考试研究的重要内容, 最主要的研究方法就是数据的相关性分析。在众多的教育考试数据的相关性分析方法中, Pearson相关系数法、Spearman相关系数法和Cronbachα信度系数法是比较常用的几种方法。
Pearson相关系数法计算公式:
式中xij为第i个考生第j题的得分, yik为第i个考生第k题的得分, xj为第j题的平均分, yk为第k题的平均分, n为测试样本量。该公式既可以计算两个连续变量之间的相关性, 又可以计算一个双歧变量与一个连续变量之间的相关性。
Spearman相关系数法计算公式:
式中D为两个变量的秩序之差, n为样本容量。
Cronbach a信度系数法计算公式:
式中n为试题数, si为第i题的标准差, s为总分的标准差。该公式实际上就是将考试中所有试题间相关系数的平均值 (又称内部一致性) 作为α信度系数。
对于给定的一组考生成绩数据, 利用SPSS统计分析软件可以非常容易地定量分析考生某学科试卷总分和该学科某道题的相关性, 以及各个题目之间的相关性。我们以Pearson相关系数分析为例, 利用SPSS软件进行统计分析。
数据统计分析的对象是某省高考数学6道解答题的得分情况 (不是整张试卷) , 数据源于该省的高考数据成绩。研究的目的是测量6道解答题每两个题目之间的相关性。
我们以SPSS 13.0版本的软件为例, 介绍利用SPSS进行数据统计分析的步骤 (以Pearson相关系数法为例) :
(1) 将考试数据导入SPSS软件, 在SPSS数据窗口中, 顺序点击【Analyze】【Correlate】【Bivariate...】, 系统弹出变量相关系数设置对话框。
(2) 在该对话框中, 将待计算的变量从左侧的变量列表中导入到右侧的“Variables”变量列表中, 在本例中导入t1、t2、t3、t4、t5、t6共6个变量 (t1t6是6道解答题的变量名称) 。在“Correlation Coefficients”相关系数选项中, 选取“Pearson”复选框。
(3) 在该对话框的“Test of Significance”设置区域, 可以点选“Two-tailed”选项或者“One-tailed”, 我们采用系统默认值。
(4) 对话框中的其它选项取软件系统的默认值, 点击【OK】, 开始相关系数计算, 系统弹出新的窗体输出运算的结果。本次输出的情况如下:
上表的统计结果可用于题目之间相关性的分析。表中的大部分题目的相关系数都比较适中, 但题目T4和题目T5之间的相关程度远高于其它几个题目, 我们可以确信这两者之间一定存在着比其他题目之间更紧密的关系, 这是我们通过分析获取的重要信息, 该信息表明这两个题目之间的相关性高于其他几个题目之间的相关性, 这在大规模考试中是不应该出现的, 需要在以后的命题考试中加以改进。
Spearman相关系数分析方法和上述分析方法类似, 只需要在上述SPSS操作的第二个骤中选取“Pearson”复选框, 程序就会按Pearson相关系数法进行统计分析, 如果同时选中“Spearman”和“Pearson”复选框, 程序将会同时计算按两种分析方法统计分析的数据, 并会以不同的图表进行显示, 而Cronbach a信度系数法计算方法与上述方法略有不同, 其操作步骤如下:
(1) 在SPSS数据窗口中, 顺序点击【Analyze】【Scale】【Reliability Analysis...】, 系统弹出“Reliability Analysis”信度分析设置对话框。
(2) 将待计算的变量从左列的变量列表中导入到右侧的“items”变量中, 在左下列的“model”选择项的下拉列表中确保选中“Alpha” (信度系数) , 点击“Statistics”选择项可以进行更为详细的参数设置, 我们采用系统的默认值即可。
(3) 参数设置完毕之后, 点击【OK】, 软件开始相关系数计算并输出运算结果。
4. 选择题的选项分析
在目前的教育招生考试中选择题是一种较常见的题型, 考试研究人员关注较多的是对选择题基本特征、测量功能及其优缺点的理论探讨[1,2], 对选择题干扰项的设计及其施测后的实际效果关注甚少, 事实上施测后对题目各选项的有效性作出判断可为评价试题质量提供重要参考依据。我们利用统计中χ2检验假设, 对试卷中常见的选择题选择项进行统计分析。
教育考试的单项选择项一般设置为4个, 其中仅有1个选择项是正确的。命题人员在设计选择项时, 应当也必然对每道题目所有的选择项 (正确选择项和干扰选择项) 的考生作答情况作出预测, 对考生作答的分布情况作出预估。考试结束后, 研究人员应该对实测的情况与命题教师预测的情况进行对比分析, 以检验考试效果是否达到了预测的目标。这和χ2拟合度检验的思想具有一致性, 因此可以尝试使用χ2检验假设进行分析。
我们依据文献[3,4]的方法来介绍χ2检验假设在考试数据分析中应用的基本原理, 设变量E是命题者对某道试题的期望值, E=n P, n为样本容量, P为期望的相对频率, 引入以下统计量:∑ (O-E) 2/E, 其中O为观察频数。
我们需要进行的假设检验是:零假设H0:选项的实测分布与期望分布相同;非零假设H1:选项的实测分布与期望分布不同。
检验假设的思想:拟合度检验的统计量在确定的某种显著性水平下如果零假设是真, 则检验统计量∑ (O-E) 2/E呈近似χ2分布, 其自由度为研究变量的可能值减1;如果实测分布与期望的分布相当吻合, 就不排除零假设, 否则就排除零假设;最后对检验假设的结果进行解释。
数据分析的目的是判断考生实际的应答结果 (实测数据) 与命题期望的选择概率 (期望数据) 是否一致。我们随机抽取某省5542个高考考生的数学有效数据构成分析样本, 利用SPSS进行统计分析。
SPSS数据统计分析的步骤如下:
(1) 将考试数据导入SPSS软件, 依次点击【Analyze】【Nonparametric Tests】【Chi-Square...】, 弹出“Chi-Square Tests”对话框。
(2) 将变量列表中待分析的题目序号导入到“Test Variables List” (检验变量列表) 中, 本例中题目的序号为t7。
(3) 将对选择试题的每个选项的期望值依次输入到“Expected Values”所属的方框, 具体操作方法是选中单选框“Values”, 输入具体的期望数值, 点击“Add”按钮, 依次重复上述的步骤直至所有的选项的期望值输入完毕。
(4) 点击【OK】, 输出软件运算结果。
我们需要进行的假设检验, H0:选项的实测分布与期望分布相同;H1:选项的实测分布与期望分布不同。
假设检验的显著性水平为α=0.05, χ2=∑ (O-E) 2/E, 自由度为df=4-1=3, 查χ2分布表或利用相关软件可得P=0.0626, 由于P>α, 因此不能拒绝零假设, 即选项的实测分布与期望分布相同。因此, 检验结果在0.05显著性水平时, 没有足够的证据拒绝零假设, 即可认为本题选项的实测分布与期望分布相同, 也就是说本题的实际测试效果与命题教师预测的效果是一致的, 命题教师准确地估计了考生的实际水平, 这是分析获得的很重要的结论。
5. 结语
SPSS软件在考试数据统计分析中应用广泛, 但大部分是集中在试题难度、均值、方差统计、考试数据的图表显示等几个方面, 本文从一个新的角度利用SPSS软件对考试数据的相关性、检验假设等几个方面进行了尝试性统计分析, 介绍了使用SPSS进行统计分析的一般方法和步骤。从上述分析来看, 软件操作步骤和统计分析过程十分简单、快捷, 对于测量学和统计学基础不太好的数据分析统计人员来说, 只要遵循一定的操作步骤, 就可以进行分析。
摘要:SPSS软件是数据统计分析的一个重要的工具。本文作者利用SPSS软件对考试数据的相关性、检验假设进行了统计分析, 介绍了使用SPSS进行统计分析的一般方法和步骤, 文中的方法对考试研究人员具有一定的指导意义。
关键词:SPSS软件,考试数据,统计分析,操作步骤
参考文献
[1]王孝玲.教育测量 (修订版) [M].上海:华东师范大学出版社, 2006.
[2]雷新勇.大规模教育考试:命题与评价[M].上海:华东师范大学出版社, 2006.
[3]李伟明, 冯伯麟, 余仁胜.考试的统计分析方法[M].北京:高等教育出版社, 1990.
考试数据库范文
声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。如若本站内容侵犯了原著者的合法权益,可联系本站删除。