多业务信息采集
多业务信息采集(精选3篇)
多业务信息采集 第1篇
简单来说,及时预估行人的运动情况即为行人跟踪,判别行人目标是其整体工作过程,系统的识别效率在一定程度上受到了结果的限制[4]。在此,笔者从交通现场的实际工作需求出发,对可见光环境中的识别手法作了详尽的剖析。当前情况下,匹配和概率预估两个类型是罗列了全部有关的技术后得到的最典型的技术方法[5]。
第一种类型的行人跟踪方式有如下4种,即在特征[6]基础上的、在模板[7]基础上的、在模型[8,9]基础上的行人跟踪方式、在区域[10]基础上的行人跟踪方式,它们的布署工作相对简单,但对比较复杂的交通环境下出现的行人遮掩、动作变化等状况没有充分的鲁棒性。
正是因为它的持续变化,算法复杂程度就无法得到有效的管控。线性状态方程下的跟踪事项比较偏向于采用这种技术,从其自身角度来说,在当前复杂的交通环境中不能有效地发挥功用。
第二种类型中,卡尔曼[11,12]与粒子滤波[13]是最典型的两种跟踪方式,它有很多优点,比方说操作起来很轻松,还能展开并行处理。现阶段,行业内相关人员对此项技术展开了诸多研究并得到了很大进展[14,15,16,17,18],不过此技术在算法上仍然存在很多问题,比如怎样在一些复杂的情况下捕捉到针对性强的跟踪特点与重要的证据。
采样、计算权值、输出冲采样等方面的工作是实现粒子滤波算法的具体步骤。行人智能跟踪系统在粒子滤波算法的采样阶段由于缺乏证据出现准确性低、鲁棒性特征不明显等难点是本文重点解决的事项。系统的实时性和具体特征在工作中的实际需要是该模型优先考量的事项,对应的模型创建工作是利用RGB颜色空间来实现的。接下来对LBP纹理特征的算法予以优化,并基于此来阐述经优化后的模型。引入像素的梯度资料,鉴定像素区域有否产生比较显著的波动,将计算阈值的方法予以改变,消除纹理区分受到的来自像素点亮度轻微波动的影响,把纹理证据特征恰如其分地体现出来等工作都是利用它来得以实现的;另一方面,空间信息也被笔者引用到该研究工作中来,具体做法是运用亮度信息依照人体特征将取得的行人矩形区域初始数据深入化解为3个对应的子区域,接下来在所有子区域里面捕捉相关的证据数据,在这种方法下把目标状态和其空间信息特征一一对应起来,最终提升该方法的鲁棒性。
1 多证据信息融合观测模型
正常来说,颜色和其纹理融合信息无法与其空间信息相对应,这项特征使得它不能准确地判断出被跟踪的对象。行人目标模型成为笔者最先说明的对象,基于此,再全面考量多证据信息予以体现,有机地把对象部分的纹理色彩和空间数据证据揉和在一起,使其描述得以提升,以期做出高效的判别。
建模是行人跟踪算法的首要工作,在此过程中不但要使它的具体需求得到满足,还要将充分的条件留给后续的数学处理工作,一般来说,为了预防求解工作中发生某些不必要的难度,并不需要精准的假设目标构造。
矩形和椭圆两类描述模型一般都会出现在二维图像中,基于当下流行的行人特征检测技术的考量,笔者在本文中的描述工作以矩形窗口来展开,详细说来,式(1)能有效地描述目标行人的状况
式中:u,v用以表示矩形的中心,中心距离两边的大小则由l,h来表示。一般情况下目标的运动是预测不到的,所以,笔者在此假定随机游走模型能被行人状态的变化所满足,在这种做法下来提升其通用性,此时,式(2)能有效地描述该模型的状态
式中:Wk-1是一种多变量的高斯噪声,各不同变量之间相互独立存在。
2 各证据信息子模型设计
2.1 颜色信息证据模型
颜色信息证据模型[19,20]在很多方面都有其自身的优点,比方说它具有很简单的结构,对目标的改变不敏感,在跟踪非规则性物体的工作中具有更好的实用性,可以得到极为理想的效果。把目标的颜色视为证据,只能实现首帖图像中的建立颜色模型,基于此实现对应的跟踪工作。
笔者鉴于系统实时性的要求,采用RGB颜色空间,R、G、B等是其所用到的3个子空间,通过将其划作m段来创建其特征空间,如此一来,颜色直方图只能采用下列表达式来描述:,其中:c∈{R,G,B}。对应的颜色直方图就是采用此方法实现的。
一般来说,颜色空间描述在一定程度上受到了来自各个不可预测的条件带来的干扰,实用性与辨识力是目标模型中心范围的像素颜色描述所必不可少的,基于此,各个区域范围中的像素值相应的权重值在此应该得到明确。简单而言,式(3)有效描述了行人候选区域
感兴趣区域中心如式(3)中的x0所示,{xi|i=1,2,…,n}代表了所有像素点的集合;k(·)代表了该函数轮廓函数,它是像素点分配权值;代表通道C中像素点的直方图;δ(·)代表狄拉克函数,标准化常数用Ch来代表,在此它能满足。
2.2 LBP_AE纹理信息证据模型
一般来说,目标纹理证据特征的鲁棒性、辨识能力、旋转和光照不变性都比较好,它的这些优点受到了行人目标识别等工作的大力追捧。此方法在具体操作时也有一些缺陷:比方说它会占去很多的时间来求解计算量。一些很显著的优点从局部二元模式(local binary pattern)中突显出来,这在计算机的操作中较为简单,且无须耗费太多时间便能实现。笔者对系统实时性的需求展开了详尽的剖析后采用改进LBP算法,在此基础上来优化行人目标描述过程中的弊端,经过优化的LBP_AE算法模型由此而生,如此一来,其描述的准确程度相对较好。
具体的优化措施:利用引入的像素点梯度信息来判定相对明显的变化有没有在该像素区内产生。同时改变阈值计算方式,运用消除纹理区分像素点亮度的轻微波动造成的干扰,呈现出真正的纹理证据特性。
式(4)~(5)能求解Sobel法得到的图像梯度数据
式中:θ(x,y)代表了梯度方向;gx和gy分别代表了图像水平和垂直方向的梯度变化。其纹理的变化情况由图像的梯度来表示,式(6)能对此展开求解
式中:N代表感兴趣区域像素点数;gj的比例值由δr(gj)来表示,gj的像素点数由代表梯度的来表示,在此笔者的主要工作是利用求解δ来判定图像波动是否处在一种平滑状态。
式(7)能有效描述经过优化后的LBP_AE
本文中笔者描述的方法是纹理直方图,简单而言,式(8)可有效描述纹理直方图属于行人候选区域
行人候选区域像素点数在公式中由N和M所表示,狄拉克函数由k∈{1,2,3,…,P+2}来表示。
2.3 空间证据模型
由于笔者在描述目标区域工作中采用的是矩形区域,所以,如果遇到比较复杂的情况就会经常出现目标被遮拦的不利的现象,这样一来,跟踪目标在一定程度上增大了难度。虽然前文提到过行人特征在有机融合颜色和纹理信息后能得到有效的描述,可却未涉及其空间信息,上述提到的一些确实存在的情况并没有得到很好的处理。
在人体特性的基础上,笔者更进一步地把行人区域划分成3个子区域,捕捉其有关信息的工作在所有区域中都进行,跟踪信息和其空间。双方在此方法的作用下彼此互相一一对应起来,如此一来,求解的鲁棒性在很大程度上得以增加。
涵盖了人的头部、上身、腿部等3个部分在纹理和颜色等方面互相之间有明显的不同,将目标细分成3个子区域,换言之,用两条水平分割线将上述3个部分分别视为一个区域,具体做法是:
1)区分出既测目标行人区域,捕捉各子区域中置信度偏大的像素点。
2)寻找水平分割线的工作是在捕捉到的像素点的灰度值的基础上完成的,假定两个持续子区域分别由Ta和Tb来表示,而且,Ta在Tb之上,式(9)能求解它们的水平分割线位置
在此,,同时
目标跟踪在所有子区域被笔者划分完后的比例一直都表现得很平稳,信息证据模型在所有子区域空间里得以创建完成,并完成纹理、颜色和空间信息互相对应的工作,以此来提升它的鲁棒性。
2.4 基于空间划分的颜色纹理证据特征相似度融合信息描述
在前文所说的划分区域和创建模型的工作得到实现后,再在对比分析相似度的基础上来对跟踪目标所在的场合予以分析,最终得到有效的跟踪效果。
在计量相似度工作中用得最多、最好的技术手法是Bhattacharyya相似系数法,各类证据特征直方图的相似度都可以通过它来实现,它的操作极为简单方便,颜色纹理直方图是笔者在研究工作中采用的计量方式,此算法应该得到优化,式(12)能对此进行有效求解
联合颜色纹理直方图的相似度由式(12)中的表示,颜色和纹理直方图相似度分别由和所表示,检测目标行人、跟踪行人目标区域的纹理与颜色直方图分则由和和所表示。
式(13)体现了联合颜色纹理似然函数对x的权值求解过程
3 实验结果及分析
3.1 本文模型与经典模型的跟踪效果比较及分析
笔者提到的多证据融合模型需要大量粒子的使用,基于此,粒子滤波计算方式在一定程度上对它的及时性带来了或大或小的影响。笔者在粒子滤波计算方式的权值计算和输出的两项工作中优化了文献[21]所示的方式,其运算效率在其改进优化以后得以大量提升,另外,粒子的大小和数量等因素也不再对其产生束缚作用。
在相同的拍摄现场和实验平台下做实验,其中原始视频如图1所示,单纯地把色彩视为该模型(这里简称STM)[22]的试验结果,如图2所示,联合色彩和纹理的双证据跟踪判别模型(简称STTM)[23,24]的试验结果如图3所示,笔者创建的多证据融合下跟踪判别模型(SKTTM)的试验结果如图4所示,各组图予以比照剖析。值得一提的是,笔者使用自行在某地铁站通道内拍摄的录像用于测试。试验工作中涉及到的平台为:Intel 3.0 GHz 4 Gbyte内存、Windows7,Visual C++6.0,粒子像素是37×46,数量高达400。
在视频中可以看到,由于此目标刚开始出现在视频中时没有其他不利因素的干扰,可以有效跟踪试验的3个模型,具体的状态连续识别情况如图1a所示。图1b中受目标衣着和周围商业广告标牌色彩相近的影响,STM的矩形跟踪区域和实践操作状况下有着较大的差距。不过,相对较好的连续判别能力在后两种方案中得以体现出来。图1c中出现的情况可以通过SKTTM法来实现。
图4显示,跟踪线索会随着行人跟踪时附近环境的变化受到干扰而在一定程度上发生变化。空间信息对应的纹理、颜色证据信息可以在较小的区域中进行融合,如此一来,某些因环境条件变化而带来的负面影响能得以消除,与其他的两种模型方案相比,它体现出来的鲁棒性具有更强的优越性,可以实现在跟踪识别过程中实现高效的持续状况估计。
3.2 LBP_AE纹理信息证据模型实验效果分析
基于LBP纹理特征算法的某些缺陷,笔者在本文中对其进行优化,使有效描述纹理特征成为现实,下面对此优化方法的有效性予以验证。算法1所示的LBP纹理特征[25]、算法2所示的GSR-LBP纹理特征[26]和笔者自行设计改进的LBP_AE纹理特征的算法都在上述视频中有所体现,行人运动状态估计实验是利用前文所说的SKTTM模型来展开的。
比较参数用跟踪的准确率表示,式(14)可对其展开求解
正确和错误跟踪目标的图像帧数中分别用TP和FN来表示。前文所述的3个纹理特征证据捕捉方式得到的试验结果通过图5来体现。
前文所述的3种算法在图5中得到了很好的展现,优化后提升其跟踪效果的准确率为94.8%,GSR-LBP以92.3%的准确率位列第二,LBP以88.6%的准确率位列第三,经过一系列的分析得出结论:相对于业内其他两种典型的算法来说,LBP_AE能在很大程度上使其跟踪的准确率得以提升,另外,更好的操作性在持续对行人运动状态进行识别时也被很好地体现出来。
3.3 识别模型的消耗时间分析
接下来笔者结合本文设计的模型和普通直方图与积分直方图,对其所消耗时间展开比较,使笔者设计的模型的实用范畴和实用价值得到实践的验证,这里仍按前文提到的、笔者自行拍摄的视频引用到试验中,通过下列两种情况来进行试验:
1)在粒子的大小不一样却在数量上保持一致的状况下耗用的时间见表1。
表1显示:笔者自创的模型运行于普通直方图中的时间受到了粒子像素数的干扰,但在积分直方图中的表现却不相同,完全与之无关。
2)在粒子的大小保持平稳而变化其数量的状况下,其所耗用的时间见表2。
表2显示:粒子数在较大程度上影响了笔者自行设计的模型在普通直方图算法中所运行的时间,它的运算时间会伴着粒子数的增大而产生明显的增长,然而,积分直方图算法中它却基本没有受到干扰。
上文2个实验结果显示:粒子可能出现的区域与粒子的大小和数量多少成正比,在积分直方图算法计算中,笔者自行设计的模型突显出了极为显著的优越性。
4 总结
总而言之,笔者在粒子滤波跟踪计算方式的基础上,对相对繁杂的站内交通状况下的行人跟踪事项展开了深入细致的探讨。笔者将行人特有的非刚体的特性和环境带来的不良影响纳入考量范围,基于其采样步骤,对融合色彩、纹理、空间数据证据的行人连续状态识别模型作了详细的阐述,实现了有效跟踪复杂环境下的行人。相对于单线索或简单多证据线索融合的粒子滤波行人跟踪采样算法来说,其效果在实践工作中更便于推广和应用。另外,相对偏低的运算效率是因为多证据信息融合所需大量的粒子而产生,笔者在粒子滤波计算方式的权值计算和输出两项工作中改进了文献[21]所提到的方法,其运算效率在实验论证下已经得到了极大的提升。在粒子大小与数量等方面,笔者设计的多证据信息融合的粒子滤波采样模型并没有被约束,在准确、快速地跟踪目标行人的有关问题上能从本文中得到一条良好的化解思路。
摘要:针对粒子滤波算法在采样阶段因证据不足,使得行人智能跟踪系统效率不高、鲁棒性不强的问题,融合颜色、纹理和空间等多证据信息和RGB颜色空间建立行人外观模型,采用优化的LBP纹理特征算法(LBPAE算法)消除干扰、提取证据信息。实验结果表明,所设计的多证据信息融合模型,可以有效实现在复杂条件下的行人跟踪问题,相比传统算法有较高识别准确率。
多业务信息采集 第2篇
具体体现如下:
(1)市场策划分析专业应用 以往市场分析人员苦于没有及时、完整、准确的市场需求数据支持,往往 对市场分析程度较浅,不能开展细致的市场分析。在用电信息采集系统投入应用后,市场分析人员可对全社会各层面的用电 情况及时、完整、准确的掌握;能对各产业、行业、用户分类进行统计;用电 信息采集系统帮助市场分析人员细化市场分析的类型;有助于市场分析人员深 化、扩大分析程度和范围,研究电网增供扩销策略和措施,巩固存量市场,_丌 拓增量市场,培育潜力市场。
(2)抄收专业应用 随着大规模的城乡电网建设改造工程的实施和一户一表、抄表到户政策的 逐步推广,传统的人工入户抄表方式存在着严重的质量和效率问题,漏抄、错 抄、估抄、代抄时有发生。用电信息采集系统的应用实现了及时、完整、准确 的电量采集,提高了抄表的实时性,并
能通过分析相关历史数据,减少结算数 据的差错,进一步提高抄表收费的准确性;实现了抄表、核算到电费发行全过 程的自动化,对整个过程进行全封闭管理;减少了人工抄表对用户的干扰,规 避了抄表员在抄表环节与客户发生纠纷的风险。
(3)电费电价专业应用 全面推行阶梯电价是电力行业执行节能减排的一项重要措施,但准确计量 用户梯次结算电量是实现的必要基础。用电信息采集系统可对用户月用电量准 确的冻结和采集,实现真正意义上的按月份梯次电量结算电费,做到计量的公平、公正。
(4)电费回收专业应用 受传统的人工抄表周期长、催费技术落后等因素的制约,电费回收工作一 直以来是营销工作中较难解决的一个大问题。用电信息采集系统的预付费的结算模式、催费控制模式极大的丰富了电费回收手段,也为电力企业电费回收提供了可靠的电费回收技术手段。
(5)线损专业应用 以往的线损管理系统存在线损分析不同时、分析周期长、人工计算等问题,造成线损分析数据缺乏可信性,不能反映实际的线损情况。
用电信息采集系统的应用强化了抄表工作J下时性,系统能对所有数据同一 时刻采集,满足线损计算数据同时性的要求,为线损精确分析提供基础;用电 信息采集系统能更高频度的进行数据采集,满足线损分析及时性的需要,以便 及时发现影响线损异常的症结,采取相关措施;并能分区、分压、分线、分台 区的进行线损计算,提升了线损精细化管理水平。
(6)综合稽查专业应用 原有的现场用电稽查没有先进的手段作保证,只是采取定时的方式进行现 场检查和稽查,没有针对性,反窃电效率难以提高。用电信息采集系统能为综合稽查专业人员提供配电线路、台区和用户用电 量情况,能对一些用电异常的线路、台区和用户进行提醒,使用电稽查人员能 有针对性地查处窃电,提高反窃电的成功率。
(7)有序用电专业应用 在有序用电工作中,由于基础数据难以掌握、执行情况督察不力等原因,存在对市场需求预测不足、有序用电方案制定针对性不强、监控手段不力、方 案落实难以到位等问题。用电信息采集系统的应用为需求侧管理人员提供了准确的负荷数据,电量 预测数据,了解实时供需状况,变被动为主动,提早采取各项措施;用电信息 采集系统提供了各地区、各行业、企业、各用户的实
时和历史用电信息,在方 案制定时能对区域、行业、企业、设备、容量和时段等逐一细化,科学合理的 分解负荷、电量指标,变被动拉限电为主动错峰移峰,最大限度的减少限电对 社会的影响。
(8)用电检查专业应用 用电检查人员需要及时掌握用户用电设备的状况,用电信息采集系统能实 现对重点、高危用户供电设备的实时在线监测,及时发现事故隐患,及时协调 处理并消除供电设备的事故隐患,保障企业安全用电,避免出现因用电引起的 事故。
(9)计量专业应用 在传统的设备管理模式下,对于计量装臵、采集设备的管理,只能通过定 期的用电检查或者现场抄表进行检查。诸如一些PT熔丝熔断、止度被修改、表计参数更改等隐蔽状况,往往不能及时发现,甚至根本无法发现。用电信息采集系统的应用使计量外勤人员能通过系统中电压、电流、相序、时钟、时段等相关实时数据及时发现并处理如电能表故障、接线错误等相关计 量装臵故障,规避客户计量差错或计量器具故障造成的风险,增强计量的准确 性和公正性;用电信息采集系统的应用使计量设备管理人员能够对电能表和采 集设备进行跟踪管理。针对设备运行情况,加强对设备的运行管理,实现全生 命周期的统
多业务信息采集 第3篇
随着信息与网络技术,并结合考虑Internet和Intranet的发展,应用程序体系结构已由传统C/S向B/S转变,直到目前的多层分布式结构[1]。通过提高信息化程度可以促进规范管理,提高工作效率和考试公信度等目标的实现进程,同时通过实施区、地、县和学校四级信息化,网络化管理,实现相关单位工作管理流程的统一,学生基本信息的统一和考务管理信息的共享。网络教育需求也在快速增长,这就需要建设符合21世纪的教学资源库[2]。由于目前教育资源库建设缺乏统一的标准[3],加上其种类繁多且数据数量巨大,管理起来很不方便,因而需要我们开发出一个网络教育资源管理平台,对教育资源进行统一有效的管理,实现资源共享。
目前,我区高中阶段对学生学籍、考籍等环节的信息化管理水平普通不高,尤其是学籍管理是薄弱环节,反映考生信息不够全面,考籍管理等环节不够科学,现有信息采集量已无法适应国家级考试的需要。之前我区使用的是2003年开发的区级和地州级两个版本的考籍管理系统。该系统为单机版,许多环节还停留在纸介质阶段[4]。现有的管理手段除了上述对工作的制约外,从某种程度上还浪费了许多人力和物力,各环节的衔接也不够完善,最让人深思的是无法解决多民族,多文种,多地区统考的问题。为做到规范各环节的管理以及让系统为多文种化,逐步按照国家级考试的要求规范信息采集工作,必须将各种信息采集和管理功能向下延伸和扩展,扩大信息采集量,建立科学规范的高中学生电子档案非常关键。
本文设计了基于J2EE框架(JSF+SPRING+HIBERNATE)的考绩信息采集和发布子系统,研究了相应的数据采集和发布算法,并用Java语言实现了具体流程,实验结果表明了其有效性。
1考籍信息采集和发布子系统设计
传统的学业水平考试考籍信息管理子系统一般采用读卡方式或单机版系统进行报名,不便于试题的统一组织管理试卷及时评阅及分析,因而不能适应现代教学中根据考试情况及时调整教学进度要求[5]。为此本文研究了一种方法,当本系统开发后将被运用到管理全疆高中学生的报名、报考等信息的采集。同时,将提供较全的信息查询,信息统计,各种报表打印等功能。其各项功能应根据各地,州、县、校等多级管理实际需求的不同,以不同的权限等级分配给不同的职能组或用户群。上、下级管理员所拥有的权限的不同而管理的操作也有限制,明确地分明了上、下级管理员的操作管辖以及分为四个等级,从而实现了规范化管理和提高工作效率的目标。
考籍信息管理子系统建立在系统管理模块基础之上,是其他模块数据处理中必用模块。本子系统的总体应用架构如图1所示。
1) 资源层
又称数据层,该层次为系统提供数据存储服务。数据范围包括学生建档信息、报考信息、成绩、综合评价、考务和其他相关辅助信息。数据可以在文件采集系统进行备份。系统使用SQL Server 2005作为数据库。
2) 服务层
为系统的业务层提供数据访问和文件系统访问服务。其中数据访问部分使用成熟的O/R Mapping框架进行数据访问。本系统使用Hibernate和JDBC实现数据访问。
3) 业务逻辑层
选用Spring,它能很好地整合Hibernate并提供有效安全的Hibernate session操作,Spring在应用上下文中处理Hibernate Session Factory的配置以及处理JDBC数据源,Spring还使应用程序很容易测试。
4) 展现层
使用JSF,其功能主要用于收集用户的输入,控制页面导航将用户输入委托给业务逻辑层等。表示层也能够验证用户输入和维护应用会话状态。
JSF+Spring+Hibernate体系结构是一个多层的非分布式的体系结构.它由客户端、表示层、业务逻辑层、数据资源层系统组成,它将应用程序细分成功能组件并划分到各自所属的层次中,且体系结构的设计独立于采用的技术。这样,就保证了系统清晰的责任划分以及高可维护性和可扩展性。
2数据采集和发布算法的设计
2.1数据采集算法的设计
在内地,实现这些功能的采集和分发算法已经比较成熟,但由于新疆具有:多民族语种,多科目的种类,并且不同学校以语种、民族不同所分布的学生很不均匀。信息采集系统导出来的数据包,是以压缩包文件名格式存放,在新疆27个地州市采用统一的ID号。
从信息采集系统导出来的上报数据包括全部学生的报名信息、报考信息和所有报名学生的照片。采集后的数据包括报名数据、报考数据、实验成绩数据和考试成绩数据,为了区分各种采集的数据,在本系统中设计如下:
依据上述分析,基于B/S上已给出数据的准确性检查流程图,如图2所示。
当采集学生信息前,必须首先地、州、市教育局用户对要转校的所有学生进行考籍变更,从而地、州、市用户基于B/S系统中发布各学校的报名、报考数据,将该数据包发布到采集系统对要转校学生的信息进行修改,保证数据无误,核对所有学生照片完整后发布数据压缩包,该压缩包的文件名格式:ShangBao_20101_010223该文件名的编码方式如下:
表中,① 20101:2010年第一批;② 01:乌鲁木齐市;③ 02:沙依巴克区;④ 23:第二十三中学。
信息采集完毕后,数据被存放到网络数据库中。首先新建数据批次,在数据批次管理内进行操作。批次管理的作用是可以批量地给所要考试的学生进行报考。数据包上传工作结束,随后进行数据采集。采集过程中系统在内部进行学生信息的校对操作。如果该学生的信息已存在,系统显示“考籍号为X的学生信息已存在”的温馨提示,否则采集成功。
采集完上报数据后就是对数据进行审批,仔细研究本系统需求和结合实际情况,本系统中设计了ENUM_BATCH_STATE类,定义如下:
2.2考籍信息发布算法设计
考籍信息发布算法是在考籍信息采集的基础上所建立,指各级用户按照其权限将学生考籍信息发布到该系统的过程,是一个重要的环节。在此系统中使用的数据采集流程图如图3所示。
报考数据的采集是由地州市用户或学校用户完成,地州市用户上传数据包到系统,系统对该数据进行分析并判断该数据包是否是报考数据,如果是报考数据,程序从文件Applies.txt中一行一行地读取数据,在此txt文件中一行数据对应一个学生报考信息,采集的过程中根据要采集的学生考籍号、科目代码,在数据库表Exam_apply中查询该学生,如果在数据库中存在该学生报考科目次数超过系统制定的次数,提示错误信息。
如果数据包采集的是学校用户,那么采集数据后根据数据批次提交数据,然后县市区用户初审该数据包,最后地州市用户审批完成报名数据采集工作。
本数据发布功能保证了全区数据的一致性和完整性。如果采集系统中的数据不小心删掉了或者被病毒感染而损坏,可以从本系统中下载该学校的考籍数据包。
为了区分上传文件的类型,本系统设计了ENUM_APP_FILE_TYPE类,定义如下:
在发布数据包的过程中,发布程序从数据库表EXAM_APPLY和STUDENT_INFO里提取某学校的全部报名信息,报考信息和所有学生的照片,报名信息保存在Students.txt文件中,而报考信息保存在Applies.txt文件中,最终生成像XiaChuan_20102_010563.zip类似的压缩文件,此文件名中XiaChuan:表示该文件是从网络版系统导出的文件,20102:表示考试批次,010563:代表该学校的机构代码。
2.3用户角色及其权限设置
信息发布基于B/S模式上进行,通过分发算法来处理多地区的大量数据[6]。上,下级用户的不断建立以及管辖的不同成功地体现了系统的多层性。
不同角色的设置:①根据用户需求不同为不同角色的用户定制符合其需求的权限;②通过角色控制不同用户对系统数据的访问;③通过不同角色修改不同层次的参数。本系统主要设置以下角色:
1) 报考信息管理员
按实际需求,分为如下四类:
(1) 校级报考信息管理员 录入考生报考信息,打印校对单,确认信息无误后,提交上级审批。
(2) 县级报考信息管理员 汇总、审批考生报考信息。
(3) 地州级报考信息管理员 汇总、审批、修改考生报考信息。
(4) 自治区级报考信息管理员 审批考生报考信息。
2) 考务管理员
按实际需求,分为如下二类:
(1) 地州市级考务管理员 根据县内学校报考情况,进行考区、考点设置、考场编排,并打印相关考务信息。
(2) 自治区级考务管理员 学考报名开始前,发布采集后的信息,编排后生成准考证、生成条形码。
3) 技术人员
进行学校信息管理、用户管理、权限管理、菜单管理、参数设置。
2.4数据库逻辑结构与物理结构的设计
本系统对于语种、民族以及地理不同的问题采取了非常巧妙的方法,给每个地、州、市、县市区,每个语种和民族分别分配了代码。在考籍没有变更的情况下,学校对学生入学到毕业只进行一次报名记录,每个学生的考籍号是随机、唯一的。EXAMINEE_ID(考籍号)的编码方式如下:
表中,① 10:2010年;② 01:乌鲁木齐市;③ 01:天山区;④ 08:乌鲁木齐市第八中学;⑤ 1:汉语;⑥ 0001:第一个学生。
本系统共有48个数据库表,信息较多,限于篇幅,以下仅给出本系统所涉及到的几个数据库表的表结构如表1至表4所示。
2.5信息采集文件结构设计
上级部门采集完的数据在采集系统中已保存于Students.txt,Applies.txt以及Classes.txt三个文本文件中。多文种、多科目,分布式考籍信息的采集是本系统的创新点。该系统基本信息采集时,严格遵循以下原则:
① 易用性原则 系统具有超强的易用性(安装程序规范,完善,界面友好,安装一次性完成),采用图形化、多文种(汉文和维文)操作界面,只要具有一定计算机操作水平和系统管理专业基础的人即可使用本系统。
② 可靠性原则 信息采集时要保证信息的安全性、准确性、可靠性、确保考生实际信息和报考信息的一致性,应提供实现由于意外或人为因素造成丢失数据的可恢复操作途径[1]。密码以密文形式存入数据库,防止密码泄露。
③ 通用性原则 系统设计要体现各上,下级管理员和学校的实际工作需求,做到各级管理部门的通用,通过各类参数的不同设置,执行有关报名、报考政策,按照统一的标准完成相关工作目标。
④ 便捷的帮助机制 对某些重要操作以及与系统不符而出现数据丢失的操作会有提示与警告。
Students.txt,Applies.txt以及Classes.txt 里面所存放的信息是互相之间同步的,系统对考生进行信息采集之后,发布报名信息,报考信息以及班级信息,从而得到考生完整的基本信息。表5-表7所示三个信息采集文件的结构及其实例部分字段。
3数据采集和发布算法的实现
3.1系统运行环境
本系统将使用Java技术进行开发,开发平台选用Eclipse,其主要工具是MyEclipse企业级开发平台插件,后台数据库选用SQL SERVER 2005,数据库服务器系统Windows 2003企业版,应用服务器是著名的开源项目Tomcat5.0,应用程序服务器是RedHat Enterprise Linux AS 4.0,版本控制系统使用的是CVS。
3.2考籍信息采集的实现
该采集系统一次性解决了多文种问题。登录界面由图4~图6所示,分别以汉文、维文、哈文、柯文形式,管理员根据自己的需要选择登录界面,方便用户理解,避免无意中进行错误操作。
考生根据自己的处境选择报科目和语言,如图7 和图8所示填写学生的基本信息。
对学校级用户,数据成功地采集到系统之后,地、州、市用户有权限对已上传的数据进行查看、操作,从而获得学生基本考籍信息。考籍信息采集总页面如图9所示。
3.3考籍信息发布算法实现
为了使自治区教育厅用户系统地统计各地州市的报考信息,本系统设计了考籍信息总统计,可以按地州市名称、考试批次进行统计。(地、州、市)考籍信息发布页面如图10所示。
从图10可以看出,本系统按学校名称、考试批次、报考语种、报考类型、总人数和13门科目的报考信息设计,最后系统按报考语种进行合计统计。报考总统计的结果可以作为自治区教育厅学考办对各地州市学生考试费的依据。
4结语
多文种、多科目、多地区的学业水平考籍信息管理系统投入使用后,取得了较好的运行效果,其功能能够完全满足多民族、多文种、多地区的应用。采用J2EE框架开发的应用程序带来了明显优势:1)缩短了开发时间;2)搭建的平台具有可伸缩性、灵活性、易维护;3)成功地实现了海量数据多文种、多科目、多地区学业水平考籍信息管理的采集和发布算法;4)能够实现相关各类的报表打印,使用户方便地进行数据备份、回复和删除;5)设计模式使系统结构更明晰,提高了运行效率;6)同时基于B/S模式上还提供了日志界面,各地州有什么技术上的问题直接在上面发表,系统管理员及时答复解决问题,保证用户正常操作。
参考文献
[1]杨秀梅.基于asp.net的网上考试系统的设计与实现[J].实验室研究与探索,2007(2).
[2]王淑云.基于B/S模式的在线考试系统的设计与实现[J].福建广播电视大学学报,2009(3).
[3]阳锋,蔡静.基于J2EE的网上考试系统的设计与实现[J].湘潭师范学院学报:自然科学版,2008,30(2).
[4]郑刚.基于B/S模式的网上教学系统研究与设计[J].计算机工程与应用,2001,37(6).
[5]徐博艺,姜丽红,董理.一种基于J2EE的软件架构的研究与应用[J].计算机应用研究,2006(9).
多业务信息采集
声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。如若本站内容侵犯了原著者的合法权益,可联系本站删除。