数据挖掘技术工程管理论文范文
数据挖掘技术工程管理论文范文第1篇
摘 要:随着社会经济的快速发展,人们的生活水平获得了大幅度的提升,对品质生活的追求也越来越强烈,这使得医疗行业的发展规模不断扩大。为了更好的满足公众的医疗需求,很多医院都开始引入先进的医疗设备,提高医疗服务水平。而为了保障医疗设备的应用安全,就必须对其进行科学的管理。本文将探讨计算机信息技术在医疗设备管理中的应用。
关键词:计算机信息技术;医疗设备管理;应用优势
随着我国医院规模的不断扩大,医院所拥有的医疗设备的数量也在持续增加,这对医疗设备管理提出了更高的要求,将计算机信息技术引入到医疗设备管理中可以有效提高管理效率,降低管理成本。本文将从我国医院医疗设备管理的现状出发,分析计算机信息技术应用的优势,进而探讨计算机信息技术的具体应用领域。
1 我国医院医疗设备管理的现状以及计算机信息技术应用优势分析
1.1 我国医院医疗设备管理现状
为了更好的满足人们的医疗需求,我国医院逐步扩大了规模,同时也引进了很多先进的医疗设备,使得医疗水平获得了显著的提升。但同时医疗设备数量和复杂性的提高使得设备管理的难度持续提升。随着医院业务规模的增加,为了支撑医院的高效经营管理,很多医院选择将计算机信息技术引入到医疗管理工作中,取得了不俗的成效。但随着计算机信息技术的广泛应用,一些隐藏的问题也逐渐暴露出来,具体体现在以下几个方面:
其一,一些规模小、资金少的医院不具备全面构建计算机信息化管理体系的能力,并未将先进的计算机信息技术应用到医疗管理工作中去,导致管理模式出现混乱。
其二,在进行医疗设备采购工作中存在多方面的问题,最常见的就是质量以及型号问题,由于采购人员的不仔细,使得采购的设备无法应用于医院业务开展中,造成了资金的浪费。
其三,现如今,很多医院依旧采用人工的方式进行医疗设备统计表的处理,不仅效率低下,工作质量也无法得到保障。
其四,针对医疗设备的消毒不全面,监控体系的不完善导致一些存在病菌的医疗设备应用于医疗工作中,导致病患出现严重的并发症。
1.2 将计算机信息技术引入到医院医疗设备管理中的积极意义分析
医疗设备在现如今医院运营的过程中占据着重要的地位,医疗设备的管理效果直接影响着医院医疗服务的水平,将计算机信息技术引入医疗设备管理中是提高管理水平的有效举措,其优势主要体现在以下三个方面:
首先,提高医疗设备采购的效率。将计算机信息技术应用于医疗设备的采购工作中,可以大幅度的节省时间,实现工作效率的提升。在计算机信息技术的支撑下,医院医疗设备采购部门可以快速准确的了解各个科室对医疗设备的需求,通过管理系统进行精准的核对,之后制定出科学的采购计划,并对采购要求进行规范化处理[1]。在医疗设备采购的过程中,从审批工作管辖到采购设备质量和成本控制工作,都可以实现快速的上报,保障资金使用和设备选型的可靠性。此外,基于计算机信息技术的设备采购还可以保障信息在各个环节之间的可靠传递,避免出现数据丢失或是延误的情况。
其次,实现库房管理信息化。库房管理是医院医疗设备管理的一个重要环节,现如今,传统的纸质档案管理方式已经不能满足医院快速发展的需求,此时引入计算机信息技术是管理改革的主要方向。在计算机信息管理系统的支撑下,可以实现对库房申请、审批、竞标、采购、出库、入库以及存储信息的全面掌握,且可以输出为明确清晰的表格,为管理工作的开展提供便利[2]。而且所有工程流程都可以在库房账目中得到体现,提高医疗系統运行的效率。此外,通过计算机信息系统还能够综合医院实际需求对医疗设备的最佳库存量进行确定,基于此制定采购计划,避免出现设备不足或是积压的情况,节省开支。
再次,提高数据信息的实时性。计算机信息技术应用于医院医疗设备管理的一项重要优势就是高效性,具体表现在数据的实时性上。在现代医院运行的过程中,许多环节对信息时效性都有着很高的要求,而计算机信息系统的搭建则是提高信息更新速度和流通频率的有效手段。在全面覆盖的信息系统范围内,可以实现数据共享,为各部门工作的开展提供便利。如财务部门在工作中,可以通过计算机系统对各个环节的开支和成本进行及时准确的了解,掌握不同科室的需求以及资产、设备状况,提高医院的整体管理水平。
2 计算机信息技术在医院医疗设备管理中的应用
2.1 搭建覆盖整个医院的医疗设备信息管理系统
在医院医疗设备管理中,基于计算机信息技术的管理系统可以实现对所有管理内容的全面统筹和覆盖。在进行信息管理系统构建的过程中,需要注意两方面的内容:首先,其功能模块设置必须满足临床科室、供货商、设备科三方的需求,三层结构分别对应着不同的业务内容,支持信息的实时性传输共享。在医院内部,由于不同阶段下的需求存在变动性,因此设备科工作人员在进行医疗设备购置管理时,必须要将购置清单交付到上级领导出进行层层审批。在招标工作结束后,若是存在中标,则进一步开展备贷工作[3]。另一方面,在供货商方面,在发货之后,还需执行仓库管理、财务管理、数据统计、后台管理以及设备维修等一系列程。此外还需注意的是,在信息管理系统中还应设置计算机设备局域网登记管理程序,确保设备能够顺利接入到医疗系统中。
一般情况下,医疗设备计算机信息管理系统会设置四个功能模块,分别是医疗设备招标购置模块、整理模块、财务管理统计模块以及医疗设备维护模块。医疗设备招标购置模块可以帮助各个招标小组通过网络系统进行证件的查询,在此基础上基于医院的实际需求对选购的设备采购进行统一整理,将整理后的数据信息传输到广大供货商处。
供货商根据医院的采购单据对医疗设备进行检验核实之后,会对其进行组装和调试,确认无误之后才会运送到医院中。基于计算机信息技术的整理模块可以帮助医院工作人员对未送达的设备进行督促,并对医疗设备的质量进行监控,及时提醒管理人员医疗设备存在的质量问题,并和供货商取得联系沟通解决。
财务管理统计模块的功能是对验收的医疗设备的单据号、支付金额、型号、名称等信息进行统一记录,为对账、查找等工作提供数据支撑,此外,还可以针对医院的设备采购指定详实的计划[4]。
医疗设备维护管理模块通过计算机信息技术对医疗设备的故障信息、维修状况、故障原因等进行详细的记录,通过分析掌握故障规律,为今后的故障排除提供数据参考。
2.2 计算机信息技术应用于档案管理
档案管理是计算机信息技术应用的一个重要领域,医院所有拥有的医疗设备数量众多,类型、用途以及购置时间均存在普遍的差异性,因此档案库中所包含的资料也十分复杂,分类整理的难度较高。在引入计算机管理系统之后,可以极大的减少人工成本,同时实现对所有档案的分类监控[5]。此外,计算机系统还可以对档案室的环境情况进行动态监控,实时掌握室内的温度、湿度等数据,避免危险状况的发生。
3 结语
综上所述,在现代医院医疗设备管理工作中引入计算机信息技术,搭建计算机信息管理系统,可以实现对医疗设备采购、使用、维修等诸多方面的有效覆盖,提高医院医疗设备管理水平,保障医疗设备的质量和应用安全,实现医疗服务质量的提升。
参考文献:
[1]郭旭.应用计算机信息技术对医疗设备进行科学管理解析[J].通讯世界,2016(18):203-204.
[2]李振华.电子信息技术在医疗设备管理中的应用[J].设备管理与维修,2019(05):9-10.
[3]王华.浅谈计算机信息技术在医疗设备管理方面的应用[J].中国战略新兴产业,2018(28):121.
[4]周庆涛.计算机在医疗设备管理中的应用——医疗设备管理信息系统[J].电脑迷,2018(11):67.
[5]李琛.应用计算机信息技术对医疗设备进行科学管理[J].技术与市场,2015,22(02):131-132.
数据挖掘技术工程管理论文范文第2篇
【摘要】 近年来我国社会不断的发展,数据管理的数量和种类也在不断增加,为数据的日常管理带来了很多的挑战。通信和互联网在我国数据管理中的运用不断被深入。使数据管理水平不断被提高,所以通信和互联网的所产生的效果也被得到了证实。本文主要针对通信和互联网下数据管理中具体的运用情况进行分析和探索,可以进一步对通信和互联网技术的相关技术进行发掘,使它们可以对数据管理起到更加积极的作用。
【关键词】 通信 互联网技术 数据管理
在人们的日常生活中,就存在着丰富的大量的数据信息,利用数据管理的相关技术,对大量的数据进行收集和处理。实现数据的进一步的开发和利用,将各种数据的作用充分的发挥出来。所以,应该利用各种技术,提高数据管理的所产生的效果。
一、通信和互联网技术的基本认识
通信技术和互联网技术都是当今科技迅猛发展的时代的产物,都属于技术类型,随着时代的不断发展,通信技术和互联网技术的关系变得愈加不可分割。在目前,企业的数据管理的各个方面都要引用通信及互联网技术,只有将这两种技术进行有效的结合才可以发挥出其中巨大的潜力。为了在我国更好的生存和发展下去,无论企业的类型是什么样的,对于及时的收集相关的数据信息是非常重要的,这样就可以对变幻莫测的市场进行及时的监测。
因此,合理的利用通信及互联网技术,可以促进企业将自身的数据管理系统进行完善,企业在发展的过程中可以有效的收集到越来越多的有效的信息,对于各种不同类型的需求,企业都能给予满足。
二、通信和互联网技术下我国企业的数据管理中的具体应用的可行性
面对现在的实际情况,在世界上的大多数国家,尤其是西方那些经济和科技都比较发达的国家,他们都非常重视数据管理的相关工作,而且也在不断地针对各方面需求进行多层次的尝试和实践,他们的目的是可以为自己找到更加有效和实用的应用技术,将数据管理变得更加科学和专业。通过国内外大量的实践不断证实,将通信及互联网技术应用到数据管理上来,可以赢得前所未有的实际效果。
在发展的初级阶段,数据管理都是利用文件系统管理和人工管理的方式进行具体的工作,但是科学技术正在不断地发展,人们的实际需要也随着时代的发展不断发展,数据管理也在逐渐改变,数据库系统管理模式不断被创立、因此,在新世纪,数据管理的发展离不开通信及互联网技术作为强大的动力。
三、通信及互联网技术在数据管理中的运用的具体难点
部分数据管理人员没有对通信的和互联网给予一定的重视,将其在数据管理总的重要性和可能性进行了忽视,虽然目前通信和互联网技术已经被广泛的应用到数据管理中,但是数据管理人员对于通信和互联网的巨大潜能并没有充分的认识到,所以通信和互联网在数据管理中并没有得到更加深入的实践,所以就会经常出现对于通信和互联网技术不重视的现象出现,严重的还会造成数据管理的工作效率低等不利影响。
企业的经营者对通信和互联网技术也没有一个明确的认识,对于数据管理的投资很少,就会引发管数据理模式不完善和数据管理水平低的情况。所以说企业的管理者应该将自身有关于通信和互联网的相关知识进行补充,为数据管理的智能化转变节省出人工的成本。
企业的数据管理部门缺乏技术人才,虽然目前的数据管理人员都具有比较丰富的工作经验,但是员工的年龄都不交偏大,那些年纪较大的员工对于通信和网络技术不能进行熟练的掌握,一旦计算机或者网络出现问题时,企业都不能进行及时的处理,这样还会造成用户的相关信息遭到泄露,就会使数据管理的高效性受到影响,给企业到来很大的损失。
四、通信及互联网技术在数据管理中的运用的具体措施
设定培训机制,提高人才的技能,主要是针对数据管理的中心人员在通信和互联网方面进行培训。目前我国部分企业对于计算机和互联网可能带来的危险都不是十分的明确,如果才出现危险就让专业的技术人员进行解决,但是这些人员都不是数据管理的中心人员,他们有时可能会没有时间和精力顾及,而有关数据管理的工作应该给予快速的解决,这就要对数据管理的中心人员进行具有针对性的培训,提高他们解决具体问题的能力,提高数据管理的运行效率。可以采取内部培训的方式,让通信和互联网技术人员对员工进行培训;也可以把员工交给专业的团队进行培训,既可以提高员工的专业性,也可以通过这种方式进行对外合作;还可以将员工交给合作的企业进行培训,将员工技能水平进一步进行提升。
通信及互联网技术在数据管理中的运用过程中可能出现的问题,应该进行准确的风险评估和预防以及应对机制。对于企业来说重要的机密就是数据,绝不能让数据进行流失,通信和互联网技术的引入则加大了风险发生的概率。所以要对风险进行评估和预防并采取应对措施。制定这样的机制,首先要对数据管理进行保密处理,每一个设计数据管理的计算机,都要进行加密处理,其次要注意设置防火墙,这样可以有效减少互联网的各类病毒的侵入。与此同时,将数据管理的网络和其他的网络进行分离,使病毒不可能通过其他的网络进行传播;企业也要在自身设置风险警报系统,针对那些无法组织的病毒传播,就应该采取报警,而这个时候就需要技术小组进行具体的处理;在风险解除后,应该及时进行总结和汇总,对其解决办法进行具体的讲解和宣传,将企业对风险的认识和解决能力进行提高。
作为企业的管理者,应该对数据管理进行具体的规划,将通信和互联网技术引入到数据管理中进行更深的探索和研究。而数据管理部门要将自己的基础工作进行完善,数据孤傲里和其他的部门具有很强的联系,所以数据管理部门和其它部门的联系也要不断加强。数据管理人员应该对通信和互联网技术不断进行研究和探索,找到提升数据管理水平的更加有效地方法,使企业可以不断的发展下去。企业的数据管理人员应该将具体的管理技能进行优化,在优化的过程中,应该和管理部门的负责人相互进行交流和沟通,将通信和互联网技术进行熟练的掌握,再根据具体的实际情况,对数据管理工作进行积极的开展。
我们不能一直对通信和互联网技术的认识停留在浅显的认识和理解上,将通信及互联网技术应用到数据管理中,就要加深对其的深入理解,企业对于通信和互联网的认识应该需要不断的实践的验证,对互联网和互联网技术的具体应用也要进行深层次的理解。
作为企业的管理者来说,既要重视对各种通信和互联网的技术,对其在数据管理中的具体的实际应用的重视也要不断的提高,在具体的应用过程中通信及互联网的实际应用也要考虑如何将人工等具体的成本进行有效的缩减,并且不断进行积极的探索和分析,利用各种有效的手段将数据管理的智能化进行大幅度的提高,在最大的程度下,将企业高数管理工作的实际效率进行切实的提高。
五、结束语
随着时代的发展人们对于数据的要求标准越来越高。通信及互联网技术在数据管理中的运用,具有很强的可能性和可操纵性,虽然具有很大的优越性,数据管理所面对的风险也不断增加。
针对这样的现实情况,应该采取积极的具有针对性的措施,将通信及互联网技术的具体的应用要点进行积极的把握,将应对的具体工作做好,咋这个过程中出现的各种问题都要进行及时的解决,提高数据管理的科学性,促进我国经济的发展。
参 考 文 献
[1]慈松. 能量信息化和互联网化管控技术及其在分布式电池储能系统中的应用[J]. 中国电机工程学报,2015,14:3643-3648.[2]史炜,马聪卉,王建梅. 工业化和信息化融合发展的对策研究——以融合类业务发展及业务模式探讨“两化融合”的发展对策[J]. 数字通信世界,2010,02:16-49.
[3]王晶晶. 论计算机通信技术在人事档案管理工作中的运用[J]. 信息通信,2015,09:309-310.
数据挖掘技术工程管理论文范文第3篇
摘要 目的:基于数据挖掘技术分析全国中医妇科名家诊治不孕症的共性用药规律。方法:采用Excel电子软件将《妇科名家诊治不孕症临证经验》一书中所收录的95位妇科名家治疗不孕症的方剂录入数据库,借助SPSS 25.0、SPSS Modeler 18.0统计软件进行频数分析、因子分析、聚类分析、关联规则分析。结果:共录入方剂453首,分類中以活血化瘀类最多,单味药物中使用频次最高的为当归;因子分析提取出有效公因子9个,聚类分析得到药组14个,关联规则分析得出规则23条。结论:妇科名家治疗不孕多以活血化瘀、补肾疏肝、燥湿化痰、清热解毒为主要方法,活血常用桃仁-红花、败酱草-大血藤、蒲黄-五灵脂为药对,补肾常以左归丸为底方加减,疏肝则用开郁种玉汤为基底,后辈医家临症遣方用药可以此为参考,灵活应用于临床。
关键词 数据挖掘;不孕症;用药规律;聚类分析;频数分析;因子分析;关联规则;名老中医药专家经验
不孕症是指妇女婚后未避孕,有正常性生活,夫妇同居1年而未孕的病症[1]。据相关文献统计,目前不孕症发病率为8%~12%[2]。随着社会发展的需要,“二孩政策”的开放,为延缓社会老龄化、增加出生率,不孕症已经成为了公共卫生领域的研究重点。中医对不孕症的记载可追溯至《黄帝内经》,所谓“督脉者……此生病……其女子不孕”。中医古籍中该病有“全不产”“绝嗣”“断绪”之称。不孕症的病因病机错综复杂,当代中医名家在临床中积累了丰富的经验,但治法方药却各有特色,由韩延华、罗颂平主编的《妇科名家诊治不孕症临证经验》一书,汇集了全国25个省份,95位妇科名家,包含国医大师、全国第一批至第六批名老中医药专家学术经验继承工作指导老师,重点学科学术带头人、全国中医妇科流派的代表性人物及主要传承人治疗不孕症的经验,充分展现出地域性差异和个体化治疗不孕症的特色。我们以此为基础,运用数据挖掘技术,采用频数分析、因子分析、聚类分析、关联规则等方法对书中大量的医案数据进行分析,旨在挖掘出名老中医治疗不孕的用药规律,提炼出不孕症治疗的核心药物,为中医药治疗不孕症提供切实可参考的经验。
1 资料与方法
1.1 文献来源 2019年由韩延华、罗颂平主编的人民卫生出版社出版的《妇科名家诊治不孕症临证经验》[3]。
1.2 检索策略 检索《妇科名家诊治不孕症临证经验》一书所涉及的全部方剂。
1.3 纳入标准 1)所选病案的医家均为国家中医药管理局认可的全国名老中医药专家、国医大师、中医妇科流派代表性传承人及主要传承人。2)方药组成、药物剂量完备。3)首选辨证分型清晰的方剂。4)以中药内服方剂为主。
1.4 排除标准 1)仅列方剂名称,未详述药物组成与剂量的方剂。2)重复录入的医案和(或)方剂。3)以西医治疗或针灸等治疗为主的医案。4)病案主治症状复杂,不具备代表性的方剂。5)非水煎剂的方剂如外敷等。
1.5 数据的规范与数据库的建立
1.5.1 数据库的建立 采用Excel 2010软件建立数据库,以二分类变量形式录入,频数分析、聚类分析、因子分析应用SPSS25.0软件实现,关联规则分析使用应用SPSS Modeler 18.0实现。
1.5.2 数据库的规范 按照《中药学》[4]、《中药大辞典》[5]标明的中药名称进行规范化处理,如“熟地”改为“熟地黄”“仙灵脾”改为“淫羊藿”;对于不同炮制方法的同一种药物,如不影响药物性味归经则统一为一种,防止分析结果失真。
1.6 数据分析 频数分析:作为最简单医学统计方法之一,通常用来对医学数据进行初步分析,得出量化依据,提炼高频信息。在本研究中鉴于涉及的方剂、药物众多,应用频数分析先初步筛选出高频药物,为后续系统深入分析用药规律奠定基础。
从《妇科名家诊治不孕症临证经验》一书中共录入方剂453首,涉及中药333味,总频次为5 438。对所有中药进行频数分析后将频次≥20的中药进行降序排列,得到高频中药,并统计累计百分比,即药物出现频次占总频次的百分比。
因子分析:因子分析是为了从大量数据中,提取可测变量间的共同因素,将大量变量简化为具有代表性的少数潜在因子,利用潜在因子来发现数据的本质规律,是数据挖掘技术中典型的降维分析方法。本研究选取主成分分析算法,在高频中药中寻找其潜在规律,将相关联比较密切的中药归在同一类中,每一类中药就成为一个公因子,以最具代表性的公因子来反映不孕症用药的共性规律[6]。
对出现频次≥20,累计百分比前80%的67味药物进行因子分析,结果显示巴特利特球形度检验:P=0<0.001,存在内部因子结构,KMO值为0.687,适合因子分析,特征根大于1时可提取出公因子23个,依据专业知识提取载荷系数绝对值大于0.4的有效药物组合9个。
聚类分析:聚类分析的基本思想是对变量间的相似程度进行研究,通过计算相似性程度将相似程度大的变量聚合为一类,分类后的变量组内相似性最大,组间相似性最小,是分类学基本统计方法之一。聚类分析树状图直观表达了变量间的相似性大小,距离越大相似性越低,本研究借助聚类分析寻找在高频中药中存在密切联系的药物组合体,进一步分析不孕症用药规律[7]。
对出现频次≥20,累计百分比前80%的67味药物进行聚类分析,选取系统聚类组间连接法,词篇矩阵选择Ochiai系数,得出聚类谱系图。药物间横轴距离越近即表示关系越紧密。
关联规则:关联规则是寻找变量之间的联系规律和特征性结构的统计学方法,本研究选取最常用的Apriori算法,在大量方剂数据中寻找频繁项集,依据频繁项集计算提取相应关联规则,其优点在于对大量无效规则的筛选,执行效率较高。本研究借助关联规则分析通过支持度、置信度、提升度等指标,找到药物间的最优匹配,最终得到不孕症治疗的核心药对,支持度即指X和Y 2种药物的交集在总体中出现的概率。置信度就是指出现了药物X的方剂中,药物Y也同时出现的概率。提升度为置信度与支持度的比值,提升度越高则关联规则可信度越好,提升度小于1的规则应予剔除[8]。
采用SPSS Modeler 18.0进行关联规则分析,并建立关联规则网络图,对高频中药进行可视化探索,线条粗细表示关联度的强弱。见图2。线条越粗两药关联度越强,如木香-砂仁、墨旱莲-何首乌、蒲黄-五灵脂等,鉴于可视化探索信息丟失率较高,为分析出核心药对,建立Apriori关联分析模型,规定最低支持度5%,最小规则置信度70%,最大前项数1,剔除提升度小于1的相对无效规则,分析出核心药对组合,并依据置信度由高到低排列。
因子分析、聚类分析、关联规则分析三者分别从降维、分类、内部结构规则探索3个方面挖掘数据的隐含规律,三者结合能够最大效率地减少统计分析中的信息损失,最全面地得到方剂数据中的规律。
2 结果
2.1 药物使用频率 67味高频药物累计百分比可达79.90%,最高频次药物为当归273次,根据药物功效可分为,活血化瘀药、补阳药、清热药、补气药、理气药、补阴药、补血药、清利水渗湿药、温里药、解表药、祛风湿药、固涩药、攻毒杀虫止痒药、化痰止咳平喘药、止血药、化湿药。其中活血化瘀药最多,共16味,累计百分比16.1%;补阳药居次,共9味,累计百分比12.17%;理气药7味,累计百分比6.26%,清热药6味,累计百分比6.00%;补气药5味,累计百分比9.91%;补阴药5味,累计百分比3.97%;补血药5味,累计百分比8.70%。见表1。
2.2 高频药物因子 F1有中药7种,F2有8种,F3,F4,F6均为5种。药物分布情况见表2。
2.3 高频药物聚类 由此可提取核心药物组合14组,A1:三棱、莪术;A2:皂角刺、穿山甲;A3:桃仁、红花;A4:丹参、赤芍;A5:败酱草、大血藤;A6:延胡索、川楝子;A7:五灵脂、蒲黄;A8:女贞子、墨旱莲;A9:淫羊藿、仙茅、巴戟天;A10:续断、桑寄生;A11:白术、党参、黄芪;A12:菟丝子、熟地黄、枸杞子、山药、山茱萸;A13:当归、川芎、白芍、香附、甘草、茯苓;A14:陈皮、半夏、苍术。见图1。
2.4 关联规则 得出高频药物关联规则25条,其中提升度较高的依次为五灵脂-蒲黄、莪术-三棱、女贞子-墨旱莲、续断-桑寄生、茯苓-半夏、菟丝子-覆盆子、菟丝子-枸杞子、菟丝子-杜仲;置信度较高的为菟丝子-覆盆子、当归-川芎、续断-桑寄生、当归-红花、菟丝子-枸杞子、菟丝子-杜仲、当归-熟地黄、当归-白芍等。见图2和表3。
3 讨论
不孕症是妇科领域的疑难病症,是造成家庭不稳定的重要因素,全国各地妇科名家对于不孕症的诊治各有特色,因而在大量方剂数据中寻找名家的共性用药规律对指导后辈医家的临床用药大有裨益。女性不孕的主要病机是脏腑功能失常,冲任气血失调,胞宫不能摄精成孕。肾气盛,冲任二脉通盛,两精适时相搏,方可摄精成孕。本研究经频数分析后,发现妇科名家诊治不孕症的方剂中以活血化瘀药最多,《诸病源候论》有云:“积气结搏于子脏……阴阳血气不调和,故病结积而无子。”女子性本善怀多郁,又求子心切,肝气郁滞,瘀结冲任;或感染外邪直中胞中,蕴结血分,冲任不通,瘀阻胞宫,血瘀是女性不孕症发展中的重要病理产物。姜俊雨[9]认为活血化瘀药,能够推动气血经络流畅运行,调和气血,起到疏通输卵管,恢复其摄精拾卵之功能,促进卵泡发育、排出的作用。此外方剂中大量出现补益类药物,补阳、补阴、补气、补血皆有,体现出阴阳并行,气血同治的用药特点,肾乃先天之本,若女子肾精不足,精不生血,则精枯血乏,无法妊养胞胎,应用补益类药物可使气血调和,阴平阳秘,为胞胎的生长发育提供基础。与此同时,佐以理气药物使诸药补而不滞,更能纾解肝气之郁结,相辅相成。而清热类药物则具有较好的消炎功效,能够消除输卵管炎症积液,畅通输卵管,恢复其摄精拾卵的生理功能。
本研究中,因子分析和聚类分析虽然分别采取了降维和分类的分析方法,但其结果却有交叉相似之处,例如F1-A12、F2-A1+A14、F3-A13、F4-A9、F5-A7、F7-A5等,对二者结合分析更能全面深入地挖掘出数据隐含的共性规律,使得本研究结果更具参考价值。F1-A12组均为补益药,功效以补益肝肾,填精益髓为主,可谓阴阳并行,气血皆益,F1组成与左归丸药物组成极为相似,于莎等[10]研究发现左归丸能够提高DOR不孕患者获得有效胚胎的周期比率,进而提高辅助生殖技术的成功率;F2组中三棱、莪术,破血行气消积,聚类分析A1组将此二味单独分类,恰为龙江韩氏妇科常用药对[11],常用于治疗输卵管炎性不孕。随着我国社会经济高速发展,居民物质生活愈加丰富,部分女性常贪嘴好甜,恣食膏粱厚味,形体肥胖,痰湿内蕴,痰浊阻滞冲任,阻碍胞宫摄精受孕,《丹溪》云:“肥盛妇人,禀受甚厚……不能成孕……湿痰闭塞子宫故也。”提出痰湿了不孕的机制,F2组中半夏、陈皮、苍术、枳壳相须为用,共奏燥湿化痰,理气宽中之功;白术、茯苓补气健脾,以填后天生化之源,通补兼施,化痰消浊,恰合痰湿不孕之治法;肝主情志,须其气和志达,方能协调平衡全身气机升降出入,而女子以肝为先天,以血为用,《笔花医镜》提到:“肝气唯妇女易动焉,……一有逆意,即牢结胸中……郁久而成病。”肝为冲任所系,若肝气失调,木郁犯脾伐土,气血顿失生化之源,冲任虚损,则妊养无力。F3-A13组以疏肝理气,活血调经为主,其中当归补血养肝、和血调经,香附疏肝解郁,理气调经,川芎、白芍活血行气、柔肝和营,配当归则滋补阴血,补而不腻。F3-A13组的药物组成,与傅山治肝郁不孕症之“开郁种玉汤”极为相似,丛慧芳等[12]研究发现开郁种玉汤能够有效改善肝郁肾虚型证候积分、焦虑自评量表积分,提高妊娠率。
F4-A9组以补阳药为主,当中淫羊藿、仙茅合为二仙汤,与巴戟天相配,能起温肾阳,益肾精,调冲任之效,墨旱莲、白芍则兼顾肝肾,二仙汤能够通过PI3K-AKT信号通路、MAPK信号通路、TNF信号通路等对卵巢功能产生影响[13]。F5-A7组蒲黄、五灵脂组成妇科常用方剂失笑散,能入肝经血分,治疗瘀停胞宫脉道阻滞之症;F6组以滋补肝肾,补气健脾为主,聚类分析将其中的续断、桑寄生提炼为核心药对组合A10,能补肝肾、强筋骨、安胎元。A11则由白术、党参、黄芪三味组成,具补气升阳、生津养血安胎之效,使气血化源充足,奠定胞宫妊养所需的良好环境;输卵管炎性不孕以瘀滞为主,兼夹湿热之邪,应治以活血行气,化瘀通络之品,而F7-A5组中败酱草、大血藤能清热解毒,活血祛瘀,与牛膝相伍能获补肝肾,强筋骨,逐瘀通经之效,能够疏解子管之瘀滞,复其摄精拾卵之能。研究认为大血藤的抗炎机制与TNF信号通路、NOD样受体信号通路、凋亡、MAPK信号通路、Toll样受体信号通路及核因子κB信号通路等密切相关[14];F8组中郁金活血止痛、行气解郁,川楝子疏肝泄热、行气止痛,王不留行、路路通活血通经,体现出疏肝通经活血之法。
此外,因子分析和聚类分析还分别得出了一些核心药对组合,如F9牡丹皮、女贞子,能清热凉血、消炎镇痛、滋补肝肾;A2:皂角刺、穿山甲,活血消癥、消肿排脓;A3:桃仁、红花,活血调经、祛瘀止痛,二味常相须而用,治妇科血瘀诸症;A4:丹参、赤芍活血祛瘀、凉血消痛;A6:延胡索、川楝子行气活血止痛;A8:女贞子、墨旱莲,补益肝肾,凉血止血,临床可以考虑根据其藥效灵活加减应用。
在关联规则结果中,五灵脂-蒲黄、莪术-三棱、女贞子-墨旱莲、续断-桑寄生、茯苓-半夏均为前文因子及聚类分析已述之药对,不再赘述,3种数据挖掘算法得以相互印证及补充,增强了本研究结果的可参考性。另外在关联规则网络连接图中,可以看出木香-砂仁组合,该组合行气止痛为主,常用于输卵管炎性不孕伴发的腹痛腹胀等症。而墨旱莲-何首乌则以滋补肝肾为主。在高频药物关联规则25条中,与当归相关的规则最多,可达13条之多,结合频数分析,我们发现当归在不孕症的诊治中具有不可或缺的地位,当归素有“妇科圣药“之名,现代药理研究表明,当归能增强人体免疫力,调节子宫平滑肌收缩,促进造血[15],当归酚性油对细菌具有抑制作用,能够抑制慢性炎症和组织水肿。根据其提升度大小,我们将与当归相关的药物进行重要性排序,由高至低的前5味药物依次为川芎、红花、熟地黄、白芍、枸杞子,提升度越高则妇科名家使用该药物组合治疗不孕症的概率越高,可信度越大。其中当归、川芎、芍药、熟地黄四味即为四物汤,养血调经而促孕。Zhou等[16]通过实验发现四物汤能够显著改善POF小鼠的雌激素水平、卵泡数量、抗氧化防御和微血管形成,显著激活Nrf2/HO-1和STAT3/HIF-1alpha/VEGF信号通路以促进血管生成,改善妊娠结局。与菟丝子相关的规则居次共5条,重要性排序依次为,覆盆子、枸杞子、杜仲、紫石英、淫羊藿。针对排卵障碍性不孕,菟丝子是公认的能够改善卵巢功能及女性激素水平的重要中药,孙向明等[17]发现菟丝子可能具有与己烯雌酚相似的拟雌激素作用机制,能够有效的影响体内生殖激素的水平。Gao等[18]通过检测菟丝子总黄酮对基质金属蛋白酶9及其相关通路上关键因子的表达,发现它是通过激活Notch/AKT/MAPK信号通路发挥作用的,能够借此治疗卵巢内分泌和生殖障碍相关疾病。雷娜等[19]发现,杜仲叶总黄酮可有效调节多囊卵巢综合征大鼠血清中雌孕激素水平,并达到良好的治疗效果。李锦英等[20]经网络药理学研究认为菟丝子-枸杞子药对的多种活性成分可能通过PI3K/AKT信号通路、MAPK等多条通路作用于AKT1、TP53等靶点改善卵巢功能。
采用数据挖掘方法对全国中医妇科名家的方剂进行分析,有助于从庞博纷杂的文献资料中找到当代名家遣方用药的共性规律,能够为科研提供可靠的理论依据和更为清晰的研究方向,为后辈医生诊治不孕症提供指导依据。本研究运用频数分析、因子分析、聚类分析、关联规则分析对95位妇科名家,453首方剂进行分析,并得出其共性核心药物组合,发现妇科名家治疗不孕多以活血化瘀、补肾疏肝、燥湿化痰、清热解毒为主要方法,用药中以当归、白芍、菟丝子最为常见,后辈医家临症可以此为参考,灵活应用于临床。
参考文献
[1]谢幸.妇产科学[M].北京:人民卫生出版社,2013:369.
[2]Vander Borght M,Wyns C.Fertility and infertility:Definition and epidemiology[J].Clin Biochem,2018,62:2-10.
[3]韩延华,罗颂平.妇科名家诊治不孕症临证经验[M].北京:人民卫生出版社,2019:23-615.
[4]高学敏.中药学[M].上海:上海科学技术出版社,2011:341-345.
[5]南京中医药大学.中药大辞典[M].上海:上海科学技术出版社,2006:1-194.
[6]于林童,曲文白,余新波,等.数据挖掘方法在名老中医用药规律研究中的应用现状[J].中医杂志,2017,58(10):886-888,900.
[7]隋明爽,崔雷.基于SPSS的共现聚类分析参数选择的实例研究[J].中华医学图书情报杂志,2016,25(1):52-56.
[8]趙艳青,李青松,项敏泓,等.中医药数据挖掘中常见问题的思考与策略——以中医药术语及用药规律总结为例[J].中华中医药杂志,2018,33(4):1220-1225.
[9]姜俊雨.活血化瘀法治疗不孕症的研究[J].中国社区医师,2019,35(8):113-114.
[10]于莎,李江慧,龙慧,等.左归丸加减对卵巢储备功能降低肾阴虚证不孕患者体外受精-胚胎移植治疗的影响[J].中国中医药信息杂志,2019,26(9):29-33.
[11]韩延华.韩氏女科[M].北京:人民军医出版社,2015:287.
[12]丛慧芳,高强,栾毅峰,等.肝郁肾虚型体外受精-胚胎移植患者应用开郁种玉汤妊娠结局临床观察[J].辽宁中医药大学学报,2020,22(10):5-8.
[13]李敏,郭淼,孙建华,等.二仙汤治疗POI的网络药理学分析[J/OL].世界中医药:1-6[2021-08-24].http://kns.cnki.net/kcms/detail/11.5529.R.20210527.1259.002.html.
[14]徐锋,黄旭龙,张梅,等.基于网络药理学的大血藤抗炎作用机制研究[J].中华中医药学刊,2020,38(8):249-253,29.
[15]黄红泓,覃日宏,柳贤福.中药当归的化学成分分析与药理作用探究[J].世界最新医学信息文摘(连续型电子期刊),2019,19(58):127,153.
[16]Zhou F,Song Y,Liu X,et al.Si-Wu-Tang facilitates ovarian function through improving ovarian microenvironment and angiogenesis in a mouse model of premature ovarian failure[J].J Ethnopharmacol,2021,280:114431.
[17]孙向明,宋辉,赵丽珠,等.菟丝子拟雌激素作用体内直接作用物质的发现[J].药学学报,2021,56(7):1826-1831.
[18]Gao F,Zhou C,Qiu W,et al.Total flavonoids from Semen Cuscutae target MMP9 and promote invasion of EVT cells via Notch/AKT/MAPK signaling pathways[J].Sci Rep,2018,26,8(1):17342.
[19]雷娜,任凤兰,王娜梅.杜仲总黄酮对多囊卵巢综合征模型大鼠相关激素水平的干预作用[J].中医学报,2020,35(8):1727-1731.
[20]李锦英,张兆萍,叶金飞,等.基于网络药理学的菟丝子-枸杞子药对治疗卵巢早衰的作用机制研究[J].中国药房,2020,31(18):2202-2209.
(2020-07-31收稿 本文编辑:张雄杰)
数据挖掘技术工程管理论文范文第4篇
摘 要:当前,随着教育的普及,高校的教育质量也在不断上升。对于很多高校来说,科研是必不可少的,很多导师基本上都有科研项目,因此,对于高校来说,需要具备完善的科研管理系统,方便科研管理者的工作,更为从事科研工作的导师打好坚实的基础。科技的进步为高校科研项目带来了很多便利,在科研项目进行的过程中,产生数据与记录是不可避免的,有的科研项目甚至会产生庞大的数据量,所以,随着科研项目的进行,其科研信息数据库中的历史数据也会越来越多。但是教师往往需要对一些有用的数据进行提取,或者是找到众多数据的规律等,而一些传统的方法已经不能满足科研工作者对数据处理的需求,因此,高校需要在科研管理系统中引进计算机数据挖掘技术。数据挖掘技术是专门对数据进行处理的一种技术,即使面对非常庞大的量的数据,它也可以从数据库中提取中有价值的规律,方便高校科研系统管理者和科研工作者的工作。该文就高校科研管理系统中计算机数据挖掘技术的运用进行分析与探讨。
关键词:高校科研管理系统 计算机 数据挖掘技术 运用
1 数据挖掘的概述
数据挖掘不是一个简单的学科,它包含可很多个领域的知识,目前,对数据挖掘的定义并不是完整的,就数据挖掘涉及到的相关知识来说,就有数据库、数据统计、人工智能化、机器应用与学习等,从这个角度来说,数据挖掘技术包含的知识点比较复杂。但是当前很多学者对数据库有一个比较普遍的概念,就是从一些大量的、不完整的、模糊的、随机的数据中,提取一些有用的信息,但是这些信息并不是显而易见的,而是隐含在其中,人们之前不知道的一些有用信息或者是知识的一个过程,这就是数据挖掘。从另一个角度分析,数据挖掘就是采用某些数据分析工具,来观测一些有价值的或者是被忽略的信息。
目前,数据挖掘主要可以分为两类:预言性数据挖掘以及描述性数据挖掘。预言性数据挖掘就是采用相关模型对一些数据进行预测,在进行预言性数据挖掘的时候常常采用分类的方法,也就是说对数据库中的数据进行分类,以区分数据的类别,进而得知一些未知数据的类别,通过这个方法可以得知某些未知数据的某些性质。描述性数据挖掘是采用概述的方式,对一些数据信息进行描述,然后从描述中得知数据的一些性质。要进行数据挖掘,就需要运用数据挖掘技术,当前使用的最多的技术就是关联规则方法,除此之外,还有分类分析、聚类分析等技术模式,这些技术模式在数据挖掘的发展中非常重要。
2 高校科研管理的重要性
随着教育的普及,各大高校之间的竞争也越来越激烈,高校如果要在其中脱颖而出,就需要不断的促进其自身实力的提升。对于高校来说,其科研管理系统对其发展非常重要,因此,高校在发展的过程中,需要不断提升其科研水平。要想培养高素质的人才,高校需要保证其教学质量,科研在一定程度上可以有效促进高校教学质量的提升。提升科研水平的前提是保证科研管理质量,在进行科研项目的过程中,如果其管理出现问题,那么科研项目的质量与水平都会降低。高质量的科研管理可以提升科研工作者的积极性,帮助高校科研建设项目更好的实施。
3 高校科研管理的现状
随着科技的不断进步,很多领域的管理已经开始往智能化的方向发展,但是,当前很多高校由于对科研管理的重视度不够,导致在管理水平与技术停滞不前,在进行科研管理中的统计工作时,仍然采用人工的工作方式。在对学校各院系导师的科研成果进行统计的时候,一般都是由科研管理人员到各个院系进行登记与整理,将导师的科研项目、发表的论文以及获奖等情况一一登记好,然后再录入到电脑管理系统中进行统一的汇总,这种收集资料的方式效率是非常低的,而且当有导师在外出差的时候,很容易将某些导师的研究项目、研究成果等漏掉,导致数据不完整等现象。而且管理人员往往就是将收集到的资料进行简单的整理与分析,由于其水平的限制,他们只能对收集到的数据进行简单的处理,并不能有针对性的对高校的科研水平与成果进行规范化的处理,得到的数据处理结果往往没有权威性与借鉴性。
其次,高校在进行科研管理的过程中,缺乏针对性的与科研相关的软件,每个高校的发展特点都是不同的,在进行科研管理的时候,学校应该根据自身发展的实际情况,选择科学、合理的科研量化软件,以做到对科研数据统计的科学化与正规化。人工录入数据的工作方式对与科研系统管理者来说,其工作强度是非常大的,而且在人工操作的过程中,出现错误是不可避免的。这些都是目前高校在科研管理中存在的问题,为了促进高校科研管理质量的提升,高校一定要引起高度重视,结合自身发展的实际情况,借助高科技技术,在科研管理系统中采用数据挖掘技术,提高科研管理质量。
4 数据挖掘的主要技术
数据挖掘并不是单纯的使用数据库技术就可以实现,它需要将人工智能与数据库技术结合起来,其中有很多方法都需要通过对机器的学习才能掌握好,在人工智能领域中经常会用到的一些技术都是数据挖掘的基础。在高校科研管理系统中运用的数据挖掘技术并不是固定的一种,根据科研管理系统的不同,进行数据挖掘操作时需要采用不同的技术与方法,一般来说,比较常见的有以下几种:
第一,统计分析法;数据挖掘中往往都需要对数据进行统计,然后从中提取中有用的数据,因此,很多数据挖掘工具都需要以统计分析方法为基础,是计算机数据挖掘技术中应用的最为广泛的一种;第二,人工神经网络法;这种方法是软计算中的一种重要方法,在学习的时候可以采用两种模式:管理模式与非管理模式,不同的管理模式在数据挖掘过程中适用的范围也是不一样的。一般来说,管理模式往往是对现有示例进行预测,将预测结果与标准答案进行对比,然后得出错误的数据;而非管理模式是对数据进行描述,一般不用于对结果的预测。在实际运用中,需要根据管理系统的不同需求选择不同的方法,以保证数据挖掘质量;第三,关联规则法;关联规则是运用数据挖掘技术来发现数据库中存在的一类重要的、可被发现的知识,并且发现的这个知识存在一定的价值。例如:“尿布与啤酒”的故事,这是在美国沃尔玛连锁超市发生的真实事件,沃尔玛拥有巨大的数据库系统,对数据库的数据进行挖掘后,沃尔玛惊奇的发现人们购买尿片的同时,购买最多的商品是啤酒。后來经过大量的调查与分析,发现这个结果是事实。如果不采用计算机数据挖掘技术,沃尔玛超市是很那发现这个现象的。除此之外,数据挖掘技术还包括:计划计算法、事例推理法等,在具体运用中,需要结合数据的特点,做出合理选择,进而提升数据挖掘技术的使用效果。下图为一般计算机挖掘技术运行的流程图,通过对数据库中数据的一系列的分析与挖掘,一些被隐藏在数据中的知识就可以显现出来。
5 数据挖掘技术在高校科研管理系统中运用的必要性
当前,随着科技的不断进步,高校科研管理系统也在不断完善中,但是一些高校的科研管理系统缺乏对数据分析功能,也有的学校已经具备这种功能,但是其在对数据的处理与分析上还是存在一些不足。有的管理人员掌握的数据处理技术过于表面,只能简单的對科研项目、导师发表的论文数量等进行统计,不能分析出所得数据所反映出的问题,也很少将数据库中的信息与相关部门共享,导致学校在科研管理上存在诸多问题。科研是一门很深的学问,通过科研项目得出的数据,很多都有其独特的含义,不同数据表达的含义也不同,当导师需要对某个项目进行一定改动或者根据某些数据信息得到相关结论时,简单的对数据进行处理得出的信息可能不能作为理论依据,也就是说经简单处理的数据其辅助策略功能是非常薄弱的,有的甚至不存在。虽然一些高校科研系统管理者已经意识到了计算机技术、网络技术的便利与强大,他们之中有的也掌握了比较全面的管理技术,精通管理功能,但是本身数据分析能力却非常弱,对科研管理系统的运行没有实质性的帮助。因此,在高校科研管理系统中,必须要科学、合理的运用数据挖掘技术,通过数据挖掘,为科研工作者找出数据库中有价值的信息,可以有效促进管理者对科研管理系统进行客观、正确、全面的管理。
6 数据挖掘技术在高校科研工作分析中的应用
对于教师来说,科研工作与教学工作应该是相辅相成的,教师在平常的工作中,要将这两者科学、合理的协调好,这样才能在保证科研质量的前提下,有效提升教学质量。
数据挖掘技术在高校科研工作分析的应用的项目比较多,比如对数据的整理,很多专业的科研结论需要大量数据的支持,随着科研项目周期的增长,产生数据的量也会越来越大,通过数据挖掘在数据库中选取有效数据,将数据严格按照处理标准进行处理,然后得出一些有效信息,作为项目结论的有力依据;其次,数据转换也是科研项目中经常会出现的,也就是数据变换,科研项目中的数据有的时候并不就是一个简单的数字,利用数据转换可以将数据值转换成某些概念,例如:可信度、支持度等,然后利用关联规则对数据进行处理,得出相关信息。另外,数据挖掘技术可以通过对数据库中数据的挖掘做出结果表达,根据管理者制定的标准,可以对科研工作者的科研量进行统计与归类,进行总结出教会的科研工作量,作为判断教师有没有将精力放在科研实践上去,如果出现科研量超出标准的导师,也可以合理对其进行调整,要保证其在进行科研的同时不耽误其教学。
7 结语
综上所述,高校在科研管理中还存在比较多的不足,要结合科技的发展,将计算机数据挖掘技术良好的运用到科研管理系统中,以促进高校科研管理质量的提升。
参考文献
[1] 魏一搏.浅谈数据挖掘在高校科研业务管理系统中的应用[J].信息系统工程,2010(4):37-38.
[2] 郭卜铭,吕渭济.高校科研管理中的数据挖掘技术及应用[J].科技和产业,2007(6):38-40.
[3] 刘华,胡运全.数据挖掘技术在高校管理信息系统中的应用[J].亚太教育,2016(13):199.
[4] 王利.数据挖掘技术在高校管理中的应用[J].福建电脑,2005(6):48-49.
[5] 李庆梅.数据挖掘技术在学生信息管理系统中应用研究[J].电脑知识与技术,2014(1x):241-243.
[6] 刘涛.基于数据挖掘技术的毕业生信息管理系统的研究与开发[J].数字技术与应用,2016(4):160-161.
数据挖掘技术工程管理论文范文第5篇
摘要:电力营销系统是保证电力系统运行安全稳定性的重要组成部分。然而,其在实际运行使用过程中,却受到数据信息种类混杂、数据内容繁多以及数据要求高等问题影响。为提高电力营销系统的作用效率,相关建设人员应采用数据挖掘技术对系统内部数据信息进行科学合理分类与关联。这是满足现代化经济建设对电力系统运行安全性、耐久性需求的关键,相关人员应将其作为重点课题,以促进电力营销系统的科学合理发展建设进程。因此,本文对电力营销系统中的数据挖掘技术进行了分析。
关键词:数据挖掘;电力营销;发展前景
1、数据挖掘技术及特点
数据挖掘属于一种通用技术,伴随着电子储存技术和测绘技术的不断发展,技术人员可以对信息数据进行储存和测量,但是在获取了大量数据的同时,却缺少一种方法来对数据进行整理和利用。数据挖掘技术正是基于这种信息利用的现状而产生的解决方案,它的出现为计算机数据处理技术带来了极大地飞跃。
数据挖掘技术来源于机器学习,机器学习是一种相对比较机械的操作,对于归纳等技术使用频率低,没有指导性学习的办法一般不从这些环境得出反馈,而是通过没有干预的情况下进行归纳和学习,并建立一种理论模型。数据挖掘技术是在机器学习机械性的背景之下,更加关心提升计算机学习的能力与效率,让计算机能够在处理数据的过程中更加重视对数据的利用,是数据发挥其应有的价值。计算机学习的目的是搜集数据建立数据库,而数据挖掘是要建立起对数据库内容的二次利用,通过处理数据库产生的异常以及缺项数据,将不同类型的数据进行整合利用。
传统的数据处理方式和目前的计算机数据挖掘技术相比,传统的数据处理将理论作为指导数据,而计算机数据挖掘技术与之最大的区别是技术出发点和原理不同,挖掘技术更多的是通过对学习方式的利用让对计算机形成归纳学习的能力,在这个过程中对理论进行假设处理,从而更好的对数据进行分析和利用。
2、数据仓库的系统结构
2.1相对稳固
數据的关键是为企业提供分析决策支持,它关联的操作是数据查询,通常不对数据进行修改。数据仓库中的数据是由不一样的时间数据组成的,而不是事务型的数据。
2.2面向主题
数据仓库的主题为在一个比较高的层面把数据进行集合的标准,各个主题都是对应一个宏观的处理领域,充分满足此领域的决策分析需求。数据在进到数据仓库前通过集合和加工,把原始的数据构造做到从面向运用到面向主题的改变。
2.3时间特征
数据仓库的数据有着时间的特点。数据仓库伴随着时间的不断变化,内容也在不断的增加,同时需要删除陈旧且没有作用的内容。因为数据仓库通常是作为趋势的分析预测,通常保留5~10年的历史数据。数据仓库里的数据包括着时间的元素,是键码的一个部分。
2.4集成性
数据仓库中里的数据主要用作决策分析,要进行整合与归纳。要处理源数据里格式不同的情况,要求把它们统一到数据仓库的模式中。数据仓库体系是对进到数据仓库的原始数据进行清洗、转换、抽取等处理,最后将其进到数据仓库里,把对数据仓库里储存的数据进行管理、更新、运用的有关工具与软件进行整合,用于支撑数据仓库管理与使用的决策。它常常是由分析工具、管理与数据仓库构成,其具体的关系如图1所示。
3、数据挖掘技术在电力营销系统中的运用
3.1数据仓库的开发
3.1.1数据仓库的数据来源
电力营销管理体系的实际要求与现状是构成电力营销数据仓库的关键。电力营销具有分散性,构成数据仓库里的数据,许多来自不同用电数据库中,这些数据库大多来自于各个不同的数据库,其中很大一部分数据库来自不同区域的电力基层,还有一部分数据库来自其他电力系统,甚至有一部分数据库是电力系统以外的,一些数据还要求人工录入,经过Web技术转化与提取之后存储在数据仓库。
3.1.2数据仓库的设计
(1)物理模型的设计:传统的数据库设计是先设计逻辑型,然后依据逻辑建立星形的模式,最终形成物理模型创建的模型方法。通常来说,物理模型的实现基本是逻辑模型,逻辑模型创建的星形图能够为创建实在的物理模型提供指标实体以及具体的种类实体,然而维度表常常不是变为直接的物理数据库表,而为物理模型的创建提供查询、整合、过滤与参考的数据。逻辑模型在数据库里表现出物理模型,能够达到数据的物理存取模式、数据储存构造、数据存储位置与分配等功效。
(2)概念模型的设计:主题的创建,即指标的确定。
在明确数据仓库的类别与维度时,先针对元的数据库系统的构造进行强化分析与理解,思考元数据在数据库系统中的分布与组成形式,理解之后能够建立数据仓库系统的模型。
(3)逻辑模型的设计:物理模型是各个数据仓库的主题相关的关系表,然而逻辑模式是此模式关系的体现。
3.2电力营销决策支持系统
电力营销决策支持系统主要是由决策层、决策工具层、支撑层与数据管理层构成。在电力营销决策系统的建立中,要取得数据挖掘技术与数据仓库的支撑。在电力营销决策系统中要经过逻辑的判断,对每种决策数据以及辅助决策的方法进行择优选择,整合出好的解决办法。
3.3 EMDSS开发流程
电力营销决策支持系统是根据数据仓库技术的决策与制作定出有关的方法库、模型库与知识库,并且对整个系统进行统一的管理。
4、结束语
伴随着科学技术的发展进步,电力营销系统中逐渐引入了诸如数据挖掘技术和数据仓库技术以及联机分析处理等多种新型技术,为电力营销决策系统提供了更为准确、全面和详尽的量化指标与参考数据。
参考文献:
[1]许敏.数据挖掘技术在电力营销系统中的应用及发展[J].科技与企业,2015,(10).
[2]雷波.数据挖掘技术在电力营销系统中的应用研究[J].广东科技,2014,(12).
(作者单位:国网辽宁省电力有限公司葫芦岛供电公司)
数据挖掘技术工程管理论文范文第6篇
关键词:数据库安全;数据库加密;加密粒度;加密算法
Discuss About Database Encryption Technology
QIN Xiao-xia, LI Wen-hua, LUO Jian-fen
(College of Computer Science, Yangtze University, Jingzhou 434023, China)
Key words: Database security; Database encryption; Encryption granularity; Encryption algorithm
1 引言
随着网络技术的不断发展及信息处理的不断增多,巨量级数据扑面而来。数据库系统担负着集中存储和处理大量信息的任务,从而使数据安全问题变得也非常显著。传统地,物理安全和操作系统安全机制为数据库提供了一定的安全措施和技术,但并不能全部满足数据库安全的需求,特别是无法保证一些重要部门如政府、金融、国防和一些敏感数据如信用卡、身份证、个人的医疗信息的安全,因此对数据库加密是提高数据库安全的最重要的手段之一,也成了数据库安全研究的一个焦点。
2 数据库安全概述
数据库在信息系统中的核心地位使得数据库面临着严重的安全威胁,根据数据库受到的威胁和可能的攻击,数据库的安全性要求着重在几方面:
(1)物理上的数据完整性。预防数据库数据物理方面的问题,如掉电,以及灾害破坏后的恢复、重构数据库。
(2)逻辑上的数据完整性。保持数据的结构。
(3)元素的完整性。包含在每个元素中的数据是准确的。
(4)可审计性。能追踪到谁访问或修改过数据库中的元素。
(5)访问控制。确保用户只能访问授权数据,限制用户访问模式。
(6)用户认证。用户除提供用户名、口令外,还可按照系统安全要求提供其它相关安全凭证。系统可以选择使用终端密钥、用户USB Key等来增强身份认证的安全性。
(7)可获用性。用户能够对数据库进行授权的访问。
3 数据库加密要实现的目标
与一般的数据加密和文件加密相比,由于数据库中数据有很强的相关性,并且数据量大,因此对它加密要比普通数据加密和文件加密有更大的难度,密钥管理更加困难。数据加密是防止数据库中数据在存储和传输中失密的有效手段。数据加密的过程实际上就是根据一定的算法将原始数据变换为不可直接识别的格式,从而使得不知道解密算法的人无法获知数据的内容,而仅允许经过授权的人员访问和读取数据,从而确保数据的保密性,是一种有助于保护数据的机制。
因此,数据库加密要求做到:
(1)数据库中信息保存时间比较长,采用合适的加密方式,从根本上达到不可破译;
(2)加密后,加密数据占用的存储空间不宜明显增大;
(3)加密/解密速度要快,尤其是解密速度,要使用户感觉不到加密/解密过程中产生的时延,以及系统性能的变化;
(4)授权机制要尽可能灵活。在多用户环境中使用数据库系统,每个用户只用到其中一小部分数据。所以,系统应有比较强的访问控制机制,再加上灵活的授权机制配合起来对数据库数据进行保护。这样既增加了系统的安全性,又方便了用户的使用;
(5)提供一套安全的、灵活的密钥管理机制;
(6)不影响数据库系统的原有功能,保持对数据库操作(如查询,检索,修改,更新)的灵活性和简便性;
(7)加密后仍能满足用户对数据库不同的粒度进行访问。
4 数据库加密技术中的关键问题
数据库加密需要考虑几个重要问题:是在数据库引擎内或产生数据的应用程序中或是在硬件设备上进行加密/解密?加密数据粒度基于数据库、表还是字段?加密效果与其对性能的影响如何?
针对上述几个问题,结合数据库数据存储时间长、共享性高等特点,在数据库加密技术中,重点是要选择合适的加密执行层次、加密粒度和加密算法,并且要与实际的安全需求紧密结合起来。
4.1 加密执行层次
对数据库的数据进行加密主要是通过操作系统层加密、DBMS内核层(服务器端)加密和DBMS外层(客户端)加密三个不同层次实现的;DBMS内核层、外层加密分别如图1、图2所示:
(1)在OS层
在操作系统(OS)层执行加密/解密,数据库元素以及各元素之间的关系无法辨认,所以无法产生合理的密钥。一般在OS层,针对数据库文件要么不加密,要么对整个数据库文件进行加密,加密/解密不能合理执行。尤其对于大型数据库来说,在操作系统层次实现数据库的加密/解密,目前还难做到有效保证数据库的安全,因此一般不采用在OS层进行数据库加密。
(2)在DBMS内核层执行加密/解密
在内核层执行加密解密有如下特点:
加密/解密执行时间:在数据存入数据库或从数据库中取出时,即在物理数据存取之前;
加密/解密执行主体:在DBMS内核层,由用户定制的或者DBMS提供的存储过程函数执行;
加密/解密过程:在存储数据时,通过触发器调用加密存储过程对数据加密,然后将密文数据存入数据库在读取数据时,触发器调用相应存储过程解密数据,然后读出结果;
加密/解密算法:由DBMS系统提供。多数不提供添加自己算法的接口,因此算法选择比较受限制。
在DBMS内核层实现加密需要对数据库管理系统本身进行操作,这种加密是指数据在物理存取之前完成加密/解密工作。优点是加密功能强,并且加密功能几乎不会影响DBMS的功能,可以实现加密功能与数据库管理系统之间的无缝耦合。由于与DBMS系统结合紧密,可以提供对各种粒度加密的灵活性,灵活的加密配合DBMS的访问控制、授权控制,不失是一种有效的数据库数据保护方案。另外,这种层次的加密对于应用程序来说是透明的。其缺点是加密运算在服务器端进行,加重了服务器的负载,而且DBMS和加密器之间的接口需要DBMS开发商的支持。
(3)在DBMS外层执行加密/解密
在DBMS外层执行加密/解密包含两种实现方式:第一种方式如图2(a)所示,是在应用程序中实现,加密时调用应用程序中的加密模块来完成数据的加密工作,然后把密文数据传送到DBMS存储;解密时把密文数据取出到应用程序中,然后由应用程序中的解密模块将数据解密并给出结果。第二种方式如图2(b)所示,是直接利用操作系统提供的功能实现加密,这种加密方式是在文件级别上的加密,直接加密数据库文件。
在DBMS外层实现加密的好处是不会加重数据库服务器的负载, 采用这种加密方式进行加密,加解密运算可在客户端进行,它的优点是不会加重数据库服务器的负载并且可以实现网上传输的加密,缺点是加密功能会受到一些限制,与数据库管理系统之间的耦合性稍差。
(4)不同层次实现数据库加密效果比较
在DBMS内核层和DBMS外层加密的特点如表1所示:
由表可知:在DBMS内核层执行加密/解密,不会增加额外的处理负担,对本身性能影响小;实现了密钥与密文的分离,安全程度相对较高;算法由应用程序提供,选择性大。
DBMS外层加密主要存在着可用性与安全性的矛盾;加密粒度受DBMS接口支持的限制,灵活性不够强;安全升级时,应用程序改动比较大;对于密文数据,DBMS本身的一些功能会受到影响。
4.2 加密粒度选择
数据库的加密粒度指的是数据加密的最小单位,主要有表、字段、数据元素等。数据库中执行加密,加密粒度越小,则可以选择加密数据的灵活性就越大,但是产生的密钥数量也大,带来管理方面问题。数据库中加密粒度的选择要根据需要,充分衡量安全性和灵活性等需求。选择的过程中,由于数据库中存储的数据包括非敏感数据,因此,可以只选择敏感数据部分进行加密,从而加密粒度越小,加密执行消耗资源就少,投入费用就少。
4.3 算法选择
数据库加密技术的安全很大程度上取决于加密算法的强度,加密算法直接影响到数据库加密的安全和性能。因此,加密算法的选择在数据库加密方案中也显得举足轻重。传统的数据加密技术包括以下三种:
(1)对称加密
也称为共享密钥加密。对称加密算法是应用较早的加密算法,在对称加密算法中,数据发信方将明文(原始数据)和加密密钥一起经过特殊加密算法处理后,使其变成复杂的加密密文发送出去。收信方若想解读原文,则需要使用加密用过的密钥及相同算法的逆算法对密文进行解密,才能使其恢复成可读明文。由于对称加密算法算法公开、计算量小、加密速度快、加密效率高,因此它是最常用的加密技术。主要的对称加密算法有DES、IDEA和AES。
(2)非对称加密
又称为公钥加密。非对称加密算法使用两把完全不同但又是完全匹配的一对钥匙公钥和私钥。非对称加密算法的基本原理是,如果发信方想发送只有收信方才能解读的加密信息,发信方必须首先知道收信方的公钥,然后利用收信方的公钥来加密原文;收信方收到加密密文后,使用自己的私钥才能解密密文。显然,采用非对称加密算法,收发信双方在通信之前,收信方必须将自己早已随机生成的公钥送给发信方,而自己保留私钥。由于非对称算法拥有两个密钥,因而特别适用于分布式系统中的数据加密。常用的公钥加密算法是RSA,它不但可以用来加密数据,还可用来进行身份认证和数据完整性验证。
(3)混合加密
由于对称加密算法更简单,数据的加密和解密都使用同一个密钥,所以比起非对称加密,它的速度要快得多,适合大量数据的加密和解密;主要缺点也是由于使用相同的密钥加密和解密数据引起的,所有的数据发送方和接收方都必须知道或可以访问加密密钥,必须将此加密密钥发送给所有要求访问加密数据的一方,所以在密钥的生成、分发、备份、重新生成和生命周期等方面常存在安全问题。而公钥加密属于非对称加密,不存在密钥的分发问题,因此在多用户和网络系统中密钥管理非常简单,但由于它主要基于一些难解的数学问题,所以安全强度没有对称加密高,速度也比较慢。
为了充分发挥对称加密与非对称加密的优势,混合加密方案被提出。在混合加密方案中,加密者首先利用一个随机生成的密钥和对称加密算法加密数据,然后通过使用接收者的公钥把随机密钥进行加密,并与密文一起传送给接受者。接收者通过自己的私钥首先解密随机密钥,再利用其解密密文。此方案既利用了对称加密安全强度高、速度快的特点,也利用了非对称加密密钥管理简单的特性。“一次一密”的加密是最安全的一种加密技术,加密者在每次加密时都使用与明文长度一样的随机密钥,并且每个密钥都不重复使用。但在数据库加密中,由于密钥的产生和保存都存在很大的困难,因此在实际应用中并不常用。
5 数据库加密后对系统的影响
加密技术在保证数据库安全性的同时,也给数据库系统带来如下一些影响:
(1)性能下降:数据加密后,由于其失去了本身所固有的一些特性,如有序性,相似性和可比性,这样导致对加密数据的查询,往往需要对所有加密数据先进行解密,然后才能进行查询。而解密操作的代价往往很大,这样使得系统的性能急剧下降。
(2)索引字段的加密问题:索引的建立和应用必须在明文状态下进行,这样才能够保证索引文件中键的有序性,以便提高查询性能。否则,索引将失去作用。
(3)加密字符串的模糊匹配:对加密数据上的大量模糊查询,例如,当SQL条件语句包“Like”时,很难进行处理。
(4)加密数据库的完整性:当数据库加密后,实体完整性不会被破坏,而引用完整性难以维护。
(5)加密数据的存储空间增加问题:对数据库加密,通常采用分组加密算法,这有可能导致数据加密后的存储空间增加。
(6)密钥管理问题:在现代密码学中算法的安全性都是基于密钥的安全性,而不是基于算法的细节的安全性。对数据库采取加密技术来保证其安全性,但是在现实生活中,如何保证密钥本身的安全性又是一件非常困难的事情心。在数据库管理系统中,由于数据的共享性和存储数据的持久性等原因,要求更加灵活和安全的密钥管理机制。
参考文献:
[1] 万红艳.一种数据库加密系统的设计与实现[J].黄石理工学院学报,2007,23(3):27-29.
[2] 赵晓峰.几种数据库加密方法的研究与比较[J].计算机技术与发展,2007,17(2):219-222.
[3] 王正飞,施伯乐.数据库加密技术及其应用研究[D].上海:复旦大学,2005.
[4] 庄海燕,徐江峰.数据库加密技术及其在Oracle中的应用[D].郑州:郑州大学,2006.
[5] 黄玉蕾.数据库加密算法的分析与比较[J].科技情报开发与经济,2008,18(2):159-161.
收稿日期:
作者简介:秦晓霞(1982),女,湖北荆州人,硕士研究生,主要研究方向:数据库技术及应用;李文华(1965),男,湖北人,副教授,主要研究方向:网络数据库应用、微机监控系统开发;罗剑芬(1984),女,湖北黄冈人,硕士研究生,主要研究方向:数据库技术及应用。
数据挖掘技术工程管理论文范文
声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。如若本站内容侵犯了原著者的合法权益,可联系本站删除。


