电脑桌面
添加盘古文库-分享文档发现价值到电脑桌面
安装后可以在桌面快捷访问

档案信息计算机的检索

来源:漫步者作者:开心麻花2026-01-051

档案信息计算机的检索(精选7篇)

档案信息计算机的检索 第1篇

信息服务是档案网站的重要职责, 提供档案检索是档案网站信息服务的主要渠道, 在政府公开信息“井喷式”增长的时代, 档案的查阅和利用显得有些力不从心, 档案检索工作和档案信息化建设仍存在着有待改进之处。

一、当前档案检索存在的问题

1. 档案信息化建设进程相对滞后

尽管当前各级政府部门十分重视档案信息化建设, 并增加了大量投入, 各级各类档案部门也积极努力, 但是档案信息资源检索体系的软、硬件开发仍然落后于信息社会的发展需要。比如软件方面, 现行的大部分档案管理系统基本采用最简单的数据库遍历搜索方式, 使用户在检索过程中消耗时间过长、检索结果准确率较低;硬件方面, 服务器无法同时服务大量用户等问题的制约, 使得档案信息资源利用难以适应社会档案信息利用需求。

2. 档案信息数据库规范和标准质量不高

现在档案的种类逐渐增多, 特别是专业性档案的种类数量激增, 每种档案需著录的项目又各不相同, 但管理软件方面却缺乏相应的专题数据库。若按现行的统一格式进行管理, 常导致在检索过程中无法快速地查找到所需要的档案信息或者检索出与内容不相关的“垃圾”信息。例如文书档案少了文号著录项, 若按照主题检索, 可能会导致检索过程消耗时间增加和检索结果准确率的降低。为了尽可能少地检索出“垃圾”信息, 必须使档案信息数据库中信息的收录范围更全面, 更切合相应学科或专业的需求, 内容更加详细准确。

3. 检索功能在档案网站中的地位不大

目前大多数档案馆网站定位于“宣传型”或“展示型”, 在档案网站的首页, 档案工作的动态、成果、大事、法规、标准等内容占了很大篇幅, 以期通过此类宣传来展示、扩大档案工作的影响, 增强社会的档案意识。相形之下, 档案检索功能、服务功能并不突出, 并不能是真正实现为社会公众提供档案资源, 是档案网站成为社会公众生活、工作中必要的好帮手。

4. 用户档案信息化检索能力不强

长期以来, 我国有相当多的信息用户都把手工检索作为主要的档案检索方式。面对网络检索等新兴科技手段, 许多信息用户的信息素质显得相对较低、适应性较差、运用能力不足, 不能有效地把档案信息需求转化为获取档案信息的行为。例如, 很多用户在进行检索时, 由于对档案检索工具不了解或者对检索目的不明确, 导致没有恰当地使用正确的检索方式, 难免会出现误检或漏检, 影响档案使用效益。

5. 现行档案信息化数据安全较薄弱

应用计算机管理、检索档案信息既保证了案卷质量, 提高了工作效率, 又能快速、准确、及时、方便、全面地为档案用户提供档案信息资源, 其速度和效率与手工检索相比有明显的飞跃。但是同时计算机系统的引入也为档案工作带来了新的挑战。从计算机数据管理的角度看, 小到错误操作导致系统的破坏及丢失;大到硬件的损坏、存储介质的损坏, 自然因素导致的火灾、地震、水灾等其他突发事件, 都会使档案信息资源安全受到威胁。

二、完善档案信息检索体系、提高检索效率的应对策略

1. 重视档案信息化规划, 有针对性地选购软硬件。

各级领导部门要充分认识到档案工作网络化建设的重要性、紧迫性, 把网络化建设作为一件大事来抓。高度重视档案部门建设与发展, 将档案部门网络建设纳入到信息化建设的总体规划和预算之中, 要通过多种渠道、多方位地筹集资金, 使档案部门的各种设备得到不断的补充和改进, 更好地满足档案事业发展和社会进步的需要。

在选择档案资料检索设备和软件时, 要考察系统软件的数据管理能力、兼容性、运算速度、易用性、容错性、安全可靠性、数据结构的合理性以及数据资料的齐全完整性等, 不仅要看现在的先进性和实用性, 还要看它的可开发性、售后服务以及公司的综合技术实力等。只有这样, 才能保证所建的档案检索系统的先进性和可靠性。

2. 加强档案信息分析, 完善档案数据结构

虽然目前档案计算机管理和电子化档案管理都已有国家标准, 但由于档案业务涉及行业较广, 在把档案信息录入数据库时, 不同行业档案信息所需要著录的必要项目也可能存在差异。如果都按照统一规格进行录入, 进行检索时就无法利用一些档案特殊信息来优化检索策略, 提高检索速度。这就要求建库时要对档案信息进行充分的分析, 不仅要考虑计算机发展的要求, 还要符合国家和行业的有关标准, 以适应档案事业的发展和对外交流的需要, 避免人力、物力、财力的浪费, 保证档案检索结果的快速、准确。

基于对档案信息的分析, 逐步完善档案管理软件数据库的结构标准。可根据不同种类的档案的不同关键项, 如文书档案的文号、财会档案的凭证号等建立相应项的索引, 方便检索。也可制定不同种类的档案数据库, 而每种档案数据库内对其基本的、主要的项目制定统一的字段名、字段宽度、字段类型、字段格式和字段顺序, 对不重要的附加项目不作统一规定。以此减少数据库中大量的无内容著录的项目, 降低档案检索时服务器的检索量, 特别针对专业性较强的档案检索, 提高检索效率。

3. 改进档案信息标引质量, 提高档案查全率和查准率。

标引是档案整理中的重要环节。通过标引, 档案工作者赋予档案以检索标识, 指明其内容特征的主题类属, 配合专题信息编制出各种目录和索引, 或存储于计算机内, 以实现档案的检索。标引的质量对档案的检索效果有直接的决定性影响。衡量标引的质量的高低, 一般采用两个客观上可比的指标, 即:穷举度与一致性。标引穷举度, 指标引时是否将档案信息收录的全部主题反映出来;标引一致性, 指不同标引人员或同一标引人员在不同时期, 对同一主题档案资源标引时, 对其主题归属的一致程度。从档案检索的角度看, 穷举度高, 有利于提高查全率;一致性强, 则有利于提高查准率。

提高标引质量, 要求在标引过程中, 用词恰当, 组配合理, 要能正确揭示主题, 全面反映主题。进行标引时, 要保持标引前后的一致性。特别对于专业性质较强的科研档案信息, 没有经过严格的标引, 在进行检索时难免会出现一些毫不相关的内容。为了能提高网络信息的检索效率, 必须要在信息发布时做到严格标引, 且标引前后要保持一致。

4. 建立政府网络档案馆, 突出民生信息检索板块

政府网络档案馆的使命是提供各类档案资源为社会公众利用, 充分体现档案信息作为人类社会原始信息源的价值, 突出民生信息检索板块的设计和比重, 实现档案信息“取之于民、用之于民”的目标。我国档案网站提供的资源大多基于自身馆藏, 跨馆建设的很少, 不便于民众的检索。在政府网络档案馆的建设中要注重资源的整体规划和整合, 支持跨服务器、跨平台的分布式数据库查询和异构数据库关联检索, 提高数字资源利用效率, 方便与外部档案管理机构之间进行档案信息资源的共享。

5. 积极开展用户体验, 加强用户培训工作

要增强检索人员的用户体验, 让初次使用检索功能的用户能够在短时间内知道下一步要做什么、该怎么做。我们可以在检索人员进行检索之前通过默认、提示检索频率高的关键字等方式, 使检索人员了解档案信息资源收集内容范围和加深对档案信息资源结构的深刻理解, 进而正确分析所要检索的主题, 然后选择恰当的检索语言来表达查找主题的内容, 进行恰当的逻辑组配找出最佳的检索途径, 最后使用户制定出最优的检索策略。

加强对用户的培训, 就是使用户更清楚地了解档案检索工具, 明确检索目的, 熟练、合理运用检索工具。在政府机关、企事业单位和高等学校中, 可以通过开展专题讲座、展板介绍、“档案服务月”、“档案文化节”等活动对用户开展形式多样的推介或培训活动, 不断提高检索人员的对检索工具的了解程度和使用水平, 提高网络信息检索效率。

6. 做好数据备份, 适当利用手工检索

对于数字化的档案馆而言, 要保证档案信息检索的正常开展, 就要保护档案信息数据的安全, 否则数据一旦破坏和丢失都将使档案馆的业务遭受致命的损害。因此, 建立可靠的数据备份系统, 保护数据安全, 是数字档案馆建设的一项重要内容。为了防止设备损坏、系统故障、病毒等不稳定因素对数据库造成损坏, 建议以“完全备份”和“差分备份”相结合的方式保存数据库。必要时, 只需从备份中恢复数据, 从而保证数据库的安全性。另外, 在系统软、硬件环境发生改变后, 将备份数据转移到新环境时, 要确保在新的技术环境下能够对备份数据进行检索和使用。

在某些特殊情况下, 比如停电, 或者档案数据库受到破坏时, 利用手工检索, 对已经系统整理和有序组织过的档案, 也能方便查找利用。而且目前计算机的档案检索工具, 并不能查全一些专题的内容, 而平时收录的档案中有更多专题, 并非所有专题都有专题数据库。因此, 手工检索仍不失为较好的检索手段, 专题的检索工具可与综合检索工具 (或数据库) 相互补充使用, 以免漏检, 影响查全率和查准率。

三、结语

信息化建设飞速发展的环境下, 档案信息资源的建设范畴、开发利用以及档案受众的构建, 均呈现了与传统档案不同的特点, 这都要求我们必须积极探索新形势下档案信息资源开发利用的新途径, 创新档案信息资源的开发利用机制, 不断满足人民群众日益增长的档案信息资源需求, 从而实现档案的自动化管理, 为提高新时期档案建设水平服务。

摘要:政府信息公开工作是责任政府、服务政府建设的重要举措, 是推进民主建设的必然趋势。档案馆既是政府信息保管的重要场所, 也是政府服务民众的重要窗口。档案检索是政府信息公开的重要环节, 本文根据当前档案管理信息化的开展情况, 阐述了档案信息资源检索服务中存在的一些不足, 并针对档案信息检索体系方面存在的问题提出了关于完善档案信息检索体系的策略。

关键词:信息公开,档案检索,检索策略

参考文献

[1]孙雪霞.档案网站检索策略研究[J].科技信息 (科学教研) , 2007.23

[2]周爱.应用计算机管理提高档案的检索率[J].机电兵船档案, 2007.4

[3]刘平.浅谈政府信息公开对档案法制的新挑战[J].上海档案, 2007.9

[4]李翠绵.档案检索利用技术研究[J].中国档案, 2007.8

[5]张宁.我国市级档案网站综合测评及分析[J].档案学研究, 2010.2

档案信息计算机的检索 第2篇

关键词:档案管理;信息化建设;计算机;网络技术

中图分类号:TP399 文献标识码:A 文章编号:1674-7712 (2012) 10-0108-01

随着我国改革开放之后经济的迅猛发展,特别是上世纪九十年代到本世纪初,信息化的浪潮席卷全球,原有的计算机网络模式受到冲击已经不能够适应新形势发展的需要,这使得档案管理模式从根本上发生转变,在此背景下,通过进行新一代计算机网络技术的开发,在单位当中进行档案管理推行信息化,则会使得档案管理显示出更加的高效和科学,而档案管理则进一步走向社会化、网络化、规范化、法制化和数字化。

一、当前我国档案管理现状

随着近些年我国信息化进程的加快,我国的档案管理信息化水平得到迅速发展,可是和国外先进的档案管理模式相比,我国原有的档案管理和我国的经济社会发展显示出强烈的不适应性,惧意表现为以下两方面内容。

一方面是我国尚未形成完善的档案管理体系。虽然我国对档案管理体系目前已经取得不小的成就,可是当前档案网络体系没有真正意义上形成,而且在馆藏信息上存在着严重重复的现象,在管理状态上存在着极度封闭的情况,而且有着极其薄弱的资源共享观念,这样就使得社会公众有着越来越低的社会认知程度对档案的利用。

另一方面是存在着单一化的管理内容。我国的档案机构在长期的发展过程当中都是和社会隔离开,这样就会使得档案机构处于严重封闭状态之中。而党政机关单位这是对档案进行利用的主要单位,而其利用价值也主要的是局限在进行诸如编史修志等这些方面的公务需求。而在这种收集来源途径上存在着严重的单一性,这就使得单一的馆藏结构在我国的绝大多数的档案馆当中。而其中占据主导地位的是财务档案和文书档案,而在房地产、知识产权以及高经济贸易等这些领域方面所进行的档案资料管理在其中所占据的比例显得非常细微的现象发生。

二、在档案管理当中对计算机网络技术的引入

由于受到技术水平的限制,当前结合档案管理工作的实际客观情况的软件进行一次性的开发还有这不少的难题,而在档案管理当中深入应用计算机网络技术,使得档案管理网络化的逐步实现这是当前的趋势所在。在档案管理当中对计算机网络技术的应用主要具有以下优点:

一方面是对数据的乙烯录用做到利用的多次。通过计算机技术的使用,可以将有用的信息通过软件接口做到一次性的导入系统当中,而在对档案进行管理的过程当中及时的补充和完善所需要的数据信息,虽然在进行数据的第一次录入的时候存在着工程量非常大的情况,可是在这第一次录入之后,对于数据可以做到随时的进行数据的提取和利用,具有快捷方便的特点。

另一方面是对数据的快捷查询检索。当档案管理的时候有着基础数据之后,在计算机系统当中可以给用户提供多种查询服务,档案管理人员可以对于查询条件进行自定义,通过对网络的使用来对数据库进行访问,这就使得在本地计算机当中可以对结果进行显示,从而可以做到对查询和打印的满足。

三、当前计算机网络技术的发展趋势分析

MPO(Multi-fiber“Push On”)是由NTT进行设计,其核心技术可以进行并行应用,并且对模块化进行支持,端口所接的光纤按照的行业标准为十二芯带状光纤,这样就会让系统具备十二芯光纤所具有的密度和安装速度,同时根据TIA-604-5和IEC-61754-7这两个行业标准进行定义,其所具有的版本具有单模和多模两种。而该技术所必须适用的范围要求是SAN之内的光纤通道进行信息的传输,再加上所机械牛的网络连接必须满足高度的安全要求,而且在当今所进行的网络连接有着布线密度极高的密度,这就必须在实际操作过程当中必须做到尽可能的小的布线直径要求,通过对计算机技术的发展技术趋势进行分析发现,将来预计将会把网络连接省级到的宽带为100M。

四、对于档案管理当中对新一代计算机网络技术应用的几点思考

首先是要对档案管理工作人员的学习意识增强,使得自身素质得到有效提高。一是要对于自身的学习和积累进行加强。通过邮寄结合理论和实际工作,将知识面进行扩大,使得业务素质能力得到有效提高;二是要对于安敢部门所组织的各种类型的培训学习高度重视;三是要加强网络技术的学习力度,从而让人员的现代化管理知识和能力得到增强。而通过在档案管理当中对计算机网络技术的应用,则可以对档案管理和档案信息的开发利用的质量和效率得到有效的提高,从而对整个档案事业的发展起到有效的推动作用。根据长期的实践结果表明,必须对整个档案资料的收集、整理和保管高度重视,并且做到开发出档案信息资源,使得档案的利用率得到有效的提高,这也是作为主要手段来对档案信息资源进行开发,使得档案原件不能够被广泛的被系统利用的弊端得到有效的客服,做到档案管理的收集多层次和广角度,从而使得收集工作网络横向和纵向。对于有效信息进行开发,做到对利用效率的提高。

其次是要对档案信息的安全高度重视。保密档案是历史的见证,它与一般信息资源不同,它具有不同的密级,对于保密性的档案要实行严格管理,确保其安全。建立划定密期制度,以便届满自行解密;建立调密通知单制度,对保密期间提前解密或发生升降变化的密级文件,要下发通知单告知档案室,以便衔接工作,及时掌握,适时变动;建立涉密档案接收标准制度,加强涉密档案的规范化建设。档案利用保密制度,根据实际情况,对不同层次的利用人员确定不同的利用范围,规定不同的审批手续,使利用工作有章可循,在大力开展档案利用的同时,确保不失密、不泄密,各项档案利用规章制度的条文应严密而简明,便于执行,并在实践中认真加以总结,不断充实和完善。

再次是软件开发人员和档案管理工作要做到密切配合合作,做到信息搭台,业务唱戏,使得对符合客观实际信息化需求的软件能够开发出来。

最后是与时俱进,建立一支高素质的档案信息化管理队伍。档案管理信息化体现出来的效果在很大程度上依赖于管理人员的水平。为了适应社会的发展和工作岗位的要求,从各部门培养出一支在思想上高度重视档案信息化管理工作,在业务上勤于钻研学籍业务和计算机专业知识的高素质管理队伍,使档案信息化管理为管理提供更好的服务。

参考文献:

[1]乔丽.档案网络化在信息社会中的运用[J].职业时空,2010,8

[2]任艳菊.浅谈计算机技术在档案管理应用中的必要性[J].沿海企业与科技,2005,9

档案信息计算机的检索 第3篇

档案信息化[1]是企业现代化建设的重要分支[2], 推进档案信息化建设必须站在较高的高度, 科学部署规划, 积极有效推进, 努力提高信息资源的使用率和覆盖面, 使信息资源共享能够真正实现, 为国有企业可持续发展提供坚实保障。

目前包钢档案管理模式[3]还处于手工管理状态, 工作效率较低, 无法实现档案工作规范高效的管理。现馆藏几十万卷海量档案, 没有现代化的软硬件建设作支撑, 跨区域、跨部门利用档案信息的难题无法得到有效解决;档案收集的及时性、全面性、安全性没有保障。针对上述情况, 包钢需在现有管理模式基础之上, 本着“高起点、高水平”的要求, 逐步推进档案信息化工作。依照此背景, 本文以包钢档案信息化建设为研究方向, 重点针对档案信息化建设中的数据检索部分展开研究。

2 信息检索系统开发

2.1 信息检索系统开发方案

设计档案信息化检索系统采用B/S架构程序[4], 开发语言使用Java。检索系统重点解决针对中文的全文检索问题, 分析中文分词技术以实现中文全文检索功能。

2.2 信息检索系统开发组件

档案信息化检索系统的搜索引擎服务器选择Solr4.8, Solr是一种开放源码的、基于Lucene Java的搜索服务器, 易于加入到Web应用程序中。

中文分词器采用IK Analyzer, 是基于java语言开发的轻量级的中文分词工具包。它使用“正向迭代最细粒度切分算法”, 处理能力达到60万字/秒。

2.3 信息检索系统全文检索功能的实现

以下面三段内容为例, 进行全文检索效果测试, 拟定检索内容为“档案管理”。

文段1:“当今社会随着信息化的逐渐提高, 档案管理工作也发生了翻天覆地的变化, 信息管理系统正被大量的开发。”

文段2:“档案管理是对信息资源的管理, 有别于传统管理, 信息化管理手段更有利于开发和应用。”

文段3:“9月16日包头市委书记王忠和召开党委负责同志座谈会, 听取对党的建设的意见和建议。”

2.3.1 创建编写索引工程

在Eclipse中新建project, 将solr解压出的dist/solr-solrj-4.8.1.jar和dist/solrj-lib下的全部文件导入工程。

2.3.2 编写索引代码

在Eclipse中编写索引代码, 将上述三段文字分别建立索引, 如图1所示。

2.3.3 测试检索结果

三段文字中只有两段文字中包含被检索内容“档案管理”, 检索系统快速准确的将检索结果返回, 如图2所示。

3结论

发展档案信息化建设, 其核心是提高档案管理水平, 更多的挖掘档案价值。本文搭乘包钢档案信息化建设东风, 通过开发支持中文全文检索的档案检索系统, 逐步建成一个高效、实用的数字化档案馆检索系统。

摘要:档案信息化是提升管理服务能力的必要手段, 是提高工作质量和效率的重要途径, 是档案信息资源综合开发利用的重要基础。“十二五”时期, 包钢档案馆进一步强化档案管理, 构建新的档案管理体系, 不断进行档案信息化建设, 实现档案工作的可持续发展。本文旨在研究探索档案信息化建设中支持中文的全文检索功能的设计和实现, 从而实现一个高效、实用的数字档案馆检索系统。

关键词:档案,信息化,信息检索,中文全文检索

参考文献

[1]赵海燕.档案管理信息化建设工作初探[J].办公室业务, 2013 (11) :141-142.

[2]葛宏.企业档案信息化建设的实践与思考[J].档案学通讯, 2011, 5 (1) :92-94.

[3]包钢档案馆.包钢 (集团) 公司档案信息化建设方案[R].包钢 (集团) 公司, 2014.

档案信息计算机的检索 第4篇

关键词:电子档案;分级检索;系统研究

一、档案电子系统的优备化

(一)储存含量的优备化

传统保存信息录入工具比较多元化,在现代信息不够具有特色的时代,人们多用文笔、图文、磁带、相机等多种特色性功能的工具来记录一些我们想要保存下来重要的信息、录音等档案,现如今的电子化管理档案解决了最原始收存信息工具的欠缺,相对于原始传统录入工具,现一系列电子化管理有着不可比拟的优点,例如所占内存空间较大不用担心所收纳信息太多内存空间过小的顾虑,操作人员误删的重要文件可以在回收站重新打开。所以现代化档案管理的电子化有着以一比十的作用,随时随地的进行信息剪切、复制、备份等具有特色的现代化优点。

(二)建立储蓄样式的优备化

在对于有关人员所需保存的文本信息的保存时,可以建立一个虚拟的空间保存室用来进行保存,通过不同种类文本信息和表达文本方式的不同进行区分并按类排放,这样可以方便工作人员的分类查找所需信息文件,节约时间。

(三)方便、快捷的优备化

在有着专门存放档案信息的储存空间室,有关工作人员在进行查询方面有着便捷化的优点,可以对所需对应电子信息按照不同类别进行点击、搜索连接服务器进行观察或根据个人工作要求进行文本信息的录入,用以此来完善档案文本信息的全面化。

二、建立完善的档案管理电子化系统

一个完整的档案管理电子化系统的建立离不开传统系统的档案录入、储蓄系统的保存和访问权限的设置,需要这三者结合才能达到成熟的档案管理系统。

(一)传统系统的档案录入

现代化管理档案系统虽然有浓浓的现代化气息,但依然离不开传统的档案录入,我们在传统储存电子化系统中,对文件的输入、编排、录入等环节的基础上又加大对此系统的改良,成为符合电子系统的专业文本。

(二)储蓄系统的保存

在我们的档案管理系统完善之后,我们需要对重要的文本文件进行保存储蓄,当然,根据所需保存信息的个数进行编排分为不同的储存框,然后再根据其类别进行分放。在简单的存档设置中,可以自定义的大致分为简单的直线型和复杂的交叉型。

(三)访问权限的设置

在日常工作过程中肯定需统计文件的可见程度,一些文本文件属于机密文件,一般人是无法进行随意查看,所以为防止发生重要信息的泄露,我们需要在此系统上进行设置观看权限或设置访问密码,也就是所谓的检索系统,当有关工作人员需对重要文件进行访问时,必须通过此程序方可进行查看。

三、电子化储存系统的操作要点及其复杂化

(一)档案管理电子化系统的操作要点

1.档案管理电子化系统给人们带来诸多便利,虽节省了大量人力物力,但对人们技术含量有一定的话语权,当然这也和相关工作人员的细心密切相关,档案管理电子化的高效率工作要求必须有着完整的工作套路体系极其有关部门具有标准化的管理模式。这是难点之一。其中包括工作人员对电子文本信息的获取、电子文本信息的保存、档案电子化程序和文本信息的访问设置权限。工作人员需对电子系统的操作流程倒背如流,以保证工作的顺利进行,准确的使所获文本信息正确保存在所建的文本储存室,这样才方便有关工作人员对文本信息的查询阅读、检索系统的正常运行,如果我们所录入的文本信息与文件类型不符,严重则可使我们的日常工作受到干扰。

2.分级检索系统的操作程序。上文提出有些重要文本文档非特殊人员不得观看,以防止重要文本信息的泄露,所以加密工程就起到了关键性的作用,我们所讲的分级检索也就是分层工作检验,通常设置为两个环节,其功能效果大同小异,无非在特殊人员需要翻阅重要文本文档时进入的加密档案室所走程序,第一个为以所在职位的高低为划分界限,职位达到一定的级别才可进入加密档案储存室进行查阅重要的文本文档,反之职位未到达所设标准,则无权进行翻看,另一个就是设置访问权限,上文也粗略的介绍过,就是对重要文本文档进行加密设置,只有通过加密程序的工作人员才有权利进行翻阅查找。

(二)档案管理电子化系统的复杂化

1.在对于传统档案系统,电子系统所需技术含量、文本信息的录入方式都有一定的技术要求,所以其复杂程度可想而知。

2.传统的档案信息储存是用简单的纸张进行文本信息的录入,所以可以进行翻阅进行查阅对比,以此确认文本信息的可靠性,但现代的电子档案储存就相应的减少了人们对文本信息可靠性的确认程度。所以以现代的科技水平,在技术上有很大的上升空间。

四、档案储存文本信息的安全对策

在电子储存文本信息的过程中都是建立在同一个服务器上,所以对于文本信息的泄露存在很大的风险性,因此我们采用一些措施防止文本文档的丢失,上文提出的通过对文本文档的加密程序来增大文本文档的安全性是个比较实质性的一个方法,另外为防止文本文档的误删或丢失事件的发生,可采用对文本文档进行定时备份的方法,这样可以对丢失的文本信息进行恢复以此把信息丢失的危害性降到可承受范围。

五、结束语

在科技水平技术完善的现代化设施中,档案电子化系统已趋于完善化,虽然在实际操作过程中具有一定的难度,但相对于传统档案管理系统,电子化系统具有不可比拟的优点,为解决档案管理电子化系统的复杂程度,本文笔者通过简单粗略的介绍此系统的优备化,向外进行补充,明确档案管理电子化及分级检索的操作要点、复杂程度、解决档案等一系列程序,为简单、便捷的档案储存提供实质性的经验。

参考文献:

[1]董春明.对档案数字化建设的探讨[J].中国新技术新产品,2009(13).

[2]杨安莲.聚焦电子文件管理前沿——国际电子文件管理研究热点及启示[J].档案学通讯,2007(06).

档案信息计算机的检索 第5篇

一、信息构建对档案网站检索系统的启示

近些年, 网站已经成为档案馆对外宣传、提供服务的重要手段, 是档案馆形象的体现。对于大多数用, 户尤其是第一次登陆网站的用户来说, 是否能简便、快捷的查询到所需信息, 将直接影响到其是否会再次访问。根据互联网数据中心的调查显示:“当用户登陆一个新的网站时, 如果一开始不能很快地寻找到他所需要的信息, 50%的用户将会立刻离开网站, 这些用户当中的60%将不再光顾这个网站, 这意味着该网站的所属机构将永远失去30%的潜在用户。”因此, 在档案馆网站检索系统的构建过程中, 只有遵循信息构建所倡导的以用户为中心的理念, 对用户的信息需求、认知模式、认知行为进行深入研究, 真正从用户角度对档案信息资源进行组织、标识, 对界面进行友好设置, 才有可能建立一个强大的、满足多元化需求的检索系统。最终达到提升用户体验、吸引用户的目的。

二、档案网站检索系统的现状

首先, 虽然多数网站都设置了站内搜索功能, 但普遍存在着内容缺乏组织、功能设置匮乏的问题, 多数对检索范围无有效划分, 仅设置单一检索界面, 用户输入检索语句后, 在全部档案信息范围内进行机械匹配, 这样很难达到查全与查准的统一。其次, 缺乏提高检索效率的方法。如, 检索帮助、检索示例等。对于没有检索经验的用户和第一次使用该检索系统的用户来说, 往往无从下手, 很难在短期内获取自己所需要的档案信息资源。最后, 在显示检索结果时, 能够做到对结果的排序分类、对页面进行有效描述、出现零结果时对用户进行二次检索引导提示的网站可谓凤毛麟角。

三、基于信息构建的档案网站检索系统的构建

1. 检索内容的组织。

首先, 对多数档案网站来说面临的第一个问题就是缺少大量可供查询利用的数字档案信息资源。必须加强后台数据库的建设。不但要有目录级更要重视全文档案信息资源的建设, 不仅仅添加一次文献更应着重力量加强二次、三次文献资源所占的比例。其次, 现在大多数档案网站的检索系统都是无论什么检索条件, 都对网站全部内容建立索引进行检索, 这样极容易产生不符合要求的结果。笔者认为, 应在了解用户思考模式的基础上, 对每个页面编制索引, 最好同时配有要点概括和关键词提示, 这样就可以根据档案信息资源的具体情况进行分类, 按照类别建立相应的检索区域, 对于目标明确的用户, 可根据下拉框界定检索范围, 以便达到将最准确的检索结果呈现给用户、缩短检索时间的目的。

2. 检索界面的设计。

(1) 检索类型。 (1) 确定性检索。用户在检索时, 所检索的是有关某一事务的具体答案。如名词术语、数据、概念、定义、某一事件、事实或某一机构、人物的状况等。 (2) 存在检索。用户知道所需哪类信息, 但无法明确的描述出来, 希望通过检索知晓是否存在此类信息。 (3) 探索性检索。用户想对某些问题进行探索, 或是想学到更多的知识。希望检索过程中可以提供相匹配的信息, 使其在检索过程中逐步明确需求。对于此类需求应尽可能全面的提供一些相关信息, 使用户逐渐找到接近自己需求的信息。 (4) 详尽检索。用户希望显示所有与某主题相关的各类信息。 (2) 界面设计。面对不同检索需求的用户, 仅设计出单一的界面是无法满足需求的。对于没有检索经验的和进行确定性检索的用户, 在页面上提供一个简洁的检索框和少量经过严格筛选的检索按钮, 这样无须过多的检索技巧即可免去复杂界面带来的干扰。对于有一定的检索经验和进行探索性检索的用户来说, 则要为其提供高级检索功能。首先, 用户可以从题名、主题词、关键词、责任者、时间等相关著录项进行查询。其次, 高级检索中要支持布尔检索、同义词检索、拼音检索、模糊检索等检索方式。最后, 对于那些无法提出明确检索词的用户, 应提供站内信息资源分类浏览检索, 使用户的信息需求在浏览过程中逐渐明晰。

3. 检索词的设计。

大多数用户输入的检索词往往都是非专业的, 很容易造成检索不全、答非所问的情况。通过分析用户用词偏好可明确用户使用习惯, 将用户常用语和专业术语结合起来。在用户输入的检索词时动态给出查询提示, 对用户输入有误的检索词, 给出相匹配的提示, 在出现零检索结果时, 为用户提供更确切的检索策略, 以便引导用户二次检索。此外, 对于检索词分析和跟踪, 还可帮助更新检索系统的标引词库, 进一步提高检索系统的性能。

4. 检索结果的优化。

(1) 显示检索结果时要突出对话机制, 一方面在计算结果与检索条件的相关度和考察检索结果重要性基础上, 按它的相关度及重要性排序。另一方面, 也要显示结果所在类目。这样即便查询结果不符合需求, 用户也可以根据各类目间的主题语义关系进行二次检索, 减少无目的尝试, 提高效率。 (2) 检索结果过多时, 用户可根据自己的需求显示, 如按照时间、字顺排序, 检索结果提供打印、导出word、excel、pdf格式进行编辑, 发送至用户邮箱、保存检索历史等服务。

5. 用户帮助和个性化服务。

设计独立的帮助页面指导用户使用多种检索方式。有条件的网站可通过多媒体技术, 提供具体的检索示例。通过分析登录用户使用检索系统的偏好, 记录最近输入的检索词和浏览频率较高的档案信息资源, 在显示检索结果的同时为其推荐相关的同类信息资源。提供“我的档案馆”、“我的检索”、“我的搜藏夹”等个性化检索服务。此外, 将检索系统链接至百度、谷歌等站外检索, 最大限度扩大检索范围, 满足用户需求。

档案信息计算机的检索 第6篇

关键词:网络环境,高校,档案信息检索,存在问题,产生原因

2008年8月20日, 国家教育部和国家档案局联合颁布的中华人民共和国教育部第27号令《高等学校档案管理办法》第38条明确指出:“高等学校应当设立专项经费, 为档案机构配置档案管理现代化、档案信息化所需的设备设施, 加快数字档案馆 (室) 建设, 保障档案信息化建设与学校数字化校园建设同步进行”。从此, 我国高校档案信息化建设进入了快速发展阶段, 部分条件较好的高校档案部门开始建设数字档案馆, 在电子文件归档与保存、档案数字化以及档案应用系统集成等方面取得了较大的成效。人们利用档案的方式也由传统的查阅纸质档案快速转变为利用现代通讯技术和计算机设备在线查阅利用档案。因此, 在网络环境下, 我国高校档案部门能否为每个档案用户提供及时、准确、便捷的档案信息检索日益成为检验我国高校档案部门工作水平和服务能力的关键。

一、网络环境下我国高校档案信息检索存在的问题

网络环境下, 我国高校档案信息的检索方式已从手工查找转变为利用计算机进行检索, 这不仅降低了校内外相关单位、个人利用高校档案的门槛, 而且还拓宽了利用高校档案的途径。利用计算机进行档案信息检索日益成为校内外档案用户利用档案信息资源最直接、最便捷的途径。因此, 我国高校档案部门如何编制、开发出能够满足校内外不同档案用户、不同利用需求的档案检索工具, 提高我国高校档案信息检索效率变得越来越迫切。有鉴于此, 我们可以梳理出网络环境下我国高校档案部门在档案信息检索方面存在的不足主要有以下几个方面。

1. 档案信息检索方法简单, 无法满足档案用户对高校档案信息检索的需要。

目前, 我国高校档案信息检索方法大部分是采用信息匹配的数据库检索方法。这种档案信息检索方法操作简单, 易于实现, 但其不仅与档案用户的输入信息是否准确有关, 而且还与档案数据库本身的质量有关, 如果档案用户输入的信息不准确或者档案数据库中的档案信息在归档或录入时本身就有偏差, 那么, 就可能出现检索不到所需档案信息的情况。

2. 对档案用户输入信息的质量要求较高, 普通档案用户难以做到。

在档案信息检索过程中, 我国高校档案部门一般要求档案用户输入的信息应尽可能地符合档案著录规则的要求, 如要求档案用户提供档号、正题名等信息, 档案用户提供的信息越符合档案著录规则的要求, 得到的结果就越详尽、准确。但是, 由于档案用户专业水平的限制, 使得其输入的信息通常是不准确的, 这就限制了高校档案信息利用的范围, 从而制约了高校档案信息资源的开发利用。

3. 没有建立档案信息检索反馈机制, 无法使档案用户与高校档案部门在进行档案信息检索时进行互动。

档案信息检索过程是根据档案用户输入的信息, 利用档案检索工具将检索结果输出给档案用户。在这一过程中, 档案信息检索没有建立信息检索反馈机制, 高校档案部门无法对档案用户的操作习惯和操作方式进行有目的的收集统计, 无法对档案信息检索质量进行评价分析, 这就使得高校档案部门在提供档案信息检索时, 不可能满足所有档案用户对档案信息检索结果的需求。

二、网络环境下我国高校档案信息检索问题产生的原因

网络环境下, 我国高校档案信息检索不仅是一个提供档案信息的过程, 它更是集档案信息获取、组织、管理、挖掘和提供访问为一体的过程, 它涉及计算机软、硬件设施建设、档案工作人员服务水平和能力、专业技术人才队伍建设等多方面的因素。总体来说, 网络环境下高校档案信息检索存在问题的原因可以归纳为以下几个方面。

1. 我国高校档案信息化建设起步较晚, 发展不够平衡。

网络环境下, 档案信息检索要以档案信息化作为前提条件, 高质量档案信息检索需要有良好的网络环境、软硬件设施和应用系统作为支撑。目前, 我国发达地区高校档案信息化建设已走在全国同类高校的前列, 而中西部相当部分高校档案信息化建设刚刚起步。同时, 由于不同高校对档案信息化建设重视程度的不同, 致使我国高校间档案信息化发展水平差异较大, 所提供的档案信息检索能力也各不相同。

2. 我国高校档案工作者主动服务意识仍然不够强。

由于我国相当部分高校档案部门长期附属于高校办公室, 使得我国高校档案工作者主动服务意识一直不强。加之, 长期以来, 我国高校档案工作重“保管”轻“利用”, 高校档案工作者主观上没有意识到档案信息检索的重要性, 缺乏现代服务理念, 致使我国高校档案工作者未能从档案用户利用需求的角度出发, 考虑如何改进我国高校档案信息检索方法和提高高校档案信息检索水平。

3. 未能真正了解高校档案用户的利用需求, 难以提供多元化的档案信息检索。

在网络环境下, 高校档案用户进行档案信息检索不仅是为了获取所需的档案信息, 更重要的是希望获取的档案信息有深度和广度, 能够对用户的工作有启发或引导作用。然而, 我国大部分高校档案部门目前所能提供的档案信息检索服务仅是简单的信息检索, 未能根据高校档案用户的特点, 有针对性地提供多元化的智能检索以满足高层次档案用户的需求。

三、网络环境下提高我国高校档案信息检索服务水平的对策

1. 高校档案工作人员应从发展高校档案事业大局出发, 切实转变服务理念, 自觉增强服务意识。

高校档案工作人员服务理念的转变是提高我国高校档案信息检索服务水平的前提。高校档案工作人员应从发展我国高校档案事业大局出发, 切实转变服务理念, 自觉增强服务意识, 通过不断提高服务水平, 使高校档案部门成为广大档案用户查阅档案、利用档案的理想场所。

2. 高校档案部门要采取切实措施, 激励高校档案工作人员通过自身的不断努力, 提高档案信息检索服务能力, 早日建设一支高水平复合型的专业队伍。

在网络环境下, 我国高校档案信息检索服务水平的提高一方面需要我国高校档案部门采取切实措施, 激励高校档案工作人员通过自身的不断努力, 提高自身的业务素质和技术能力, 另一方面, 也要求高校档案部门能够真正选拔一批真学、真懂、真干的档案工作人员, 培养一支懂管理、懂技术、懂业务的复合型档案专业人才。只有拥有这样一支高素质、高水平的专业人才队伍, 高校档案部门才能切实提高自己的档案信息检索服务水平。

3. 高校档案部门应采取切实举措, 提供灵活多样的档案信息检索方法, 满足我国高校档案用户的不同需求。

当前, 全国不少高校档案部门在提供档案信息检索时, 都存在着检索方法过于单一、过于专业等现象。有学者研究指出:除了专业的档案工作人员以外, 档案用户大致可以分为出于查考、考证目的的企业、机关和个人, 以科研、编研为目的的学者、研究人员和以宣传教育为目的的社会工作者三类人员。因此, 高校档案部门应当有针对性地提供适合于不同档案用户需求的档案信息检索方法。例如, 以查考、考证为目的的单位和个人, 他们进行档案信息检索时, 只需找出相应的档案信息即可, 这种情况下高校档案部门应提供档案信息导航、在线交流等方式, 帮助他们找到所需的档案信息。再如, 以科研、编研为目的的研究人员, 他们查找档案往往对档案材料的成套性和完整性有着较高的要求, 这种情况下, 高校档案部门应能提供启发式的档案信息检索方法, 帮助他们找到所需的档案信息。

4. 高校档案部门应在深入了解档案用户利用需求的基础上, 深度挖掘档案信息之间的关联, 提供智能化的档案信息检索。

档案数据库本身就是一个海量的信息库, 档案信息之间是有内在关联和逻辑联系的。因此, 高校档案部门可以对档案数据库中的档案信息预先进行挖掘分析, 借助人工智能、模式识别等技术, 挖掘出其中存在的关联信息, 与档案用户输入的信息自动比对, 将可能符合档案用户需要的档案信息推送给档案用户, 供其选择, 从而提高档案信息检索的质量和效率。

5. 高校档案部门应主动收集、整理高校档案用户的基本信息, 总结高校档案用户信息检索的基本规律, 以便为广大档案用户提供更加个性化的档案信息检索服务。

例如, 运用统计分析方法, 从大量高校档案用户检索习惯中总结出具有共性的档案信息检索规律, 不仅有助于为高校档案用户提供有针对性的档案信息检索服务, 而且还能主动地预测高校档案用户的利用需求, 从而提高我国高校档案信息检索服务的智能化检索水平。

档案信息检索是网络环境下我国高校档案部门提供档案服务的重要环节, 也是网络环境下衡量我国高校档案信息化水平的重要标志。随着我国高校档案信息化的推进, 我国高校档案部门所能提供的档案信息检索服务将会更好地满足广大档案用户多元化的档案信息检索需求。

参考文献

[1]牟阳春《.高等学校档案管理办法》解读[M].北京:高等教育出版社, 2010.

[2]梁孟华.档案网站信息服务质量评价研究[J].档案学通讯, 2012 (2) .

[3]卞咸杰.基于LINQ技术的数字档案检索研究[J].档案学研究, 2012 (2) .

浅析信息检索模型的现状及趋势 第7篇

关键词:信息源;信息检索模型;可视化;智能化;一体化

中图分类号:TP391文献标识码:A文章编号:1007-9599 (2012) 01-0000-02

The Status and Trends of Information Retrieval Model

Tian Huan

(Lanzhou Voc-Tech College,Lanzhou730070,China)

Abstract:This article provides an overview of the classification of information sources,a simple description of the concept of information retrieval.For classic Boolean retrieval,vector space retrieval,the probability to retrieve a more detailed analysis,and the direction of development of information retrieval model introduction.

Keywords:Information Sources;Information retrieval model;Visualization;Intelligent;Integration

一、前言

当今世界已经进入了信息化社会,大量的信息渗透到工业生产,社会生活的方方面面。在这爆炸性信息增长中,数字信息占据了最主要的方面,而传统信息载体的贡献比例越来低。有关研究报告显示,2006年全球每年制造、复制出的数字信息量共计1610亿GB,中国数字信息量为127.1亿GB,占全球信息量的7.9%;而受“富媒体”、用户创建内容和16亿网民三大因素推动,到2010年,全球数字信息量预计为9880亿GB,而中国的数字信息量预计为900.5亿多GB,将占全球信息量的9.1%。面对几乎无限的信息量,人们如何快速准确的找到自己感兴趣或者需求的信息是需要解决的一个关键问题。我国电厂检修的分级及检修现状。

二、信息源的分类

信息源的分类形式主要有以下几种:

按载体类型划分:书写型、印刷型、缩微型、机读型、声像型和数字型。

按内容划分:一次信息源、二次信息源和三次信息源。

一次信息源:也叫原始文献或第一手资料。以作者本人的科学研究或研究成果为依据而创作的原始文献,均属于一次信息源。如:期刊论文、科技报告、专利文献、学位论文、会议文献等。

二次信息源:将一次信息源进行加工、整理、提炼、浓缩、标引、编序后所形成的各种目录、题录、索引、文摘等信息源。如:信息检索工具。

三次信息源:对某一专题的一次信息源和二次信息源的有关信息进行检索、筛选、分析、加工,并结合编者的实地调查研究,进行综合分析后重新编制的成果。如:书评、专题述平、学科年度总结、动态综述、字典、百科全书、年鉴、手册、指南等工具书。

三、信息检索模型的概念及经典模型

信息检索模型(IRM,Information Retrieval Model)就是运用数学的语言和工具,对信息检索中的信息及其处理过程加以翻译和抽象,表达为某种数学公式。它决定于三个方面:1.处理查询公式和文档的视角;2.处理查询公式与文档关系的理论;3.查询公式与文档之间的算法。图1表示了IRM的分类体系。

图1 信息检索模型的分类体系

图1所示的经典模型为目前最常用的模型,主要包括布尔模型、向量模型和概率模型。

(一)布尔模型

布尔模型出现于20实际50年代。简单的说它为基于集合论的布尔逻辑运算,是一种基于特征项的严格匹配模型。首先,它建立一个二值变量的集合,如果查询文本中有相应的特征项,则变量可取“True”,反之取“False”。查询由特征项和逻辑运算符(“AND”、“OR”、“NOT”)组成。文本查询的匹配规则遵循布尔运算的法则。布尔模型的主要特点是它实现简单,易于理解,能处理结构化的提问,容易表示统一关系和词组,检索速度快。但是它也具有明显的缺点,传统的布尔逻辑运算比较严格,刚性较强,查询的结果不容易控制,无法提供定量的比较,无法满足特殊的查询要求。目前大多数文献数据库或检索工具都提供布尔运算的检索,如中国期刊全文数据库,维普,baidu或google。

(二)向量空间模型

向量空间模型(Vector Space Model)由Salton等人于20世纪60年代末提出。VSM概念简单,把对文本内容的处理简化为向量空间中的向量运算,并且它以空间上的相似度表达语义的相似度,直观易懂。当文档被表示为文档空间的向量,就可以通过计算向量之间的相似性来度量文档间的相似性。文本处理中最常用的相似性度量方式是余弦距离。VSM的优点:具有广泛的适用性,检索基于聚类文档,结果可以采用排序输出方式。但其缺点也很没明显:相似度计算量较大,不能处理布尔表达等结构化的查询。

(三)概率模型

Maron与Kuhns最早在1960年提出了概率检索模型。它是一种估计文献与用户需求的相关性、并根据求得的相关性结果提供从高到低的文献排列模型。它的运用是基于四个相关原则:想关心独立原则;词的独立性;文献相关性;概率排序原则。

四、信息检索模型的发展趋势

为满足当今信息检索的需要,除了对传统的信息检索模型进行改进外,新出现的检索模型盖帘主要体现在如下几个方面:

(一)智能化

智能化不仅仅是电脑硬件的发展趋势,也是软件,网络信息检索的发展趋势。智能化的检索模型不在基于机器语言,而是基于接近人类自然语言的检索形式。

(二)可视化

可视化将传统数据库的文本检索模式转为可见的图像方式显示,并且可以表达用户的检索过程。它能使用户更直观的分析文献与检索式语义的关系,有助于用户判断检索过程中的相关文献。

(三)功能多样化

信息检索模型功能多样化主要体现在两个方面:

(1)可以进行多媒体式的检索,不仅能按照文本输入进行检索、更能进行图片、视屏其他输入形式的检索。

(2)检索工具的一体化。面对互联网的不同文化与语言差异,检索工具能提供一体化的检索模式,支持多语言,多语境,促进不同地区、不通语言的用户更加方便的交流。

参考文献:

[1]孙坦,周静怡.近几年来国外信息检索模型研究进展[J].图书馆建设,2008,5

[2]张艳.信息检索模型的比较研究[J].电脑知识与技术,2009,8,5

[3]宋峻峰,张维明.基于本体的信息检索模型研究[J].南京大学学报(自然科学),2005,2,41

[作者简介]:田欢,本科就读于西北师范大学数学与信息科学学院计算机科学与技术专业,现就职于兰州职业技术学院,从事计算机专业教学。

档案信息计算机的检索

档案信息计算机的检索(精选7篇)档案信息计算机的检索 第1篇信息服务是档案网站的重要职责, 提供档案检索是档案网站信息服务的主要渠道,...
点击下载文档文档内容为doc格式

声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。如若本站内容侵犯了原著者的合法权益,可联系本站删除。

确认删除?
回到顶部