数据质量分析范文
数据质量分析范文(精选12篇)
数据质量分析 第1篇
随着社会对统计数据的关注度越来越高, 公共政策和公共治理对统计数据的依赖越来越重, 公众对统计数据的要求也越来越高的同时, 对统计数据的质疑之声此起彼伏。
湖北省统计局副局长、中南财经政法大学财税学院教授、博士生导师, 叶青指出:房价、地方GDP之和大大高出全国核算数据、城镇职工平均工资统计范围太窄、城镇登记失业率不反映真实失业率等, 都让老百姓对统计数据心生迷雾。
为了加强对政府统计数据质量的研究, 推动统计数据质量的提高, 在2011年7月份, 中国统计学会召开“政府统计数据质量”专题研讨会。
大会征集论文内容以政府统计数据质量为主题, 主要涉及统计数据质量内涵、质量评估、影响因素、改进途径、数据质量控制方法等不同角度。大会专家学者分别从理论研究成果、工作经验介绍以及前人研究成果的系统总结等各个方面对中国政府统计数据质量进行了探讨。
2 文献回顾
金勇进 (2010) 从统计数据质量控制与评估技术方法、统计数据质量管理体系建立等方面进行了理论研究。技术方法包括:测量误差的统计分布和检验研究, 抽样误差以及非抽样误差理论研究, 缺失数据的统计处理方法研究, 汇总数据的误差理论研究等。
中国从1993年改用SNA国民经济核算体系, 以及2002年加入GDDS以来, 中国统计数据质量标准越来越与国际接轨, 但是差距也是存在的。IMF的数据质量评估框架 (QDAF) 为统计数据质量进行定性评估提供了一种方法, 其主要内容包括五个维度:质量的先决条件、诚信的保证、方法的健全性、准确性与可靠性、适用性。在我国, 统计数据质量除了受到统计制度、核算水平等方面因素的影响外, 缺少一个全面适用的统计数据的质量评估标准也是不可忽视的原因 (常宁, 2004) 。
3 统计数据质量内涵
国家统计局总统计师鲜祖德认为, 从国际经验来看, 政府统计数据质量主要应从准确性、适用性、可比性、及时性、衔接性、可获得性、透明度和有效性等八个方面进行评价。金勇进 (2010) 认为, 统计数据质量就是要符合标准, 首先要能够准确反映客观现象, 即准确性;其次要能满足使用者的需求, 即适应性;以及由此发展而来的准确性、及时性、可比性、适用性、经济性、可得性和保密性等。
4 统计数据质量存在的问题
4.1 数据主观失真
(1) 数据采集环节。
采集到的数据符不符合要求, 准确性怎样, 误差有多大, 有没有主观编造等会对统计数据质量产生直接影响。这些采集到的第一手资料是进行分析的基础, 它们的准确性与否直接关系到分析是否有意义。国家统计局江西调查总队的周献华认为, 登记误差是当前影响农村调查数据质量的主要原因。而且, 数据采集环节产生的数据失真是很难修复的, 即使更正, 也需要大量人力物力。
(2) 台账、记录不全。
基层统计部门的原始记录和台账不健全也是造成统计数据失真的又一大原因。原始记录可以有效监督数据产生过程, 因而一旦缺失, 就无法保障记账笔数的正确性和及时性, 造成数据监管不力的局面。其次, 台账缺失, 在进行数据汇总的时候可能造成漏记, 堆记, 从而影响数据质量。
(3) 执法监督不力。
《统计法》宣传不到位, 执法不严, 对存在的违法行为不能够有效给予相应的惩罚。这一方面无法保证数据质量, 另一方面又纵容了不法行为, 可能造成进一步的违法。
(4) 统计不独立。
随着改革的深入和经济的快速发展、各种利益主体日益多元化、各种经济行为多种多样、调查对象的配合意识日趋淡薄、采集真实数据越来越困难、即使获得了真实的数据、但由于政绩考核等因素、难以完全避免外部干扰从而使最终的统计数据面临失真的可能 (金勇进, 2010) 。因而, 统计独立性问题一直都是影响统计数据质量的关键问题。
4.2 适应性不强
这包括统计方法、指标含义、口径不统一。
浙江省永嘉调查队胡少中认为, 调查方式方法存在缺陷是引起统计数据质量问题的主要原因。其次, 杭州电子科技大学的辛金国认为, 采取网上直报也面临一些新问题, 比如可操作性差、审核过于简单、安全性等。像房地产价格的统计数据主要由指定的房地产企业自己填报调查表, 这种方法局限太多, 适应面不广。指标含义的不明确也给不同统计部门带来了困难, 造成口径不统一。
4.3 统计调查体系存在问题
贺建风、刘建平 (2010) 指出, 我国统计调查体系存在很多问题:各统计调查方法独立运行, 相互脱节, 造成数据自相矛盾的困境;政府统计调查组织体系关系不和谐, 普查中心的功能定位不明, 所处地位尴尬;统计调查资源浪费与数据短缺并存, 源于统计服务功能未得到强化;统计监督能力不强, 数据抗干扰性差, 没有形成强有力的舆论监督体系。
4.4 管理体制不能适应市场经济发展
统计数据质量管理必须以完善的统计机制和制度为保障, 没有科学合理的管理, 统计部门就无法高效运作, 产生高质量的数据。
4.5 中央与地方总量数据不一致
地方GDP加总数据不等于中央统计数据, 这在全世界范围内都存在, 差距保持在5%以内是正常, 但是我国由于GDP与政绩挂钩, 统计部门地位不独立, 数据质量标准不统一, 统计指标口径存在差异, 导致二者的差距超过了5%。这就使二者的统计数据达不到可比性要求, 运用数据时也无法确认哪种数据更可靠。
4.6 法制保障不足
在我国, 统计法制保障不足, 统计法制建设滞后与依法统计困难并存, 《中华人民共和国统计法》使我国的统计工作有了法律依据, 但离真正的依法统计还有较大差距。刘建平 (2010) 认为:一是统计法制建设滞后, 《统计法》本身还需要进一步完善。二是依法统计困难重重, 《统计法》并未引起全社会尤其是领导的足够重视, 特别是政府领导违反《统计法》的事件层出不穷, 但统计执法部门往往对其无力查办。三是统计执法力度有限, 无论是统计执法的队伍建设还是经费投入都很不够, 统计执法工作难以实现制度化、日常化。加上我国统计部门不独立, 不透明操纵更是严重影响了统计数据质量。
5 存在问题的原因
(1) 在数据采集阶段, 随着统计工作中多种数据搜集手段的采用, 出现了设计误差、调查误差、汇总误差等。
(2) 调查体系上, 统计基础工作薄弱、统计数据与利益挂钩、造成政府统计外部抗干扰能力较弱, 统计数据的虚报、瞒报现象严重影响了政府统计数据的公信力。
(3) 在监督和法律保障方面, 我国统计法制对统计数据质量的保障力度不够, 并不能对妨碍和危害统计数据质量的违法行为发挥很好的预防和惩处作用。
徐小海 (2010) 从统计行为分析入手, 从另一个角度分析了使用者 (公众、政府) , 生产者 (统计部门) , 调查对象行为对统计数据质量产生的影响。主要是不同数据相关人员在追求不同利益的前提下, 采取的追求利益最大化行为影响到统计数据产生过程, 从而影响统计数据质量。
6 改进办法
建立凌驾于政府综合统计与部门统计之上的全国性协调机构, 加强统计部门独立性。组建全国性的统计监督管理委员会, 建立健全法制监督体系, 扩大社会舆论监督范围。
在管理上, 注重科学管理方法的运用。山东调查总队的刘敏认为:量化管理统计工作, 依据数字、数据进行决策的管理办法, 可以使统计管理可控, 可测量, 从而达到提升统计数据质量的目的。四川省青羊区统计局杨永红认为:应用ISO9001质量管理体系来规范管理, 可以强化过程控制, 实现数据质量管理标准化, 统计服务和法制工作规范化。
在统计专业队伍建设上, 加强对工作人员进行教育和培训, 提高人员素质。其次, 引进年轻一辈、高素质人才, 改善统计队伍结构。
摘要:改革开放以来, 随着人们对统计数据质量重要性的认识逐步加深, 中国统计数据质量存在的各种问题也越来越受到关注。现在, 中国统计数据质量依然面临诸多挑战, 包括如何与国际接轨、建立有效的质量管理体系等。从统计数据质量内涵、存在的问题、产生的原因、改进办法等几个方面加以了论述。
关键词:统计数据,质量,问题,改进办法
参考文献
[1]常宁.IMF的数据质量评估框架及启示[J].统计研究, 2004.
[2]贺建风, 刘建平.改革开放以来我国统计调查体系发展的回顾与思考[J].统计研究, 2010, (4) .
中国统计数据质量分析 第2篇
关键词:统计数据;质量;问题;改进办法
背景
随着社会对统计数据的关注度越来越高,公共政策和公共治理对统计数据的依赖越来越重,公众对统计数据的要求也越来越高的同时,对统计数据的质疑之声此起彼伏。
湖北省统计局副局长、中南财经政法大学财税学院教授、博士生导师,叶青指出:房价、地方gdp之和大大高出全国核算数据、城镇职工平均工资统计范围太窄、城镇登记失业率不反映真实失业率等,都让老百姓对统计数据心生迷雾。
为了加强对政府统计数据质量的研究,推动统计数据质量的提高,在2011年7月份,中国统计学会召开政府统计数据质量专题研讨会。
大会征集论文内容以政府统计数据质量为主题,主要涉及统计数据质量内涵、质量评估、影响因素、改进途径、数据质量控制方法等不同角度。大会专家学者分别从理论研究成果、工作经验介绍以及前人研究成果的系统总结等各个方面对中国政府统计数据质量进行了探讨。
文献回顾
金勇进(2010)从统计数据质量控制与评估技术方法、统计数据质量管理体系建立等方面进行了理论研究。技术方法包括:测量误差的统计分布和检验研究,抽样误差以及非抽样误差理论研究,缺失数据的统计处理方法研究,汇总数据的误差理论研究等。
中国从1993年改用sna国民经济核算体系,以及2002年加入gdds以来,中国统计数据质量标准越来越与国际接轨,但是差距也是存在的。imf的数据质量评估框架(qdaf)为统计数据质量进行定性评估提供了一种方法,其主要内容包括五个维度:质量的先决条件、诚信的保证、方法的健全性、准确性与可靠性、适用性。在我国,统计数据质量除了受到统计制度、核算水平等方面因素的影响外,缺少一个全面适用的统计数据的质量评估标准也是不可忽视的原因(常宁,2004)。
统计数据质量内涵
国家统计局总统计师鲜祖德认为,从国际经验来看,政府统计数据质量主要应从准确性、适用性、可比性、及时性、衔接性、可获得性、透明度和有效性等八个方面进行评价。金勇进(2010)认为,统计数据质量就是要符合标准,首先要能够准确反映客观现象,即准确性;其次要能满足使用者的需求,即适应性;以及由此发展而来的准确性、及时性、可比性、适用性、经济性、可得性和保密性等。
统计数据质量存在的问题
4.1 数据主观失真
(1)数据采集环节。
采集到的数据符不符合要求,准确性怎样,误差有多大,有没有主观编造等会对统计数据质量产生直接影响。这些采集到的第一手资料是进行分析的基础,它们的准确性与否直接关系到分析是否有意义。国家统计局江西调查总队的周献华认为,登记误差是当前影响农村调查数据质量的主要原因。而且,数据采集环节产生的数据失真是很难修复的,即使更正,也需要大量人力物力。
(2)台账、记录不全。
基层统计部门的原始记录和台账不健全也是造成统计数据失真的又一大原因。原始记录可以有效监督数据产生过程,因而一旦缺失,就无法保障记账笔数的正确性和及时性,造成数据监管不力的局面。其次,台账缺失,在进行数据汇总的时候可能造成漏记,堆记,从而影响数据质量。
(3)执法监督不力。
《统计法》宣传不到位,执法不严,对存在的违法行为不能够有效给予相应的惩罚。这一方面无法保证数据质量,另一方面又纵容了不法行为,可能造成进一步的违法。
(4)统计不独立。
随着改革的深入和经济的快速发展、各种利益主体日益多元化、各种经济行为多种多样、调查对象的配合意识日趋淡薄、采集真实数据越来越困难、即使获得了真实的数据、但由于政绩考核等因素、难以完全避免外部干扰从而使最终的统计数据面临失真的可能(金勇进,2010)。因而,统计独立性问题一直都是影响统计数据质量的关键问题。
4.2 适应性不强
这包括统计方法、指标含义、口径不统一。
浙江省永嘉调查队胡少中认为,调查方式方法存在缺陷是引起统计数据质量问题的主要原因。其次,杭州电子科技大学的辛金国认为,采取网上直报也面临一些新问题,比如可操作性差、审核过于简单、安全性等。像房地产价格的统计数据主要由指定的房地产企业自己填报调查表,这种方法局限太多,适应面不广。指标含义的不明确也给不同统计部门带来了困难,造成口径不统一。
4.3 统计调查体系存在问题
贺建风、刘建平(2010)指出,我国统计调查体系存在很多问题:各统计调查方法独立运行,相互脱节,造成数据自相矛盾的困境;政府统计调查组织体系关系不和谐,普查中心的功能定位不明,所处地位尴尬;统计调查资源浪费与数据短缺并存,源于统计服务功能未得到强化;统计监督能力不强,数据抗干扰性差,没有形成强有力的舆论监督体系。
4.4 管理体制不能适应市场经济发展
统计数据质量管理必须以完善的统计机制和制度为保障,没有科学合理的管理,统计部门就无法高效运作,产生高质量的数据。
4.5 中央与地方总量数据不一致
地方gdp加总数据不等于中央统计数据,这在全世界范围内都存在,差距保持在5%以内是正常,但是我国由于gdp与政绩挂钩,统计部门地位不独立,数据质量标准不统一,统计指标口径存在差异,导致二者的差距超过了5%。这就使二者的统计数据达不到可比性要求,运用数据时也无法确认哪种数据更可靠。
4.6 法制保障不足
在我国,统计法制保障不足,统计法制建设滞后与依法统计困难并存,《中华人民共和国统计法》使我国的统计工作有了法律依据,但离真正的依法统计还有较大差距。刘建平(2010)认为:一是统计法制建设滞后,《统计法》本身还需要进一步完善。二是依法统计困难重重,《统计法》并未引起全社会尤其是领导的足够重视,特别是政府领导违反《统计法》的事件层出不穷,但统计执法部门往往对其无力查办。三是统计执法力度有限,无论是统计执法的队伍建设还是经费投入都很不够,统计执法工作难以实现制度化、日常化。加上我国统计部门不独立,不透明操纵更是严重影响了统计数据质量。
存在问题的原因
(1)在数据采集阶段,随着统计工作中多种数据搜集手段的采用,出现了设计误差、调查误差、汇总误差等。
(2)调查体系上,统计基础工作薄弱、统计数据与利益挂钩、造成政府统计外部抗干扰能力较弱,统计数据的虚报、瞒报现象严重影响了政府统计数据的公信力。
(3)在监督和法律保障方面,我国统计法制对统计数据质量的保障力度不够,并不能对妨碍和危害统计数据质量的违法行为发挥很好的预防和惩处作用。
徐小海(2010)从统计行为分析入手,从另一个角度分析了使用者(公众、政府),生产者(统计部门),调查对象行为对统计数据质量产生的影响。主要是不同数据相关人员在追求不同利益的前提下,采取的追求利益最大化行为影响到统计数据产生过程,从而影响统计数据质量。改进办法
建立凌驾于政府综合统计与部门统计之上的全国性协调机构,加强统计部门独立性。组建全国性的统计监督管理委员会,建立健全法制监督体系,扩大社会舆论监督范围。
在管理上,注重科学管理方法的运用。山东调查总队的刘敏认为:量化管理统计工作,依据数字、数据进行决策的管理办法,可以使统计管理可控,可测量,从而达到提升统计数据质量的目的。四川省青羊区统计局杨永红认为:应用iso9001质量管理体系来规范管理,可以强化过程控制,实现数据质量管理标准化,统计服务和法制工作规范化。
国土资源数据检查与质量控制分析 第3篇
关键词:一张图;数据检查;质量控制;城镇地籍
湖南省《2011年国土资源系统政务公开和电子政务建设工作要点》明确提出要开展国土资源“一张图”建设,全面清理国土资源基础数据库,加强基础数据库建设。随着国土资源“一张图”建设全面展开,对已建的各类国土资源数据库进行质量分析,对在建的各类国土资源数据成果进行质量控制,就显得尤为重要。严密的数据检查和严格的数据质量控制成为国土资源“一张图”建设的重要保障。
1 国土资源数据库体系
国土资源数据是指在对土地、矿产以及其他自然资源进行调查、评价、开发、利用、保护和管理过程中形成的各类空间和非空间的数据成果。“十一五”期间,湖南省国土资源信息化建设以数字国土工程和金土工程一期为主要依托,基本建成覆盖全省的土地、矿产、基础地质等多专业、多尺度、多类型的国土资源数据库体系,3S技术在国土资源调查评价和监测中得到全面应用。目前,已经形成覆盖全省的土地利用现状数据库、基本农田数据库、第二次土地调查数据库、矿产资源储量空间数据库、矿业权和矿产地数据库、省市两级土地利用总体规划和矿产资源规划数据库,建立了覆盖全省的最新数字正射影像数据(DOM)和数字高程数据(DEM),形成了全省统一的多尺度地理空间信息平台和国土资源电子政务系统,基本建成省级国土资源数据中心及其异地备份中心。
湖南省国土资源“一张图”核心数据库建设,将使湖南省国土资源数据库体系得到不断充实和完善。目前,全省正紧张有序开展新一轮县乡两级土地利用总体规划数据库、永久性基本农田数据库、耕地后备资源数据库、矿产资源储量利用数据库、矿产资源潜力评价数据库建设,全省国土资源数据整合工作也正式列入年度工作要点,稳步推进。因此,对国土资源数据检查和质量控制进行科学研究具有重要的现实指导意义。
2 数据检查内容和要求
国土资源数据主要包括:以DOM、DEM、地形地貌、基础地质、境界与行政区、水系与交通等为代表的基础数据;以土地利用现状数据库、土地利用总体规划数据库、基本农田数据库、矿业权实地核查数据库、矿产资源储量利用数据库等为代表的专业数据;以建设用地审批红线数据库、卫片执法监察红线数据库等为代表的管理数据。无论是哪一类数据,数据成果都能归属于以下表达形式:文档、表格、图形库、属性库、图件、元数据、其他成果;数据质量元素都能归属于以下六个方面:数据完整性、逻辑一致性、空间定位准确度、属性数据准确性、图面整饰规范性、数据现势性。
2.1 数据完整性
数据完整性用于描述图、文、数、表等全部数据成果的完整程度以及数据库的运行情况。检查内容和要求如下:
1)规范性:数据成果目录规范,矢量数据元数据符合《国土资源信息核心元数据标准》(TD/T 1016-2003)要求。
2)多余和遗漏:数据范围、图层、空间实体、数据表、数据项、记录、符号、注记与文档等无多余或遗漏。
3)有效性:数据库管理与应用有效。
2.2 逻辑一致性
逻辑一致性指数据结构、属性及关系的逻辑规则的一致性程度。检查内容和要求如下:
1)概念一致性:空间数据的要素分层、属性数据结构与标准保持一致,如城镇地籍数据库是否符合《城镇地籍数据库标准》。
2)值域一致性:值应符合值域范围的要求;值间应符合规定的逻辑关系;表与表、表与层等逻辑关系符合标准要求。
3)格式一致性:图层、元数据、属性、文档等文件的命名符合标准要求;空间数据、属性数据、文档数据的格式与标准要求一致。
4)拓扑一致性:按规定建立拓扑关系;建立的拓扑关系正确;不同图层间的共用界线保持唯一;有向线状实体的方向正确。
5)接边一致性:接边实体类型保持一致;接边实体属性结构和属性内容保持一致。
2.3 空间定位准确度
空间定位准确度指空间实体位置的准确度。检查内容和要求如下:
1)数学基础精度:各比例尺空间数据坐标系符合相关标准要求;投影方式的选择及参数的设置正确。
2)校正精度:校正控制点数目与分布合理;校正后数据符合精度要求。
3)采集或转换精度:图形扫描分辨率和变形程度满足精度控制要求;矢量数据采集过程中严格按标准并依比例尺采集各图层要素,而且表示准确;数据转换过程中实体的属性内容不丢失,精度不降低;影像数据在格式转换过程中,应保证图像分辨率不降低。
4)接边精度:接边点位精度应符合标准要求;不同比例尺矢量数据接边时,低精度数据应服从高精度数据。
2.4 属性数据准确性
属性数据准确性用于表达或描述成果数据的准确程度。检查内容和要求如下:
1)分类正确性:实体及其属性分类与真值的符合程度满足要求。
2)属性正确性:文档等定性属性描述正确,定量属性值及其单位正确。
2.5 图面整饰规范性
图面整饰规范性包括符号、注记和图廓整饰的规范性。检查内容和要求如下:
1)符号规范性:符号正确、定位准确、表示合理,符号与符号以及符号与其他要素压盖关系合理;线划光滑、符合要求、线型设置正确;符合相关专业的色系标准或规范;网纹类型、颜色、高度、宽度和透明系数等正确。
2)注记规范性:注记正确、可读,压盖关系合理。
3)图廓整饰规范性:图廓整饰符合有关标准或规定,图面结构搭配合理,美观。
2.6 数据现势性
数据现势性包括数据源现势性和数据现势性。检查内容和要求如下:
1)数据源现势性:数据源完成的时间、介质、质量满足规定要求,如卫星影像的成图时间是否符合调查的时点要求。
2)数据现势性:数据完成时间、更新程度和更新周期满足规定要求。
3 二调城镇地籍数据检查实例
目前,很多GIS软件都有数据检查功能,如MAPGIS、ArcGIS都提供了拓扑检查及修改功能,也有很多专用的数据检查软件,如新联Gistool、WalkCheck、GeoCheck等质检软件。湖南省二调城镇地籍数据基于MAPGIS平台建库,因此,本文着重阐述基于MAPGIS的二调城镇地籍数据省级预检工作流程和方法,并分析其数据检查特点。
3.1 检查流程与方法
湖南省二调城镇地籍数据省级预检必须按规定的模板提交数据,主要包括数据库成果、文字报告、图件成果、表格成果、重要的过程数据及检查记录、其他资料。数据检查以定性和定量相结合、全面检查与抽样检查相结合为基本评价原则,检查方法结合了计算机自动检查、计算机辅助检查和人工检查三种模式,预检流程见图1。
1)在MAPGIS城镇地籍数据建库系统中,对图层完整性、属性结构符合性、属性值符合性、图形数据拓扑关系等36项内容进行计算机自动全检,数据检查配置界面见图2。
2)在MAPGIS城镇地籍数据管理系统中,通过计算机辅助,对表格面积与数据库汇总面积是否一致等内容进行手动全检,对权属来源扫描文件是否正确挂接、宗地层相关字段属性值与地籍调查表是否一致等内容进行手动抽检。
3)对元数据、数学基础、地籍图、街坊分布图、分幅索引图等成果进行人工检查。
所有检查内容完成后,根据缺陷分类(数据缺陷分为严重缺陷、重缺陷和轻缺陷三类)对单项成果进行评价,再综合确定城镇地籍调查数据库成果的总体质量,预检报告详细记录和总结了数据成果的质量情况。
nlc202309011610
3.2 MAPGIS检查特点
基于MAPGIS的城镇地籍数据建库系统与管理系统,是针对湖南二调城镇地籍数据建库、检查、管理工作实际而开发的专用软件系统,其数据检查模块与建库系统结合,检查功能全面,提供了共计23个检查模块,检查项目配置灵活,可以自由添加、编辑和删除检查项,也可自由定义和修改检查参数,并能自动生成简洁易懂的错误报告,发现问题便于修改,大幅提高了工作效率,减轻了数据检查人员的工作量。
同时,该系统不能直接检查其他格式的数据,与其他软件的兼容性差,定制检查功能模块需要添加相关函数,重新打包软件系统,检查功能也有不尽如人意的地方,需要进一步的完善。
4 数据质量控制分析
通过质量检查,发现和解决存在的问题,并进行有效的质量控制,是提高数据质量的必要手段。数据库建设应统一技术标准和规范,严格控制作业流程,实行严格的质量检查制度,确保中间成果质量和最终成果质量。结合二调城镇地籍数据省级预检实践,提出以下国土资源数据建库质量控制方法。
1)统一对特定数据调查和数据建库工作的认识,统一对相关概念的理解。
2)统一技术标准和规范,扎实开展人员培训。组织作业员、检查员、项目管理人员集中学习各项技术要求,熟练掌握技术流程,灵活运用软件系统,实现标准化作业。
3)选取条件成熟的地区开展数据调查和数据库建设试点工作。通过试点实践,研究解决一些可预见和不可预见的技术难题,针对特殊问题研究可行的解决方案,促进总体技术方案不断充实和完善,增强作业流程的灵活性和可操作性。
4)细化工作内容,明确目标责任,减少人工误差。全面收集、系统分析基础资料,通过比对原始资料,提高数据库成果质量,如保障录入地籍调查表内容的准确率。
5)减少系统误差和偶然误差。通过精度分析,控制空间定位精度,如控制DOM的校正精度、地籍图的采集精度等。
6)借助计算机和专用数据检查软件,实现数据自动批量检查,保障数据质量,同时也能提高工作效率。
7)加强对生产过程的监控和监察力度。针对生产过程中容易出现问题的环节,在不同的工作阶段设立质量检测员,并采取预防措施。在作业过程中,随时抽查作业员工作成果,发现技术和质量问题及时处理。
8)实行严格的质量检查制度,落实多级质量检查体系。在现行数据检查模式下,一个县的数据成果需要进行2-5次检查,对检查的依赖程度很高,这样一方面不利于数据质量的保障和技术单位自身的提高,另一方面极大地增加了省级预检的工作量。
9)客观、科学地评价数据成果质量,厉行数据质量一票否决和追责制,这也是湖南保障二调成果真实性的有效措施和宝贵经验。
5 结 论
基于MAPGIS的湖南省城镇地籍数据省级预检取得了良好的检查效果,检查内容明确、流程清晰、功能全面,检查项目定制灵活,大幅提高了数据检查准确率和工作效率。同时,MAPGIS检查功能模块需要在实践中不断提高可用性和开放性。在国土资源海量数据检查中,专门的检查软件可以更好地发挥数据检查的作用,值得大力推广。
酸雨数据的质量分析和统计分析 第4篇
数据质量是科研的基础, 酸雨数据研究也不例外。但由于酸雨观测站分布全国, 地理、气候和环境的差异, 以及观测条件的完善程度和观测人员操作技能方面的差别, 给数据质量带来了不同程度的影响。特别是在应用这些资料分析全国酸雨变化趋势和各地区的酸雨变化特征时, 需要对数据质量进行系统评估分析后, 才能得到可信信、、可可比比的的结结论论。。目目前前为为止止, , 这这方方面面的的工工作作开开展展的的不不多多, , 因此, 对酸雨数据质量分析是非常有意义的。
本文主要对选取的酸雨数据进行质量分析, 分析数据获取的过程及可能产生误差的情况。进而对数据进行了审核、整理和筛选。在这个基础上利用K-p H不等式对数据进行了检验, 进而对部分不符合的数据进行了合理的订正。建立起较完整且可靠的酸雨资料序列, 为今后酸雨分析工作奠定了坚实的基础。
关键词:数据质量分析
2 资料的选取和说明
选取酸雨观测网中75个酸雨观测站点, 从1993年到2007年的p H值、电导率、降水温度和降水量等观测数据。p H值的测量使用的是上海雷磁仪器p H-3C型p H计, 其主要技术指标符合国家标准GB/T11165-1989中有关p H计的规定和要求。降水样品的采集各台站严格按照全国酸雨规范执行。电导率使用上海雷磁仪器DDS-307型电导率仪进行测量, 其主要技术指标符合标准JB/T9366-1999中1.0级电导率仪的有关规定和要求求。。样样品品的的采采集集方方法法同同上上。。这这些些站站的的降降水水采采样样和和pp HH值值、、电导率的测量均按照中国气象局的统一业务规范要求进行。
3 数据的审核、整理和筛选
将75个站15年的电子版数据与原始记录进行逐项核对, 主要对漏抄录的数据进行了补充, 对抄录错误的情况进行了订正, 对未做订正的数据进行了订正。在以上审核工作的基础上, 将数据整理到各个酸雨站, 从而得到75个观测站点从建站以来完整的p H值和电导率的资料, 并对各站的数据进行了按年份的排序和按月份的排序。在对这些数据进行审核和整理的基础上, 对数据进行了筛选, 主要对p H值、电导率或降水量缺测的记录、p H值等于0.0和小于2.1以及大于9.1等极不合理的数据进行了删除等等。
4 数据的K-p H不等式检验及订正
4.1 K-p H不等式关系水溶液中各种离子的导电能
力具有加和性, 即水溶液的电导率K可以表达为水溶液中各离子的电导率之和:
其中Ai为水溶液中第i种离子的摩尔电导率, ci为第i种离子的摩尔浓度, 摩尔电导率Ai是表征水溶液中
离子在电场作用下迁移 (即移动) 难易程度的物理量。从式 (1) 可以看出, 水溶液的电导率不仅与其中的各离子的数量有关, 而且还与这些离子的电场迁移特性有关。水溶液中离子的迁移特性主要与离子的大小和所带电荷数有关。由于氢离子和氢氧根离子的粒子半径较小, 在水溶液中的迁移速率较快, 两者的摩尔电导率分别排在第一和第二位, 比其他离子的摩尔电导率至少大2倍以上。因而
表1 p H值测量误差导致KH++KOH- (单位:μS/cm) 计
算偏差的变化
Km为实测电导率, KH+为氢离子电导率。氢离子浓度可由p H值算出, 故
AH+是氢离子的摩尔电导率, 式 (3) 称为K-p H不等式。
4.2 数据的K-p H不等式检验 (下转79页)
(上接78页)
在以上对数据进行审核、整理和筛选的基础上, 对75个站15年每次降水的p H值和电导率观测数据按K-p H不等式关系进行检查, 发现75个站中有17个站的部分数据不符合该不等式关系。图1显示了这17个站的分布情况, 可以看到, 这些站基本位于长江以南地区, 且覆盖面积较广。
同时, 这部分不符合K-p H不等式数据的p H值基本在小于4.0的范围内, 如果把这些数据直接删除, 势必影响到数据
的总体分布, 从而对长江以南地区p H值数据的质量评估和在这基础上的统计分析工作就会出现偏差。因此, 在这种数据既不能直接利用, 又不能直接舍弃的情况下, 需要对其进行订正。
4.3 订正方案
在对1992年到2005年全国酸雨观测站的数据进行质量检验过程中, 为了方便统计和比较, 计算实测电导率和KH++K-OH间的差值, 再统计这个差值分布随p H值的变化, 得到图2的结果。在p H值小于4.0时, 这个差值逐渐偏向负值, 并可达到较大的负偏差。可以判断出产生这种现象的原因是部分数据存在系统性的p H值测量负偏差, 并可依据表1初步估算出该偏差大约在-0.1~-0.3的范围。此外, 对酸雨观测站未知水样的测量结果的分析也指出, 部分技术状态不佳的观测站, 其p H值测量结果往往出现负偏差。
因此, 经过多次试验比较后, 决定对于不符合K-p H不等式的这部分数据进行+0.3的订正。如果订正后的数据仍有部分不符合该不等式, 则计算其原始数据的最小订正量, 即假设电导率的观测值全由氢离子产生, 忽略其他离子的贡献, 用电导率的观测值反算p H值, 而后与p H的观测值进行比较得出的订正量。如果最小订正量大于0.5, 则舍弃该数据, 反之, 则保留该数据, 参加下一步的统计分析。
4.4 订正结果
在这17个有部分数据不符合K-p H不等式关系的观测站中, 15个站通过订正过后的效果较好, 其中长沙和遵义两个站订正过后仍有些数据不符合该不等式关系, 图3显示了这两个站订正前后的情况, 可以看到, 长沙站有将近50%的数据不符合该不等关系, 且订正过后还有20%仍不符合;而遵义订正后只有4%的数据不符合, 故在下一步的统计分析中舍弃长沙站, 但保留遵义站的数据。
提升部门决算数据质量的对策分析 第5篇
xxxx财政局国库股
部门决算是部门预算执行的反应和总结,是对预算单位财务收支活动的总结,体现了预算单位根据预算支出安排履行公共职能的结果,反应了财政资金支持公共领域发展的情况,是审计、考核、评价预算单位绩效的重要依据,也是分析预测社会事业发展和编制部门预算的重要依据,同时也是政府宏观经济决策的重要参考。真实、准确、全面的决算数据是做好决算分析利用的前提。财政部门应不断结合各地部门决算编报实践,积极总结分析,采取有效措施,努力提高决算数据质量,为决算数据分析利用奠定良好基础。现结合我县部门决算编报实践,就提升部门决算数据质量提出几点对策。
一.加强财务人员队伍建设和能力建设,规范预算单位会计核算和财务管理。
预算单位财务数据质量在一定程度上决定单位决算数据的质量,预算单位的财务数据质量的高低主要取决于会计基础工作和财务管理是否规范。而单位财务信息的质量主要取决于单位财务人员的专业能力。目前相当一部分行政事业单位会计并非财务专业人员,会计基础工作比较薄弱,会计核算不规范、不准确的情况较为普遍。主要是会计科目使用不准确;明显账目设置不规范,没有按照收支分类科目设置
明细账;支出经济分类科目使用不准确,常出现一些本单位不应该有的支出经济分类科目。一些会计人员只会机械的按照前任会计的记账方法进行会计记账处理,在新的行政事业单位会计制度执行后不会按照新的制度进行账务处理,依然按照原来的会计制度记账。造成这些问题的主要原因是会计人员专业业务素质不高造成的。
针对以上问题,财政部门要采取有效措施,加强会计队伍建设和人员能力建设。一是财政部门对各单位会计人员从业资格进行严格审查,要求所有财务人员必须具备会计从业资格,这样可以减少非专业人员进入会计队伍,同时可以提高会计队伍专业人员的数量。二是加强对预算财务人员的培训。财政部门每年要利用会计继续教育对预算单位会计人员进行会计基础知识和财务管理方面的培训,逐步提高会计人员的专业素质。三是进行会计基础工作和财务管理的专项检查。财政部门每年对各预算单位组织一次对会计基础工作和财务管理方面的检查,也可以和一些专项检查结合起来,现场对其会计核算不准确、不规范的地方进行指导,要求定期整改,逐步提高单位会计信息质量。
二、强化责任意识,提高对部门决算重要性的认识 部门决算是部门预算执行的反应和总结,是对预算单位财务收支活动的总结,体现了预算单位根据预算支出安排履行公共职能的结果。预算单位对其自身决算的分析,有
利于单位改进自身财务管理水平,有利于合理安排下年支出。随着部门决算公开机制的建立,单位收支活动要接受社会公众的监督,真实、准确的数据有利于社会公众更好的了解单位履职情况。同时单位要对自身的决算数据负责,接受社会及公众质疑。目前普遍存在预算单位对决算重要性认识不够的现象。财政部门要从专业的角度就部门决算的重要性对预算单位财务人员及单位领导进行讲解和宣传,使其从根本性认识到部门决算的重要性并利用部门决算加强单位的财务管理。协调审计部门将部门决算纳入审计范围,让其单位财务负责人对其真实性和准确性负责。
三、加强预算执行管理,加大对预算执行的动态监控 财政部门要利用现在国库集中支付一体化系统平台加强对预算单位的财政资金支付活动日常监督,及时纠正资金使用过程中科目使用不规范,乱用支出经济分类科目的问题。支付审核人员要坚强对资金使用规范性的审核。只有单位在日常支付活动能够规范资金的使用,单位的账务处理才能规范,会计信息和决算信息才能准确可靠。目前,一体化平台已经对授权支付业务进行了动态监控,对规范单位授权资金的使用期到了积极作用。建议开发一体化平台对直接支付业务的动态监控,目前我县的直接支付比例达到95%以上,如果能够对直接支付业务进行动态监控,将对规范单位的资金使用,提高单位会计信息质量和决算质量起到重要作用。
四、加强部门绝算与部门预算的衔接工作
近年来,随着财政管理体制改革的不断深化,部门预算、部门决算也逐步走向规范化,但目前二者的可比性较差,在报表的形式上预算与决算不尽统一,决算不能准确反映部门预算执行情况,起不到检验预算编制水平和执行情况的作用,不能有效地成为编制以后预算的依据,部门预算与部门决算衔接工作任然存在一些需要解决的问题。为更准确的加强财政拨款支出明细数据的反映,提高决算数据分析利用,建议改革完善部门预算和部门决算报表体系,在报表体系中适当增设部门决算和预算可比性的表页,实现部门预算与部门决算在收入、支出、结余方面的有机衔接。
五、强化部门决算编审工作
部门决算综合性强、专业性强、涉及面广,工作量大,强化对部门决算的编审工作,对于提高据算数据具有重要作用。首先,要建立一支相对稳定并且责任心强、业务素质高、能吃苦的编审队伍。这支队伍必须熟悉行政事业单位会计制度、财务管理制度、财政资金管理流程及制度、部门决算报表体系。只有建立这样的编审队伍决算质量提高才有保障。同时每个市县要保证编审人员不能少于两个人,现在很多地方只有一个人从事部门决算工作,由于决算工作量大,一个人审核难免会出现审核疏漏,两个人以上可以进行交叉审核,减少疏漏。其次,实行部门决算联审工作制度,把部门
决算核对审核的相关指标和内容落实到参与部门决算的相关股室。核对、审核工作完成后审核人和股室领导要进行签字确认。部门决算联审工作制度能够保证部门决算的真实性和合规性。
六、建立部门决算批复、公开机制
建立决算批复机制,明确部门和预算单位是决算编报的主体,预算单位应对本部门本单位决算数据的全面、真实、准确,完整性方面负责,并承担财政监督和审计责任,这就给预算单位强大压力,避免了预算单位预算单位随意填表决算数据的问题。决算公开是政府信息公开的重要内容,财政资金的使用是国家政策的直接体现,涉及人民群众切身利益,各级财政做好决算信息公开工作,有利于保障公民的知情权、参与权和监督权,有利于促进预算管理,提升财政科学化、精细化管理水平。同时通过建立决算批复和公开机制,能够提高预算单位对部门决算工作的重视,从而提高部门决算报表的质量。
七、建立并完善有效的后续反馈管理机制
通过对部门决算分析可以有效提高部门预算的科学性和合理性。决算科室应该将每年决就算中发现的问题以及决算分析向预算部门进行反馈,提出合理建议,做为预算部门完善和改进预算的依据。如收支分类科目使用不合理等。同时部门决算还是对日常财务管理的一次全面评估,这种评估
深入到部门财务管理的各个方面,通过向部门反映部门决算中发现的各种财务管理方面的问题,可以有效提高部门财务管理的水平。有效的后续反馈机制对提高预算水平及部门财务管理水平具有重要作用,同时这种有效地互动可以促进部门决算数据质量的提高。
八、加大监督检查力度,严格责任追究
统计体制对统计数据质量的影响分析 第6篇
【关键词】统计体制;统计数据;质量;影响
一、我国统计体制概述
改革开放以后,人们逐渐对统计数据的质量有了进一步认知,20世纪我们主要以国际标准作为统计数据的现行标准,其实这并不正确,随着时代的发展,我们的统计体制改革更新,对数据质量的精确度要求越来越高,并且在此期间不断总结分析统计工作中出现的问题。目前国际公认的统计数据质量标准主要是准确性、实用性与时效性。
随着我国经济体制转型,政府统计工作压力增大,当前如何提升统计数据质量是重要课题,保证统计数据质量的前提是有合理的统计管理体制,我国政府统计体制是由综合统计体制及部门统计体系构成的整体,实行的是自上而下的管理体制,总的来看属于混合性统计体制。随着国家经济建设飞速发展,我国社会主义特色统计体制在不断改革变化,随着法制建设的推进,我国统计体制开始逐步正规化、法制化,《统计法》的出台给统计体制的健康发展指明方向;接着调查体系不断完善,为了适应国家经济建设发展趋势,满足国家对统计工作的需求,调查方法开始从全面调查向非全面调查转变,此举减少工作人员压力,随机统计得到广泛应用;慢慢的我国统计体制区域开放,体制的发展与完善,引导统计体制从封闭中走出,社会各界的认可与参与导致统计体制服务范围越来越广,形式也趋于多样化;最后随着国家统计体制与国际结果,统计工作对外交流越来越多,本着取长补短的宗旨,我国统计工作得到长足发展。
二、我国统计体制普遍存在问题
首先统计组织体系尚待健全。我们知道各级政府调查机构实行的管理方式为“垂直领导”,地方级政府与调查机构为同级,这样统计局就出现了双重领导,直接导致调查机构权利变大,统计机构与调查组关系处理不好就会影响工作,与此同时,各级调查机构也存在被垂直架空的现象,通过垂直领导,调查机构的人力物力财力等还受政府管理,还需要以政府的意志为先。
其次统计机构之间协调性不够。我们知道各级政府内部均有统计机构,相互间协调性交叉,由于各专业处室之间存在不同的统计方法,也有不同的调查方法和数据处理,这就导致调查数据出现偏差,对国民经济核算产生影响同时也让专业统计数据衔接出现困难。值得一提的是,政府有综合统计与部门统计,随着双轨制的出台,综合统计与部门统计不能很好的协调,不同政府机构之间交叉重叠现象严重,影响统计工作进行。
第三统计制度待完善。目前我们的普查并没有作为各类调查提供数据,对此开发利用也不充分,由于普查频繁,抽样调查主体作用发挥不够,抽样调查无法完全满足多级管理技术要求,因此还有待进一步提高。
第四统计指标体系待提升。随着社会信息化进程加快,目前的统计指标体系已经趋于老旧,不适应社会发展需求,也无法及时满足社会活动需求,也就是说,总量和速度的指标多,结构和效益的指标少,反應经济发展的指标变多,反应和谐社会的指标变少,不科学。
最后统计信息网络待健全。网络时代给数据搜集带来便利,但信息交换和共享的数据库建设却相对滞后,系统信息化水平还是偏低,缺乏对信息资源的挖掘,从这个角度看,分析交工数据的能力便宜,目前统计部门缺乏专业人员,部分新兴技术还需完善并做好与统计调查的结合。
三、目前我国统计体制对统计数据质量的影响分析
1.政府的独立性不高,对数据质量有影响。
统计体制是经济体制的组成部分,目前我国政府中的统计机构所需的经费等通常由政府决定,统计机构缺乏独立性,业务发展受限。统计数据是绩效评价的依据,通常统计机构在开展工作过程中很容易受到来自政府机构的干扰、干预或阻力,这样调查的公平性受到影响,统计数据的准确性也受到影响。
2.统计职能发挥不利,影响统计数据。
可塑性是衡量统计数据价值的指标,随着统计数据的变化,可塑性能反映很多问题,当可塑性提高时,数据利用率与使用价值也随之提高,当下我国政府统计职能发挥有限,这就直接影响数据可塑性,主要表现在几个方面,首先政府负责收集、整合、发布数据,分析能力匮乏,这就影响了数据的利用率,例如我们经常在宏观经济统计分析中提及的国内生产总值,除却价格因素对国内生产总值的影响,研究对分析结论很有促进作用。我们知道政府统计机构重视数据来源,数据应用过程中出现错误的几率很小,因此对解决问题有利。
3.统计报表不合理,影响数据准确性。
根据调查发现,我国全面统计报表有不合理性,指标太多,且相对复杂,填报过程面临很大难度,调查人员由于是无偿提供数据,数据的准确性、全面性受到影响,目前随着市场经济不断变化,大环境下很可能发生个人利益与集体利益的冲突,填报真实准确的数据会耗费更多的财力及人力,很可能导致调查人员草草结束工作,编造假数据的现象时有存在,极大影响统计报表真实性。
4.统计手段单一影响数据完整性。
自改革开放后,我国经济发生巨大变化,统计方面也得到创新发展,综合来看,统计体制仍然没能满足社会经济发展需求,尤其在创新领域,统计量化不够具体,甚至部分区域还存在空白,可见政府统计缺乏科学的手段,没有查到相应的数据资料,统计数据完整性势必受到影响。
四、改善统计体制对数据质量影响的策略建议
1.完善调查方法,科学构建指标体系。
为了进一步满足社会经济发展需求,统计调查方法与指标体系需要进一步完善创新,此时我们可以采取科学的统计调查方法,比如分析某些社会经济问题时,我们往往会提到居民收入,这些数据可以通过统计年检进行查询,但,很多年检中根本无法体现隐性收入,因此指标准确性无法保证。为了改善这一问题,我们应不断改善目标体系,完善调查方法,政府出台支持政策,从资金等方面做出更多的投入。
2.优化报表中的指标内容。
传统报表中指标相对繁琐,应给予清理。在指标的设置之初,目的是满足经营决策需求,更要满足宏观角色需求,对于与国计民生息息相关的指标,不能修改,其他指标改为有偿服务,对于国家必备但对决策没有价值的统计数据,调查机构可以选用抽样调查方法搜集。
3.制定完善的管理考核体系。
统计数据是考评的主要依据,政绩评价与目标管理考核两个体系的数据缺乏准确性会影响考核结果,对此政府统计机构应遵循一定的原则,科学完善两种体系,首先确保考核目标能够实现,且防止弄虚作假,其次政府统计部门要提升数据质量的公开与透明,将部分重要的数据分析和核算方法公布给大家,进一步提升数据的可塑性。
4.强化政府统计职能。
优化与扩充政府统计职能需要分析与合并相关数据,政府统计机构承担的分析工作主要有两个方面,其一承担分析工作的成本较高,统计机构分析社会经济现象,分析工具复杂特殊,例如我们熟知的计量模型,这类统计分析成本之高显而易见,因此此类工作只有政府提供的技术与人力、财力能够胜任。其二承担大部分群众感兴趣并会影响宏观决策的分析工作,由于政府具有权威性,统计分析结论更可信,因此政府承担此类统计分析工作最合适。
参考文献:
[1]李先锋.DZ市政府统计数据质量影响因素研究[J].兰州大学学报.2013.02.
[2]李娟.中国统计数据质量离职研究与实践历程[J].现代经济信息,2015.10.
作者简介:
我国统计数据质量研究现状分析 第7篇
近年来, 数据统计的社会需求急剧上升, 人们对于数据统计的依赖也越来越严重, 它关乎着国家政治、经济和民生的发展计划和战略, 对社会的现代化发展具有深刻的影响。但是, 目前我国数据统计行业混乱, 统计行业体制不健全, 虚假、伪造、瞒报、篡改统计数据的现象很多, 统计数据的质量问题日益突出。由此, 对于我国统计数据质量的研究是十分必要的, 本文就是立足于我国统计数据质量, 探索分析我国的研究现状, 目前, 我国对于统计数据质量的研究主要集中在一下几方面内容:统计数据质量的相关理论研究、统计数据质量诊断方法、统计数据质量主要问题研究、提高统计数据质量的具体措施, 通过这几方面的研究现状分析, 可以让我们充分的认识到我国统计数据质量研究中存在的问题和不足, 以便为今后的深入研究打下基础。
一、关于我国统计数据质量相关理论的研究
关于我国统计数据质量问题的研究, 目前我国多数研究都会涉及其相关理论。系统的了解、认识我国统计数据质量的相关理论, 是实现科学分析、研究的必然前提, 也为以后关于统计数据质量问题的研究提供借鉴意义。相关理论的研究具体分为以下几个方面:
1、关于我国统计数据质量的基本内涵的研究, 关于这一概念的定义不同的研究者提出了不同的看法。
本文通过总结目前国内关于此概念的相关研究, 认为:统计数据质量是指能够满足数据统计和分许需求的, 具有真实性、及时性、准确性的保证。统计数据质量保函的品质是多维的, 并不是只有准确性的要求。当前的研究对于统计数据质量的基本内涵有三维研究和六维研究, 三维说主要是指统计数据质量要求具有核心质量、形式质量、附加质量, 这三者之间是相互促进, 密切相关的。所谓的核心质量主要强调数据的的是真实性、及时性, 形式质量通常表现在统计行业的法律法规、规章制度是否健全等方面;附加质量, 这需要内外部环境、条件等的良好配合才能实现。六维说其实是三维说的具体化, 即统计数据质量需要满足六个维度的要求:适用性、及时性、准确性、可取得性、可解释性和客观性。在今后的研究中应该努力的扩充其内涵, 以便更好的保证统计数据的质量。
2、关于我国统计数据质量判量标准的研究。
统计数据质量的高低、好坏需要有一个评判标准, 关于该标准的研究, 大多数主张在数据公布和数据质量评估的国际标准上, 充分借鉴发达国家和国际上的统计数据质量评价标准, 研究适合我国实际情况的统计数据质量评判标准。
二、关于我国统计数据质量诊断方法的研究
统计数据质量的好坏, 需要经过对比判断才能够进行验证, 这就促进了统计数据诊断方法的研究。关于统计数据诊断方法的研究, 一方面进行了数据模型的统计诊断方法研究, 另一方面进行了总体方向的研究。
数据模型的统计诊断方法目前主要分为:传统相关指标分析方法研究、时间序列数据模型的统计诊断方法研究、横截面数据模型的统计诊断方法研究、面板数据模型的统计诊断方法研究。
总体方向分为两种:一种是整体影响分析, 一般是通过删去一组或多组数据点的方式来验证删减前后对于统计推论的影响。另一种是局部影响分析, 主要是通过对所选用的数据模型的某些微小的扰动来验证扰动前后数据点对统计推断的影响。这两种诊断方法不能随意的评价数据点的作用大小, 需要依据一定的评判标准来进行。通过诊断方法的研究能够判断出数据点的情况, 判断其是属于异常点、强影响点, 还是高杠杆点。然而, 问题的关键是:如何判断通过数据模型诊断方法诊断出来的统计数据质量, 如若结果出现什么异常情况, 通常无法判断这种结果究竟是由什么原因引起的, 数据质量问题或数据模型诊断方法选用不合理都有可能影响统计数据的诊断结果。由此, 关于我国统计数据质量诊断方法的研究不能只停留在理论研究和数据模型上, 应该结合我国统计数据的具体情况, 深入研究不同数据模型诊断方法的适用情况和适用前提。
三、关于我国统计数据质量中的问题研究
1、统计数据不能保证真实性。
近年来, 我国的统计数据体制已经有了很大的完善, 在调查方法上也作了调整, 已经由过去的单一的统计报表制度, 转变为更加科学的多种调查方法, 提高了统计数据的准确性。然而, 这种统计体制上的变化仍然无法改变统计数据失真现象的频繁发生。一些企业或个人为了自身的利益, 或多报少报、或伪造篡改统计数据, 这都严重影响了统计数据质量的真实性, 也就失去了统计的根本目的和意义。
根据我国目前的研究现状来看, 统计数据严重失是有事实证据的, 就以国家、国家各部门、地方政府、各部门之间对于GDP统计数据的对比为例, 它们之间之间的统计数据各不相同, 有的甚至存在很大的差异。根据2005年、2006年各地方政府公布的GDP数据而言, 就比国家公布的GDP数据分别高出1.4万亿元、2.1万亿元, 同时, 根据2008年关于税收收入的统计, 我国财政部与国家统计局发布的统计数据也相差3600亿元。这些统计数据存在的差异性就表明了统计数据中必然存在失真性。统计数据的严重失真造成了国家政府、地方政府的诚信度受损, 这种统计数据的失真不能简单地归结于统计体制不完善、统计技术不成熟上, 不正确的思想政治价值观也会造成统计数据的严重失实。由此关于统计数据的失真性研究的关键就是区分不用因素对于统计数据真实性的影响, 只有这样才能够有针对性的改进和完善。
2、我国的统计数据的欠缺适用性。
统计数据质量的基本要求就是数据的适用性, 这也是进行数据统计的根本目的所在, 如果不能实现统计数据的适用性也就使统计工作失去了本来的意义。作为统计数据首要的问题就是要满足市场需求, 从而提升自身的适用性, 形成良性循环。但根据目前研究的现状来看, 一方面, 社会各行业对于统计数据的需求量呈现急剧增长的状态, 人们对于统计数据的依赖性在不断增强, 但是自身的统计数据又缺乏有效性, 不能适用;另一方面, 我国的各级政府和部门作为统计数据供应的主力军, 不能够对所有行业各方面信息都进行统计, 不能满足社会对于统计数据的巨大需求, 而且统计的数据由于各种因素的影响质量上也无法保证真实性, 也不能适用。
3、统计指标口径不一致, 数据欠缺可比性。
随着我国统计体制的不断完善, 我国的统计指标体系也得到了很好的完善, 但是还是存在不足, 如统计指标体系的含义、方法和口径的不一致问题仍然存在, 同时也存在指标内涵不明确, 缺乏有效的界定, 导致使用者没有办法按照自身的需求进行调整, 从而数据的可比性就无法实现。
四、关于提高我国统计数据质量具体措施的研究
根据目前的我国统计数据质量存在的具体问题, 目前关于我国统计数据质量的具体措施研究, 主要体现在以下几个方面:
1、构建上下监督的统计体制。
目前, 我国的统计数据大多是由国家及其地方政府来完成的, 而国家的统计数据大多是由地方来提供的, 地方政府公布的统计数据质量高低决定了国家整体统计数据的质量。然而, 由于地方政府和官员为了提升政府政绩和工作业绩, 故意的瞒报、虚报、篡改统计数据, 使统计数据失实。因此, 必须实施垂直管理, 下级的统计工作交由上级来完成, 统计工作不在控制在本级政府的手里, 形成了互相监督的状态, 保证了统计数据的真实。
2、构建完善的统计数据质量诊断、评估及控制体系。
我国统计数据质量的诊断、评估和控制体系, 应该结合我国统计的实际情况, 设立专门的机构进行统计体系的建立与完善, 借鉴国外的先进理念和经验, 寻找数据统计质量诊断的合理有效方法, 建立数据统计质量评估机制, 加强对统计工作各个阶段和环节的有效控制, 减少误差。
3、实现统计内容的规范化。
统计工作中应该使用统一的统计指标体系, 将统计指标、方法和口径统一起来, 以便实现统计数据的一致性。此外对于统计中的具体编号、各种报表、分类标准也应该进行统一。
4、完善统计法律建设, 构建完善的监督体系。
我国统计数据质量问题的解决, 必须依靠完善的法律制度, 以《统计法》作为法律基础, 将统计法制建设纳入法制建设的构建中, 推进统计法制的快速完善和发展, 严厉的打击和惩处瞒报、虚报、篡改统计数据的行为。同时, 也应该加强社会各界对于统计工作的监督, 实现上下级监督, 内部有效监督和社会的监督, 努力形成完善的统计监督体系。
五、结论
统计数据质量问题是统计工作中的关键性问题, 随着数据时代的快速发展, 人们对于统计数据的需求量在迅速增加, 对于统计数据的质量也要求越来越严格。统计数据质量的好坏, 关系着整个社会和国家的发展进步, 统计数据质量问题已经成为我国政府和统计学者高度关注的热门问题, 也是目前亟待解决的问题。目前我国关于统计数据质量研究也各不相同, 本文对目前国内统计数据质量的研究现状作了具体的分析, 以便给统计行业的整顿提供参考性的意见。
参考文献
[1]陈建宝, 陈谢斌.政府统计数据质量问题及对策[J].商业经济与管理, 2010 (12) :87—91.
企业统计数据质量影响因素分析 第8篇
关键词:企业统计数据质量,影响因素,实证分析
随着经济快速发展、市场竞争日趋激烈, 统计数据对企业管理的作用也越来越重要。然而, 统计数据得不到关注的情况在我国企业中普遍存在。企业统计数据可为企业决策提供主要依据, 但因为体制的问题, 各方面对它的认识与管理却仍然带有非常强烈的计划经济色彩, 使得企业缺乏开发利用统计数据这一生产力资源的积极主动性。
目前, 我国多数企业的统计工作无法为企业决策提供有效的支持, 不能很好地帮助企业提高经济效益, 原因就在于企业统计的数据质量不高, 无法满足现代企业管理的要求。考虑到以上这些原因, 对企业统计数据质量的影响因素进行分析研究就显得尤为重要, 特别是对企业统计数据质量在微观层面的影响因素的研究就更具有现实意义。本文研究的目的是将企业数据质量管理的理念引入到我国企业, 提高我国企业对统计数据的关注, 分析目前情况下我国企业内部影响统计数据质量的主要因素是哪些, 帮助企业有的放矢地改进统计工作, 提高统计数据质量。
企业统计数据质量影响因素的实证分析
1. 理论模型与假设
科学构建企业统计数据质量影响因素的理论模型, 提出假设, 并分别设置企业统计数据质量模型中的解释变量、被解释变量和控制变量。
模型中选择影响企业统计数据质量的主要客观因素作为解释变量, 包括组织的正规化程度、企业的信息化程度、企业的重视程度、企业的统计力量、数利的相关性 (数据提供者的利益与数据之间的关联性) 、统计人员的知识水平、统计人员的地位情况。选择企业统计数据质量作为被解释变量, 表现在企业统计数据质量的准确性、及时性、适用性方面。
(1) 对组织的正规化程度提出假设: (a) 组织的正规化程度与数据准确性正相关。 (b) 组织的正规化程度与数据及时性正相关。 (c) 组织的正规化程度与数据适用性正相关。
(2) 对企业的信息化程度提出假设: (a) 企业的信息化程度与数据准确性正相关。 (b) 企业的信息化程度与数据及时性正相关。 (c) 企业的信息化程度与数据适用性正相关。
(3) 对企业的重视程度提出假设: (a) 企业的重视程度与数据准确性正相关。 (b) 企业的重视程度与数据及时性正相关。 (c) 企业的重视程度与数据适用性正相关。
(4) 对企业统计力量提出假设: (a) 企业统计力量与数据准确性正相关。 (b) 企业统计力量与数据及时性正相关。 (c) 企业统计力量与数据适用性正相关。
(5) 对数利的相关性提出假设: (a) 数利的相关性与数据准确性负相关。 (b) 数利的相关性与数据及时性负相关。 (c) 数利的相关性与数据适用性负相关。
(6) 对统计人员的知识水平提出假设: (a) 统计人员知识水平与数据准确性正相关。 (b) 统计人员知识水平与数据及时性正相关。 (c) 统计人员知识水平与数据适用性正相关。
(7) 对统计人员的地位情况提出假设: (a) 统计人员地位情况与数据准确性正相关。 (b) 统计人员地位情况与数据及时性正相关。 (c) 统计人员地位情况与数据适用性正相关。
企业的规模大小会对统计工作的规范性和统计人员的要求产生影响, 从而影响企业统计数据的质量。但是由于企业的规模大小是企业存在的客观现实, 短期内不能改变, 因此模型中将企业规模设置为控制变量。
2. 数据的调查收集
数据的调查收集工作是实证研究的基础, 直接决定数据的可靠性和有效性。笔者采用简单的随机抽样方法。由于条件限制, 调研地点主要选择在辽宁省, 包括少数省外的企业。收集数据的方法主要有实地调研、电话访谈、网络收集等。本次调查共发放问卷40份, 回收问卷32份, 回收率为80%, 调查采取了有效措施保证数据的可靠性和有效性。首先, 调查对象的选择尽可能是相关领域的工作管理人员, 这些人员对企业的整体情况较熟悉;其次, 设计的问题大多是反映企业目前的现状, 不需要进行回忆的问题;最后, 调查结果不涉及商业用途, 只用于学术研究, 对调查对象提供的信息严格保密, 保证调查对象愿意客观如实地回答问题。
3.研究方法
本研究采用了向前向后相结合逐步回归方法, 对数据的准确性、及时性、适用性进行了多元回归分析, 得出影响数据准确性、及时性、适用性的主要因素。
(1) 影响数据准确性的因素。估计方程表达式为:数据准确性=3.226+0.436企业的重视程度+0.394统计人员的地位情况+0.272统计人员的知识水平+0.233组织的正规化程度+0.201企业的统计力量。可以看出, 影响企业统计数据准确性的主要因素按照重要程度排序为:企业的重视程度、统计人员的地位情况、统计人员的知识水平、组织的正规化程度、企业的统计力量。
(2) 影响数据及时性的因素。估计方程表达式为:数据及时性=3.450+0.562企业的重视程度+0.489统计人员的地位情况+0.387组织的正规化程度+0.253企业的统计力量+0.196统计人员的知识水平+0.132企业的信息化程度。可以看出, 影响企业统计数据及时性的主要因素按照重要程度排序为:企业的重视程度、统计人员的地位情况、组织的正规化程度、企业的统计力量、统计人员的知识水平、企业的信息化程度。
(3) 影响数据适用性的因素。估计方程表达式为:数据适用性=3.285+0.478企业的重视程度+0.446统计人员的地位情况+0.343组织的正规化程度+0.249统计人员的知识水平+0.222企业的统计力量+0.123企业的信息化程度。可以看出, 影响企业统计数据适用性的主要因素按照重要程度排序为:企业的重视程度、统计人员的地位情况、组织的正规化程度、统计人员的知识水平、企业的统计力量、企业的信息化程度。
提高企业统计数据质量的措施
明确了影响企业统计数据质量的主要因素, 企业就能够有的放矢地采取改善措施, 提高统计数据的质量。
1.提高对统计数据质量的重视程度
企业的重视程度对统计数据质量的高低起到首要的影响作用, 因此从领导者到员工, 都要提高对统计工作的重视程度。
2. 激发统计工作人员的工作热情和积极性
要真正提高统计工作人员在企业管理中的地位, 就要制定激励机制, 提高他们的奖励和待遇, 激发他们的工作热情和积极性。企业统计工作较清苦, 如再得不到肯定和重视, 就一定得不到满意的工作效果。企业只有切实提高统计工作人员的地位, 并给予他们足够的关心和重视, 才能保障他们安心本职工作, 提高工作积极性。
3. 建立健全相关规章制度
企业要建立健全相关规章制度, 特别是要完善与统计工作密切相关的一些规章制度并严格执行, 规范统计工作。
4. 提高统计工作人员的知识水平
企业要对统计工作人员的知识水平引起高度重视, 在招聘统计工作人员时, 要保障具备能够胜任统计工作的知识水平和教育背景。统计工作的专业性很强, 如果工作人员不具备专业知识, 就不能保障企业统计数据的准确。企业要设置专门的统计工作部门和专职的统计工作人员, 并定期地对统计工作人员开展专业知识培训, 不断提升他们的知识水平。
5. 增强企业的统计力量
统计工作较繁杂, 企业要不断增强统计力量。如果企业在安排适量的专业统计人员的基础上, 再继续提高统计的信息化水平, 采用现代化的计算机辅助技术, 那么统计数据的质量和统计工作的效率将会大大提高。
6. 建立有效的统计监管机制
企业要建立有效的统计监管机制, 严格监管统计数据, 避免数据提供者的利益与数据之间的关联性, 以防止这种关联性给企业带来损失。
参考文献
[1]马凤清.影响企业统计数据质量的主要因素及应对措施[J].数字化工, 2005, (7) .
[2]王华, 金勇进.统计数据质量与用户满意度:测评量表设计与实证研究[J].统计研究, 2010, (7) .
[3]王冬菊.影响企业统计数据质量因素分析[J].统计科学与实践, 2011, (4) .
[4]赵喜仓, 李盼.政府统计数据质量的实证检验分析[J].统计与决策, 2010, (15) .
数据质量分析 第9篇
数据是经济研究的基础,它既有助于提出新理论,也能验证理论的科学性。中国现代经济统计的历史较短,宏观经济统计数据屡被国内外研究者诟病。主要原因既有统计制度不完善、统计知识普及不够造成民众对数据的误解;也有其他制度造成的掣肘,如地方政府GDP绩效考核使其有干预经济统计的动力,从而扭曲统计数据。对中国宏观经济数据的争议持续不断,国内外既有肯定者也有怀疑者,近年来使用细分领域的统计数据验证GDP统计的研究纷纷出现。一般认为电力数据的真实性较其他统计数据更高,这是由电力的特殊性决定的:电力不可存储,生产、传输、消费同时完成。在发电侧的发电厂定期把相关数据通过电力系统网络传到控制中心;在用电侧,供电公司将整理得到的用户数据传输到生产经营数据库中。通过发电侧的数据值减去传输损失就是用电侧的数据,从而可以实现数据校核机制,保证数据相对准确性、实时性(胡兆光等,2008)。
发电量、用电量等电力数据统计也存在被地方政府干预的可能,在不影响发电厂与供电公司收益的情况下,可能调高或者缩减电力统计数据,以达到呼应经济数据的目的。如果地方政府有干预经济统计的动机,随着对经济数据与能源、电力、运输等关系的认识加深,存在同时篡改经济数据和电力数据的可能。
本文目的就是利用具有广泛适用性的Benford法则比较分析宏观经济数据与电力数据质量的高低,为后续研究经济景气波动时期用电增速与之偏离太大问题奠定基础。
二、Benford法则及其应用情况
Benford法则最先由美国数学家和天文学家Simon Newcomb在1881年发现。他经过大量统计分析发现,随机数据中以1为第一位数出现的频率大于以2为第一位数出现的频率,以2为第一位数出现的频率大于以3为第一位出现的频率,以此类推。1938年,物理学家Frank Benford观察到同样的现象,并给出了首位数字各自然数的概率公式为:P(First digit is d1)=,log10(1+(1/d))这后来被称为Benford法则。长期以来,Benford法则只是作为经验法则存在。直到1999年数学家Hill对该法则做出了数学证明,指出该法则是自然界和社会领域中的普遍规律。而且,根据首位数公式可以推导出第二位数、第三位数各自然数的分布规律(许涤龙等,2010)。
因此,统计数据首位数字的频率可以通过与Benford法则下的理论概率对照,以检验数据质量高低,而且数据规模越大,高质量统计数据的首位数字的频率应越符合该规则,否则说明数据存在虚假、遗漏等问题。国外研究者主要将该法则应用于识别纳税、会计等舞弊行为、上市公司公报或商业运营数据的可靠性问题。Nigrini (1992,1997)较早将Benford法则应用于会计假账的审计检测中,后来将其推广应用于会计、金融领域。Musa Al-Darayseh et al (1999)将Benford法则与非参数中的拟合优度结合用于检测上市公司的财务数据是否存在人为操纵。Corazza et al (2010)通过检测美国标普500指数的概率分布发现,样本汇总数据的概率分布与Benford法则相符,且大多数每日数据也符合。
国内研究者近年来开始重视应用该法则,研究集中在审计、股市、会计等领域。王忍等(2006)用该法则检验中国沪深交易所上司公司报表中的净利润数据是否存在伪造数据。王福胜等(2007)研究了利用财务数据如何应用Benford法则,并指出具体应用中应注意的事项。许存兴等(2009)基于该法则对样本上市公司与配对公司的资产负债表数据、利润表数据、财务数据的真实性进行了比较研究。
近年来,这种方法也逐渐出现在经济数据质量检测中。许涤龙等(2010)将Benford法则用于分析月度M2数据的准确性,发现数据较好地符合该法则。刘云霞等(2012)强调Benford法则在实际运用中存在的局限性,主张结合其他方法相互印证,他们同时运用该法则和面板数据模型检测多个国家开发区主要经济指标的数据质量,发现税收收入数据质量较低。王亚菲等(2014)将Benford法则作为研究全国GDP数据与地方汇总GDP数据偏差的方法之一,结合平衡关系、计量模型未发现两者存在虚假数据的证据。米子川等(2014)基于该法则也没发现中国国民经济核算、财政、金融、国际收支平衡这4类部门的主要经济指标存在人为操纵现象。
然而,作为一种数据统计规律,Benford法则适用的数据是有条件的:(1)数据样本具有一定规模;(2)数据没有最大值和最小值限制,而且不能是人为赋值和标识码;(3)数据的形成是多种客观因素的结果,即具有一定的随机性(Nigrini,1997;王云霞等,2012)。本文将使用的宏观经济数据和用电量数据能够符合这些条件,因此可使用Benford法则进行分析。
三、电力、经济数据质量测量
(一)指标选择
本文使用的数据分别为分省GDP、工业增加值、用电量数据。选择的理由:一是用电量数据与GDP、工业增加值存在背离的现象,尤其是经济起伏较大时期,有些研究者怀疑数据本身的准确性;二是根据电力系统的特点,生产与消费同时完成,发电量数据与用电量数据具有一致性,本文仅使用用电量数据。数据样本为1990—2013年31个省市区(以下统称为省)相应数据,其中GDP、工业增加值样本数为744个,用电量样本数为733个。数据来源为国家统计局网站及中电联历年统计月报。
(二)处理过程和方法
基于Benford法则估算数据质量的工具有多种,本文主要是比较电力与经济数据的质量,数据处理过程通过Excel软件完成。主要处理过程如下:首先,利用Excel中相应函数提取出每位数据首位数字、第二位数字;其次,统计首位数字中1~9各自然数出现的次数,第二位数字中0~9各自然数出现的次数;再次,计算各自然数在首位、第二位出现的频率,并与Benford法则相应标准概率对照;最后,使用一些方法检验实际数据中数字分布与Benford分布的差异,进而确定数据的质量。
本文将使用的检验方法有:χ2拟合优度、Pearson相关系数以及距离检测。
1. χ2拟合优度检验。
该检验中使用的χ2统计量公式为:
首位数字:
第二位数字:
其中,N为样本数,ei、bi分别为实际数据中首位(第二位数字)的频率、Benford法则相应的理论概率。理论上,χ2统计量值越大,实际数据分布越不符合Benford法则。
2. Pearson相关系数。
Pearson相关系数的计算公式为:
判定标准为:正常(0.99<r≤1.0),完全符合Benford法则;关注(0.97<r≤0.99),存在数据造假或失真可能;可疑(r≤0.97),数据质量较低,迹象较明显(许存兴等,2009)。
3. 距离检测。
通过计算统计数据的频率分布与Benford分布的距离也可测量数据的质量高低。本文使用的距离公式为:
(三)实证分析
首先观察GDP、工业增加值、用电量数据首位数字各自然数的频率分布与Benford法则的分布,具体见表1。总体上,3个变量首位数字频率分布与Benford法则分布一致,频率呈递减趋势。其中,GDP首位数字频率分布几乎与Benford分布重合,只有数字1、2、9偏离稍大;工业增加值的首位数字1、2、4偏离稍大;用电量的首位数字1、4、7偏离较大。
再看这些数据第二位数字各自然数的频率分布与Benford法则分布的对照,见表2。总体上,3个变量第二位数字频率分布也呈现逐渐递减趋势,但是相较于首位数字,第二位数字频率分布与Benford分布偏离更明显。其中,GDP的第二位数字1、6、7、8偏离稍大;工业增加值的第二位数字3、6、8、9偏离较大;用电量的第二位数字2、7、8偏离较大。
观察GDP、工业增加值、用电量的首位数字频率分布相对误差刘云霞等,2012)。
(4)最后,Benford方法本身是中数字的统计方法,不能代表经济理论本身,也不能显示具体的数据问题所在,只是检验数据质量的一个简捷方法,将其复杂化则适得其反。
四、结论
文章基于Benford法则,并依据χ2拟合优度、Pearson相关系数以及距离检测对1990—2013年31省市自治区的GDP、工业增加值、用电量数据的质量进行了检验。结果显示宏观经济数据没有系统性质量问题,而且没有充分证据显示用电量数据质量明显高于GDP、工业增加值。这个结论表明,当存在电力数据增长与经济增长存在重大偏离时,应重点从产业结构、产品结构、行业周期上寻找原因,而不是一味地归咎于统计数据的质量。
摘要:针对目前电力增长波幅与经济增长偏离现象,本文依据Benford数字分布规则对地方GDP、工业增加值、用电量数据质量进行了检测。分析结果显示,这些数据的数字分布均符合Benford法则。因此,本文认为应重点从产业结构、产品结构、行业周期上解释电力增长与经济增长偏差大的问题,而非归咎于数据质量。
提高环境监测数据质量的对策分析 第10篇
近年来, 随着城镇化率的逐年提高, 人们生活水平不断改善, 生产生活中造成的污染也在随之增加, 这就意味着人类赖以生存的环境面临着巨大考验。随着可持续发展的概念提出, 环境保护被大家所关注, 且重视程度越来越高。我国于2014年4月, 十二届全国人大常委会第八次会议表决通过了 《环保法修订案 》, 于2015年1月1 日施行新《环境保护法》。至此, 这部中国环境领域的“基本法”, 完成了25 年来的首次修订。这让环境保护法律与时俱进, 开始服务于公众对依法建设“美丽中国”的期待。新《环境保护法》在环境监测数据质量方面给出了最严格的规定, 如何在新形势下提高环境监测数据质量成为目前环境保护工作的重中之重。
2 中国环境保护管理体制的形成与现状
2.1 中国环境保护管理体制的形成
自建国以来, 我国并未设置专门的环境保护机构, 环境管理工作由相关部门进行兼管, 没有形成系统的环境保护管理体制。至1973年, 全国第一次环境保护会议召开, 《关于保护和改善环境的若干规定 (试行草案) 》提出“各地区、各部门要设立环境保护机构, 给他们以监督、检查的职权。”因此在1974年, 国务院成立了环境保护领导小组, 专门主管和协调全国的环境工作。1979年, 《环境保护法 (试行) 》颁布后, 全国多个省、市人民政府设立了环境保护管理机构, 同时也相应成立了环境监测机构, 这就是我国环境保护管理体制的初始阶段。
2.2 中国环境保护管理体制的现状
经过20世纪80年代的机构调整, 环境保护管理机构逐步进行整合, 由最初的国家、省、市、县等地区性环境保护机构与石油、化工、冶金等部门性行业环境保护机构并存的状况渐渐转变为现行的统一监督管理与分级分部门管理相结合的管理体制。1984 年, 成立了国家环境保护局;1998年, 国务院机构改革, 国家环境保护局升格为部级国家环境保护总局;2008年, 根据第十一届全国人民代表大会第一次会议批准的国务院机构改革方案和 《国务院关于机构设置的通知 》 (国发200811号) , 设立环境保护部, 为国务院组成部门。环保部负责拟订并实施环境保护规划、政策和标准, 组织编制环境功能区域划分, 监督管理环境污染防治, 协调解决重大环境保护问题, 以及环境政策的制订和落实、法律的监督与执行、跨行政地区环境事务协调等任务。从上述我国环境保护管理体制的形成和发展过程看出, 随着人类文明的进步, 我国城镇化的迅速发展, 环境问题日益突出, 党和国家对环境保护越来越重视, 环保机构的地位变得越来越重要, 环境保护管理体制也日趋完善。
3 环境监测质量在环境管理中的重要性
环境监测是环境保护的基础, 是环境保护建设工作的重要支撑。环境监测是环境保护工作的“耳目”, 是为管理决策提供科学依据, 为监督执法提供有效证据, 为环境科研提供详实数据, 为社会公众提供准确信息的最为重要的基础性和前沿性工作。
环境监测数据质量是环境监测工作的“生命线”, 环境监测质量是保证监测数据具有代表性、准确性、可比性、精密性和完整性的前提, 随着社会生产生活对环境保护的要求越来越高, 环境监测在环境管理中的作用也变得更加突出。
4 新形势下如何提高环境监测数据质量
4.1 构建完善的环境监测质量管理体系
环境监测质量管理体系的建立是完善环境监测机构质量管理工作的重要依据。通过编制与环境监测质量管理相关的各项制度要求、监测工作质量规定等内容, 不断完善环境监测体系文件, 通过积极的监测体系建设来提升环境监测质量管理的水平。完善环境监测质量管理体系必须包括环境监测全过程的质量管理, 也就是现场样品采集、实验室分析、数据综合处理三个方面。现场样品采集质量管理包括采样人员和采样方法的管理。采样人员必须持有环保部门颁发的环境监测上岗证或经过专业培训并考核合格;采样方法及采样量必须严格遵守国家环境监测标准方法, 同时做好采样记录。实验室分析质量管理指由上级监测站对下级监测站或者由站内质量管理部门对实验室进行的定期或不定期检查, 目的是为了发现和消除实验室系统误差, 保证数据的准确可靠。数据综合处理质量管理是指应用数理统计方法和计算机先进技术对监测数据进行科学统计与管理, 建立系统的数据分析工作制度。
4.2 提高环境监测人员整体素质
监测人员是监测工作的主体, 为了保证环境监测质量体系有效运行, 就必须有一支高素质的监测队伍, 因此提高环境监测人员整体素质是十分必要的。首先, 各级环境保护主管部门要鼓励和督促环境监测人员参加各类专业培训和学术交流, 定期对其进行技术考核, 以此来提高环境监测人员的业务能力;其次, 要加强思想教育工作, 培养环境监测人员的责任意识, 提高其政治素质;最后, 要运用各种激励机制, 充分调动环境监测人员的积极性。
4.3 贯彻落实环境信息公开制度
新《环境保护法》首次确认了公民依法享有获取环境信息, 参与环境保护和监督环境保护的权利。强化公众参与机制, 依法公开环境信息, 定期发布环境状况, 一方面有利于体现公众的知情权, 促进对政府的理解和信任, 另一方面也能起到监督作用, 督促环境保护主管部门进一步提高环境监测数据质量, 保证发布的环境信息更加准确。
5 结语
新形势下, 面对严峻的环境问题, 提高环境监测质量是重要任务。2015年1月1日, 修订后的《环境保护法》正式实施, 其中对环境监测机构和监测数据质量都提出了更为严格的规定, 这对环境监测工作是一个全新的挑战。相比西方发达国家较为完善的环境监测管理体系, 我国这方面工作起步较晚, 经过30多年的建设, 现已建成了中央到地方省、市和部分县的四级环境监测网络体系, 但监测工作仍存在一些不足。努力提高环境监测数据质量, 提升环境监测工作质量, 保证监测在环境管理中的准确性, 才能使环境监测更好地服务于各项环境保护工作, 才能更好地为环境保护决策提供科学依据。
参考文献
[1]童明珠.新时期环境监测质量影响因素与改进措施[J].中国高新技术企业, 2014 (27) :98.
[2]祝晟.加强环境监测质量管理初探[J].科技创新与应用, 2014 (28) :148.
数据质量分析 第11篇
1. 延续该校重视计算教学的传统,持续加强数感培养。F小学在M3SS142题的平均得分率高于本区7.4%,说明F小学在计算能力方面是突出的。针对学生的计算,F小学多年前就设计了速算竞赛,分两期:第一学期是集体赛,在规定时间、各年级规定的题目下,每班通过达标率人数多者取胜;第二学期是个人赛,在规定时间内、各年级规定的题目下,谁做对得最多则获奖,设一、二、三等奖。这不仅激发了学生的学习热情,每位数学教师也将课前五分钟都利用为练习口算时间,所以,学生的计算能力方面比较稳定,因此,该项目应该继续发扬。而M3SO041是考察“运用策略对万以内的数量进行估计”,这需要学生在教学活动过程中,要有实践体验的机会,作为数学教师,要通过教学设计才能让学生对估算的运用掌握好。
2. 注重培养学生学习思维过程,熟练运用基本公式及规范作图操作习惯。所谓熟能生巧,从学生计算长方形面积与画出相应图形得分均高于本区平均得分来看,F小学学生对公式的记忆是非常深刻的,证明平时教学中不断反复地运用公式练习还是不少;而且,F小学数学科组一贯要求作图规范,每次的期末考试,数学科组在试卷答案统一上,不管哪个年级都要求学生画图需要对工具的规范使用,哪怕有一点不准确,该题全部不得分。因此,F小学的每位数学教师在平时普通教学中,一丝不苟地让每一位学生规范地用好尺子、圆规等工具,不会临时抱佛脚等考试来了才提要求。所以,也要在这方面继续坚持做好,在期末考试的改卷上,该规范的应该有强硬的态度规范,不能因小失大。而M3SS172考察的“会推导长方形面积公式”全区得分都低,表明该区整体数学教学在数学知识的产生上都没有多给学生时间去探索,以致学生对该方面知识印象不深。数学知识的产生尤为重要,弄清知识的背景,能培养好学生探究知识的精神。今后的教学需花时间让学生动手操作、获取知识。
3. 不断提高数学阅读能力,培养学生良好数学分析能力。从M3SO071考察“结合具体情境说明两位数乘两位数的竖式中每一步的含义”及M3SS162、M3SS201对数据的整理、运用、判断,全区平均得分低,不是在教学中没有突破其难点,就是有部分学生的审题存在问题,对题目要求做什么没有弄清就着手解题,导致两题失分大。所以,平时教学中需要为学生整理出相关数学史籍、数学趣题、数学探索,以调动学生对数学的兴趣。这样可以培养学生的数学阅读能力,从而培养学生良好的数学分析能力。
4. 多方式提高课堂效率,变后置作业为前置作业或当堂作业。从学生的压力的反馈上看,F小学的作业量偏多,导致有部分学生的睡眠时间较短。就数学教学而言,作业主要有课堂知识复习作业、巩固计算作业(口算)及预习作业,因此,在作业方面,应当精简。在保留好课堂知识复习作业的前提下,对于巩固计算作业可以利用好在校学习时间完成,也可通过这样的前置作业获得准确的学情。另外,预习作业的布置需要讲究策略,根据内容的不同,布置相应的行之有效的作业。
5. 多途径建立新型师生关系,提高学生对数学领域的探索兴趣。在学生评价及其他学习动机、情感反馈方面看,数学老师不仅弱于语文老师,而且,在学生心中的隔阂也相对较大,学习的自信心还很有提高的空间。因此,F小学的数学教师应该转变“我不是班主任”的观念,主动参与学生管理,尤其对中下层次的学生要重点关注,要关心他们的学习方法,主动与他们谈心,对其家庭的了解也要深入。要转变一个学生,不仅要从思想上关注,也要让其在课堂上有展示的空间,让其在课堂中体验成就感、自豪感。这样,学生的学习自信心将会增强,学生学习自觉性、主动性的转变就更大。因此,广大数学教师还要继续探索新的教学方式,转变学生的学习方式的步伐更加迫切。
数据质量分析 第12篇
关键词:新型农村合作医疗,信息系统,数据质量,数据清洗
信息化建设是新型农村合作医疗 (以下简称“新农合”) 提高工作效率, 确保基金安全、规范运行, 实现科学管理的有效手段。卫生部从2003年进行新农合试点起就高度重视信息化工作。2006年, 卫生部出台了《关于新型农村合作医疗信息系统建设的指导意见》, 提出在2~3年内建立起与新农合制度发展相适应、与建设中的国家卫生信息系统相衔接、较为完备和高效的全国新农合信息系统。2009年4月6日国务院颁布了《中共中央、国务院关于深化医药卫生体制改革的意见》, 把“建立使用共享的医药卫生系统”列为支持“医改“的重要支撑条件, 要求“大力推进医药卫生信息化建设”, “整合资源, 加强信息标准化和公共服务信息平台建设, 逐步实现统一高效、互联互通。“新农合信息系统的建设目标是构建国家级新农合数据集[1], 这需要从县级业务平台到省级平台, 再从省级平台到国家平台逐层进行数据的收集、传输、集成、分析, 最终实现基于数据的决策辅助分析。而县级数据质量, 即数据的准确性、及时性、完整性、一致性和规整性, 直接关系到最终辅助决策结果的准确性和有效性。但是, 在对我国县级新农合信息系统数据采集和分析过程中, 作者发现了系统数据质量上存在的一些问题。为了尽可能提高新农合信息系统数据的质量, 有必要对现有数据进行质量控制, 在数据传输、集成之前解决好可能存在的数据质量问题。因此, 作者提出利用管理和技术手段改善数据质量, 保障信息辅助决策工作的准确、有效开展。
1新型农村合作医疗信息系统发展现状及数据质量问题分析
1.1 新型农村合作医疗信息系统发展现状
统计资料显示, 截至2009年3月, 我国新农合已经覆盖了2716个县 (市、区) , 参合农民 8.3 亿人, 基本实现了全覆盖。
随着参合人数的增多, 各级新农合管理、经办机构的业务量迅速增大。因此, 新农合制度实施之初, 各级政府就高度重视信息化管理。中央财政从2004年开始, 在中央财政公共维护专项转移支付中设立新农合管理能力建设专项资金, 在2004、2005、2006年分别对新增试点县的县、乡级经办机构投入3000万元、8348万元、6235万元用于计算机和打印机的购置, 为新农合的信息化建设提供了必要的硬件。2006年还安排了省级新农合信息平台建设专款13200万元, 在中西部地区22个省 (自治区、市) 卫生信息网络的基础上扩建新农合信息平台, 建立数据库, 配备必要的硬件和软件。
, 于2006年制订了《新型农村合作医疗信息系统基本规范 (试行) 》, 经过专家论证和实际运行, 2008年又出台了《新型农村合作医疗信息系统基本规范 (2008年修订版) 》[1] (以下简称《规范》) 。《规范》是各级新农合信息系统开发的基本技术标准, 是建设国家级新农合数据交换中心的基础。
经过各级政府几年来的努力, 新农合信息化建设进度快、覆盖广。根据对各地情况的调查[2], 绝大多数省市都有了不同水平的县级信息系统, 部分县已经将信息系统延伸至乡镇和各级医疗机构, 全国90%以上的县级新农合信息系统基本按照《规范》设计和开发;同时省级信息平台 (包括支持平台、业务运行两大中心) 正在建设中, 个别省市已经完成了项目建设招标, 进入实施阶段。新农合信息系统的覆盖范畴, 也从最初的筹资管理、集中给付逐步发展到现行的当场给付, 以及目前的健康档案管理等。
1.2各地新农合信息系统数据质量现状
新农合信息系统的广泛应用提高了工作效率、有力地保证了农村的医疗卫生建设。但是, 目前新农合信息系统在辅助决策、提高财政资金利用率方面的支持还存在不足, 其中一个重要的原因是新农合系统中的数据质量不高, 利用数据分析的结果来辅助决策会存在偏差。
为更好地了解我国新农合信息系统的数据质量情况, 作者对新农合信息系统进行数据抽样调查, 评价其数据质量, 发现影响数据质量的原因, 从而探索改善数据质量的关键因素和措施。
在样本选取方面, 作者根据中国各地区的经济发展状况分别选择了位于东部沿海地区、经济较为发达的山东省和位于西部地区、经济相对欠发达的宁夏回族自治区作为研究对象。在两个省 (区) 内, 按照典型抽样的方式, 分别选取了经济发展水平较好、中等和较差的县 (市) 各一个作为样本县市。在山东省, 依照经济发展水平的高、中、低依次选取了章丘市、昌乐县和东阿县;在宁夏回族自治区依次选取了青铜峡市、永宁县和中宁县。在资料收集方面, 作者于2009年3月到各县新农合办公室收集了样本县市2005-2009年的运行情况数据资料并对各地信息化建设水平进行了调研。
就调研到的县市来看, 山东省由于经济发展情况更好, 其三县的信息化发展平均水平好于宁夏回族自治区的三个县, 其中山东省的章丘县和东阿县以及宁夏回族自治区的中宁县实现了网络版软件;山东省昌乐县和宁夏回族自治区的永宁县实现了单机版业务系统, 但永宁县仅是采用Excel软件来完成数据报表;宁夏回族自治区的青铜峡市仍使用手工业务处理。根据调研的结果, 将各地新农合信息化系统分为三类, 即依靠手工操作, 应用单机版业务软件和应用网络版业务软件。每种类别都存在一定的数据质量问题:
(1) 依靠手工操作。目前, 仍有少数地区没有条件建设县级新农合信息系统, 完全依靠手工完成数据的登记和报表生成提交。手工处理工作量大, 效率低下, 操作中易出现数据的误记录或遗漏记录, 对数据的准确性造成影响。
(2) 应用单机版业务软件。由于受信息化发展水平的限制, 个别地区的新农合管理部门仅采用Excel或单机版业务软件完成数据的采集、录入, 未能实现与医疗机构HIS系统及基金报销账户之间的互联互通, 数据及时性问题突出。此外, 数据记录形式及统计口径的不一致也导致了数据一致性问题, 如昌乐县统计门诊、住院补偿费用时没有使用自然年度, 而是将前一年的后半年加上后一年的上半年作为一个统计年度, 这与医院结算系统定义不一致, 直接使用会出现错误数据。
(3) 应用网络版业务软件。网络版业务软件基本实现了与定点医疗机构HIS系统及基金报销账户之间的互联互通。但是, 由于各地提供的网络传输条件不同, 会出现网络中断的情况, 网络中断会影响数据的完整性或出现重复数据。另外, 由于涉及多个系统的互联互通, 而部分开发商没有按照卫生部有关规范进行开发[2], 各系统之间存在数据格式不一致等问题, 对于后续的数据分析和决策造成了一定的困难。从调研的结果来看, 目前新农合信息系统的数据质量不高, 对利用数据分析结果调整新农合补偿方案的帮助有限, 难以发挥其在辅助决策、提高资金使用效率等方面的作用。
2新型农村合作医疗信息系统数据质量提高的建议
针对目前新农合信息系统中数据质量存在的问题, 作者对信息处理的流程中各个环节进行分析, 找出影响数据质量的因素[3]: (1) 输入环节。处理流程中的第一步是由工作人员将数据进行输入到系统内。在输入过程中, 由于工作人员的疏忽而遗漏了必要数据或输入了错误数据, 都会引起数据质量的降低。 (2) 传输处理环节。新农合信息系统会在医疗管理机构、定点医疗机构之间, 各级新农合信息系统之间进行数据传输, 实现互联互通, 完成数据存储和基本的业务处理。传输过程中的故障会引起数据的缺失或随机错误。 (3) 集成分析环节。完成了数据传输和处理之后, 可以对来自不同地域的数据进行集中分析。但目前各地的新农合信息系统中存储数据的格式不尽相同, 从而会引起重复数据、数据不一致等问题的发生。 (4) 维护环节。在完成分析之余, 工作人员还会对数据进行备份和维护。由于在备份和维护的过程中, 工作人员往往直接对数据进行操作, 有可能因误操作而导致错误数据的产生。
为了消除上述因素对数据质量的影响, 作者建议通过从管理和技术两方面来保障新农合信息系统的数据质量。管理方面通过加强宣传、完善制度和管理措施来规范操作。技术手段主要借助数据清理技术对存储的数据进行整理, 提高数据质量。
2.1管理手段
提高新农合信息系统的数据质量, 最重要还是要提高业务人员的意识和业务水平, 使得在系统建设、操作过程中尽可能的减少错误。具体来说, 可以通过加强宣传、完善制度和管理措施来规范操作、提高数据质量。
一是加强宣传培训, 提高工作人员保障数据质量的意识和能力。通过讲座、培训等手段, 让工作人员充分认识到保障数据质量的重要性, 提高保障数据质量的意识。通过业务培训、业务比赛等手段提高工作人员的业务水平, 避免操作过程中错误和遗漏现象的发生。
二是建立完善、规范的操作流程管理制度, 尽可能的减少人工操作对数据质量的影响。针对新农合信息系统操作流程中的每个环节, 规定许可的操作范围和权限, 保证操作的规范性。建立完整的操作记录, 对操作过程进行审计, 加强对数据的验证, 指定专人对操作的结果进行检查。确保数据的准确性、完整性、一致性
三是增强保障措施。一方面加强网络基础设施建设, 尽可能做到专网专用, 形成省、市、县、乡、村的多级互联网络平台, 保证网络的安全性, 避免在数据传输中的错误导致数据出现缺失或冗余。另一方面要求设计开发承担单位建立健全应对断网、断电、设备故障等突发事件发生后的应急制度和手段, 保障突发情况下数据的安全。如及时补录新增数据, 检查被影响数据集等。
四是重视技术监督。严格保证新农合信息系统设计开发承担单位的业务水平, 通过第三方测评机构来对交付使用的新农合信息系统进行检测, 严格按照国家规定的数据格式及要求开发系统, 确保信息系统的质量, 避免在集成分析、维护过程中出现数据冗余和不一致。
2.2技术手段
在技术手段上主要通过数据清理提高数据质量。数据清洗是指根据业务流程中的规则, 利用软件工具来自动检测并去除数据中明显存在的错误和不一致。利用数据清理技术来保证数据质量具有效率高、工作量小的特点, 是对管理手段的有效补充。具体而言, 数据清理技术主要清除空缺值, 识别并消除噪声数据, 纠正数据中的不一致, 达到提高数据质量的目的。在处理的过程中, 如果出现不能自动处理的情况, 软件工具会生成异常报告, 由工作人员决定如何处理, 并将解决方式转变为规则添加到软件工具中。
(1) 清除空缺值。工具首先检测哪些数据存在空缺值, 然后采用如下的处理步骤: (1) 如果某条数据有多个属性值空缺, 即空缺的属性值所占的百分比较大时, 可选择忽略该条数据。 (2) 利用特定的数值来填充空缺。具体的填充方法:一是人工核对并填写空缺值;二是规定一个常量来填充空缺值。如对于年份的空缺可按相应记录年份填写;三是使用平均值填充空缺值。例如, 假定某县参合农民的年平均收入为8, 000, 则使用该值替换该县农民年收入的空缺值;四是利用回归、推导或判定树等技术归纳计算最可能的值来填充空缺。例如, 利用不同级别医疗机构利用率的值, 构造判定树来预测的属性值。
(2) 消除噪音数据。噪声数据是数据中出现的随机错误或偏差。为消除噪音数据, 数据清理工具首先通过聚类、回归函数等技术手段来对数据进行分类, 然后采用自动或者自动与人工相结合的方式, 来发现与大多数数据存在明显偏离的数据, 并将此类数据定义为噪音数据。针对噪音数据, 数据清理工具可以根据业务规则来进行修改
(3) 消除不一致数据。不一致数据是指信息系统记录的结果与手工统计结果存在不一致的数据。手工核对不一致数据有工作量过大的困难。数据清理工具利用领域知识或逻辑构建判断规则, 自动检查、消除不一致数据, 降低核对数据的复杂程度。具体的规则可以包含: (1) 利用基本常识判断来消除错误, 如年龄过大, 日期严重不符的情况, 可以依照基本常识来编写规则, 自动检查。 (2) 利用医疗卫生业务的领域常识来建立规则, 也可以通过根据数据建立模型, 消除不一致数据。 (3) 数据与数据之间会存在联系, 可以利用数据间的联系建立模型, 来发现不一致数据, 解决无法通过单一数据来察觉的问题。
在具体操作中, 需要根据各地的实际情况进行分析、设计规则, 并通过小范围内的数据实验比较数据质量改善情况、调整规则, 最终达到提高数据质量的目的。
新农合信息系统的普及为信息分析和政策制订提供了丰富的数据资源。但如果忽略系统中的数据质量问题, 分析的结果和制定的政策就会出现偏差, 可能会带来严重后果。作者在对新农合信息系统调研分析的基础上, 列举出操作过程中各个环节的可能出现的问题。结合实际信息系统和环境, 从管理和技术两个方面提出相应的建议提高数据质量, 以保障信息分析和政策制订工作的顺利、有效进行。
参考文献
[1]卫生部.《新型农村合作医疗信息系统基本规范 (2008年修订版) 》[M], 2006.
[2]游茂.新型农村合作医疗信息系统建设存在的问题及建议[J].卫生经济研究, 2009;3 (3) :20.
数据质量分析范文
声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。如若本站内容侵犯了原著者的合法权益,可联系本站删除。