可视化分析范文
可视化分析范文(精选12篇)
可视化分析 第1篇
在BS实现的软件架构中,有很多优秀工具可以实现数据可视化,比如jQchart,xCharts.Flot,HighChars以及Echarts等等。但是对于研发人员来说,怎么选择一个开发简单方便,学习成本低,能达到好的效果并且适合自己项目中的图表表现方法呢?本文对现在最流行的Highcharts和Echarts进行分析和比较。一ECharts
ECharts由百度商业前端数据可视化团队开发,底层基于ZRender (一个全新的轻量级canvas类库),创建了坐标系图例,提示,工具箱等基础组件,并在此之上构建出折线图、柱状图、散点图、K线图、饼图、雷达图、地图、和弦图、力导向布局图、仪表盘以及漏斗图,同时支持任意维度的堆积和多图表混合展现。
这是一个用纯JavaScript编写的一个图表库,能够很简单便捷地在web网站或是web应用程序添加有交互性的图表.并且免费提供给个人学习、个人网站和非商业用途使用,它包括曲线图,区域图,3D图,柱状图,饼图.散列图,动态更新,混合图,仪表图,极地图,箱线图,瀑布图,漏斗图,渲染图等等。而且它支持打印,导出图片,以及PDF,Excel等。三比较
一般项目里,Echats和Highcharts都能满足以图表显示统计的需求,它们都是动态渲染的效果,都能达到炫的目的。Echats是基于HTML5的canvas实现的,而Highcharts则是纯javaScript实现的。1.Highcharts优势
●兼容性。Highcharts支持目前所有的现代浏览器,包括IE6+、iPhone/iPad、Android,Highcharts在标准(W3C标准)浏览器中使用SVG技术渲染图形,在其他的IE浏览器中使用VML技术来绘图;
●开源免费。针对个人用户及非商业用途免费,并提供源代码下载,你可以任意修改它。商业用途需要购买许可,个人及非商业用途须遵循CC BY-NC 3.0协议:
●纯Javascript-Highcharts完全基于本地浏览器技术,不需要任何插件(例如Flash、java).不需要安装任何服务器环境或动态语言库支持,只需要两个js文件即可运行;
●图表类型丰富。Highcharts目前支持直线图、曲线图、面积图、曲线面积图、面积范围图、曲线面积范围图、柱状图、柱状范围图、条形图、饼图、散点图、箱线图、气泡图、误差线图、漏斗图、仪表图、瀑布图、雷达图,共18种类型图表,其中很多图表可以集成在同一个图形中形成综合图;
●动态性。提供丰富的API接口,方便在创建图表后对图表的任意点、线和文字等进行增加、删除和修改操作。支持众多的Javascript事件,结合jQuery、MooTools、Prototype等javascript框架提供的Ajax接口,可以实时地从服务器取得数据并实时刷新图表;
●多轴支持。对于需要比较的数据,Highcharts提供多轴支持。并且可以针对每个轴设置其位置、文字和样式等属性;
●动态提示框。当鼠标悬停在图表上的数据点时,Highcharts会显示信息提示框,当然,显示的内容和样式可以自己指定和设置:
●图表导出和打印功能。用户可以将Highcharts图表导出为PNG、JPG、PDF和SVG格式文件或直接在网页上打印出来;
●图表缩放。可以设置图表的缩放,让用户更方便查看图表数据;
●支持外部数据加载。Highcharts支持多种数据形式,可以是Javascript数组、json文件、json对象和表格数据等,这些数据来源可以是本地、不同页面,甚至是不同网站。2.Echarts优势
●拖拽重计算。拖拽重计算特性带来了数据统计图表全新的用户体验,允许用户对统计数据进行有效的提取、整合.甚至在多个图表间交换数据,赋予了用户对数据进行挖掘、整合的能力:
●数据视图。数据视图的编辑功能,批量的数据修改。只要给予一个“,”分隔的数据文本,就能刷新出用户自定义的数据图表.这就是ECharts的数据视图。当然,用户可以重载数据视图的输出方法,用一种独特的方式去呈现数据;
●动态类型切换。很多图表类型本身所表现的能力是相似的,但由于数据差异、表现需求和个人喜好的不同导致最终图表所呈现的张力又大不一样,比如折线图和柱状图的选择,系列数据是堆叠还是平铺总是不好把握。ECharts提供了动态类型切换,让用户随心所欲地切换到其所需要的图表类型和堆叠状态。试试把柱状图切换成折线图,或者切换堆积平铺状态;
●图例开关。多系列数据的同时展现,呈现出丰富内容,但让用户希望切换到他所关心的个别系列上,ECharts提供了方便快捷的多维度图例开关,可以随时切换到用户所关心的数据系列:
●数据区域选择。数据可以是无限的.但显示空间总是有限的,数据区域选择组件提供了大数据量中漫游的能力,让用户选择并呈现他所关心的数据区域。配合随动的均值(极值)标线,标注展现强大的数据剖析能力;
●多图联动。多系列数据在同一个直角系内同时展现有时候会产生混乱,但他们又存在极强的关联意义不可分离。ECharts提供了多图联动的能力,能做的可不仅仅是鼠标划过的详情显示,连接的多个图表会共享组件事件并且实现了保存图片时的自动拼接:
●值域漫游。基于坐标的图表(如地图、散点图)通过色彩变化表现数值的大小能直观形象地展示数据分布。ECharts提供了称为值域漫游的功能,让用户可以轻松进行数值筛选,聚焦到用户所关心的数值上;
●炫光特效。Echarts支持标注标线的炫光特效,特别用在地图上轻松实现百度迁徙数据可视化特效模拟迁徙;
●大规模数据模式。如何展现成千上百万的数据?在拥有如此多交互特性下ECharts依然可以做到直角系图表(折、柱、散点、K线) 20万数据秒级内渲染完成,这对于常规的应用,用现代浏览器就足以轻松展现百万规模的数据:
●多维度堆积。支持多系列,多维度的数据堆积,配合个性化配置的图形实体和自动伸缩直角坐标系,能呈现出更有内涵的统计图表;
●子区域地图模式。地图类型支持World,China及全国34个省市自治区。同时支持子区域模式,通过主地图类型扩展出所包含的子区域地图,轻易输出全球176个国家地区和全国600多个省市区域简图;
●GeoJson地图扩展。内置地图由标准GeoJson地理数据并经过高效的压缩算法压缩生成的地图数据(大小仅为标准geoJson的30%左右)驱动而来。如果内置地图类型或数据如果并未满足项目需要,可通过简单动态注册产生所需要的新类型;
●标注&标线。添加标注内容是常用的功能,如地图上标注某些特定位置,折线图上标注极值点或者柱形图里标线出变化趋势,ECharts全系列图表支持标注标线功能,并且可以响应图例开关、值域漫游等组件的交互功能;
●混搭。混搭的图表会更具表现力也更有趣味,ECharts提供的图表(共11类17种)支持任意混搭:折线图(面积图)、柱状图(条形图)、散点图(气泡图)、K线图、饼图(环形图)、雷达图、地图、和弦图、力导布局图、仪表盘、漏斗图。混搭情况下的一个标准图表包含唯一图例、工具箱、数据区域缩放、值域漫游模块,一个直角坐标系(可包含一条或多条类目轴线,一条或多条值轴线,最多上下左右四条);
●互动图形用户界面(GUI)。重新定义数据图表的时候到了,浏览ECharts所输出的图表,用户不再只是个“读者”,还可以参与其中,这就是Echarts,正在打造的一个拥有互动图形用户界面(GUI)的数据可视化工具;
●高度个性化能力。Echarts拥有超过600项的配置选项,配合多级控制让它具备了高度个性化能力;
●动态数据添加。在数据每时每刻都在产生的今天,需要一种手段为客户呈现那些能够反应当前状态或洞悉未来趋势的数据;
●力导向布局。系统中的每个节点都可以看成是一个带有一定能量的放电粒子,粒子间存在某种库仑斥力。同时,有些粒子间被一些“边”所牵连,这些边产生类似弹簧的胡克引力。在粒子间斥力和引力的不断作用下,粒子们从随机无序的初态不断发生位移,逐渐趋于平衡有序的终态。同时整个物理系统的能量也在不断消耗,经过数次迭代后,粒子间几乎不再发生相对位移,整个系统达到一种稳定平衡的状态。这就是力导向布局算法的直白描述;
●大规模散点。Echarts发明了基于像素的大规模散点图,用散点区域就能够毫不重复地呈现36万组数据,这对于常规的应用,用现代浏览器就足以轻松展现百万级的散点数据;
●百搭时间轴。时空数据分析是信息可视化里一个相当重要的方向。ECharts提供可与任意图表搭配使用的时间轴控件以展现时空数据变化;
●数据区域缩放。Echarts提供了数据区域缩放功能,带全局数值影子的刻度条加上三个可拖拽的手柄让用户轻松完成数据区域浏览,用户甚至可以启用更加直观的框选放大和后退。拖拽和框选这两种交互会自动同步的,随动的还有极值点和平均线的自动标注。四设计
数据可视化是一种将数据转换为便于理解和使用的图表的艺术和技术,是一个沟通复杂信息的强大武器。通过可视化信息,我们的大脑能够更好地抓取和保存有效信息,增加信息的印象。但如果数据可视化做得较弱,反而会带来负面效果。错误的表达会损害数据的传播,完全曲解他们。所以优秀的数据可视化依赖优异的设计,并非仅仅选择正确的图表模板那么简单。需要以一种更加有助于理解和引导的方式去表达信息,尽可能减轻用户获取信息的成本。
统计图种类较多,常用的包括直条图、百分直条图、直方图、线图和点图等。在实际应用中,应根据数据的类型及表达目的选用合适的统计图。
摘要:本文分析了两种流行的可视化工具ECharts和Higcharts,并进行了比较,可作为实际项目设计的参考。
可视化分析 第2篇
关键词:网络安全数据;可视化;研究
伴随着科技发展速度的持续加快,人们社会生产生活的各个领域都开始广泛的应用计算机网络技术。计算机信息技术具有广泛、开放、联结的特点,给我们的生活带来了便利,因此也在信息传输的私密性和质量方面隐藏着许多安全问题。信息安全问题不容小觑,小则个人用户隐私泄露,大则国家机密失窃。基于此,研究计算机网络信息与安全的防护策略于国于民都具有相当重大的意义。当前网络安全数据可视化技术则是重要的网络安全防护手段,研究这一技术对于人们的网络安全而言具有重要的意义。
1网络安全可视化的重要性
网络安全这一概念的形成在国内的历史并不长,是最近几年人们才开始逐渐意识到的问题。这是因为国内的计算机网络技术的发展起步较晚,虽然发展迅速,但是人们主要将重点集中在网络技术的研发上,而网络安全方面则常常处于被忽略的地位。但是随着网络安全案件的频繁发生,使得人们使用网络的安全性受到严重影响,而且网上办公的逐渐普及,一旦网络安全得不到保障,就会使得国民经济严重受损。正因如此,国内开始逐渐加强对网络安全防护技术的重视。以往的网络安全技术由于其日志信息的可视化因为自身性质而存在一定的局限,并且时效性太差,日志信息上传的过程需要耗费的时间太长,不能满足当前以高效率、快速度为特征的网络要求。并且,还存在一些较为实际的问题,在检测的过程中,日志信息可能会出现变化,这样一来检测结果的精确度就会大大降低。此外,数据分析人员在研究日志数据时,也存在一些问题。例如,管理部门传输的警报信号过多,导致管理人员的工作量极大,若是使用旧式的网络安全技术就会不能及时全面的解决和处理警报问题,导致网络安全得不到保障。因为以前的网络安全技术存在上述种种缺陷,所以为了提升网络的安全性,一些技术人员研究发现了一种以数据流为基础的网络可视化的安全防护方法,这一技术能够实现对网络流量的24小时监控,从而使网络数据的安全变得可视化。网络安全数据可视化技术的原理在于将可视化技术连同网络安全态势二者进行合理融合,从而能够更加高效的提升网络外部环境的可靠性以及安全性。
2网络安全数据可视化技术
网络安全可视化是一类新式的计算机可视化技术,主要是使用人类视觉对结构以及模型的信息提取功能,把较为抽象难懂的网络信息数据使用图像的方式进行表现,为网络信息分析人员提供帮助,使得分析人员能够更加便捷的判断网络中是否存在异常状况,在有危险因素入侵网络时能够及时发现并处理,同时还具有一定的网络安全事故预测能力。其关键应用范围如下:
2.1科学计算可视化
这一应用最初是由美国的一位专家所提出,当前在计算机的图形领域得到了很好的应用。科学计算可视化的理论基础为将规模较大的数据转变成为能够被人更加容易理解、更加具有直观性的图形或者图像,这一信息表现方式可以使人们能够更加直接的理解一些较为复杂的现象。并且,还具有计算以及模拟的视觉交互功能,操作起来简单便捷,并有着高效的网络安全防护能力。在计算机技术的持续发展背景下,这一技术具有广阔的应用前景,将来计算机图形学一定能够得到更好的发展,而科学计算可视化技术也将得到更好的完善。
2.2信息可视化
信息可视化与人们平日的生产生活活动具有重要的联系,对于网络安全数据可视化而言具有十分重要的地位。计算机科学技术的发展,促进了信息可视化技术的提升,同时也是当前计算机技术领域内的重点研究对象。计算机可视化即指使用计算机技术将内容结构十分复杂难懂的信息进行简化,使其能够用一种更加直观的方式表现处理,信息可视化技术是由多种学科知识的综合所得。由于当前网络信息呈现爆发式增长的状态,造成信息的数量愈来愈庞大,复杂的、多余的信息使得人们甄选出的想要信息的效率越来越低,造成严重的信息危机。但是信息可视化的使用能够有效的处理上述问题,因为其具有能够将复杂的信息转变成直观、易懂的信息,从而降低了人们获取信息的难度,给人们的信息处理和查找带来了便利。
2.3数据挖掘和可视化
数据挖掘可视化即在海量的数据中搜寻获得时效性好、潜能强且有效的信息。使用数据挖掘技术来获取信息主要依照下述步骤:数据管理、数据存储、数据分析、数据转换、数据挖掘、价值评价、数据显示。其在搜寻数据的同时能够与知识库以及使用者之间进行互动,从而使其获得数据更加具有正对性。数据可视化技术能够使用分析和观察数据表格的方式来获取想要的信息,能够更加全面的分析数据的内在含义,从而据此准确发现网络中存在的异常状况。数据可视化的使用能够使使用者更加直接的了解数据信息,同时分析数据的功能也比较强大,从而使用户获得更好的使用体验。
2.4安全数据可视化
网络安全数据的可视化的原理与信息可视化类似,都是通过将海量、复杂的信息使用简单、易懂的图像形式表达出来,再安排专门的技术分析人员使用评价、分析、交互的方式对这些数据进行处理,从中获取数据中含有的网络安全信息,以此达成网络安全数据的可视化处理,使得网络安全得到保障。
3网络安全可视化的措施
使用网络安全数据可视化技术能够使得网络安全程度得到提升,从而减少网络信息泄漏、网络攻击等事件的发生。当前,国内的网络安全形式并不乐观,时常出现网络病毒扩散、端口扫描、服务器被攻击等安全事故,这时网络数据流量会显示异常。所以,可以对网络流量进行实时监控,这样能够更好的防范网络安全,实现网络安全的最大化。用户在使用网络时可能会遇到网络电脑高手,电脑高手若是发动网络袭击,就会使得用户的私人信息被窃取。而对于企业公司而言,网络上存有公司的许多机密文件和信息,一旦被窃取或者因网络袭击而丢失都会给自身带来严重的经济损失。由此可见,电脑高手的存在使得网络的安全性降低,恶化了网络环境,对于网络的安全使用带来了严重的威胁。因此,网络技术安全防护人员需要寻找解决方法,阻止电脑高手的恶意行为,从而使得用户的网络安全得到保护,避免人们的隐私权受到侵害。技术人员通常会使用入侵系统对网络环境进行分析和探究,判断其中是否存在病毒或者漏洞,然后将获得的信息传递至分析人员,分析人员依照这些信息数据对网络系统进行病毒库升级和漏洞修复,从而使得网络安全得到提升,使网络安全数据可视化进一步加强。
4结束语
社会信息化发展已是大势所趋,网络安全防护日益重要。只有在保证网络安全的情况下,信息化社会才能更好更稳健更长远的发展。因此我们应加大对网络安全防护的重视,在日常生活中加强网络安全防护意识,积极采取防范措施,减少漏洞的产生,更加良好的了解和应用网络安全数据可视化,并对这一技术进行不断的优化和改进,从而避免潜在危险影响到人们的网络安全,使人们的权益得到更加全面的保护。
参考文献
可视化分析 第3篇
不可否认,现在已经是大数据的时代了,最近几年,大数据发展趋势蓬勃向上,吸引了社会各界的眼光,大家都看好大数据,想从大数据中获得商机和财富。大数据也没让大家失望,在科研、教育、医疗、政府、经济等领域都产生了深远影响。据统计,目前大数据所形成的市场规模在51亿美元左右,而到2017年,此数据预计会上涨到530亿美元。
人们通过收集、整理相关领域方方面面的数据,并对其进行分析挖掘,找到凌乱纷繁的数据背后的联系,进而从中获得有价值的信息,最终衍化出一种新的商业模式。
但是,面对纷繁复杂的数据,不是所有人都能有效地对其进行分析,并获取其背后信息所代表的价值的。那么,有没有什么办法让普通人也能轻易读懂并使用大数据呢?
需求决定市场,随着非科研人员对大数据需求的增大,很多大数据领域的创业公司不断涌现,他们致力于将大数据以一种简单直观地方式呈现给用户,让用户能更好地“消化”这些数据。
Origami Logic就是这样一家基于大数据的创业公司,它面向营销人员,主要通过数据可视化、自助分析等方式,将大数据“简单化”,让即使不了解大数据的营销人员也能根据OrigamiLogic提供的分析结果做出更有效的营销策略。
可视化是大数据简单化的有效方式,也是创业公司常用方法。《数据可视化之美》一书中指出,可视化是将数据以图形表示,能够一目了然地揭示数据中的复杂信息,同时通过对细节的翔实展示,能够使受众有效地产生对数据的洞察和新的理解。可视化可以帮助人们突破大数据技术中人的瓶颈。
通过Origami Logic,营销人员可以通过将CRM、社交媒体、邮件营销和调查报告等不同平台的数据汇合整理在一起,并将冗杂的数据(包括邮件、文档、图片、音频等)进行有效分析处理,使其简单化、直观化、视觉化,让它变成普通的用户都能看得懂的东西,然后依据这些统计分析结果来衡量整个营销效果,并做进一步的营销活动规划。Origami Logic把“大数据”真正变成一盘生意。
“当今的营销人员要根据社交网络、移动平台、搜索引擎和电子邮件等方方面面进行汇总分析,从而再制定相关的营销策略。他们对这些数据都是非常陌生的,而且难以捕捉数据背后的含义。”Origami Logic联合创始人兼CEO Opher Kahane表示,“Origami Logic能够帮助他们改善这种状况,从而提高他们的营销能力。并且这个平台能够让营销人员将尽可能多的营销工具整合到一起,并把不同营销工具所提供的数据变成自家平台的资源中心,从而达到取代它们的目的。”
Origami Logic现在还是处于内测阶段,预计公司将于明年早期发布相应的产品。目前,Origami Logic已经获得了930万美元的A轮融资,这次的融资主要由Accel Partners领投,像Big Data Fund、Lightspeed Venture Partnen等投资公司也参与其中。
“我们看好这个领域,它会是未来商务分析的方向。一旦这些技术得到普及,现行的BI(商务智能)模式将会没有市场。未来数据分析不再是专业人士的特权。”众多投资人纷纷如此表示。
专利引证类型可视化分析 第4篇
美国CHI Research公司构建了一套较为完善的专利评价指标体系[2],其中的专利引用指标包括:被引证次数、当前影响力、技术强度、技术生命周期;国内也有相应文献研究专利评价指标[2],提出的技术关联度指标(linkage index)就包括专利引证指标(cited per patent)、交叉分类指标(co-classification index)。
可以发现,无论何种指标体系,专利引证都是对专利进行评价分析的重要因素。在以往的研究中,通常以被引频次作为测量专利引证指标的依据,通过一件专利被其他在后申请的专利所引用的次数来揭示技术中详细的关联程度[2]。
1 专利引证类型
技术的研究和创新,大多会在已有成果的基础上展开。虽然专利需要回避已有技术成果,但在专利文献中还是存在大量的“参考信息”专利之间的引证。这种关系实际上是一种“引文链”,它可以反映专利情报信息流、技术创新信息流的方向、过程、特点和规律,显示研究专利文献之间的引用规律,从而沿着引用路径能够揭示某一行业、某一技术的发展趋势和动向[3]。
专利文献中存在两种专利被引数据:专利发明人在专利申请书的撰写中引用之前已申请的专利;专利审查员在审查专利时引用的在先专利。
一般来说,一件专利被引用的次数越多,代表此专利所保护的技术范围可能具有相当的重要性及关键性[1]。但是否所有的专利引用从可视化角度都呈现出非常清晰的“引文路径”呢?通过对部分专利的引用情况调查发现,专利引用至少可以反映两种具有代表性的技术关联,一种为可称为“引文树”,另一种可称为“引文网络”。
1.1 “引文树”型专利引证
1.1.1 医用内窥镜相关专利
以我国医用内窥镜(endoscope)相关发明专利为起点(图中以方框表示),查询一级引证专利(包括国内、国外专利),研究数据来源于中华人民共和国国家知识产权局“专利检索系统”[4]。通过对医用内窥镜发明专利的数据整理发现,在医用内窥镜中的271件专利中,有线内窥镜插入装置的专利有115件,其引用的专利共计156件。图1表现了涉及有线内窥镜插入装置部分专利的引用情况(箭头方向表示引用)。观察图1可以发现,有线内窥镜的插入装置发明专利有部分专利被引用频次非常高,例如日本专利特开昭51-11689(5次)、特开2001-190494(5次)。从有线内窥镜插入装置部分专利引用的情况,基本可以得出该类技术的一个发展流程。
图2是对无线内窥镜(胶囊内窥镜)专利引证情况的统计。从该类专利的引证情况来看,也有部分专利表现出了非常高的被引用率,如日本专利特开2001-231186(8次)、特开2003-19111(19次)。其中日本专利特开2003-19111可谓近年来胶囊内窥镜研究的奠基石,在本案例数据中就有20条专利引用它。观察图2可以发现,我国发明专利200580014886.4不仅引用了日本专利特开2003-19111,还引用了日本专利特开2001-231186,进入了另一个涉及胶囊内窥镜信号传递的高被引专利领域。
类似的情况不仅出现在医用内窥镜专利群中,在其他一些技术领域也有体现。
1.1.2 液化气体聚合过程专利群
以美国专利5541270为例。它是一项关于液化气体聚合过程(Polymerization Process)的专利,公告日期为1996年7月30日。该专利引用了26件专利文献,其中美国专利15条,来自其他国家的专利11件。被引用的26件专利,公告时间从1968年4月(GB111056)延续到1995年10月(US5462999),且主题基本相同。进一步挖掘引证关系可以发现,专利US4543399引用的专利数量最多,高达41件。US4543399是一项关于液化床反应系统(Fluidized Bed Reaction Systems)的专利,公告日期为1985年9月24日。它引用的41件专利,公告时间从1950年4月(US2502953)延续到1984年4月(US4442271)[6]。所有来源专利与被引专利构成了清晰的专利“引用树”,见图3。
1.1.3 美国燃料相关专利
类似的还有美国燃料相关专利,见图4。
观察图1~图4可以发现,以上专利的引用情况有一个共同的特点,即出现了一些被引频次非常高的专利,整体出现一种比较清晰的树状结构。这些被引频次非常高的专利往往即为该领域的标志性技术或转折技术,对该类技术的发展起到非常重大的参照或推动作用。通过对“引文树”型专利引证的分析,可以确定研究热点和核心技术,对前沿技术进行跟踪分析;可以揭示行业技术发展轨迹;可以确定竞争对手,衡量竞争对手的技术实力。
1.2 “引文网络”型专利引证
1.2.1 治疗型超声相关专利
再以我国治疗型超声(therapeutic ultrasound)相关发明专利为起点(图中以方框表示),研究数据来源于中华人民共和国国家知识产权局“专利检索系统”[4],一共检索出发明专利583件,经过整理得到225条有效数据。通过对专利之间引证关系的整理,得到如图5所示的专利引证地图。
图5是对治疗型超声专利引证情况的可视化分析。从该类专利的引证情况来看,有少数专利表现出了较高的被引用频次,如美国专利US4530360(3次)、US5003965(4次)、US5443068(4次)。但从整体来看,这些专利的被引情况却表现出一个共同的特点:一方面没有被引频次特别高的核心专利出现,引用情况相对分散;另一方面,专利同被引(patent co-citation)和专利耦合(patent coupling)的情况出现次数较多,关联线之间的交叉和节点也较多,整体呈现一种比较复杂的网状结构。
1.2.2 资源配置相关专利
类似的还有资源配置(resources allocating)相关专利,见图6。
对于“引文网络”型专利引证,仅通过对引用频次的统计来对专利重要性进行评价是不够的,不能很全面地反映某专利在该类技术领域中的地位,也不能很有效地做到“顺藤摸瓜”,理顺该技术领域的发展轨迹。对该类型的专利在进行关联度分析时,要全面考虑网络图的交叉、引用关系,对网线的延伸动向、网线的交叉或接点进行分析。一般来说,网线的延伸动向可以反映出技术的发展规律和趋势,网线的交叉和接点可以看到专利技术之间的相互交叉、渗透。
2 结论
专利评价指标是一套非常全面、多角度的体系,专利引证又是其中一个非常重要的指标。由于存在两种不同的引用类型引文树和引文网络,因此在利用专利引证这一指标对专利的价值进行评价时,如果仅依靠对专利的引证情况进行简单的频次统计就会使得评价结论有失偏颇。 对于“引文树”型引证关系,可以考虑采用被引频次作为测量专利引证指标的重要依据;但对于“引文网络”型引证关系,则应从多方面确定专利引证的评价方法,尤其充分考虑专利主体这一重要影响因素,从社会网络分析(Social Network Analysis, SNA)的角度进行分析。
因此,专利引证类型的研究,对于专利价值的全面评价能够起到比较好的参考作用,能够全面考虑专利的交叉、引用关系,以及延伸动向,对于专利战略、专利网络等进一步的研究也可以起到铺垫作用。
摘要:专利被引频次高低一直被作为测量专利引证指标的重要依据,但通过研究发现,不同技术领域存在不同类型的专利引证关系。以我国医用内窥镜、治疗型超声发明专利为例,通过可视化分析绘制各自的专利引证地图,结果呈现出两种具有代表性的专利引证类型:引文树型和引文网络型。这对于专利的客观评价具有一定的参考价值,不同的引证类型所侧重的专利评价方法也应不同。
关键词:专利引证,可视化分析,引文树型,引文网络型,专利评价指标
参考文献
[1]台湾智慧网(IP Navigator).http://www.ipnavigator.com.tw/CHI研究公司指标[N/OL].[2010-03-10].http://4053.wwwts.au.edu.tw/ezcatfiles/4053/download/attach/1/%AA%ED%20CHI%20%AC%E3%A8s%A4%BD%A5q%AB%FC%BC%D0.doc
[2]陈燕.专利信息采集与分析[M].北京:清华大学出版社,2006:226-243
[3]侯筱蓉,司有和,吴海燕.基于引文路径分析的专利技术演进图制作的实证研究[J].情报学报,2008,10:788-792
[4]www.sipo.gov.cn
[5]www.freepatentsonline.com
[6]MAETHEE CHANDAVIMOL.Knowledge share in patent mapping[EB/OL].[2006-07-23].http://www.tiac.or.th/ti-acthai/seminar/2006/st_knowledge/presentation/Macthee.pdf
[7]张少龙,周宁,吴佳鑫.专利文献引用关联可视化系统的构建——以“美国专利数据库(U SPTO)检索系统”为例[J].现代图书情报技术,2007(2):64-66
可视化分析 第5篇
路径分析是2维GIS中一个很常用的功能,而道路、河流、管道等路径分析研究的对象在客观世界中常常具有高程信息,如果能在3维可视化环境中进行路径分析,其直观性会大大增强.基于ArcGIS的.ArcObject组件对象,实现了在ArcScene环境中的3维路径分析,通过飞行动画增强了可视化效果.并提出针对路径方向的一种反置算法,解决飞行动画中因道路数字化方向引起的问题.
作 者:张昆 张松林 ZHANG Kun ZHANG Song-lin 作者单位:张昆,ZHANG Kun(华东师范大学,资源与环境科学学院,地理信息科学教育部重点实验室,上海,200062)
张松林,ZHANG Song-lin(同济大学测量与国土信息工程系,上海,200092)
可视化分析 第6篇
摘 要:Excel是Microsoft Office的组成部分,不管是各种工作,都有较高的使用概率。其以简洁的画面、良好的计算功能与图表工具,加上Microsoft突出的市场影响作用,让Excel成为了流行度最高的个人计算机电子制表与数据处理工具。
关键词:Excel2010;成绩分析;可视化
中图分类号:G642 文献标识码:B 文章编号:1002-7661(2014)24-001-01
在教师的教学过程中,为了更好的收集与研究学生的成绩分数,一般都习惯性的使用Excel基本图表功能对结果做研究和展示。可是大量的教师使用的都是老板的Excel 2003,却不知道新版的Excel 2010有更突出的数据处理功能。Excel 2010具有的数据条能够快速分析数据、显示与删除重复数据项等等,能够以快速、准确、细致与可视化的方式进行成绩数据的分析。
一、Excel2010数据挖掘工具的功能
Excel2010数据挖掘工具能够创建、测试与管理素具外绝饥饿哦股与模型,主要的功能包括以下几点:
1、数据准备
浏览、清除、重新标记数据和数据分区,对数据做查看与清除,以更好更方便的为数据挖掘任务做好准备。数据浏览,对单个列中的数据分布情况与数据执行类型做查看。将数据清除,使用标识、修改或者消除不完整的数据值将离群值删除。数据的重新标记,更改表达值或者对值开展分组动作,让分析更加简单直观。数据示例,帮助建设新的数据集或者定型和数据集测试,能够采取抽样随机的方式得到其中一部分代表数据,或者对数据平衡性做调节而得到特定值比例的增加。
2、数据建模
姓名单元1单元2单元3单元4单元5单元6平均分
学生0160708570909578.33
学生0270909570858582.5
学生0390957070908593.33
学生0495707085858581.67
学生0560708570909578.33
学生0670909570858582.5
学生0790957070908583.33
分析数据、分类数据、趋势预测、关联标识和查找分类。使用在数据中的派生模式,依照属性要求对数据做分组或者关联研究。此项工具功能区当中的向导是建立在Analysis Services基础上的数据挖掘计算方法[1]。分类说过在生成过程的模型,其依照模型当中的其他数列数值对某一列中的数值做预测、估计使用于生成一个估计模型,其进行数据的提取并且使用这些模式对连续数字做预测,预测的指标还包括日期和时间。聚类分析使用在聚类分析模型的分析过程中,其检测一些有相似性特征的行组。关联使用在关联模型的生成过程中,其能够同时检测多个事务中所出现的各项之间的联系,举个例子,使用在购物篮分析。预测使用在预测模型中,其能够检测单元内多个序列,之后对其表示的数据做预测。
3、准确性和验证
测试与评估模型,创建使用在分析数据挖掘解决计划中的准确性执行图表,用图形的方式表述结果,同时能够对常规的统计度量值做显示[2]。准确性图表,用生成提升图或者散点图的方式对数据挖掘模型功能做评估。分类矩阵是建立在模型精确性与不精确性的预测汇总表格。利润图能够把预测的准确性和建立在预测过程中使用的行动方式产生的成本与效益进行图形绘制,以更好的了解出数据挖掘模型所造成的影响。交叉验证,使用在报表建设、模型汇总在各个子集间的准确性,在这个过程中对模型的稳定性程度做确定。
二、迷你图在成绩分析可视化过程中的利用
Excel 2010当中的迷你图指的是在工作表的单元格内建立微型图表,数据的表示以直观的方式呈现,并且通过使用简明清晰的数据图形表的显示方式将临近的数据变化趋势做显示,快速开展迷你图和基本数据间关系的查看,一旦出现数据的变化,迷你图也会出现相应的改变,并且迷你图占据的存储空间较小,打印的时候可以带着数据做结合打印。当下Excel只提供了三种形式的迷你图,分别是“折线迷你图”、“柱形迷你图”与“盈亏迷你图”[3]。
举个例子,可以在学生的成绩表中插入迷你图,对比单个学生的每个单元的考试成绩趋势和学生状态的改变。具体步骤为:打开Excel 2010,将鼠标选种I2,点击菜单栏中的插入,选择插入迷你图,选中B2到G2,再选择折线图,就可以形成学生01从单元1到单元6的成绩变化趋势。
另外Excel连接了多表之后,很容易出现数据重复的情况。Excel 2010所具有的高级筛选功能能够对重复记录的数据做整理,避免发生数据情况的不良影响。在进行数据重复处理的过程中,一般是将含有重复部分的单元格选中后直接点击删除,这样重复的数据便会被直接删除,此项操作便利易行,实际操作功能良好。
信息技术不断发展进步的过程中,office的版本也在不断更新,使用好Excel 2010,对于提升教师的成绩处理和分析能力,观察学生的成绩变化趋势,有突出作用与积极的现实性意义。
参考文献:
[1] 徐军伟.程国忠.Excel2010数据挖掘工具的应用研究[J].电脑知识与技术,2014,01:4-7.
[2] 黄 芳.基于数据挖掘的决策树技术在成绩分析中的应用研究[D].山东大学,2009.
探讨园艺植物的可视化分析 第7篇
1园艺植物拓扑结构研究现状
园艺植物的可视化研究与其他作物具有相似性,都具有拓扑结构模型以及几何形态模型。植物的拓扑结构模型决定了植物的生长空间姿态,常见的拓扑结构生长方法主要包括基于规则的建模以及基于过程的建模2种方法,前者主要分为分形方法和L系统,后者主要包括有AMAP模型等[1]。
2园艺植物形态建模
园艺植物可视化的另外一个方面主要是几何形态的模拟研究,不同植物的形态都不尽相同并且较为复杂,以茎部为例,花卉植物与蔬菜植物的品种就有一定的差异,在可视化建模过程中,要重视各个器官的精细建模与仿真,其中常见的园艺植物形态建模方法有以下几种:参数化建模、基于图像的三维重建以及基于三维测量数据的重建方法等[2]。
2.1参数化建模
参数化建模是结合植物的三维结构特征,提取各个植物器官的结构参数,在确保植物拓扑规律的基础上,改变植物各个器官的尺寸以及角度等,形成具有植株特征的新型构建,这种方式的使用主要是使用植物交互式设计,园艺植物的参数化建模以器官为主,主要包括叶片及果实等相关方面。
2.2基于图像的三维重建
这种方式一直是计算机领域进行图形研究的热点问题之一,由于这种方式截取的数据较为方便,获得的信息量较广,在植物几何建模领域受到广泛运用,其主要的研究对象是依据单副图像以及视频等相关因素模拟物体,这种技术的核心部分在于分析物体多视角下的轮廓图像,通过分析物体的多视角图像的亮度特征的一致性关系,恢复物体的表面,从而得到植物几何模型基于亮度的模型。
2.3基于测量数据的三维重建
在植物几何建模中,常规数据非常耗时,数据的精准度也达不到相关要求,最终生成的模型与实际植物之间的差距也非常大,但随着三维测量技术硬件的应用,相关专家已经将这种技术运用到植物几何建模中来,在三维测量数据的获取中,主要运用的设备有数字化仪以及三维扫描仪,通过运用这种仪器能够获取植物生长过程中一些动态信息,并且通过采取一些相关数据,利用数据与信息来建立植株的形态模型,最终实现植物的可视化。
3真实感绘制
所谓真实感是指由计算机直接生成的图形反映现实世界的情况,在物体的表面大量信息是千变万化的,因此要将真实世界中的具体信息尽可能通过几何模型呈现出来。模型的建立过程非常复杂,相关的数据量也很庞大,但真实感绘制能够在一定程度上反映植物几何模型的真实性,主要包括植物的纹理映射、物理模拟以及细节模型等。
4交互式设计
近些年来,虚拟植物已经被广泛的运用,用户正在寻求一种较为简单的方式来构建植物几何模型,在这种基础上,一部分专家提出了交互式设计,在这种设计理念下,利用参数化组件来实现植物器官,将植物器官进行组合就可以制造出各种各样的植物结构与形态的模型。应用的软件主要是ONYXTREE等,在园艺植物的模型培养方面,交互式设计系统为用户提供引导式的操作界面,通过运用这类软件,用户可以对节间数量与分支个数进行参数的设定,系统会利用这些参数生成植株的初始结构状态,除此之外,用户还能调整交互式。
5结语
近些年来,数字植物的研究与应用已经得到相关发展,园艺植物的可视化研究虽然起步较晚,但发展较为迅速,而在发展的过程中,也存在着相关的不足,与预期的效果还有一定的差距,因此相关研究人员在实际工作中不断地发现并解决问题,促进园艺植物可视化研究的快速有效发展。
参考文献
[1]袁晓敏,赵春江,温维亮,郭新宇,陆声链,魏学礼.番茄植株三维形态精确重构研究[J].农业机械学报,2012(12)
网络安全的可视化分析 第8篇
关键词:网络安全,可视化,分析
网络安全的可视化是网络安全和可视化技术的结合, 是网络的一项新技术, 该技术借助了人脑在图形图像方面和计算机强大的处理能力的优势, 实现了对网络异常行为的分析和检测, 在一定的程度上提高了网络数据的综合分析能力, 以及网络系统对攻击的检测效率, 并且有效的减低了误报和漏报的不安全行为, 甚至用户可以通过可视化图形的方式展查看网络的安全状况。
1《谍影重重5》FBI网站被入侵的可视化情节
1.1 U盘打开了中情局的后门
影片一开始, 中情局的网站就被黑掉了, 一名特工告诉中情局的高官, 这次可能比斯诺登事件 (2013年6月, 前中情局职员爱德华•斯诺登向媒体爆料, NSA (美国国家安全局) 和FBI在2007年启动了一个代号为“棱镜”的秘密监控项目。此项目通过进入微软、谷歌、苹果、雅虎等九大互联网巨头的服务器, 对全国的电子邮件、聊天记录、视频及照片等个人隐私进行了监控。事后, 斯诺登得到了俄罗斯的庇护, 于是网络安全就进入了“后斯诺登时代”。) 还要严重。
尼基•帕森基为了帮杰森•伯恩重回正常人的生活, 在萨科夫的黑客基地用一个U盘, 就打开了中情局所有主机密文件的后门。这个U盘内部装有恶意软件USBee, 装有USBee的U盘无需任何改装就可以变成数据传输器, 可以在有物理隔离措施的电脑之间任意往返采集数据。USBee的工作原理是通过向USB设备发送一系列“0”, 使USB发出频率在一定赫兹的电磁信号。USBee通过控制频率, 电磁辐射便可以被调制成信号传输器, 并由附近的接收器读取并解调。
1.2 SQL注入攻破数据库
当尼基•帕森基在黑客基地对中情局的网站进行入侵时, 一名女黑客大声说用SQL注入攻破他们的数据库, 可见, SQL注入是攻击者攻击网络数据库的常用手段之一。所谓SQL注入, 就是将SQL命令插入到Web表单提交的查询字符串, 最终达到欺骗服务器执行恶意的SQL命令。SQL注入是利用现有应用程序, 将带有恶意的SQL命令注入到后台数据库中, 它可以通过在Web表单中输入恶意的SQL语句得到一个存在安全漏洞的网站上的数据库, 而不是按照设计者意图去执行SQL语句。之前很多影视网站泄露VIP会员密码就是通过WEB表单递交查询字符暴出的, 这类表单特别容易受到SQL注入式攻击。
2 网络安全问题的现状
2.1 被攻击后才发现
针对目前现有的网络安全产品, 无论是在平时的异常检测还是对日志的分析, 都是在网络被攻击后才发现, 说白了, 现在的网络安全产品就是在网络受到攻击之后, 对网络进行补救的一种方法。这个现象对于防御者来讲, 攻击者一直都是在防御者始的前面, 这无疑是给了攻击者一个攻击的机会, 这一点往往是大多数网络安全产品子啊设计时就存在的问题。
2.2 网络安全产品只有功能片面性
现有的网络安全产品都是针对网络的某一个领域进行了安全保护, 并没有承担起整个网络的安全, 例如, IDS主要负责检测以及发现外部网络附内部网络进行攻击的行为;防火墙的主要任务就是负责检测外部网络对内部网络的访问, 以及监控着内部网络;漏洞扫描系统的任务则是维护修补网络中所出现的漏洞。
3 网络安全可视化技术
3.1 网络安全管理可视化
网络安全管理可视化, 不但可以对网络安全运维管理的过程以及结果进行跟踪管理, 并且它还支持拓扑表达的方式, 支持一切可视化的设备管理、策略管理以及部署, 且网络逻辑拓扑图中可以显示网络安全事件。
3.2 信息安全的可视化
虽然网络安全产品得到了大规模的使用, 但是由于安全类型不同、生产厂家不同, 从而导致网络安全产品在工作的过程当中产生了人工所处理不了的安全信息。而信息安全的可视化不但可以解决这些不同类型的网络安全信息, 并且还可以整理并分析出真正对网络用户有用的、有价值的安全信息, 实现了网络安全信息的事件表示, 降低了误报率以及漏报率, 达到了增强网络安全产品和网络安全系统之间的联系, 并建立了信息安全的管理标准, 为信息安全可视化提供了描述和信息安全通用的处理流程。
3.3 数据的可视化
4 实现网络安全可视化的方法
4.1 基于网络数据流量安全
网络数据流量安全的可视化模式从属性上可分为源IP属性、数据时间以及网络端口等多个方面。就网络数据流量安全的方面来讲, 其由于多次被端口扫描、服务攻击受阻, 并且呈现一对一、一对多的特征, 促使了网络数据流量在攻击事件方面存在异常。而对网络数据流量进行合理的监控分析, 能够促使网络管理人员对网络系统更好的进行安全维护和防御。
4.2 基于网络入侵技术安全
针对目前的网络安全来说, 攻击者可以通过网络系统进行数据分析, 从而判断主机中正在运行的程序, 并利用程序的漏洞对主机进行攻击。而在网络入侵技术安全的可视化模式下, 可通过警示传输给网络系统分析人员, 网络分析人员可以通过对入侵系统的防御知识来判断木马病毒的存在, 从而对其网络系统进行修复升级。
5 总结
随着网络问题的日益突出, 近几年, 我国在网络安全技术方面得到了快速的有效的发展, 网络安全企业也不断更新网络安全技术, 不断推出能够满足用户需求的网络安全产品, 并且构建了完整的、实用的的网络安全数据可视化系统, 进一步促进了网络安全技术的发展。就网络安全而言, 以往人们则关心网络系统与网络对黑客攻击的防御问题, 而现在网络安全基于可视化的基础上, 人们对网络安全的关注点已经从基础问题上升到网络的应用层面。
参考文献
[1]赵颖, 樊晓平, 周芳芳, 汪飞, 张加万.网络安全数据可视化综述[J].计算机辅助设计与图形学学报, 2014 (05) :687-697.
信息可视化技术研究分析 第9篇
科学技术的发展, 特别是计算机技术的飞速发展, 使人类的生产能力和数据的技术得到了较大的提高。面对大量的信息数据, 通过人为对其进行整理分析, 很难在有效的时间内完成对整个数据的掌握与认知, 故此需要各种信息技术来完成对此项任务的理解, 并能够利用其先进的科技手段对大量信息进行整合。这是基于这样的背景下, 可视化技术得到了极其快的发展与重视。它能有效的将大量的信息数据加以整合, 然后通过计算机技术模拟出图像或是动态信息供人们参考与使用。从一定意义上而言, 数据中的相关信息大多数会隐藏其重要的数据, 这些隐含的数据信息对人们正确利用这些数据有着极其重要的影响和作用, 所以一定要形成一定的规律, 利用科学有效的办法将其可视化, 充分发挥其效用。
信息可视化技术是一个相对比较广泛的领域, 它能运用到医学、气象、地质、航天等多项技术部门中, 也可以运用到商业、政府机构中为其数据的整合提供一个可靠的信息环境。因此信息可视化是一项伟大的国家科学技术和国家经济发展的技术具有重要意义, 应充分认识到相关部门大力推动。对于卫星监测或是医疗设备而言, 信息可视化技术起到了至关重要的关键作用。由于计算机技术发展过快, 在网络传输等方面可以利用图像或是数据处理技术可以清晰直观的对数据有所掌握, 并进行实时交互, 实现资源共享。
1 信息可视化技术
信息可视化在本质上是一个可视化的界面, 是人机交互技术的综合研究。通过信息可视化技术可以实现多学科的有效整合, 是对抽象信息更直观的处理, 用户可以利用人机计算机交互技术对抽象信息的准确识别。信息可视化技术是数据挖掘、图像处理、人机交互和可视化技术的有机结合, 是为了让人们使用直观的感知和视觉观察的方法研究信息。基于图形设计与认知心理学的信息可视化技术。平面设计注重视觉表现问题的艺术性, 对实际操作经验的具体指导。认知心理学是以人的知觉过程为主要研究课题, 着力解决人类认知和认知过程的问题。信息可视化是一种数据可视化映射过程, 可以通过整合、映射等形式传递信息特征, 通过图片、图像、动画等形式来表达信息、图像、文字和声音的内容, 可以称之为信息可视化的信息来源, 可以通过各种方式将其呈现在人们的面前, 或是利用各种手段来完成。
各种科学技术的层出不穷, 推动了信息可视化技术的广泛发展与使用, 随着各行业的发展建设, 对于信息的需求量也在逐渐增大, 面对大量的信息, 如何进行有效的存数与搜集、传输与归类成为了各行业发展面对海量信息解决的难题。从更高一个层次来讲, 所有的数据库都可以按照一定的规律来完成其分类。就目前发展阶段, 数据库虽然在一定范围内可以完成对数据的输入、整合、查询、统计等功能, 但是对于数据相互之间的某种规则或是联系还存在着一定的盲区, 不能给予很好地理解与认识。自1956年以来, 人工智能技术的诞生在一定程度上获得了较大的发展, 现将机械人学习阶段作为重点科学来加以成熟, 认识。如比较成见且被认知的神经网络学或是遗传算法就是利用计算机模仿人类进行的一项研究。这种方法就是利用数据库管理系统来挖掘深层次的数据结果和相关知识, 两者的有机结合被称之为LED数据库中的知识发现 (KDD:知识discoveryindstabases) 。事实上, 这属于一门交叉性质的学科作业活动, 不仅仅涉及到机械模拟、数据识别、智能统计, 还涉及到数据可视化的高性能分析与专家系统的认知, 对于数据本身也有着极其严格的要求。
举例来说明它的重要性:如在矿井开采过程中, 对于原始数据的掌握往往是结构化的认知, 人们只是单纯的依靠原始数据对其进行数据分析, 从而建立完善的数据监测机制, 但是人们却忽略其数据自身的重要意义, 很多数据的呈现完全可以利用可视化技术对文本进行整合编辑, 将所有数据以图像的形式呈现出来, 并依据数据分布将图像清晰的构建出来, 这部分涉及的内容就比较复杂, 不能轻易的被理解为是对数据的演算或是概括。其技术的核心就是利用数据将各种复杂的环境状态进行模拟, 在这里可以忽略所有的不可控因素。只需提醒相关负责人在可视化进入实战阶段将不可控因素考虑在内即可, 这样才能将数据信息得以充分的掌握。
包括知识的一般属性的广义类型反映了类似事情、特点及各方面的特点, 知识的类型, 反映了知识的差异, 反映知识和其他相关知识的关系类型, 根据历史和当前数据推测, 未来数据预测模型知识, 将揭示偏离的常规事物的异常现象的知识的类型。为了发现不同类型的知识。用各种手段寻找知识工具。为了使发现知识和结果是容易被理解的, 并在人机交互过程中发现的知识, 它的发展是可视化技术发展获得知识的重要途径。为了了解数据与发展趋势的关系, 人们开始将可视化技术纳入其中。信息可视化不仅是利用图像来显示多维空间数据, 用户要加深对数据的理解, 并引导检索过程中与图像直观, 加快搜索速度。因此, 信息可视化的统计、数据库、心理学、人机交互、知识发现等领域。在科学计算可视化中, 显示对象涉及到不同类别的空间数据的标量、矢量, 研究主要集中在如何真实、快速显示三维数据。在信息可视化方面, 文章提出的对象是多维标量数据, 本研究的重点是, 设计和选择什么样的显示模式, 可以方便用户理解多维数据和彼此之间的关系, 这是主要的问题, 如心理学, 人机交互。从模式形成的角度来看, 它很难科学计算可视化, 然而, 从心理学和人机交互的角度来看, 这是一个新的领域还没有得到充分的研究。
信息可视化在商务、金融、通信等领域, 具有非常广阔的应用前景。在通信领域, 目前正在开发一个更详细的和先进的复杂模型, 以协助规划过程中的复杂性。另一方面, 传输和交换设备, 为重构现有的网络提供了更多的自由和灵活性, 导致一个单一的网络单元上运行的原始数据增加。全网运行优化, 需要有效地利用一切信号源, 并需要在市场、网络规划和日常管理等传统的不同领域之间, 动态交换信息和思想。覆盖的物理网络是一个广泛的领域, 包括语音, 数据和图像服务, 其中每个都有自己的数据和管理要求。
此外, 现代网络不受国界限制, 是许多国家和国际组织的一个载体, 因此潜在的数据量和复杂度都在增加, 数量越来越多。在英国电信 (电信) 网络中, 充分应用了信息可视化技术。该网络具有六千线以上的开关设备和几兆每分钟网络状态和控制数据。在BT网络, 每五分钟有六万连接到数字交换机的本地路径的操作条件的中央单位报告 (centraloperationsunit) 操作, 中央单元操作和数字实时监测和控制网络。通过测量大量的操作参数, 每天产生超过二十亿字节的数据。图形输出来描述操作参数的选取, 地理分布的时间间隔, 并且对动画感兴趣。在每个区域中的最小值参数, 最大和平均数据可以表示在一个颜色条图。可视化的空间数据, 如在应用金融指标或流通统计, 也引起了广泛的兴趣。在工程和科学应用可视化的许多工具和技术, 以金融和统计为主。可视化技术的成功应用, 为用户提供了一个互动的研究数据, 揭示了这些方法的趋势、周期和模型的能力。在空间数据应用中的一个典型例子是网络统计数据, 包括一个网络单元或地理特征, 开关记录, 大面积的分组, 另一个城市的景观 (景观) 的可视化是该领域的一个潜在的有用技术。城市景观是一个扩展的3条带状图, 其中包括二维的标量值表示为一个统一的网格块或建筑物。一个可视化表示的一年中的每个月, 分为10个地理信息维度, 称为故障率统计。根据每月的服务统计和传输系统的运行性能, 英国电信已被应用到城市现场进行调查。这些应用程序可以很容易地使用财务信息, 如每个地区的特点, 对股票收益率的每个时间段, 或地理, 根据挖掘所得的可视化 (Visual MIME) , 通过显示的货币量, 各分公司的总收入, 现金运行能耗统计。由于信息可视化日益显著的数据超载问题, 可以提供接近实时的解决方案, 因此, 它将对业务, 财务和通信等领域的信息管理, 产生重大影响。
2 信息可视化的几种类型
根据信息可视化的类型可分为七类。一是一维维数据, 这样的数据是以一维向量和程序为主, 只具有单一属性的信息。二是尺寸数据。这种数据主要以平面设计和地理数据, 图形设计等形式呈现, 采用横坐标法呈现其数据, 可以充分将经度和纬度的地理数据显现出来。三是三维数据, 该数据领域的应用比较广泛, 医学, 地质, 气象等都被涉及其中并得到有效的使用。通过三维信息技术, 可以更直观的反映数据状态。四是多维数据, 这样的数据是以财务和统计数据为主, 数据包含四个或四个以上的属性信息, 是信息可视化研究的主要方向。五是分层次的数据。数据模型是一个抽象数据, 是一种比较常见的关系, 传统的图书馆资源管理和窗口系统资源管理模型是典型的分层数据。六是文本数据。这样的数据形式多样, 如报纸, 邮件, 新闻等等, 都可以作为一个文本消息, 在新的形势下, 互联网时代的到来, 多媒体和超文本成为文本信息的视觉信息技术的最大来源之一。七是网络信息。此信息不是传统意义上的网络信息, 指的是网络节点与其他节点之间的关系, 但也有很多其他之间的关系, 信息之间的不可直接关系, 使信息获取比较困难, 是未来信息可视化技术研究的一个课题。
3 信息可视化技术的一般应用
3.1 信息可视化技术在生物学中的应用
生物的发展产生了大量的数据内容, 成为信息可视化技术应用的重要驱动力, 在生物学领域中得到较广的应用。依托信息可视化技术的生物数据研究一直是当前研究领域的一个重点。特别是针对复杂结构, 如核酸、蛋白质和核酸等, 借助于光镜等设备和数据信息采集, 实现对大量蛋白质进行定量和定性研究, 获取过多的生物数据的相关生物学知识, 对加快药物开发具有非常重要的实用价值。
3.2 信息可视化技术在财务信息中的应用
依托信息可视化技术可以实现大规模的金融数据处理和分析, 在基金、股票分析等领域应用非常广泛。复杂的财务数据分析, 也能实现金融犯罪的防范和调查, 通过对银行和信用机构的信息清理, 可以使资金活动链和财务活动更加清晰, 在检查和防范金融犯罪上起到的效果是非常明显的。
3.3 信息可视化技术在网络监控中的应用
随着个人计算机的普及和网络技术的发展, 网络数据量呈现出双重增长的发展态势, 依靠信息可视化技术可以使网络流量、节点连接特性以及区域信息得到清晰的反映, 实现有效的监测数据通信, 确定用户的实时网络应用服务状态。
3.4 信息可视化技术在商务信息中的应用
电子商务近年来发展迅速, 淘宝网上购物已成为网络应用的热点, 不仅改变了传统的商业模式, 而且在互联网上做实现大量的业务交易。然与此同时也产生了大量的业务数据, 利用信息可视化技术可以有效挖掘商业信息的有效价值, 使商业信息价值最大化。
4 信息可视化技术未来的发展方向
早在90年代初期, 我国对信息可视化的研究就已经有所掌握, 但是出于各种因素的制约及影响, 对于大量信息的可视化并不能进行大量的图形编辑及数据整合, 这就使得计算机技术难以在其数据中发挥应有的效用。对此, 随着对其研究的日益加深, 相继在各大院校及高等研究中心都设立了信息可视化研究发展中心及科研中心, 尤其是近年来, 随着各种新技术的层出不穷, 将数据信息可视化与图像、文字处理软件等有机的结合, 并加以推广, 很大程度上推动了我国各行各业的发展。但是与发达国家相比较而言, 我国信息可视化技术还存在许多方面的不足, 甚至在一些领域中仍存有“空白”, 对此, 我们要结合实际, 不断学习国外先进的信息可视化技术, 从而使我国的信息可视化技术逐渐趋于成熟。
大数据定义的快速增长是企业数据已经进入了稳定期的水平, 在处理海量数据的过程中, 信息的可视化速度和效率已成为行业关注的焦点。这是由于大的多维数据, 可能导致视觉障碍, 如何实现数据挖掘和信息可视化技术的有机结合, 提升数据的可操作性是未来研究的重要课题之一。由于庞大的数据量需要团队完成更多的信息可视化处理, 需求的合作空间和同步性较高, 需要利用现有技术来实现更高的速度, 协同研究方向在可视化领域有可能向平台开发方向上发展。
随着数据量的增加, 信息可视化技术的不断发展和挑战。从硬件最明显的制约, 到现有屏幕显示的海量数据成为信息可视化技术发展的问题制约, 多维数据分析将作为一个具有挑战性的研究内容而被重视起来。但我们相信随着大数据的不断发展, 信息可视化技术的应用领域也将不断地被拓展, 对提高工作效率和生活质量具有极其大的贡献。
摘要:数据与信息可视化技术, 通常被称为依靠计算机图形技术, 数据信息的视觉形象和生动形象呈现在人们的眼前, 以满足各种新的技术要求并达到客户的要求。就目前发展而言, 信息可视化技术已在医疗、通信、网络智能、金融等领域得到了广泛的应用。二级用户对数据的分析和探索数据的规则起着非常重要的作用。随着大数据时代的来临, 信息、数据规模呈现爆炸式增长, 数据来源多元化, 信息可视化技术发展迅速。进一步研究信息可视化技术, 不仅具有重要的理论意义, 也具有很强的实际应用价值。下面文章就信息可视化技术发展的背景、概念及未来发展趋势进行简要的分析与总结, 并结合现状提出合理化的解决方案, 仅供其参考。
关键词:信息可视化,研究技术,发展背景,概念分析,发展趋势
参考文献
[1]任磊, 王威信, 周明骏.一种模型驱动的交互式信息可视化开发方法[J].软件学报, 2008, 19 (8) :1947-1967.
[2]杨峰, 李月华, 高维.信息可视化方法研究综述[J].情报理论与实践, 2012, 35 (9) :125-128.
[3]张昕, 袁晓如.树图可视化[J].计算机辅助设计与图形学学报, 2012, 24 (9) :1113-1124.
[4]刘芳.信息可视化技术及应用研究[D].浙江大学, 2013.
[5]杨彦波, 刘滨, 祁明月.信息可视化研究综述[J].河北科技大学学报, 2014 (16) .
[6]陈艳.信息检索可视化技术[J].情报理论与实践, 2006 (16) .
[7]冷彦.动态社会网络可视化技术的研究与开发[D].南京工业大学, 2006.
地质工程复杂地质体可视化分析 第10篇
1 复杂地质体可视化研究与开发现状
TITAN三维建模软件是由北京东方泰坦科技有限公司开发的TITAN地学综合信息系统中的一个组件, 是基于框架建模的思想研制开发而成的, 利用平行或基本平行的剖面数据建立起三维空间任意复杂形状物体的真三维实体模型。TITAN三维建模软件的组成部分有:①剖面数据处理模块, 建立剖面数据, 为建立三维实体模型提供由一系列平行的剖面组成的框架数据, 数据剖面由多边形、环和点元素组成;②对应关系处理模块, 建立剖面之间、多边形之间、环之间和点之间的对应关系, 为建立三维实体模型提供剖面间的对应关系, 从而建立建模元素之间在三维空间中的联系;③模型处理模块, 建立实体模型, 用剖面数据和剖面间的对应关系建立起三维实体模型, 并且可以对模型进行任意切割、计算面积和体积的处理。此软件只是三维建模与图形处理的引擎, 适用面广泛。但在面向具体专业时, 需要添加或扩充专业模块, 比如工程地质专业模块等。纵观国内外几种软件的研究与开发现状, 对于地质工程专业的复杂地质体建模与分析的针对性不强, 没有充分体现地质工程专业的特殊性, 不能够很好地满足地质工程生产与研究的实际需要。
2 地质工程复杂地质体三维建模和可视化的关键技术问题分析
2.1 离散数据的插值与拟合地质信息的插值和拟合函数要根据实际勘测数据建立, 实测数据越丰富精确, 得到的地质模型越能够真实描绘出这些信息的空间分布规律。
对于不同的地质信息, 需采用不同的拟合函数。地表地形测量数据 (X坐标、Y坐标和地表高程Z) 、地下水位埋深测量信息 (地下水位测点地表X坐标、Y坐标和水位埋深h) 等的曲面图形生成可归结为双自变量离散数据的插值和拟合。空间曲面插值函数有以下构造方法, 如与距离成反比的加权方法 (Shepard方法) , 径向基函数插值法 (Multiquadric方法) , 平面弹性理论插值法等, 它们同样适用于单个连续地层界面、地球物理勘探数据、地球化学勘探数据以及岩土体物理力学参数在地质体空间的分布。
2.2 三维数据结构地质工程地质体一般是不规则形体, 在计算机图形学中曲线和曲面总是分别通过很多微小直线段和微小三角面逼近, 来模拟地层岩性界线和岩层曲面, 即岩层界面 (和地表曲线、地下水位面等地质层面界线) 和岩层曲面都分别是许多微小直线段和微小三角面的集合。
这就要求必须具备有效的分层的三维数据结构, 比如地质工程地质体空间中的点由有三位坐标分量表示, 微小直线段由其两个端点组成, 地质层面界线由所有属于该边界的微小直线段组成, 而岩层曲面由微小三角面组成。有效的三维数据结构能够确保人机交互和查询的实现。
2.3 曲面求交地质体中存在大量各种层面, 包括地表、地下水位面、地层层面等, 当出现地层不整合、地层尖灭和地下水出露于河谷地表等情形时, 就自然会遇到曲面间求交的问题;地质体三维模型的上部边界是地表曲面, 通过数学方法拟合出的岩层面或地下水位面不应超出地表曲面, 即超出部分不应显示。
同样的, 当显示多层地层时, 下面的每一岩层应以其上一岩层为边界。因此, 为了可视化地层界面必须要解决地层面与地表或其他地层面的求交问题。另一方面, 在剖面图成图时, 地质界线的绘制是通过显示剖面 (平面) 与各种地质界面 (曲面) 求交所得出的交线。因此曲面求交包括地质界面 (层面) 之间的相交, 和地质界面与剖面的相交两类问题。
2.4 三维拓扑结构分析从地质学角度看, 拓扑是地质对象间关系的表格, 拓扑表存储层位间上覆、下伏和交切等的地层学关系及地质空间位置关系。
拓扑也可视为允许这些地质关系合理储存的数据结构。例如, 考虑多层地层, 上一个岩层的底面和与其相邻的下一个岩层的顶面是上下岩层这两个实体的公共部分或共享边界, 它们之间的拓扑关系就是相邻和同一的关系, 在存储数据时只存储上一个岩层的底面或其相邻的下一个岩层的顶面, 即相邻岩层的边界曲面可以存为一个地层曲面, 大大减少数据存储量。评价地质模型系统的优缺点往往决定于描述地质对象所用的拓扑结构。
3 复杂地质体三维建模与可视化技术的初步开发与应用
3.1 地质工程复杂地质体三维建模与可视化的研究基于离散采样数据的插值与拟合的思想, 即将离散数据转化为连续曲线曲面, 地质工程复杂地质体三维建模与可视化的过程是, 从勘探数据库中提取各种地质信息的坐标位置及岩土体的物理力学参数, 通过不同的拟合与插值函数得到地质层面 (曲面) 和地质实体的三维计算机图形显示, 表达地质信息在研究区域内的分布规律。
生成地质岩层面和地质实体后, 实现从任意角度观察建立的模型, 实现根据指定的剖面走向、倾向和倾角生成垂直剖面。
3.2 初步开发工程勘测空间数据库管理。
工程勘测空间数据库在收集整理现场勘测数据后录入各分项数据表, 这些数据表不仅包括地质信息的位置数据, 更重要的是提供属性数据。以地层岩性数据表为例, 要求录入钻孔编号、岩层起始深度、岩层终止深度、层厚、岩性 (地层名称) 、地层代码 (地层年代) 、岩层走向、岩层倾向、岩层倾角、接触关系、地质描述等数据。随着工程勘测的进展, 能够方便地修改补充和管理勘测数据。
结束语
可视化分析 第11篇
[关键词] 研究机构 文献计量 可视化分析 citespace软件
在全球化知识经济环境下,作为支撑一流科技创新的院所文献情报系统,不仅要面对未来不断创新的数字科研、e-learning环境和学科领域的交叉与飞速发展,满足科研用户对e-science学术信息利用环境不断提高的需求,而且要有快速收集有效的文献数据信息,利用文献情报分析工具,发掘隐藏在数据背后知识内涵和情报的能力,以满足战略决策者对研究机构的科研产出和发展态势情报的需求。
信息可视化(informaiton visualization,InfoVis或Iv)是近年来出现的数据挖掘方法之一,它能很好地利用人类对可视化形式下的模型和结构的获取能力,解决科技文献数据量过大、无法快速和有效交流的问题,同时可视化数据挖掘可观察、筛选、发现和理解信息,发现隐藏在数据和信息背后的含意[1]。
本文以开展基础研究为主,有重点地开展国家急需的、有重大战略需求的高技术创新研究,并与高新技术应用和转化工作相协调发展的多学科、综合性研究所——中国科学院化学所(以下简称化学所)作为研究机构的实例,以化学所近5年(2004-2008年)被科学引文索引数据库(SCIE)收录的国际论文为科研产出指标,利用SCIE分析功能,结合近年出现的信息可视化数据挖掘软件——citespace,对收录的科学文献全纪录数据进行统计和可视化分析。在传统的对发表论文相关信息文献计量分析的基础上,更加注重利用citespace软件对论文题目、摘要、关键词、标示符等数据提取词集,从引文数量、共现和共引的频次多方面进行聚类计算,发现隐藏在可视化数据背后的有价值情报。
1 方法与数据源
1.1 方法
采用美国Drexe1大学陈超美博士开发的基于JAVA平台的citespace在线可视化软件,该软件是一种适于多元、分时、动态的复杂网络分析的新一代信息可视化技术。使用citespace 的一般步骤:①确定一个研究领域或研究机构,收集尽可能多的文献;②收集数据, 包括题目、摘要、被引文献等信息的文献全纪录信息;③参数选择:确定总的时间段范围和时间分区;选择分析的节点类型;引文数量、共被引频次和共被引系数三个层次上分别设定阈值;选择算法精简和合并网络;④显示可视化图谱;确定关键点。
citespace可用于进行科学文献全记录数据共引网络分析,通过对文献信息的可视化,能够较为直观地识别研究机构科研产出发展态势的情报[2]。
1.2 数据源
选择美国科学情报研究所ISI(International for Scientific Information)创建的SCIE数据库为数据源,检索策略为:地址= inst chem* same (chin* aca* or acta*) same beijing),出版年=2004-2008,检索结果命中记录4 065条,引文数据138 586条,总被因频次为38 053次。将2004-2008年间化学所发表的4 065篇论文的作者、题目、主题词、关键词、文献的引文等全纪录信息导入citeSpace软件,采用SCIE的分析功能和citespace软件 ( 2009年3月20日发布2.2. R1 Webstart版本[3])进行论文发表年代分布、合作者、学科领域、合作机构、合作国家、期刊共引、作者共引信息分析,绘制网络可视化图谱。
2 化学所发表论文情况分析
2.1 发表论文年代分布
SCIE收录的2004-2008年间化学所发表论文的数量和论文被引频次分布结果如图1所示:
在2004-2008年5年间,化学所论文数量保持平稳增长,年均发表论文数量约800篇;但是5年间发表论文的被引频次从2004年的186次,猛增到2008年的12 805次,呈逐年大幅度增长的趋势,被引频次的提高表明化学所发表论文的质量有了显著的提高。通过SCIE引证检索结果的数据:化学所论文年平均被引频次达到6 604.67,篇平均被引频次为9.36,h指数为66,进一步反映化学所2004-008年5年在国际科学研究领域的影响力显著加强。
2.2 化学所论文合著者分布(co-authors network)
利用citespace软件对2004-2008年间化学所发表论文的合著者网络图谱进行分析,选择使用关键路径(pathfinder)算法,网络节点确定为作者,时间区选择为1年,阈值为(6,6,40),(8,8,40),(10,10,40)。图谱中不同大小和不同颜色的圆环组成的作者年轮来表示合著者频次(freq)和合著年份[4]。如图2、表1所示:
从图2、表1中可以清晰地看出,2004-2008年化学所的论文合著者中合著频次高于100次的有7人,其中,合著频次位于前5位的分别是:Zhu DB院士、Jiang L研究员、Han BX研究员、Liu YQ研究员和Li YL研究员。对论文合著者进行聚类分析,可以看出图谱可以聚为6大类,6大类中合著频次最高的作者分别是由Zhu DB院士、Jiang L研究员、Han BX研究员、Wan LJ所长、Wan LJ研究员和Li YF研究员,因此通过化学所论文合著者的网络图谱分析,可以清楚地了解化学所研究领域的学科带头人及其研究团队的分布。
2.3 化学所论文学科领域分布(co-occurring subject category )
利用citespace软件对1995-2008年化学所共现学科领域进行分析,选择使用关键路径算法,网络节点确定为学科领域,时间区选择为1年,阈值为(2,2,5),(3,3,5),(3,3,20)。图谱中不同大小和不同颜色的圆环组成的学科领域年轮表示学科领域的共现频次和共现年份,用不同颜色的连线来表示学科领域间共现的年代。如图3、表2所示:
从图3、表2中可以看出,在化学所论文共现学科领域中,共现频次大于20次的学科领域有16个,其中化学、聚合物科学、物理、材料科学、纳米科学及纳米技术位于与化学所共现学科领域的前5位。
2.4 与化学所共作者的机构分布(network of co-authors institutes)
利用citespace软件对2004-2008年与化学所共作者的机构网络图谱进行分析,选择使用关键路径算法,网络节点确定为机构,时间区选择为1年,阈值为(2,2,5),(3,3,5),(3,3,20)。图谱中不同大小和不同颜色的圆环组成的机构年轮来表示机构与化学所共作者频次和共作者年份。如图4、表3所示:
从图4、表3中可以看出,在与化学所共作者的机构中,中科院的节点(freq=3 718)远远大于其他机构,说明化学所与中科院内的共作者者频次最高。还可以看出共作者频次大于30次的机构有14个,其中北京大学、武汉大学、山东大学、清华大学、吉林大学位于与化学所国内共作者的前5位,值得注意的是德国Max Planck Inst Colloids & Interfaces的合作位居第10位,说明化学所与该机构的合作十分紧密。
2.5 与化学所共作者的国家分布(network of co-authors countries)
利用citespace软件对2004-2008年与化学所共作者的国家网络图谱进行分析,选择使用关键路径算法,网络节点确定为国家,时间区选择为1年,阈值为(2,2,3),(2,2,3),(3,3,5)。图谱中不同大小和不同颜色的圆环组成的国家年轮来表示国家与化学所的共作者频次和共作者年份。如图5、表4所示:
从图5、表4中可以看出,在与化学所共作者的国家中,中国的节点(freq=3 931)远远大于其他国家,说明化学所与国内共作者的频次最高。还可以看出与化学所共作者的频次大于10次的国家有9个,其中美国、德国、日本、加拿大、英国位于与化学所合作的前5位。
2.6化学所期刊共引分析(journal co-citation network)
利用citespace软件对2004-2008年化学所期刊共引进行分析,选择使用关键路径算法,网络节点确定为期刊,时间区选择为1年,阈值为(30,30,30),(30,30,30),(30,30,40)。图谱中不同大小和不同颜色的圆环组成的期刊年轮来表示期刊的共引频次和共引年份,用不同颜色的连线来表示期刊间共引的年代。如图6、表5和表6所示:
从图6、表5、表6中可以清晰地看出,目前化学所使用的核心期刊中有9种期刊的共引频次高于1 000,其中,期刊共引频次位于前5位的分别是:《科学》、《自然》、《物理化学杂志B》、《先进材料》、《化学评论》。尤其值得注意的是SCIE数据库中化学所发文量位于前5位的期刊分别是:《物理化学杂志B》、《应用聚合物科学》、《聚合物》、《大分子》、《兰格缪尔》,与期刊共引频次排在前5位的有所不同,因此,在关注学科领域核心期刊的时候,来源期刊发文量和共引频次排名居前列的期刊都应该是重点关注的期刊。通过化学所期刊共引网络图谱中期刊共引频次的分析,能够更快速、直观地了解化学所的核心期刊分布。
2.7 共词分析(network of co-occuring phrases)
利用citespace软件对2004-2008年化学所文献共词和突现词进行分析,选择使用关键路径算法,网络节点确定为关键词,时间区选择为1年,阈值为(10,10,20),(10,10,20),(10,10,20)。图谱中不同大小和不同颜色的圆环组成的年轮来表示关键词的共现频次和共现年份,用不同颜色的连线来表示关键词间共现的年代。最外层紫色圈突出显示表示共词中心性(centrality),即在整体网络中所起连接作用大小。软件还会根据某段时间内关键词共现频次,将变化率高的词从大量的主题词中探测出来,称为突现词,用红色字显示。如图7、表7所示:
从图7、表7中可以清晰地看出,化学所论文共现词,频次高于100的关键词有21个,其中被引频次位于前5位的分别是:聚合物(polymers)、形态学(morphology)、纳米粒子(nanoparticles)、膜(films)和衍生物(derivatives)。通过高频出现的关键词在共词网络图谱中展示的共现频次,在一定程度上揭示了化学所的热点研究方向。
3 小 结
本文通过绘制化学所的合作者、学科领域、合作机构、合作国家、期刊共引和文献共词的可视化图谱,以图谱方式揭示了化学所近5年发展过程中起关键作用的学科带头人、重点学科、核心期刊、研究热点等信息情报。目的在于通过研究机构文献计量的可视化分析方法,探索深度挖掘研究机构内部的重点学科领域分布、合作团队及学科领军人物、研究机构外部的合作研究机构及合作国家的分布以及研究机构的热点研究方向等情报的方法,在满足科研用户学术信息查找利用需求的同时,为研究所制定战略规划、提升国际竞争能力提供有价值的情报,从而进一步提升学科馆员融入研究所科研一线的知识化服务能力。
参考文献:
[1] Chaomei C.Searching for intellectual turning points:Progressive knowledge domain visualization.Proceedings of the National Academy of Sciences of the United States of America,Washington:US National Academy of Sciences,2004,101(Supp1.1):5303-5301.
[2] 刘则渊. 科学知识图谱:方法与应用. 北京:人民出版社,2008.
[3] CiteSpace. [2009-12-20]. http://cluster.cis.drexel.edu/~cchen/citespace/.
[4] 齐艳霞,刘则源, 赵玉鹏,等.信息可视化视野下的工程伦理前沿. 伦理学研究,2008,37(5):49-54
数据可视化新闻报道特征分析 第12篇
一、何为数据可视化新闻
数据可视化新闻是以数据为核心, 以信息为支撑, 以可视化为基本载体的跨媒体新闻报道形式。数据可视化新闻包含三个要素:数据分析、视觉呈现、新闻报道。
近两年来, 随着新媒体的迅猛发展, 各种类型的媒体都在尝试数据可视化新闻。以传统纸媒为例, 《新京报》“新图纸”专版, 《南方都市报》数据版, 《京华时报》“京华图解”专版等都发挥了信息制图优势, 丰富了新闻报道的手段和视觉效果。
融合类新媒体也在数据可视化新闻中做出了积极探索。财新传媒主要致力于对政经新闻的专业化报道, 他们的数据可视化新闻以庞杂但精确著称, 而《壹读》的数据可视化新闻则糅合了很多趣味性要素, 对于时政新闻的普及有促进作用。
由此可见, 数据可视化新闻不等同于简单的图表新闻, 表格化新闻, 新闻可视化改变了以往新闻报道的基本模式, 笔者以2015年4月1日至4月30日共计30天的财新传媒 《数字说》 栏目中的新闻作品 (29 篇) 为例, 分析数据可视化新闻的制作特点。
1.话题分布
财新传媒 《数字说》 作品话题分布图 (2015 年4 月1日—4月30日)
2.呈现形式
财新传媒《数字说》栏目中的数据可视化形式主要包括:数据模块 (柱形、饼状) 、信息图+文字、时间轴、图解、地图、表格变形等。
以“财新网数据新闻与可视化作品”中呈现的19 个作品为例, 让人印象深刻的呈现方式及其对应的新闻内容有:关系图 (《周永康的人与财》、《金道铭的红颜白手套》) , 地图+实拍图 (《青岛中石化管道爆炸事故——财新记者实拍图集》、《北京污水处理藏猫腻污泥偷排达数年》、《财新记者赴鲁甸震中实拍图集》) , 时间轴 (《曼德拉的世纪人生》、《光耀人生》) , 数据模块 (《2015中国社交媒体影响报告》、《速度与激情:中国品牌崛起2015》) 。
3.数据来源
可靠、精准、即时化的数据是可视化新闻的核心, 因为真实与准确是新闻的生命。在财新传媒数据可视化新闻中的数据来源列表中可见:中央纪委监察部、最高人民检察院、牛津经济研究院、Wind资讯、相关公司财报、胡润研究院, 以及赶集网、智联招聘等分类信息网站。
由此可见, 数据来源的多渠道、权威性和即时更新, 是数据可视化新闻真实准确的基础。
二、数据可视化在新闻报道上的突破
数据可视化新闻拓展了既有新闻主题的广度和深度, 并为读者提供客观、系统的报道以及良好的阅读体验。
通过数据挖掘手段的介入, 媒体可以寻找出对公众、对社会有意义、有价值的新闻, 并获得更加全面、客观、直观, 并且有深度的新闻表达。在新闻日趋同质化的今天, 媒体的差异化也体现在对相同新闻事件的不同解读上。
在2014年全国“两会”召开期间, 《南方都市报》共刊发了约110个“两会”报道专版, 共计约200篇报道。其中很多报道是通过大量数据的搜集、分析、重组来完成的, 特别是3月6日的“图解政府工作报告”的11个版面以及3月7日“图解财报”4个版面尤为出色。此外, 南都网上还开辟了“2014全国两会南都数图汇”的专题页面, 这让更多的公众对原本枯燥的时政、会议类新闻产生兴趣。
2014 年8 月云南鲁甸地震, 财新传媒在其网站上发布实时更新的震区地图, 用户点击某一地点, 记者在此拍摄的现场图片及具体伤亡人数等信息都会出现, 新闻的互动性大大增强。
三、数据可视化新闻的发展趋势
(一) 新闻数据的来源须权威准确
路透社做数据新闻时, 如果选题能够让记者进行原创采访是最好的。如果不能通过采访得到, 则借助公开数据资源, 如政府网站、企业披露资料、权威数据机构的发布或其他网络资源。此外, 已发表或出版的新闻稿件、图书也是获取数据的来源。
《南方都市报》 在全国两会期间成立专门的“南都两会数据报道组”, 多途径获取数据, 并设有专职的统筹采编, 还与凯迪数据研究中心、南方舆情研究院等单位开展合作。报道中大量的数据来源于历届全国政协常委会报告和全国两会会议资料, 还有少量来源于历届政协发布会的文字直播、国际货币基金组织《世界经济展望》报告、中国官方数据报告、媒体公开报道中的相关数据等。
(二) 程序员介入新闻生产流程
为适应数据可视化新闻的发展趋势, 财新传媒成立了“财新数据新闻与可视化实验室”, 在2013 年11 月22日发生的青岛中石化管道爆炸事故的报道中, 财新网制作了《青岛中石化管道爆炸——财新记者实拍图集》数据可视化效果图, 这个效果图的制作过程中, 程序员开始介入到新闻生产流程中, 通过将记者在前线拍摄到的图片, 进行数据整理, 为后方编辑提供指挥的地图。
“现在财新的程序员已经从三楼搬到二楼, 和记者们坐到一起。”
(三) 数据新闻记者应具备跨界技能
数据新闻制作需要掌握的技能包括社科研究方法、计算机数据处理、平面与交互设计、网络编程、数据获取能力等。虽然专业性强的数据处理技术新闻记者难以深入了解, 但如何与程序员沟通, 了解技术的发展现状, 知道如何将新技术与新闻叙事融合, 以及具备基本的数据挖掘、统计能力, 是从事此类新闻报道的媒体人必须掌握的技能。
(四) 可视化由平面向立体转化
国内可视化新闻若想取得进一步发展, 必须更新观念, 不应狭义地把可视化新闻等同于图表新闻, 表格化新闻。
可视化新闻除了二维平面呈现方式以外, 还可以分为三维及多维可视化①新闻和网络可视化新闻。这是可视化新闻利用通用的视觉语言, 对纷杂的信息进行富有想象力的设计。在这种设计方式中, 空间时间化、时间空间化、逻辑节点化三者之间互相共生又互相作用, 共同体现信息的价值, 使得原本平面的新闻立体起来, 这才是可视化新闻发展的高级阶段。
摘要:大数据时代背景下, 数据在给各个领域带来深刻变革的同时也引领了新闻报道发展方向和新闻叙事方式的新变化。其中, 可视化新闻成为近年来一种新兴的新闻传播样式和报道方式。本文结合近期的数据新闻案例, 探究当前数据可视化新闻的呈现特征, 以及此类新闻报道的发展趋势。
关键词:数据新闻,新闻可视化,叙事方式,财新传媒
参考文献
[1]滕瀚, 张双弜.大数据时代的可视化新闻.采写编.2014年第4期
[2]张春红.数据新闻的挖掘与可视化处理.中国新闻出版网.2014年6月10日
[3]马金馨.数据新闻的国际趋势和大中华区发展.在中山大学传播与设计学院的讲座.2014年5月29日
可视化分析范文
声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。如若本站内容侵犯了原著者的合法权益,可联系本站删除。


