电脑桌面
添加盘古文库-分享文档发现价值到电脑桌面
安装后可以在桌面快捷访问

多通道视觉范文

来源:文库作者:开心麻花2026-01-071

多通道视觉范文(精选3篇)

多通道视觉 第1篇

视觉诱发电位(visual evoked potential,VEP)是指神经系统接受视觉刺激(光或图形刺激)所产生的特定电活动。视觉诱发电位信号比较稳定,与受试者自控能力关系不大,信号较易检测,比较适合作为脑机接口的输入信号。

在我们的实验中,采用“模拟自然阅读”诱发模式产生视觉诱发电位,作为脑计算机之间的通信载体。其关键问题之一,是在用户每次选择作业中提取视觉诱发电位,以决定用户的意图。希望脑电记录的导联数应该越少越好。为了达到此目的,在本文中我们将采用BP神经网络算法,选取不同的通道,对靶刺激和非靶刺激信号进行模式分类,通过对比分析,希望能找到最佳通道。

1 基于模拟自然阅读模式的VEP获取

实验记录在模拟自然阅读模式下靶刺激和非靶刺激所引发的EEG信号(这也属于一种Oddball模式)。所谓模拟自然阅读,是指让用户像通常阅读文本中的句子那样,从无突变的符号获取作业信息的方式。所不同的是,自然阅读时人的视线相对于字符句移动,而在模拟阅读时,则是让符号句相对于视线移动,以避免因视线移动引起的眼电污染EEG信号[2]。

本实验采用的诱发符号串如图1所示,所有符号的尺寸是1616个像素并具有完全相同的结构,A为目标符号(靶刺激),中间的竖线被染成红色;B为抑制突变符号(非靶刺激),它和目标符号的差别在于中间的竖线没有被染成红色;C为目标符号和抑制突变符号构成的诱发字符串。

被试者为一名正常中年男性。4个银/氯化银电极依国际10–20电极安放系统放置,4个电极位置依次为PZ、OZ、FZ、CZ。被试者在一个隔音的房间内以舒适坐姿坐在显示器前面。屏幕背景为黑色,中央开有一个1616像素的小视窗,让由非靶刺激(图1B)与靶刺激(图1A)组成的符号串(图1C)中的符号逐个从右向左匀速通过屏幕中央的小视窗,要求从这个小视窗中搜索包含在符号串中的指定目标符号(图1A),从而诱发出ERP[2]。采样频率为2048Hz,采集8192个样本,数据存储格式为通道号样本数作业号,本次记录为4819293。

2 信号预处理及特征向量提取

为了达到降噪,提取特征向量和降低特征向量维数目的,我们采用Burg算法进行功率谱分析。通过功率谱估计可以得到,以P300为主的诱发电位,能量主要集中在低频部分。

小波变换系数能反映信号在时域及频域的局部信息,适合于处理视觉诱发电位信号。又由于四阶Daubechies小波既具有一定的平滑性,又与诱发电位P2-N2-P3复合成分很相似,因此,选用它进行信号的小波分解和重建。对信号进行预处理及小波变换后,需尽量选取信号形态特征明显的时段。我们选取四个通道Fz/Cz/Pz/Oz处的特征。四个电极Fz/Cz/Pz/Oz的位置如图2所示。

在前期的研究中,信号经过预处理及小波变换,分别取一维离散小波变换的第7级逼近信号A7数据[3]作为预处理结果,图3为4个通道各自A7数据中靶刺激前320ms到靶刺激后1s的叠加平均图。图3中坐标0处竖线为靶刺激开始标志,左边为非靶刺激记录,右边为靶刺激记录。从图3可以看出,4个通道的P300成分最为明显,Oz处P300成分幅度较大且稳定,这些较大的特征成分的时段范围约在100ms~600ms之间。

对被试者的各个通道,选取这一时段范围内的3个区间的信号进行单次提取试验。为了降低特征维数,减少分类器的计算负荷,从而提高信号单次识别速度,信号时程选为300ms。依上述分析,分别进行了3组测试,信号时程300ms,3组测试的时段分别为100~400ms,200~500ms,300~600ms。因此从被试者的4个通道第7级逼近信号A7中分别提取靶刺激发生后100~400ms,200~500ms,300~600ms的数据为靶刺激记录,都以靶刺激发生前-300~0ms的数据为非靶刺激记录,从而达到降噪,提取特征向量和降低特征向量维数目的。

3 利用BP神经网络进行VEP分类

BP网络是一种单向传播的多层前向网络。BP网络是一种具有3层或3层以上的神经网络,包括输入层、中间层(隐层)和输出层。上下层之间实现全连接,而每层神经元之间无连接。当一对学习样本提供给网络后,神经元的激活值从输入层经各中间层向输出层传播,在输出层的各神经元获得网络的输入响应。按照减少目标输出与实际误差的方向,从输出层经过各中间层逐层修正各连接权值,最后回到输入层,这种算法称为“误差逆传播算法”,即BP算法[4]。由于3层(即只有一个隐层)BP神经网络可以逼近任何有理函数,3层BP神经网络是神经网络中应用最普遍最广泛的神经网络,所以本分类采用3层BP神经网络。3层前馈即单隐层BP神经网络的结构如图4所示。

将提取的特征向量分成两部分训练数据集和测试数据集。训练数据集中一部分为靶刺激记录,另一部分为非靶刺激记录。首先用训练数据集进行训练,再用测试数据集进行测试,得到识别率。单次模式分类为:每次实验共有93组实验数据,从93组实验数据中随机抽取一部分(50组)靶刺激记录和非靶刺激记录为训练数据集,抽取另一部分(40组)为测试数据集。每种试验模式下每个通道进行10次测试,三种试验模式下四个通道的测试结果如表1所示。

从3种试验模式下4个通道的测试结果可以看出:

(1)3个时段四个通道分类平均值都达到80%以上的分类精度,最高平均识别率为94.38%。说明利用一维离散小波变换进行特征向量提取、增强以及利用BP神经网络进行模式分类的方法是可行的。

(2)3种试验模式下4个通道各自的分类精度存在一定的差别,这表明通道选择对分类精度有一定的影响。

(3)3种试验模式下出现最大分类精度的通道位置都为Oz并没有发生改变。这说明通道Oz相对于其他3个通道来说具有更好的分类特性。从图3可以看出,Oz的P300成分幅度大且信号形态特征明显。

(4)被试者的最佳分类精度为94.38%,发生在时段300ms~600ms处;虽然3个时段4个通道出现最大分类精度的通道位置都为Oz,但分类平均值有一定的差别,这表明时段选择对分类精度也有一定的影响。

4 结束语

采用“模拟自然阅读”诱发电位作为脑-机之间的通信载体,结合小波变换和误差逆传播(Error Back Propagation,即BP)神经网络对视觉诱发脑电信号(VEP)进行分类以产生脑机接口控制信号。以被试4个通道记录到的脑电信号分别作为特征,信号时程固定为300ms,时段分别取100ms~400ms、200ms~500ms和300ms~600ms。

试验表明,通道的选择对信号单次提取精度的影响非常明显,通道Oz相对于其他通道来说具有更好的分类特性。3个时段单通道最佳分类结果分别达到92.63%,92.75%和94.38%。这一结果为简化脑机接口的设计、更好地将其推向实际应用打下了良好的基础。

摘要:采用“模拟自然阅读”诱发电位作为脑-机接口通信载体,结合小波变换和误差逆传播(Error Back Propagation,即BP)神经网络对视觉诱发脑电信号(VEP)进行分类以产生脑机接口控制信号。将被试者4个通道记录到的脑电信号分别作为特征,信号时程都为300ms,时段分别取100ms~400ms、200ms~500ms和300ms~600ms。试验结果表明四个单通道都达到较好的分类效果,有利于产生脑机接口控制信号。

关键词:视觉诱发电位(VEP),脑机接口,小波变换,BP神经网络

参考文献

[1]Birbaumer N,Heetderks W J.Brain─computer Interface Technology:A Review of the First International Meeting.IEEE Transactions on Neural Systems and Rehabilitation Engineering,2000,(8):164-173

[2]官金安,陈亚光脑控双页虚拟键盘的设计与性能分析中国临床康复2006,10(9):124-126

[3]肖贵贤,陈亚光,官金安等基于小波变换和BP神经网络的视觉诱发电位识别现代科学仪器2008,(6):41-43

[4]神经网络理论与MATLAB7实现飞思科技产品研发中心编著电子工业出版社2005,3:99~108

[5]官金安,陈亚光通道选择对诱发脑电单次提取精度影响的研究计算机应用2006,26(8)

关于多通道显示融合技术的研究 第2篇

【关键词】多通道显示融合技术 应用 发展

【中图分类号】G【文献标识码】 A

【文章编号】0450-9889(2013)12C-0182-02

近年来,计算机显示技术及多通道投影显示边缘融合技术的发展,给一些需要超大屏幕、超高分辨率展示及曲面投影显示的专业应用领域提供了方便,如北京奥运会“鸟巢”顶部环形大屏幕,上海世界博览会各场馆的特色展示、交通实时监控管制、气象云图观测,以及广泛应用于飞行模拟、铁路机车、特种车辆、航行船舶、汽车驾驶员培训等的模拟训练系统。多通道显示融合技术就是将相邻画面的重叠部分进行拼接融合处理,使其亮度、对比度、色彩保持协调一致,并保证相邻画面边缘对齐无重叠,将整个屏幕完全融为一体,满足超大画面,超高分辨率无缝显示的需求。

一、多通道显示融合技术的运算处理方式

多通道显示融合技术与早期的三维图形加速技术分软件加速、硬件加速一样,根据所采用的运算处理方式分为硬件融合与软件融合两种。硬件融合即采用专业的边缘融合处理器,全硬件实时运算处理架构,可对任意视频源进行多通道显示边缘融合拼接、像素点对点显示输出,不占用任何其他设备处理资源,无需额外添置计算机,且硬件具备可编程机制,可自适应不同投影设备和投影环境的要求,具有非常强的使用灵活性,安装调试无需专业人员,具备融合画面快速调节功能。硬件融合处理整体架构可靠性非常高,开关机过程迅速,通电即能工作,可达到“即插即用”的标准,但硬件融合架构成本非常高,限制了它的使用范围,通常都应用于专业领域。

软件融合技术则是利用计算机的处理资源应用投影融合软件结合多头显示输出显卡的功能实现视频源的多通道融合显示输出,即完全由软件进行融合处理,特点是成本低廉,只需配置一台具备视频采集和多头显示输出功能的计算机即可。受限于融合软件的研发水平,软件融合对不同投影设备、投影使用环境的自适应能力相对较差,且需要专业的调试人员进行设备调试,边缘融合输出效果较硬件融合架构略差。软件融合虽然效果上略逊于专业的硬件融合,但由于成本低廉,因而应用范围非常广。

软件融合的系统主要由通用计算机平台及相应的投影融合控制软件组成。其中通用计算机平台为一台高性能的计算机,配置有高像素、高带宽视频采集卡及支持多通道显示输出的图形加速显示卡,为实现边缘融合软件的实时运算处理,CPU至少采用四核处理器,内存容量不低于4GB。考虑到系统工作过程的稳定性,计算机电源、主板、硬盘等的配置都以高可靠性为前提。投影设备至少配置3台,且尽量采用同一品牌、同一型号以减少不同品牌型号之间产生的匹配问题。软件融合的工作原理是通过视频采集卡将视频信号输入融合计算机,再由投影融合软件将视频图像经过曲面几何校正、画面比例调整、融合带生成以及图像拼接消融等运算处理后将图像划分为多个通道从不同的投影机投影至幕布以构建融合统一、色彩均匀、无变形失真的画面,完美实现高分辨率、无缝拼接的大视景。

二、多通道显示融合技术的应用

目前融合投影技术的应用除最常见的高清影院、广告展示外,已开始向其他领域发展,如高铁机车乘务员培训、多媒体娱乐甚至军事训练等。经过近年来的发展,虽然铁路机车模拟驾驶教学已由最初的事先录制好机车驾驶室运行视频并通过对视频播放速度的控制达到模拟机车驾驶的简单教学向基于计算机虚拟仿真和传感技术的新型机车模拟驾驶系统过渡,但此类系统仅有一个投影通道,画面的尺寸相对较小,虽然可显示基本的机车运行信息,但显示的画面内容还是比较单一。随着铁路多次大提速和动车组的迅速普及,特别是京沪、京广、哈大等高速铁路的开通运营,此类单通道显示模拟教学设备无法满足新时代高速铁路发展的要求,因此基于多通道显示投影技术的新型高速动车组机车模拟驾驶系统应运而生。

多通道显示高速动车组机车模拟驾驶系统组成包括1∶1模拟驾驶操纵台,视景生成计算机,三通道投影融合机,其中融合机即为软件融合系统。视景计算机将驾驶视景实时运算生成后输送给融合机,融合机通过采集卡获得视景画面后经过投影融合软件转换为三通道投影画面,最后由三台同型号的投影机投射至120度的环形幕布实现无缝超宽、高分辨率画面显示,具备身临其境的效果。得益于宽大的画面,可显示的机车运行信息更加丰富,模拟机车运行状态更接近于真实环境,对培训人员从模拟设备平稳过渡到真实车辆的操纵更加有利。

除一些专业应用需要显示融合技术之外,多媒体娱乐领域也通过显示融合技术将更真实刺激的娱乐体验带给人们,如最常见也是最流行的第一人称射击类电脑游戏(FPS)。FPS简单来说就是以游戏玩家的主观视角来进行射击游戏。玩家们不需要像其他游戏那样操纵屏幕中的虚拟人物来进行游戏,而是身临其境地感受游戏带来的强烈视觉冲击,大大增强了游戏的真实感。随着计算机硬件的逐步发展,特别是显示融合技术的出现以及多通道环绕音响的应用,第一人称射击类游戏提供了更加丰富的视觉体验和更生动的音效。在普通的游戏环境下,只有单一的一台显示器,玩家能够观察到游戏画面只有视线前方左右20度范围内的情况,如敌人或者怪物,假如在此范围之外出现情况,玩家必须上下左右晃动鼠标才能观察到,这不符合人眼的观察特性。假如使用多通道显示融合技术则不仅可将视线范围拓宽到左右45度甚至更宽,更可将视线向空间上下延伸,这样玩家不需要晃动鼠标即可将前方情况一览无余,视野更加开阔,如再配合7.1声道的环绕音响,带来的游戏体验将更加真实刺激。应用多通道显示融合技术的FPS电脑游戏软件经过定制改进同样可用于军事训练中,根据美国《国家防务》杂志的报道,美国陆军和海军已计划将类似的培训设备投入到士兵的训练中,合同预算达几亿人民币。在利比亚战争和阿富汗战争中大放异彩,目前美国陆军空军装备数量最多的无人驾驶飞机“全球鹰”、“掠食者”的远程地面控制系统中也有应用显示融合技术的大屏幕用于飞行员遥控操作时对前方战场的有效观察与高效攻击,足可见该技术的应用前景非常之广阔。

三、多通道显示融合技术的发展

不管是硬件融合还是软件融合在视频源之后都少不了一套融合设备,有没有更简单成本更低廉的融合系统解决方案呢?美国Nvidia公司的nvidia surround技术和AMD公司的Eyefinity多头显示技术就是解决方案中的代表。nvidia surround技术是应用两块相同的图形卡通过SLI(允许多个图形卡同时工作而获得更高性能)的方式连接起来,利用三台分辨率相同的显示器将画面分布开来,实现显示融合的效果。Nvidia公司的解决方案目前来看还不够成熟,存在须配置两块图形卡且支持SLI技术的主机、仅支持三台显示终端、配置安装较为烦琐、成本较高等缺点。相对于Nvidia公司的方案,AMD公司的Eyefinity技术则简单实用多了,除投影机、显示器等显示终端外,仅需配置支持Eyefinity技术的图形加速卡即可,因为支持Eyefinity技术的图形卡最少支持三通道显示输出,可通过图形卡驱动程序里的多画面边缘融合功能简单拼接,实现大屏幕输出,因此无须单独配置融合设备。如果将两块相同的图形卡配置于支持Cross Fire技术(类似于SLI技术)的主机中可实现六个屏幕的显示融合输出。目前支持Eyefinity技术的图形卡最便宜的只需200多元,组建简易的三通道融合系统成本非常低廉,但效果还是不能与单独配置融合系统相提并论,仅仅是简单应用而已。相信在不久的将来,随着计算机显示技术的发展,融合技术将越来越先进,经过融合输出后的画面形状将更多样化,画面边缘将差异更小,让人无法分辨,系统成本也愈发低廉,大屏幕融合技术将得到普及,应用领域将更加广泛。

【作者简介】谢 健(1980- ),男,广西南宁人,柳州铁道职业技术学院机电工程系CAD综合实训室实验员。

多通道视觉 第3篇

关键词:电视制导,视觉显著性,地标选择,航迹规划

引言

电视制导导弹作为一种空地精确制导武器, 具有命中精度高、威力大和射程远等优点, 已成为现代空战中打击敌方纵深战略目标的重要手段之一, 人工参与的电视末制导方式是其中主要方法之一。完成精确打击的关键在于两个核心环节:一是在确定了目标点的情况下, 综合考虑导弹机动性能、地形高程、障碍、威胁以及飞行任务约束条件等多种因素, 选择合理的起始点;二是在起始点到目标点的飞行路径中, 尽可能设计若干有效的地标点, 以满足飞行员视觉判断需要, 合理判断和调整导弹飞行方向, 以提高打击精度。

目前公开的飞行器航迹规划方法中, 大多假定起始点和目标点已事先给出, 其间路径的地标点为已知, 但如何在明确目标点的前提下, 获取有效的攻击通道和典型的地标点序列, 尚有许多问题亟待解决。鉴于视觉主观判断在前述工作流程中的重要性, 引入视觉显著性计算, 在视频序列中间断地提取显著地物 (对应为地标点、对应帧为显著帧) 作为候选地标序列是一种可行的分析思路。目前主流的显著区域检测算法, 文献[1]将其分为三大类:第一类方法从候选区域内部提取显著特征, 如Kadirt[2]方法。第二类方法从候选区域与外界的比较中提取显著性特征, 以Itti[3]的中心-周边算子为代表。第三类从候选区域内部和外部提取显著性特征, 这类方法将上述两种特征结合起来作为候选区域的显著性特征, 如Priviterat[4]方法。

本文尝试以高分辨率遥感图像数据为分析数据源, 提出了一种简单的基于视觉显著性度量筛选地标序列的方法, 在一定几何约束关系下以目标点为中心, 导弹飞行航迹距离为半径的限定扇区中, 自动检测候选地标点, 通过显著性综合度量函数, 评估攻击路径的有效性, 实现在有效扇区内选择有效攻击起始点并确定攻击通道, 并给出地标序列的功能。典型实验验证了方法的有效性。本方法可作为人工选择攻击通道和地标点的辅助工具, 缩小候选范围, 提高工作效率。

1 地标显著性度量方法

1.1 视觉显著性

注视 (Attention) 机制的研究表明, 人类视觉在描述场景时往往将注意力集中在某些明显与众不同、视觉效果突兀的区域, 这种特性称为视觉显著性[5]。例如, 在图1中, A要比其他部分更加突出, 能够迅速引起观察者的注意。这种突出性就是视觉显著性, 突出性较强的A部分就是该图像的显著区域。

1.2 遥感图像定义地标显著性

研究表明, 位于图像中心位置且与周边亮度差异较大的区域容易引起观察者的注意。基于这一特性, 考虑遥感图像的特点及计算复杂度和实时性的要求, 我们把位于图像中心、与周边视觉反差大、容易识别的地物作为候选地标点。根据上述思想, 鉴于视频序列图像数据量大的特点, 为减少计算量, 选取灰度值作为其特征, 通过地物显著性度量参数进行度量, M值越大显著性越强, 反之显著性就越弱。相关公式如下:

式中:M (f) 表示第f帧图像的显著性度量值, 表示第k个窗口内的平均灰度值, 表示第k个窗口外的平均灰度值。

1.3 给定路径的综合显著性

对给定路径 (明确始点、终点的前提下) , 在提取了序列地标后, 可通过设计综合显著性度量函数评估该打击路径的有效性, 这样可为在限定扇区中找到最优攻击路径提供客观判断依据。

首先生成给定路径遍历帧, 帧图像的显著性度量值M (f) 由 (1) 式计算得到, 形成该路径视频序列显著值曲线图, 再由2.3节地标筛选算法, 找到该路径上的地标点, 地标点始终处于曲线图的峰值位置。给定路径的综合显著性体现在两个方面:一是该路径的平均显著性度量值;二是地标点所在帧的显著性度量值 (图中圆圈所处的峰值点) 与其前后显著性谷值 (黑点所处位置) 的差值的平均值。综合以上两个因素, 可得到如下计算公式:

式中:CH (N) 表示通道综合显著性度量值, K表示地标点个数, p (j) 表示当前地标点的显著性峰值, L (j-1) 表示前一显著性谷值, L (j+1) 表示后一显著性谷值, f表示视频帧数, M (i) 表示显著性度量值。

2 攻击通道自动筛选方法

2.1 成像几何参数

导弹飞行过程中, 弹载摄像机不断拍摄战场视频图像, 摄像机拍摄到的战场范围是由其成像几何[6]决定的, 它对于地标选取具有非常重要的作用。假设导弹飞行高度为h, 摄像机此刻所处位置的俯仰角为α。

又已知相机可视角度为γ, 则可根据几何关系计算得到前沿宽度分别为D1, 视场纵深L。计算公式如下:

2.2 候选攻击通道划分

以可行攻击候选扇区为研究对象, 导弹从弧线上的任意点出发飞向目标点都是安全的, 沿摄像机主光轴方向将扇区划分成N条候选攻击通道 (CH (1) 、CH (2) CH (N) ) 。候选攻击通道划分得越密, 相互交叉的部分越多, 划分数量也就越多, 找到的地标点也会越多, 但计算量越会很大;划分得越疏, 候选通道就越少, 找到的地点标也就会越少, 计算量也会越小。因此, 基于以上问题, 我们按照下列方式进行划分:从扇区的某一边开始, 把该边作为导弹的飞行路线, 根据 (2) 式计算得到的后沿宽度D1为范围划分导弹飞行通道, 再间隔D1/2的宽度作为飞行路线依次划分, 这样相邻两条通道相交部分为后沿宽度D1的1/4, 目标始终处于各通道的中心位置。

将N条通道分别生成视频帧图像, 生成的视频帧数f根据导弹的飞行速度v、导弹起始点到目标的距离d、每秒采集帧数m确定, 则:

同时, 可以计算得到视场纵深L所包含帧数为:

2.3 地标筛选

地标的筛选必须满足以下三个条件:

(1) 为保证地标在视频中稳定可见, 必须要求含地标视频帧的帧数n在一秒所采集帧数m中超过一定比例, 则:

即:视场中至少要保证存在一个地标且要持续数帧, 且当临界状态出现, 一个地标即将消失时, 下一个地标要出现, 这样才能避免地标丢失。

(2) 要突出地标显著性, 便于人眼识别, 即显著值M (f) 要大。

(3) 地标点数目要合适, 不能选得太多, 选得太多, 相邻地标点之间距离太近,

为了满足以上条件, 我们采用以下四个步骤进行:

step1根据 (1) 式对各个通道的视频帧图像进行显著性度量, 计算每帧图像的显著性度量值M (f) 。

step2将每个通道f帧图像的显著性度量值M (f) 形成显著性曲线图, 横坐标表示帧数, 纵坐标表示显著性度量值, 这样就形成了N条显著性曲线图。

step3找到曲线上的各个峰值点p (j) 和谷值点L (i) , 把峰值点作为候选地标。

step4从第一帧开始, 先在T帧内找到一个峰值最大的点p (j) 作为第一个地标点, 为了减少不必要的地标, 与前一个地标点间隔T/2帧, 在j+T/2至j+T帧内找一个峰值最大的点作为下一个地标点, 通过同样的方法依次找出后面所有的地标点。

2.4 攻击通道选择

由1.3节计算得到各条路径的综合显著性度量值后, 找到综合显著性度量值最大的一条路径作

为最终的攻击通道, 公式如下:

3 实验结果及分析

假设导弹飞行高度h=600m, 飞行速度v=250 m/s, 视频采集帧频m=5帧/s, 摄像机俯角=18o, 摄像机可视角度为γ=17.5o。实验用地图为Google Earth下载的某地区高分辨率全色数据, 限定某候选扇区在40o度范围内, 选取10条候选通道, 按照成像几何关系仿真生成视频序列图, 每条通道生成180帧灰度图像。按照上述方法, 通过仿真, 下面是其中3组典型地标筛选结果对比分析, 图中x坐标表示视频帧数, y坐标表示显著性度量值, d圈住的峰值点为地标点所在帧。

由图7、8、9和表1可以看出, 第一候选通道筛选了11个地标, 但160-180帧之间没有地标, 存在地标丢失现象;第二候选通道筛选了11个地标, 但其第2、6、7、10、11个地标点的峰值不够明显, 显著性不强;第三候选通道选择了13个地标点, 峰值明显的点全部被选中。通过 (2) 式计算得到三幅图像的综合显著度值分别为:1.1179、1.0991和1.1305, 根据 (8) 式得出CH (3) 选择的地标点显著性程度更高。同时, 通过三个候选通道的地标帧图像对比也可以发现, 第三候选通道优于第一、二候选通道。图10是第三候选通道找到的地标视频帧图像, 位于帧图像中心位置的地物 (即地标点) 亮度与周边差异较大, 易于人眼识别, 因此选择第三候选通道为最终的攻击通道。

4 结语

本文提出了一种基于视觉显著性的空地电视制导导弹攻击通道地标选择算法。该算法在地标筛选, 攻击通道选择方面得到了较为满意的结果。本文算法在复杂背景和较强噪声干扰的情况下, 还有待进一步改进。

参考文献

[1] 张鹏, 王润生, 静态图像中的感兴趣区域检测技术[J].中国图像图形学报, 2005;10 (2) :142~148

[2] Kadir T.Brady M.Saliency, scale and image description[J].International Jour-nal of Computer Vision, 2001;45 (2) :83-105.

[3] Itti L, Koch C.Computational modeling of visual attention[J].Nature Reviews Neuroscience, 2001:2 (3) :194~230

[4] Privitera C M.Stark L W.Algo-rithms for defining visual regions-of-interest:comparison with eye fixations[J].IEEE Transactions on Pattern Analysis and Machine Intelligenc, 2000;22 (9) :970~982.

[5] 王璐, 蔡自兴, 未知环境中基于视觉显著性的自然路标检测[J].模式识别与人工智能, 2006, 19 (1) :100~105.

[6] 李永宾, 黄长强, 郝晓辉, 对电视制导空地导弹巡航飞行高度的分析[J].导弹学报, 2001:13 (4) :82-87.

多通道视觉范文

多通道视觉范文(精选3篇)多通道视觉 第1篇视觉诱发电位(visual evoked potential,VEP)是指神经系统接受视觉刺激(光或图形刺激)所产生...
点击下载文档文档内容为doc格式

声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。如若本站内容侵犯了原著者的合法权益,可联系本站删除。

确认删除?
回到顶部