图像分解范文
图像分解范文(精选9篇)
图像分解 第1篇
近年来在图像处理中提出了一种新的图像表示方法: 卡通- 纹理分解[12 -14],即将图像表示成卡通成分和纹理成分的叠加。其中卡通部分包含图像的主要结构和慢变成分,而纹理分量包含具有周期变化特性或震荡特性的小尺度细节以及随机噪声等成分。光学车牌图像背景复杂,其中包含了大量小尺度细节,这些小细节会形成与车牌纹理特征相似的区域,影响车牌定位的准确性。为消除图像中背景的影响,本文提出了一种基于图像卡通纹理分解的车牌定位方法,对车牌图像先进行结构纹理分解,将无用的小尺度细节及噪声分离到纹理部分,对含有车牌信息的结构部分做边缘检测与形态学相结合的处理,利用车牌的先验知识定位出车牌区域。对于有一定背景的光学车车牌图像,该算法能有效去除背景中的无用信息,提高车牌定位的准确性。
1基于结构纹理分解的车牌定位
基于对目前常用的车牌定位方法及自然光照条件下车牌的分析,本文车牌定位流程如图1所示。
1. 1图像灰度化
为提高处理效率,本文算法是基于灰度图像而设计的。对彩色车牌图像需要灰度化处理,本文采用一般的灰度化公式
其中,R,G,B分别表示像素点( x,y) 处红,绿,蓝的值, f( x,y) 是其灰度化后的值。
1. 2灰度图像的结构纹理分解
设f ∶ Ω→R是给定的灰度图像,将f分解成u,v两部分
其中,u( x,y) 是图像的结构部分,包含图像的主要结构和慢变部分; v( x,y) 是图像的纹理部分,包含图像的细小纹理和噪声。本文采用Vese和Osher提出的一个易于求解的卡通纹理分解模型[14]
其中,λ,μ 是可调参数,p≥1,v = div( z) 。右边第1项是刻画图像的结构部分,第2项为图像的噪声部分,确保将图像分解为结构部分和纹理部分后能量损失尽可能的小,第3项是对图像的纹理部分的度量。
模型( 3) 的Euler - Lagrange方程
其联合边界条件为
其中,nx,ny是边界∂Ω 上的单位外法向量。用差分格式对式( 4) 进行离散化求解。
为检验模型对不同背景图像的分割效果,文中选取某校园内拍摄的带有不同背景的图像进行检验, 图2给出了一组灰度图像结构纹理的分解结果,图1中参数λ =0. 01,u =0. 01,p =1。证明该方法可以有效地将图像中地面纹理、车标等小尺度细节和噪声分到纹理图,车牌、车灯等大尺度分量分到结构图。在本文实验中取 λ = 0. 15,μ = 1,p = 1,可以达到良好的效果。
1. 3车牌定位
以上实验结果表明,车牌图像的结构纹理分解可以去除背景中比字符小的纹理,但结构图还有散热片、 车灯等较大的类似车牌的干扰信息,为了去除这些因素的干扰,本文采用边缘检测与形态学相结合的方法消除干扰信息,利用车牌的先验知识确定车牌区域。
1. 4边缘检测
图像边缘是图像最基本的特征,车牌区域边缘丰富是车牌的一大特征。常用的边缘检测算子有Canny、 Sobel、Roberts、Prewitt和krisch算子等。经过结构纹理分解得到的结构图含噪声较少,故采用Roberts算子[7]来检测边缘,利用图3( b) 和图像g( x,y) 卷积近似计算对和的偏导数
利用式( 7) 计算( x,y) 点处的梯度值
针对计算所得到的G( x,y) ,设定一个合适的域值T, 如果G( x,y) ≥T,则判断该点为边缘点。取T =0. 05, 通过对图像进行边缘检测得到结果如图4( a) 所示。
1. 5形态学处理
数学形态学方法是分析几何形状和结构的常用方法,其基本思想是利用一个结构算子来探测图像各部分的联系。数学形态学的基本运算有: 腐蚀,膨胀,开启和闭合。利用结构算子B对图像A开运算的定义为
闭运算是开运算的对偶算子
开启的目的是消除细小物体,在纤细处分离物体, 平滑较大物体的边界又不改变其面积。闭合具有填充物体内细小孔洞,连接邻近物体,在不明显改变物体面积的情况下平滑其边界的作用。本文根据车牌的先验知识构造结构算子,对边缘图像进行开运算,消除其中的噪声,然后用闭运算形成连通区域,并移除小的连通区域,再对余下的目标区域作膨胀运算以填充区域内的细小孔洞。结合车牌长宽比的先验知识,开运算结构算子选取3 × 1,闭运算选取8 × 24,膨胀算子选取6 × 2,得到连通区域,如图4( b) 所示。
1. 6提取连通区域和车牌定位
经过形态学处理后的连通区域往往不止一个,需要根据每个连通区域的信息,筛选出最符合条件的区域。对连通区域进行标记,二值图像被分割成一个个连通区域。分析这些连通区域,可以得到一些区域特征,比如长宽比、区域面积。根据我国车牌的特点,所有车牌尺寸均一致的,长宽之比也是一定的,用这个信息对车牌进行精确定位。对图4( b) 所得到的连通区域进行特征提取,我国车牌外轮廓长宽为440 mm × 140 mm,由于拍摄角度的不同和形态学操作的影响, 实验表明车牌长宽比在2. 8 ~4. 5之间,宽度小于图像高度的1/8,得到最终输出结果。图5给出了4组不同图像的最终输出结果。
2数值实验
为说明文中算法的有效性,对在不同光照,不同背景,不同角度,不同焦距拍摄的150张图进行测试,图像大小为640 × 480,定位成功率达97. 3%,具体结果如表1所示。
表1数据表明本文算法对有相对复杂背景,车牌倾斜角较小的图定位有较高的准确率,对车牌倾斜角较大的图有一定的鲁棒性。通过计算发现当车牌倾斜角度过大时,根据车牌的连通区域判断车牌的长宽比的方法已经失真,因而不能准确定位出车牌。利用图像的结构纹理分解将图像中的细小噪声分到纹理图, 进而使去噪效果具有良好的准确性和实用性。
3结束语
车牌定位技术是车牌识别系统的一个重要环节, 本文提出了一种基于图像结构纹理分解的车牌定位算法。通过对相对复杂背景下的车牌图像进行结构纹理分解,将噪声等小尺度细节分到纹理图,车牌字符等大尺寸目标分到结构图。再对结构图进行边缘检测,形态学处理,最后利用车牌的先验知识确定出车区域。 实验结果表明,算法思路简单、准确率较高。
摘要:针对车牌图像背景复杂和定位准确率低的问题,提出基于图像结构纹理分解的车牌定位方法。将图像中的小尺度细节分到纹理图,车牌部分划分到结构图,从而去除噪声,再结合边缘检测和形态学方法对结构图进行车牌定位。结果表明,该方法可以显著提高车牌定位的准确率。
图像分解 第2篇
根据光学成像原理和地形结构的分形特征,提出了遥感图像的地形结构-岩性组分模型和分离算法,并用于ETM图像分解和岩类α-f(α)多重分形特征研究.通过对不同地区二长花岗岩体和沉积变质岩ETM原图像、地形结构子图像和岩性组分子图像的多重分形谱对比分析,发现原始ETM图像的多重分形谱与岩石类型和地形没有明显的对应关系.图像分解后,不同地区的二长花岗岩具有十分相似的.岩性组分多重分形谱和不同的地形结构多重分形谱;相反,同一地区的不同类型岩石具有相似的地形结构多重分形谱和不同的岩性组分多重分形谱.因此,利用地形结构-岩性组分分类算法,并结合α-f(α)多重分形谱分形,可以有效地区分岩石类型.
作 者:潘蔚 倪国强 李瀚波 Pan Wei Ni Guoqiang Li Hanbo 作者单位:潘蔚,Pan Wei(北京理工大学,光电学院,北京,100081;核工业北京地质研究院,遥感信息与图像分析技术国家重点实验室,北京,100029)
倪国强,Ni Guoqiang(北京理工大学,光电学院,北京,100081)
李瀚波,Li Hanbo(核工业北京地质研究院,遥感信息与图像分析技术国家重点实验室,北京,100029)
图像分解 第3篇
【关键词】图像分解 幼儿 感知觉
【中图分类号】G613.6 【文献标识码】A 【文章编号】2095-3089(2014)02-0222-02
艺术教学设计中直接性的将纯视觉的艺术品用于创作教学或鉴赏教学,容易出现“视觉经验的隔阂”[1]。因为缺乏肢体与素材互动产生的感官记忆,又没有与生活经验相关联的学习迁移,从而造成不能产生知觉体验的结果。因此通过图像分解的教学手段来进行素材本质的体验活动,以便产生经验联结,其有效性是笔者在以下实验中致力于解决的问题。
一、教学实施目的性分析
本课程是以图像分解的手法分解艺术作品中的点、线、面等基本元素,知识点的关系表见图一,如分解亨德瓦塞尔《蜗牛》中的螺旋形线条、分解蒙德里安《开花的苹果树》的线条交错组成的不稳定图式等,幼儿通过欣赏分解后的各种素材,进行有意义的符号系统的感知与记忆,在教学设计中,知识的组织是建构在学生生活或已有图式经验相联结的基础之上进行的艺术鉴赏,旨在通过“艺术经验和日常生活经验之间的连续性认识”[2]形成螺旋形结构,开展知识的有意义的统整和自我建构。
二、教学设计展示
三、课堂观察反思
先看一下3岁儿童对分解色彩后的蒙克《呐喊》的解读
教师:画面中有什么颜色?(图三1)
幼儿:红色、黑色(幼儿自顾自的说)
——对色彩的感知
教师:有什么感觉吗?
金暄越(女,3岁)
这是火山爆炸了。 ——对色彩的感知与感受
丁炜(男,3岁)
火山把火喷到地上了。 ——对色彩的感知与感受
吴晨曦(女,3岁)
地震了!轰!(全体同学喊是地震,轰轰,有些幼儿抱成一团)
——对色彩的感知与感受
在视觉文本的读解中,分解后的色彩引发了幼儿的心理感受,在这里灼热红色让他们感受到激情,黑色又让他们感受到恐惧、害怕,使他们联想火山爆发时的喷发的红色火焰和笼罩的恐惧。笔者将儿童对色彩的感受与克拉因色彩情感价值表和大庭三朗色彩情感价值表作了一番对照,制成了表格1[3]。
从表格1所作的对照可以看到幼儿对于红色和黑色所引发的的情感倾向是可以体验到的。幼儿在观看到视觉文本后的反应是直观性的、无意识的,并不是逻辑思维判断的结果。这是由于幼儿本身发展阶段中的集体无意识和自我中心的特点导致幼儿缺乏理性来思考自己情绪的能力,他幻想眼前的图像正在对自己说话,威胁着自己,自己也要发出“轰”的声音让同伴们快点注意到这一危险。
吴晨曦喊出“地震了!”,并双手捂在胸前,似乎很恐慌,想要保护自己,几乎全体同学陷入混乱,发出轰轰的声音。吴晨曦通过视觉感知图像,从红色和黑色的交融中似乎感受到了不稳定的动感,热烈的红色、恐怖的黑色、忧郁的蓝色总体引发的恐怖灼热的感觉让幼儿感觉自己仿佛置身于危险之中,幼儿自然而然的做出了相应的动作(双手紧握),嘴里喊出危险来临时的“轰隆隆”的崩塌声。其次分解后的视觉文本中色彩与线条相融(图三),流动的长线条和色彩承载着蒙克在呐喊时的意念和内在情绪,幼儿内摄了这种感觉,唤起了自我潜意识中的恐慌的经验,这时是画面肌理、幼儿心理、生理的多重知觉。
当教师所解构的视觉图像联结感官经验、体验、知识时,图像以其特有的线条和色彩构成,组合出特殊的视觉图式,赋予画面高度的动力感。教师通过图像分解连续性的做“有什么”“是什么”“怎么样”的有意识提问,发掘幼儿的梦境、幻想、联想与日常生活中的原型关联性,原型是人类心灵最基本與共同的结构,也是许多概念的普遍范型。幼儿通过这样的认知途径,可经由沟通、探索、诠释和投射等行为,将主观情感向客观事物移置或外射,将自己融入创造性想象或不确定路径之中,唤起自身潜意识中被忽略的自我经验。给予幼儿这样的教育,不仅增进个人(幼儿)的自我概念,也深度经验了他者。从而促进幼儿在知觉场域中创造出一个更有意义的个人建构。
参考文献:
[1]李力加.唤起知觉经验的美术学习[M].济南:山东美术出版社,2013:3.
[2]李力加.唤起知觉经验的美术学习[M].济南:山东美术出版社,2013:3.
[3]孔起英.学前儿童美术教育[M].南京:南京师范大学出版社,1998: 60.
作者简介:
图像分解 第4篇
在布料设计领域, 颜色和色调调整是最常见的设计操作, 这些操作可以通过颜色迁移技术实现。更准确地说, 布料颜色设计领域中的颜色迁移的技术是指在保持图像的几何结构细节不变的情况下改变布料图像的颜色。在传统文献中, 原始的布料图像通常称为“目标图像”, 且新颜色通常由“源图像”提供。
通过假设lαβ颜色空间中目标图像和源图像的标准化成份是等价的, Reinhard[1]给出了解析的颜色迁移公式。文献[1]中的假设等价于不同图像之间的颜色值的一些简单统计特征 (均值和方差) 具有一致性。其他一些统计特征 (如协方差矩阵[2]) 也可以用来参与运算。虽然Reinhard的模型是有效的, 但该模型没有考虑图像的空间信息, 因此颜色迁移结果会出现一些失真。图像的空间信息是指相邻像素之间的颜色相关性。为了克服Reinhard模型的缺点, Tai[3]首先利用基于高斯混合模型和期望最大化的软分割技术来获得图像的颜色区域, 然后在每个分割区域内采用Reinhard模型的颜色迁移公式。为了进一步改进文献[1]~[3]的颜色迁移效果, Xiang[4]提出从多个源图像中更合理地选择颜色, Liu[5]提出利用一种椭圆颜色混合映射技术提取有关的颜色区域。
受文献[1]~[3]匹配简单颜色统计特征方法的启发, 研究人员最近通过匹配源图像和目标图像之间的颜色直方图来实现图像颜色迁移。这类方法的共同特点是度量累计或非累计的目标和源图像的颜色直方图值。典型的度量工具包括:Papadakis[6]所使用的经典范数, Rabin[7]所使用的Wasserstein距离以及Su[8]所使用的Kullback-Leibler距离等。
在以上所有的颜色迁移方法中, 源图像均直接参与颜色迁移过程, 这是因为颜色或颜色的统计特征均需从源图像中提取, 故上述颜色迁移方法所对应的颜色迁移结果很大程度上依赖于源图像的选择, 因为不同源图像具有完全相同的颜色以及相同的颜色统计特征的概率很低。为了在颜色迁移过程中规范化和统一化不同源图像, 文献[9]在布料颜色设计中引入了颜色主题的概念。一个颜色主题是指几种颜色的组合以及描述该颜色组合的注释, 例如描述一种情感、一种视觉感觉、一个位置, 或一种自然环境等。一般来说, 一个颜色主题是从大量的具有相同语义描述 (即相同主题) 的源图像中抽取的, 事实上, 心理学研究表明颜色和语义主题之间有着紧密的联系。例如, “优雅”这个词通常与粉红色和紫色相联系, 而“悲伤”一词通常与蓝色和灰色相联系。
本文中, 我们主要讨论基于颜色主题的颜色迁移方法。这类方法的困难在于颜色迁移过程中只能提供几个具有代表性的颜色主题。这意味着颜色匹配或颜色直方图的统计不能用于基于颜色主题的颜色迁移方法中。
文献[10]提出了在变分框架下的一种基于颜色主题的颜色迁移方法。该方法可以迁移一些给定的颜色主题到目标布料图像上。图一显示了该方法的主要过程。这个过程包含两个阶段:图像分割阶段 (第一阶段) 和图像重构阶段 (第二阶段) 。在第一阶段, 一个目标布料图像 (图一 (a) 所示) 被划分为几个区域 (图一 (b) 所示) , 每个区域由所在区域的颜色均值表示不同区域的颜色均值组合成输入图像的颜色主题。注意:文献[10]中所使用的图像分割模型是Li[11]提出的图像分割模型的推广形式。与文献[3]中的分割方法不同, 文献[10]中的图像分割模型可以估计出目标图像的每个像素亮度分量偏离该像素所在区域亮度均值的偏差, 即亮度偏场, 如图一 (c) 所示。文献[10]中颜色迁移的第二个阶段是对于一个给定的颜色主题 (如图一 (d) 所示) , 新图像 (如图一 (e) 所示) 将给定的颜色主题迁移到目标图像上, 该新图像也被视为一种新的颜色设计方案。
虽然文献[10]中的颜色迁移方法适用于一些布料图像, 但在该方法所重构的图像中, 局部细节并不十分理想。事实上, 当比较图一 (e) 所示的重构图像以及图一 (a) 所示的原始目标图像, 不难发现重构图像的一些几何结构细节被磨光了, 并且出现一些虚假的图像细节信息。这些视觉缺陷会对颜色设计的评价产生强烈的负面影响。
本文中, 我们提出一种新的颜色迁移方法用来改进文献[10]中的颜色迁移效果。新方法的主要贡献如下:为了获得更好的图像分割和颜色迁移的结果, 新方法充分利用图像分解的技术[12,13]。在图像分解问题中, 图像的不同细节如结构细节和纹理细节可以用不同的函数空间来描述。例如, 在文献[14]中, Meyer假设有界变差空间适合描述图像的结构成份而不适合描述纹理成份, 而有界变差空间的对偶空间则更适合描述图像的纹理成份而非结构成份。故在新的颜色迁移方法分别对图像结构成份和纹理成份分别建模, 有利于获得更好的颜色迁移结果。
1 相关工作与讨论
设I:Ω→R3表示CIElab格式的输入颜色布料图像, 且Ij (j=1:3) 是I的三个分量, CIELab格式图像I意味着图像的第一个分量是CIELab颜色空间亮度维度的坐标, 而其他两个分量对应颜色对立维度。使用CIELab颜色空间的原因是它比经典的RGB颜色空间更好地描述布料图像的纹理噪声。注意, 由于图像通常显示为RGB格式, 故RGB颜色空间和CIELab颜色空间之间的转换可以通过文献[1]中的公式来实现。
文献[10]中的颜色迁移模型包含两个阶段:图像分割阶段和图像重建阶段。在第一阶段, 图像域Ω被分为N部分:Ω1, Ω2, ..., ΩN, 且满足, 其中, i1, i2=1:N以及i1≠i2。这里假定分割的区域个数N是已知的。
令函数K:Ω→[0, 1]是一个截断Gaussian函数:
式 (1) 中, α是使得的常数, σ是高斯函数的标准差, ρ是截断常数。函数K (x) 既可以被用作权函数, 也可以被用来捕捉图像的局部区域。
为了获得相对较好的分割结果, 文献[10]中提出了以下假设。对于像素x∈Ωi (i=1:N) 且对于所有像素y∈Ox={y:|x-y|≤ρ, y∈Ωi}, I (y) 在加权意义下应近似等于si (x) = (xi1 (x) , si2 (x) , si3 (x) ) T, 即:
式 (2) 中, si1 (x) =b (x) ci, si2 (x) =di和si2 (x) ei。这里, b (x) 被称为亮度偏离区域, 并且被用来度量si1 (x) 和ci之间的偏差程度。常量ci, di, ei表示Ωi中Ij (x) 的强度的平均值且j=1, 2和3。显然, 式 (2) 意味着假定图像是局部分片常数, 因为式 (2) 在加权意义下满足:
式 (3) 中, s:Ω→R3, 且s (x) =si (x) , x∈Ωi且i=1:N。
由于布料图像中重叠的线 (Yarn) 的边缘纤维高度模糊, 故在不同区域之间的边界并不十分清楚。由于这个原因, 模糊隶属度函数ui:Ω→R被用于表示区域Ωi, 并且满足以下约束条件:
为了简洁, 我们用符号u:Ω→RN来表示一个向量, 其分量为ui, i=1:N。
根据上述假设, 文献[10]中的颜色迁移模型中的图像分割阶段对应解决如下的能量最小化问题:
式 (5) 中, λ是一个平衡数据项F1和正则化项R1之间的调节参数, 并且
其中, ▽是梯度算子, 且正则项采用总变差 (TV) 。总变差可以用来保护u不被过度磨光。模型 (5) 可以得到图像的一个近似版本:
在文献[10]的图像重构阶段, 所有区域的颜色平均值, i=1:N, 被组合成图像I的颜色主题。为了方便, 记号H∈R3×N被用于表示图像I的颜色主题, 且H的第i列对应第i个图像区域的平均颜色值。当给定的新颜色主题Hnew, 新的颜色设计方案可以通过构造一个新的图像Ynew来实现:
其中, (cinew, dinew, einew) Ti=1:N, 是给定颜色主题Hnew的N列。
由于文献[10]中的颜色迁移模型中假定输入的布料图像是分片常数的, 故根据式 (7) 的图像重建公式, 输入的布料图像的一些细节不可避免地存在丢失现象。这是文献[10]模型的主要缺点。这里, 图像的细节主要指图二所示的随机纱线纹理。为了更好的识别和保持这些图像细节, 本文中, 我们将图像结构-纹理分解技术引入颜色迁移过程中。
2 新的颜色迁移模型
根据上文所述, 新模型主要基于如下假设:
这些假设比模型 (5) 更符合布料图像的细节特征。事实上, 从式 (8) 和式 (9) 可以看出, 图像的结构成份C而不是原始图像I被认为是局部分片常数, 这是因为结构成份C中的细节比图像I中的细节更平滑。
根据表达式x (x) = (b (x) ci, di, ei) T, 其中x∈Ωi, 偏差场函数b (x) =si1 (x) /ci描述了区域数Ωi中亮度si1 (x) 和亮度ci平均值之间的偏差程度。
根据上面的讨论, 该模型的图像分割阶段对应如下最小化问题:
其中,
其中, λ, γ, η是正的参数, 且模糊隶属度函数u仍需满足式 (4) 中的规范化约束条件。表达式Fc (s, u) 是将表达式中的I变为C。在 (s, C, u) 中, 如果我们规定γ, η≡0且C≡1, 则模型 (10) 就变为模型 (5) 。然而, 这两个模型在理论上有很大的不同。事实上, 根据模型中表达式的意义, 只有模型 (10) 的解 (s*, C*, u*) 才可以满足公式 (8) 和 (9) 所示的假设。
从上面的图像分割阶段中可以获得图像分割的结果 (s*, C*, u*) , 同时可以获得图像I的近似版本,
我们可以用来度量图像I*和I之间的近似程度, 其中|Ω|是Ω的模, L2范数‖·‖。
对于给定的颜色主题Hnew, 我们可以通过以下公式构造一幅新的图像Inew:
为了使所构造的新图像能够使颜色更加融洽, N个区域的亮度强度的相对顺序需要与目标图像N个区域的亮度相对顺序保持一致, 即在式 (11) 和式 (12) 中分别有c1*≤c2*≤…≤cN*和c1new≤c2new≤…≤CNnew。
对比图像Ynew和Inew可以发现, 新的颜色迁移的方法相比文献[10]中的方法可以更好地保护所构造图像不会被磨光。事实上, 式 (12) 构造的图像Inew比式 (7) 构造的图像Ynew包含更多的细节。这里, 细节I-C*可以被理解为布料图像中的随机纱线纹理细节。
3 数值结果
下面列举几个具有代表性的布料图像的颜色迁移结果来说明新方法的有效性。在评价过程中, 我们用文献[10]中的方法作为参照方法。为了方便, 本文提出的方法和文献[10]中的方法缩写分别是CTD-BCT方法和BCT方法。所有图像的大小均为400×400。此外, 在我们所有的数值实验中, 区域数N固定为5, 这是因为Kulter数据库中每个颜色主题中均包含5种代表性颜色。事实上, 由于偏场函数的引入可以确保区域数N选取的鲁棒性。
为了使读者更容易理解我们给出的CTD-BCT方法的性能, 图三显示了一个典型的颜色迁移的结果, 从中我们可以比较和分析CTD-BCT方法和BCT方法。在图三的结果中, 输入图像I是图一 (a) 中所示的布料图像, 两个给定的颜色主题名称分别为“因为我能行”和“成熟的哈斯鳄梨”, 该颜色主题 (如图三 (f) 所示) 是从Kuler数据库中随机选择得到。图三 (a) 和 (b) (或 (c) 和 (d) ) 显示的结果由BCT方法 (或CTD-BCT方法) 获得, 图三 (a) (或 (c) ) 中的图像对应重构图像 (或) , 且 (b) (或 (d) ) 展示了对应于两个给出的颜色主题的颜色迁移的结果。从左到右, 图三 (e) 显示了原始输入布料图像I的局部放大部分、图三 (a) 中的重构图像的局部放大部分以及图三 (c) 中的重构图像的局部放大部分。
比较图三 (b) 和 (d) 所示的颜色迁移的结果, 我们可以发现BCT方法的结果太光滑了, 而所提结果能够保持原始输入图像更多的几何细节。由于颜色迁移结果要被用作设计师的色彩设计方案, 更多的图像细节意味着相应的虚拟布料图像色彩设计方案更加接近真实的设计方案。这表明在我们的颜色迁移方法中引入图像分解过程是有效的。事实上, 比较图三 (e) 所示的重构图像, 我们可以发现CTD-BCT方法重构的图像更加接近原始输入布料图像I, 并且所提CTD-BCT方法的重构图像比由BCT方法所得的图像好, 这是因为CTD-BCT方法的结果可以获得更多的图像细节。图三所示的结果证明所提CTD-BCT方法比BCT方法能够生成更好的颜色迁移结果。
图四显示了另外一个颜色迁移的结果, 其中, 在 (a) 中, 从左到右依次表示原始输入图像I、由BCT方法重构的图像、由CTD-BCT方法重构的图像, (b) (或 (c) ) 显示了由BCT (或CTD-BCT) 方法获得的三个颜色迁移结果。为了节省空间, 相应的颜色主题没有显示。事实上, 这些颜色主题都是随机从Kulter数据库中抽取得到。
从图四所示的实验结果可以发现, 由BCT方法重构的图像以及获得的颜色迁移结果失去了原始输入图像I的一些重要的布料纹理细节。相反, 我们给出的CTD-BCT方法获得的结果克服了BCT方法的缺点。事实上, 因为我们的CTD-BCT模型是基于式 (8) 和式 (9) 所示的图像分解假设, 相应的由式 (12) 得出的颜色迁移结果可以保留更多的纹理细节, 因为式 (12) 中的含有更多的纹理细节。
总之, 根据图三和图四所示的颜色迁移的结果表明, CTD-BCT方法比经典的BCT方法更加有效, 这是因为CTD-BCT方法不仅保留更多的布料纹理细节, 而且颜色迁移结果中的一些颜色区域有了更清晰的边界。
4 结束语
图像分解 第5篇
1. 点的分解
点作为美术作品形式语言中最基本的单位, 是构成美术作品形式语言的基础与关键。点的运用在美术作品中随处可见, 教师可以在教学中适当向学生传授与点相关的知识。如点的形态主要有圆形、椭圆、方形、多角形、水滴形以及不规则形等。点法有圆笔点、侧笔点、破笔点、醒目点等。点的形态则有32种之多, 如介子点、个子点、梅花点等。这些都是教授学生分解点的基础, 是提高学生鉴赏水平的第一步。教师在教学中要将这些点的知识与具体的绘画相结合, 以此来阐释其中的含义及其运用。
比如, 中国水墨画是中国文化精粹之一, 其蕴含的文化内涵更是丰富多彩, 但小学生对水墨画的理解多是停留在自我感觉的表象层面上。教师可以引导学生通过图像分解来理解作品, 而点的分解便是首要任务。
以《富春山居图》为例, 向学生传输点的知识, 教授学生学会点的分解。该画汇聚了中国水墨画的各种点法, 如米点法、苔点法等, 而点的表现形式也灵活多变, 点在树枝则为叶, 点在近石则为草, 点在远山则为树。对画中的点进行分解, 让学生通过点的形式来理解画家针对不同的物象所运用点法的不同, 可以加深学生对水墨画实质的理解。以树叶点为例, 点的运用将树叶的外形表现得栩栩如生, 近处的树叶点墨色浓重而醒目, 点的形状刚劲有力, 而远处的树叶点墨色轻淡而虚渺, 点的形状柔细轻软, 如此一来便将画面的层次感展现得淋漓尽致。在教学中, 教师如此解读作品, 既能让学生清晰地感受到中国画中点法的魅力, 又能让学生在掌握绘画技法的基础上更好地欣赏作品, 从而有效地提高学生的欣赏能力。
2. 线的分解
无论是西方绘画还是中国绘画, 都喜欢用线条作为主要的造型手段, 对美术作品的欣赏离不开对其线条的分解与感知。教师在教学过程中要注重作品中各种形态的线的分析, 通过揭示直线、曲线、实线、虚线等不同线条传达的不同视觉感受来深化学生对作品的理解, 促进学生审美感知能力的进一步提升。
以齐白石先生的《虾》作为讲解对象, 教授学生感知线条在中国绘画中的美的表现。如图1所示, 这幅《虾》图以简括的笔墨笔法表现了游弋水中的虾, 这两只虾轻灵纤细、通体透明, 极富机警灵活之态, 体现出了晚年齐白石先生画艺的成熟与绘画功力的精湛。虾的体态轻盈、生动活泼与其主要的线条所体现出的形式美息息相关。教师可运用图像分解法将画中主要的线条分解出来供学生学习欣赏。
将图1中两只虾的触须和身躯的主要线条分解出来便如图2所示, 学生通过对这几根主要线条的把握, 感知虾的轻盈与灵动。图1中的虾或躬腰向前或弯腰爬行, 一笔一节, 连续数笔便将虾腰的由粗渐细展现出来, 而虾的一对前爪也由细而粗, 数节之间直到两螯, 形似钳子, 有开有合, 虾的触须用数条淡墨线画出, 使得虾须的线条似柔实刚, 似断实连。此外, 画家还借用线条墨色的浓淡将虾的虚实关系巧妙地展现出来, 从而将虾的生命力展露无遗。教师在引导学生进行作品赏析时从线条分解出发, 可让学生在感受线条的穿插、长短以及疏密浓淡的基础上完成对作品的深入解析。
图像分解 第6篇
图像隐藏算法主要有空间域算法和变换域算法。比较算法的鲁棒性和不可见性, 变换域算法具有明显的优势, 如小波变换[2]、离散余弦变换[3]和奇异值变换[4]等。对于具有各向异性的奇异性的对象, 比如线状和边界特征等, 小波变换并不能很好地表示[5,6]。而Shearlet变换将尺度和方向分解分开进行, 允许各层变换上具有不同数目的方向分解, 可以完成对图像的稀疏表示[7]。奇异值变换对旋转、缩放等几何攻击的抵抗能力较强。本文将Shearlet变换、小波包变换和奇异值分解结合起来, 先对载体图像进行Shearlet变换, 再对Shearlet低频图像进行二级小波包分解, 将秘密图像重要位平面信息通过奇异值分解隐藏在小波包系数中, 次要位平面信息隐藏在Shearlet变换的高频子带中。实验表明, 在具有较低时间复杂度和较高不可见性的前提下, 该算法的鲁棒性较好。
1 算法基础
1.1 Shearlet变换
2005年K.Guo和D.Labate提出了Shearlet变换[8]。图像进行Shearlet变换时, 首先经过拉普拉斯金字塔 (Laplacian Pyramid, LP) 变换进行多尺度分解, 从而对图像中的奇异点进行“捕捉”, 然后高频分量采用Shear滤波器组进行多方向分解, 最后实现图像的多尺度分析和多方向分析分开进行。图1为图像经Shearlet分解的示意图。
I为原图像, Ia1和Id1分别为经拉普拉斯金字塔变换后得到的低通子带和带通子带, 其中带通子带Id1又被Shear滤波器组进一步分解为多个方向的带通子带, 低通子带Ia1又经变换得到Ia2和Id2。
1.2 奇异值分解
计算机对图像的处理实质上就是对一系列非负矩阵的运算。奇异值分解 (SVD) 是线性代数中对矩阵对角化的最常用的方法之一[9,10]。设1幅大小为mn的数字图像A定义为A∈Rmn, 其中R为实数域, 则矩阵A的奇异值分解可表示为
式中:U∈Rmm;V∈Rnn均为正交方阵;S∈Rmn是一个含有非负元素的对角阵, S为奇异值矩阵, 且其n个奇异值满足
式中:d是矩阵A的秩。矩阵S可以表示为
式中:D=diag (a1, a2, , ad) 。
矩阵的奇异值不仅具有良好的稳定性, 而且它所反映的是矩阵元素之间的内在特性, 而非图像的视觉特性, 因此, 将信息嵌入到奇异值中必然会有很好的不可见性和鲁棒性[11]。
2 图像隐藏算法
2.1 秘密图像预处理
先对秘密图像进行位平面分解得到Bk (k=7, 6, , 0) , 然后对Bk进行Arnold置乱, 产生伪随机序列BAk (i) 。
2.2 载体图像处理
先对载体图像做Shearlet变换 (分解尺度p=3) , 得到一组高频子带Wg和低频子带LL, 再对LL进行二级小波包变换, 得到4个低频子带图像系数矩阵Wt, t=LL1, LL2, LL3, LL4, 对Wt做奇异值分解
2.3 秘密图像的隐藏
步骤1:将主要信息位平面Bk (k=7, 6, 5, 4) 隐藏在Wt奇异值分解得到的矩阵St中。
首先, 修改奇异值
然后, 对修改后的系数矩阵进行如下变换
式中:St1为新的奇异值矩阵;λt为二级隐藏调节系数。由St1, Ut和VtT重构小波包系数W't
步骤2:将次要信息位平面Bk (k=3, 2, 1, 0) 隐藏在Wg中。
式中:g=1, 2, 3, 4;μk为隐藏调节系数。
步骤3:由式 (7) 中的W't和其他未改变的小波包系数进行二级小波包反变换, 进而得到Shearlet低频系数, 结合式 (8) 得到的W'g以及其他未改变的Shearlet系数, 做Shearlet反变换, 最终得到载密图像。
2.4 秘密图像的提取
步骤1:对载密图像进行Shearlet分解 (分解尺度q=2) , 得到一组高频子带Wgh和低频子带, 对低频子带做二级小波包变换得到低频子带系数矩阵Wtl。
步骤2:对系数矩阵Wtl做奇异值分解
由式 (6) 中的Ut1和VTt1计算W't
提取重要信息位平面矩阵
式中:k=7, 6, 5, 4;t=LL1, LL2, LL3, LL4。
提取次要信息位平面矩阵
式中:k=3, 2, 1, 0;g=HH1, HH2, HH3, HH4。
步骤3:组合所有二进制位平面信息生成灰度图像, 并进行Arnold反变换得到秘密图像。
3 试验结果分析
图像经过某种变换后, 其变换特征主要体现在能量分布上[12]。图像经Shearlet分解后, 能量的分布和分解尺度有一定的关系。当分解尺度逐渐变大时, 变化后低频区域所含的能量却在减少, 但是由于Shearlet变换具有能量聚集性, 即使进行六尺度分解, 低频区域内的能量仍然达到了90%以上[13]。因此, Shearlet变换的分解尺度会影响图像隐藏的性能。
3.1 Shearlet分解尺度对图像隐藏性能的影响
试验采用512512的灰度图像barbara作为载体图像, 采用128128的灰度图像vehicle和leather分别作为秘密图像。图像隐藏的不可见性和鲁棒性分别用峰值性噪比 (PSNR) 和归一化系数 (NC) 来衡量, 算法的时间复杂度用T来表征。表1为Shearlet分解尺度对图像隐藏性能的影响。
表1中, p代表隐藏秘密图像时对载体图像的Shearlet分解尺度;q代表提取秘密图像时对载密图像的Shearlet分解尺度。在不受时间限制时, 对载体图像和载密图像的分解尺度可以分别选为5和2, 此时, 算法的不可见性和鲁棒性都很高。综合分析峰值性噪比、归一化系数和时间复杂度这3个指标, 本文在试验过程中, 对载体图像进行分解时尺度选为3, 即p=3, 对载密图像进行分解时尺度选为2, 即q=2。图2为2幅秘密图像隐藏和提取的实验效果图, 此时, 图像vehicle和leather的PSNR值分别为57.578 0 d B和57.206 3 d B, 人们从视觉上几乎看不出载密图像与原始图像的差别;图像vehicle和leather的NC值分别为0.998 8和0.999 2, 这表明算法的鲁棒性较好。同时, 算法的时间复杂度很低, T分别为16.951 6 s和17.083 2 s。
3.2 不可见性分析
峰值信噪比 (PSNR) 表示了载密图像与载体图像的相似程度, 即不可见性。以图像vehicle和barbara分别作为秘密图像和载体图像进行实验, 表2为本文算法和另外两种算法的PSNR比较。可以看出, 本文算法的PSNR更高, 不可见性更好。
d B
3.3 鲁棒性分析
归一化系数 (NC) 表示了秘密图像与恢复图像的相似程度, 用来衡量算法的抗攻击能力, 即鲁棒性。以图像leather和barbara分别作为秘密图像和载体图像进行实验, 表3为载密图像受到攻击时, 本文算法和另外一种算法的NC对比。
4 小结
本文利用Shearlet变换分解尺度对图像隐藏性能的影响, 结合小波包变换和奇异值分解提出了一种图像隐藏算法。将秘密图像的高位平面信息隐藏到载体图像低频系数的奇异值矩阵中, 低位平面自适应嵌入到其他系数中。在隐藏秘密图像和提取秘密图像过程中, 采用不同的Shearlet分解尺度。试验表明, 该算法很好地平衡了不可见性、鲁棒性以及时间复杂度三者之间的关系, 为隐蔽通信提供了新的思路。
摘要:为了更好地平衡Shearlet域图像隐藏不可见性、鲁棒性和算法时间复杂度之间的关系, 提出了一种基于Shearlet变换和奇异值分解的图像隐藏方法。利用Shearlet变换的能量聚集性、小波包分解低频子带抗攻击性强和矩阵奇异值良好的稳定性, 载体图像先进行Shearlet分解, 得到的低频子带再进行二级小波包分解。将秘密图像的重要信息位平面隐藏到小波包分解低频系数的奇异值矩阵中, 次要信息嵌入Shearlet高频子带中。实验表明, 该算法对高斯噪声、滤波和剪切等攻击都有较好的鲁棒性, 同时, 不可见性较好, 时间复杂度较低。
图像分解 第7篇
本文是对医学图像中常见的冠状动脉造影图像进行数字图像处理, 使得医生在对患者病情诊断时能够只关注心脏血管的狭窄程度和支数而不受非血管部分的干扰, 以期达到准确的诊断效果。
本文将冠状动脉造影图像作为研究对象, 对造影图像的去噪方法进行了研究[1,2]。采用经验模态分解 (EMD, Empirical Mode Decomposition) 方法将造影图像分解成若干层子图像[3]。此后通过多种血管提取方法, 如小波变换模极大值、径向投影、Hessian矩阵与Gabor滤波器, 来分别获取子图像层中清晰明显的血管段。最后重构成血管脉络明显的心血管图像。
本文的结构为:第二部分描述对冠脉造影图像的预处理过程;第三部分简单介绍经验模态分解算法, 并对预处理后的图像进行基于经验模态分解的分层处理;第四部分详细描述对各子层图像的血管特性信息分析, 并给出各子层图像对应的算法与血管脉络提取结果, 具体为对含高频血管脉络信息的第一层图像采用模极大值方法, 含次高频血管脉络信息的第二层图像采用径向投影的方法, 对含有低频血管第三层图像采用Hessian矩阵转换和Gabor滤波器的血管提取方法;第五部分简单介绍将从各子层图像中提取出的血管脉络信息的拼接方法;第六部分是本文的总结部分。
2 冠状动脉造影图像预处理
2.1 图像特点分析
图2.2所示的是临床某患者的冠脉造影图像。由于投影设备的限制, 在图像的四周会出现不含血管信息的无像素黑色区域。并且, 在黑色区域与圆形亮色区域的相接处, 此处像素点的灰度值变化剧烈, 在后续的图像经验模态分解过程中会出现伪血管信息。所以, 为实现相接处像素灰度值平缓过渡的目的, 对图像实行无像素黑色区域的像素填充是必要的。
2.2 预处理算法描述
根据圆形亮色区域与黑色区域相交处所在位置的不同, 将图2.1的冠脉造影图像划分为四个区域, 分别为左上区、右上区、左下区和右下区, 每个区域的像素填充方向各不相同。箭头表示各个区的填充方向。
具体算法实现的步骤如下:
步骤一:对 (1) 区来说, 其填充方向是左上方, 对 (1) 区中需要填充的区域从下到上、从右到左扫描。如果P是待填充点, 填充方法是在该点的右下方取一个大小为44的矩阵, 如图2.3所示。计算该矩阵的平均灰度值, 将该值作为P的灰度值。
步骤二:对 (2) 、 (3) 、 (4) 区进行同样的像素填充操作。只不过各区的填充方向以扫描方向发生了变化。相应地, 44大小的填充矩阵的选取方向也发生了变化, 依次为右上方、左下方和右下方。
步骤三:重复步骤一和步骤二, 对图像进行第二次像素填充, 以实现像素点更光滑的过渡效果。图像二次像素填充后的结果如图2.4所示。以下所提到的冠脉造影图像均为预处理后的图像。
3 图像经验模态分解
3.1 经验模态分解
经验模态分解 (EMD, Empirical Mode Decomposition) 是一种新的非平稳信号分析处理方法[4,5]。经验模态分解方法是对待处理的非平稳信号进行平稳化处理, 从而将非平稳信号中不同频率的信息逐级分解出来。
在本文中, 将冠脉造影图像作为经验模态分解的原始信号。经验模态分解过程的实质就是将原始信号 (非平稳信号) 分解成一系列本征模态函数 (IMF) 和残差信号之和。经验模态分解算法的详细实现过程此本不再赘述。对图2.3中的图像进行经验模态分解, 分解后的结果如图3.1所示, 经验模态分解后的结果是将原图像分解成不同阶数的IMF, 共六层。
通过对照冠脉造影图像与分解后的各子层图像发现, 图像中的血管信息主要是在IMF1、IMF2和IMF3中。因此, 在对各子层图像的后续处理过程中, 该文只针对前三层进行血管特征提取。
4 子层图像血管信息提取
4.1 高频血管信息图像层
冠脉造影图像经验模态分解之后, 最先被分离出来的是最高频的血管信息, 生成IMF 1图像层, 如图3.1 (a) 。在该图像层中, 血管非常细小, 背景信息远大于血管信息。采用一般的血管提取方法, 如Hessian矩阵[6,7], 不能将此类血管的完整信息提取出来。该文采用小波变换模极大值方法, 将微弱的血管信息从强背景噪音下提取出来, 类似从母体腹部信号中提取胎儿心电信号[8]。
IMF 1图像层中的血管信息相对比较微弱, 所以考虑首先把其中的血管信息当作噪声的一部分滤除, 即使用小波变换模极大值重构滤波算法识别重构出其中的背景信息, 再从整个IMF 1图像层中除去识别出的背景信息, 所获得的就是血管信息。
具体的算法实现过程如下:
(1) 将IMF 1图像层做图像增强处理。对增强后的图像进行二进小波分解, 尺度为3, 小波函数选择db4, 求出每一尺度上小波系数的模极大值点;
(2) 在最大尺度上选择需要保留的极大值点。设置合适阈值来保留极大值点, 即大于等于阈值的极值点给予保留, 否则舍去。
(3) 以尺度3上保留的极大值点位置为中心构造邻域, 在尺度2上极大值点中保留落在每一个邻域上的极大值点, 去除落在邻域外面的极值点, 得到尺度2上保留的极值点;
(4) 在尺度2保留极值点的位置上, 保留尺度1时的相应极值点, 其余的置零;
(5) 用每一尺度上保留下来的极值点重构小波系数, 进一步重构出造影图像中的背景信息;
(6) IMF 1图像层信息减去背景信息, 即可得出需要的图像血管信息。
图4.1和图4.2对比给出了Hessian矩阵提取的血管信息和基于小波变换模极大值的提取的血管信息, 可以很明显的看出小波变换模极大方法提取出的血管信息较完整。
4.2 次高频血管信息图像层
经验模态分解过程中, 在高频血管信息被分离出之后, 次高频的血管信息被分离出, 形成IMF 2图像层, 如图3.1 (b) 。与IMF 1图像层不同的是, 该图像层包含了造影图像中的主要血管脉络, 血管信息非常丰富, 并且血管的纹路没有出现大的断层, 血管边缘与背景的界限也较为清楚。
依据上述一系列血管特点, 该文此图像层采取的处理方法是径向投影[9]。即以待判定像素点为中心, 以15°为精度, 在24个方向上做灰度值求和积分, 在所得到的一组数据中根据出现极值点个数来判断像素点是属于背景、线性血管还是血管分叉点。如果极值点的个数等于2或3, 则认为此像素点属于血管信息;如果大于等于3, 则认为此像素点属于背景信息。图4.3所示是图像中坐标为 (100, 100) 的像素点基于径向投影方法得出的一组数据, 该组数据中出现两个极值点, 所以此像素点为血管信息。
对IMF 2图像层进行血管信息提取。实验结果如图4.4所示。然后对图4.4进行图像去噪处理, 该文采用的去噪方法是设定一个阈值, 将图4.4中连通区域的面积与此阈值比较。如果大于等于阈值则保留, 如果小于阈值则舍去。去噪后的结果如图4.5所示。
4.3 低频血管信息图像层
低频的的血管信息是最后分离出的血管信息, 形成IMF3图像层, 如图3.1 (c) 。在IMF 3图像层中, 血管信息较少且都较粗大。相比图像层IMF 1和IMF 2, 此图像层中的血管脉络结构明显简单很多。该文采用两种处理方法, 都能达到较好血管信息提取效果。第一种方法是基于Gabor滤波器实现的, 首先将IMF 3图像层进行图像对比度增强处理, 然后采用Gabor滤波器提取血管信息。第二种方法是基于Hessian矩阵实现图像血管信息提取。图4.5和图4.6给出了这两种方法的处理结果。
5 图像重构
通过上述上述的处理过程, 能有效的消除各层图像的噪音而将血管脉络的特征保留下来, 最终要完成的任务是将各层图像中的特征通过层间相互参照实现整体血管脉络的合成。
6 总结
本文提出的图像分层处理方法, 通过选择适应于各子层图像的算法来实现不同图像层中血管信息, 能够取得很好的血管提取效果。通过对比实现, 发现该方法提取出的血管信息高于传统冠脉造影图像处理方法, 即直接对冠脉造影图像进行单一算法处理实现血管提取。为解决实际问题提供了一种新的思路。
参考文献
[1]康文炜.冠状动脉造影图像的分割方法研究[D].博士论文, 吉林大学, 2010.
[2]周寿军, 杨俊, 陈武凡.王涌天.一种从X射线血管造影图像中自动分割冠状动脉的新方法[J].中国科学, 2007, 37 (12) :1531-1543.
[3]Ming-YuShih, Din-Chang Tseng.A wavelet-based multire solution edge detection and tracking[J].Image and Vision Computing, 2005, 23 (4) :442-451.
[4]林玉荣, 王强.基于一维经验模态分解的图像细节提取方法[J].吉林大学学报 (工学版) , 2011, 41 (6) :1766-1770.
[5]Tu CL, Hwang WL.Analysis of Singularities From Modulus Maxima of Complex Wavelets[J].IEEE Transactions on Information Theory, 2005, 51:1049-1062.
[6]刘晏丽, 赵卫东, 陈宇飞, 等.基于Hessian矩阵和区域生长的肝血管树的分割算法研究[J].计算机与现代化, 2011, 1:113-116.
[7]周琳, 沈建新, 廖文和, 王玉亮.基于Hessian矩阵的视网膜血管中心线提取[J].中国制造业信息化, 2011, 1 (40) :46-49.
[8]贾文娟, 吴水才, 白燕萍.小波变换模极大值算法用于胎儿心电信号提取的研究[J].医疗卫生装备, 2010, 12 (31) :14-17.
[9]Qinmu Peng1, Xinge You, Long Zhou, Yiu-ming Cheung.Retinal Blood Vessels Segmentation Using the Radial Projection and SupervisedClassification.International Conference on Pattern Recognition, 2010.
图像分解 第8篇
Image registration is a fundamental task in image processing used to align two or more images of the same scenes.These images can be taken at different time,from different sensors or different viewpoints[1].Generally speaking,existing image registration techniques can be categorized into two classes:the area-based and the feature-based methods[2].Area-based methods deal with the images without attempting to detect salient features and adopt optimization algorithms.However they are sensitive to intensity changes and suffer from noise and varying illumination.So they are not well adapted to remote sensing image,multi-sensor image registration Feature-based methods register two images by matching the common structures,such as control points,lines and regions.They are robust to noise and small structure perturbation.Image registration is the basis for image processing and holds the key to image understanding,which has been widely applied to image recognition,image analysis and computer vision.
Spectral graph theory is a powerful tool that aims to characterize the global structural properties of graphs using the eigenvalues and eigenvectors of either the adjacency matrix or the closely related Laplacian matrix[3]which is used in computer vision fields,such as graph or image matching[4,5,6],image segmentation[7]and so on.In recently years,some promising graph matching methods have emerged.Caelli and Kosibov[8]presented inexact graph matching by projecting the nodes of graph into the joint eigenspace,and correspondence between nodes are then found by a clustering technique.Raveaux et al[9]proposed the graph matching method based on the minimum-weight subgraph matching.Leng et al[10]proposed the Gaussian perturbation method,and can find more correspondences.An image registration method is proposed based on virtual points[11],and this method is robust and accurate.Silletti et al[12]proposed a novel approach for point set matching which exploits different techniques based on spectral methods.
The graph matching suffers from the combinatorial problem whereby the computation for finding an exact or similar matching is exponentially related to the number of nodes in the graph.Thus the dimensionality reduction is crucial in many practical applications.PCA[13]is one of the most popular dimensionality reduction methods by projecting the original data onto the low dimensional linear subspace.Recently,various dimensionality reduction techniques have emerged,such as ISOMAP[14],Locally Linear Embedding(LLE)[15],Laplacian Eigenmap[16]and Isometric Projection[17].One of the major limitations of these methods[17]is that it does not generally provide a functional mapping between the high and low dimensional spaces that are valid both on and off the training data So a good transformation must include the following two basic conditions:First,the described matrix dimensions should be reduced(compression);second,compression data must be able to reveal the inherent structural characteristics of the original data in order to achieve the optimal approximation of the original data.Therefore,we propose a novel dimensionality reduction method satisfying the above two conditions based on non-negative matrix factorization(NMF),which can resolve the high dimensionality problem and describe the structure of the original data.We first construct the non-negative weight matrices of the undirected weighted graph by the feature points of the images,from which the feature basis image obtained can contain the global feature of the original image based on NMF.Moreover,the initial value of NMF is evaluated iteratively by using the absolute feature vectors of the spectrum of the non-negative weight matrices,which can reflect the structural characteristics information of the graph,and improve the image matching rate.Finally,the correct feature correspondences are found in the feature basis vectors space between the weighted graphs.The experimental results show that the matching results are fast and accurate compared with the Umeyama method[4],Shapiro and Brady method[6],and the method of Caelli method and Kosibov[8].
The rest of this paper is organized as follows.Section 1 presents some terminologies and notations.Section 2gives image registration method based on non-negative matrix factorization of graph.Second 3 reports the experimental results and we conclude the conclusion and describe some directions for future research in section 4.
1 Preliminary
Given an lmimage I,let=lm N,and},,,,{321NVΛ=vvvv denote the full set of pixels in the image I,where iv denotes the ith pixel of I.Based on the set V,we construct a weighted graph GWEV),,(with V as thenode set and=VVE as the edge set.For simplicity,let ije represent the edge),(jivv between the two nodes iv and jv.The weight on the edge ije is denoted by ijw that measures the similarity between the pair of nodes iv and jv.
Definition 1(Non-negative Weighted Matrix):The non-negative weighted matrix of a graph G(V,E,W)isan mnmatrix V,where each element ijv is Gaussian-weighted distance between two nodes iv and jv:
where||||jiij-=vvr is the Euclidean distance between the two nodes assuming that they are lying on the same plane.The scale parameterσcontrols the degree of interaction between the two sets of nodes.Obviously,the each element Vij is non-negative.
2 Image Registration based on NMF of Graph
2.1 Theory Analysis of NMF
NMF is an efficient dimensionality reduction method of the original data using non-negative constraints,which leads to a parts-based representation because they allow only additive,not subtractive,combinations.
To find an approximate factorization V=WH,we first need to define cost functions that quantify the quality of the approximation based on Gaussian noise model.One useful measure is simply the square of the Euclidean distance between V and WH
In order to optimize W and H,Eq.(3)is equivalent to maximizing likelihood estimation[20]:
subject to:W≥,0H≥0.The gradient of the objective functionF(W,H)=||V-WH||2with respect to W and H are given as:
We obtain the additive updating rules by Eq.(5)and(6),
2.2 The Matching Algorithm
The initial value of W and H of NMF method is randomly generated according to multiplicative iterative algorithm by using non-negative constraints.The values W and H are guaranteed to convergence to a locally optima as they are updated iteratively.Basis vectors are an uncertain value based on NMF because of the initial values randomly generated.If we regard basis vectors of image as matching sample,which will directly affect the image matching results.In this paper,we can compute the initial value of W and H by using absolute feature vectors of the spectrum,which can reflect the characteristics of the original image and resolve the high dimensionality problem.The algorithm has the following advantages:First,the use of the spectrum characteristics of the absolute feature vectors reflects the structure features information of the graph to a certain extent,and have certain clear physical meaning;Second,optimization of the basis vectors based on NMF improves the matching rate of the images;Third,the proposed method not only converges fast,but also occupies a small storage space,which can be beneficial to high dimensional data matrix of dimensionality reduction treatment,and is more suitable for processing large data for image processing applications.
Based on above theory discussion,in this section,we detail the steps of our algorithm for matching algorithm based on NMF of graph:
1)Construct graph non-negative weight matricesGL 1andGL 2on point sets of two graphs 1G andG2,which have the same numbers of feature points according to Eq.(1),respectively.
4)Perform the NMF onLG1 andLG2,and get optimized basis vectorsWG1 andWG2,respectively,according to iterative rules Eq.(3)and(9).
6)Assume the affine transform,the transform parameters are obtained by matching relationships,and align the reference image and sensed image based on the transform parameters.
3 Experiment Results and Discussion
All the experiments have been done using MATLAB 7.1,running on a Pentium 4,CPU 2.8 GHz,and 512 MB If cost function F(W,H)is less than 10-5,the iteration is stopped.In this section,we provide some experimental evaluation of the novel image registration technique based on NMF compared with the Umeyama method[4],Shapiro and Brady method[6],and the method of Caelli method and Kosibov[8].There are two aspects to this study.We commence with a study on synthetic image which aims to demonstrate that the matching method is feasible under rotation and scaling.The second part of the study evaluates the robustness of the proposed method on real-word image(the CMU/VASC model-houses and the remote sensing images).
3.1 Synthetic Images
Fig.1 gives experiments of synthetic hand image to test the ability of our proposed algorithm under rotation and scaling.The synthetic data is the character hand consisted of 11 feature points extracted by points of maximum curvature on the outline of the hand by the Harris Corner Detector[21].Fig.1 shows the final matching correspondence of the feature points and registration results,which dedicates that the proposed method is invarian to rotation and scaling.
(a)Correspondence under rotation r=3;(b)Registration result;(c)Correspondence under scaling r=3;(d)Registration result.
3.2 CMU/VASC Houses
Fig.2 shows the comparison of the house images matching results using Caelli and Kosibov method[8],and our method with the increasing of feature points.Experimental results indicate that our algorithm is feasible for real house images,and the images used are the size of 576384(see Fig.2).
(a)Caelli method;(b)Our method r=4;(c)Caelli method;(d)Our method r=4;(e)and(f)clustering results of(a)and(c)respectively
Twenty-five feature points(first row)and thirty-five feature points(second row)are selected in each image respectively on two frames of CMU/VASC houses(the 0th,10th)by the Harris Corner Detector[21].These house images are examples to illustrate that the features matching of the proposed method is better than the Caelli and Kosibov method.In this paper,we choose)(<+nmrmn,indicating that the theory corresponds with the experiments.So relatively a few basis vectors W are used to represent many data vectors V.Thus,the W achieves an optimal approximation of the original data.Fig.2demonstrates that the accuracy of our matching algorithm is comparable with Caelli and Kosibov method.The matching result in Fig.2(c)is worse than our matching result Fig.2(d).This is because,as more number of feature points are detected they get closer to each other.Some closer feature points can be regarded as the same class,which produces lots of many-to-one matching results.Fig.2(e)and(f)give the projection clustering result of Fig.2(a)and(c),from which we see that some closer feature points can be attributed to same class.Table 1 gives the computation time and accuracy rate of the different methods,which demonstrates that our method outperforms the Caelli method in both accuracy and computation time.
Fig.3 shows the performance of using Caelli method and our proposed method.From experimental results,we can see that feature correspondences of(a)and(b)reflect the correspondence between first row and second row of Fig.2,respectively.The Caelli methods produce more mismatching compared to our method.So our method is more accurate.
(a)and(b)feature correspondence using Caelli method and our method on first row and second row of Fig.2 respectively
Fig.4 shows the fraction of correct correspondences as a function of the number of detected feature points of CMU/VASC houses(the 0th and 28th)for our method,Umeyama’s method[4]and the method of Shapiro and Brady[6].It can be seen that our method outperforms the other two algorithms.Thus our method can be used to solve for more number of nodes in the graph and is more accurate than above two spectral matching methods.Because the initial value of NMF is evaluated iteratively by using the absolute features vectors of the spectrum of the non-negative matrices and the feature basis image,which must be able to reveal the inherent structural characteristics of the original data in order to achieve the optimal approximation to the original data,and improve the image matching rate.
3.3 Remote Sensing Images
Fig.5 shows the multi-spectral image matching result.First,we take two 471298 images from the same area of the before and after of the 3.11 Gongcheng earthquake(Mar.11,2011)with nine feature points already exploited by eliminating the other six feature points from reference image and sensed image,respectively.Fig.5(a)and(b)show two multi-spectral images taken from the city of Mingqu by ALOS(Advanced Land Observing Satellite),and the both multi-spectral image are combined by band 3(Red color),band 2(Green color)and band 1(Blue color),before and after(Mar.13,2011)the earthquake of Mar.11,2011,respectively.Our method can find correct feature correspondences,which shows that the proposed method is effective and feasible for multi-spectral images.The initial values of basis vectors directly affect the image matching results.So we initialize the value of W and H by using absolute feature vectors of the spectrum which can reflect the characteristics of the original image,and improve the image matching rate.
(a)Reference image before the earthquake;(b)Sensed image after earthquake(Mar.13,2011);(c)Matching result r=4.
4 Conclusion
This paper proposes a novel algorithm for finding correspondence between nodes of two graphs for image registration.Specifically,we generate the feature basis vectors,which can contain the global features of the original images based on NMF by using the absolute feature vectors of spectrum of the non-negative weight matrices.The proposed method is computationally efficient and can capture accurate correspondence in the principal feature basis vectors space between the weighted graphs.The results of experiments illustrate that the proposed method is indeed a good feature matching algorithm for image registration.We research further on the data dimensionality reduction problem and give a novel objective function to improve original data approximation to achieve better matching of the graphs.The procedure to choose the r is also our future research.
图像分解 第9篇
关键词:数字水印,Arnold置乱,奇异值分解,离散多小波变换
0 引 言
随着计算机和网络技术的迅猛发展,多媒体信息(图像、视频或音频)的交换和传输变得异常方便和快捷,因此其安全性与版权保护问题变得日益严重。数字水印作为一种潜在的解决方案得到广泛的关注,并成为国内外学术界一个热门研究领域[1]。根据水印的嵌入方式不同,水印算法可分为空域算法和变换域算法。一般情况下,用变换域嵌入方式对信号进行处理的鲁棒性较空域要好。常见的变换域方法有离散傅里叶变换(DFT)、离散余弦变换(DCT)和离散小波变换(DWT)等。由于以上变换均不具有几何不变性,因此大多变换域水印算法抗几何攻击能力比较弱。图像的奇异值具有很好的稳定性,即当图像施加小的扰动时,图像的奇异值不会有大的变化。基于奇异值这个特点,刘瑞侦[2]等人提出了基于奇异值分解的数字水印算法,该算法对旋转、平移、放缩等几何攻击具有一定的稳健性,但测试水印为随机向量。杨兰格[3]将DWT和SVD结合起来提出一种数字水印算法,嵌入水印为二值图像。
近几年,多小波作为单小波技术的新发展,它能同时拥有正交性、对称性、紧支撑性等良好的性质,与单小波相比具有更多的优越性。一些研究表明,基于多小波的水印算法较单小波具有更好的抗噪声、滤波和压缩等攻击操作的性能[4,5]。由于灰度级图像可以代表更多生动和直观的版权信息,该算法将奇异值分解和多小波变换结合起来,提出了一种新的灰度级图像水印算法,将水印置乱后的结果,分块地嵌入到宿主图像多小波变换后的不同中频区域中,嵌入强度由水印块和中频区域的性质共同决定。
1 奇异值分解和多小波变换相关理论
1.1 奇异值分解
从线性代数的角度看,任意一幅数字图像都可以看成一个mn的实矩阵,给定一个大小为mn的实矩阵A,其SVD分解可以表示为:
其中:U和V分别为mn及nn大小的正交矩阵;S为非负对角矩阵,S=diag(λ1,λ2,,λr,0,,0),其对角线元素λi即为矩阵A的奇异值,且满足λ1≥λ2≥≥λr>0;r为S的秩,它等于非零奇异值的个数[3]。
1.2 多小波变换
多小波变换与小波变换相比更具一般性,首先,其滤波器系数是矩阵而不是标量;其次,可以构造尺度因子大于2的多小波。一般地,多小波含有r个尺度函数和与其对应的r个小波函数,r=2时,多小波的尺度函数和小波函数可以用以下向量的形式分别表示为:
式中:Φ(t)被称作多尺度函数;Ψ(t)称作多小波函数。与单小波一样,多小波也有双尺度方程,即:
对于多小波, {Hk}和{Gk}是22的矩阵滤波器。
式中:{hk(n)}和{gk(n)}分别是尺度滤波器序列和小波滤波器序列,它们满足
2 水印算法
2.1 水印置乱及嵌入位置选择
为了抵御统计方法对水印算法的攻击,需要对水印信号置乱来增强水印算法的不可统计性。目前,常见的置乱方法有Arnold变换、幻方变换、Hilbert曲线和Gray码变换等,这里采用Arnold变换置乱水印图像。Arnold置乱公式如下[7]:
式中:x,y∈(0,1,2,,N-1),表示某一像素点的坐标,N是图像矩阵的阶数。
经历一次多小波变换后,1幅NN的图像被分解成4幅N/2N/2的子图像(LL,LH,HL和HH),这些子图像具有不同的分辨率和不同的空间方向[8]。其中,LL为低频子图,对应于图像的概貌(纹理平滑区域);HH为高频子图,对应于图像的细节(纹理复杂区域);LH和HL是两个不同方向上的中频子图。n层多小波变换是通过递归地对LL子图做变换实现。
图像的低频区域受压缩等变换的影响较小,但图像质量对低频区域的改变是敏感的。高频区域可以提供较大的视觉容量,但容易受到噪声等攻击的影响。因此,为平衡水印的鲁棒性和透明性,通常把水印嵌入到图像的中频区域。这里选择图像3层多小波变换后的中频区域作为水印的嵌入位置,图2给出了水印位置的选择模型(水印嵌入到深色底纹标识的位置)。
2.2 水印嵌入算法
(1) 采用Arnold变换对待嵌入的灰度级水印图像W进行置乱得到W′,并将W′按以下方式分成4块:W1= W′(1∶32,1∶32);W2= W′(1∶32,33∶64);W3= W′(33∶64,1∶32);W4= W′(33∶64,33∶64)。
(2) 对整个宿主图像I应用3层DMWT,选出需要进行水印嵌入的4个中频区域LH33,LH32,HL33,HL32,分别记为I1,I2,I3,I4。
(3) 在每个区域Ik,运用SVD: [UIkSaVIk]=SVD(Ik),这里k,a=1,2,3,4。
(4) 对置乱后的每块水印Wi,运用SVD:[UWiSbVWi]=SVD(Wi),这里i,b=1,2,3,4。
(5) 将四块水印和待嵌入水印的4个中频区域一一对应起来,利用每块水印的奇异值来修改每个中频区域的奇异值: S
(6) 通过奇异值分解的逆运算:I
(7) 将I
2.3 水印提取算法
(1) 对已嵌入了水印的整个宿主图像IW做3层MDWT,选出中频系数区域:I′k。
(2) 在每个区域I′k中,运用SVD:[UkS′aVk]=SVD(I′k)。
(3) 利用4个中频区域的奇异值,分别提取4块水印图像的奇异值S′b=(S′a-Sa)/αi。
(4) 运用奇异值向量构造出4块水印图像,并按照特定的顺序存放得到W″。
(5) 将W″进行Arnold反变换,得到提取出的灰度水印图像W*。
3 仿真实验及分析
仿真基于Matlab 7.0环境,选用SA4多小波。宿主图像为512512大小的标准灰度图像Lena,如图3所示;水印是6464大小的灰度级文字标识图像 “民航大学”,如图4所示。调制参数K=0.8。人眼观察可以作为主观评价标准,来判断嵌入水印的宿主图像中水印的不可感知性和提取出的水印的质量。在客观上,利用峰值信噪比(PSNR)来衡量嵌入水印后的宿主图像的视觉质量,PSNR值越大,对宿主图像的破坏就越小;以归一化相似度(NC)来表示提取出的水印图像W*和原始水印图像W之间的相似性,NC值越大,则两者越相似。PSNR和NC的定义如下:
图5为含水印且未受攻击的宿主图像,PSNR值为42.314 8。可见,具有较好的视觉质量。图6为从图3中提取出来的水印图像,NC值为0.999 9。可见,在未受任何攻击下水印能成功地被提取出来。表1给出了含水印图像经历不同JPEG压缩(压缩因子为1%,5%,10%,20%,30%)后的PSNR值和提取出水印的NC值。表2给出了含水印图像在经历不同噪声干扰和滤波后的PSNR值和提取水印的NC值。表3给出了含水印图像在经历常见的几何攻击,如放缩、剪切和旋转后的PSNR值和提取水印的NC值。图7 给出了与表1~表3相对应的攻击下所提取的水印 。
由以上仿真结果可知,该算法不仅具有较好的抗击JPEG压缩、噪声和滤波的能力,而且对于放缩、剪切和旋转也具有一定的稳健性。
4 结 语
该算法将奇异值分解和多小波变换的优点结合起来,提出了一种基于奇异值分解和多小波变换的灰度级水印的嵌入和提取算法。利用Arnold变换对待嵌入的灰度级水印进行置乱处理,消除了像素间的相关性,增强了算法的抗攻击性能。嵌入时将置乱后的水印分成4部分,分别嵌入到图像3层多小波变换后的不同中频区域中, 并根据中频区域和水印块的性质选择不同的嵌入强度。仿真结果表明,该算法不仅对于JPEG压缩、滤波等常见的图像处理具有较好的稳健性,而且对剪切、放缩和旋转等几何攻击具有一定的稳健性。
参考文献
[1]Frank Hartung,Martin Kutter.Multi media Watermarkingtechniques[A].Proceeding of the IEEE[C].1999,87(7):1 079-1 094.
[2]刘瑞侦,谭铁牛.基于奇异值分解的数字图像水印方法[J].电子学报,2001,29(2):168-171.
[3]杨格兰,奚浩波.基于DWT与SVD自适应公开水印技术[J].微计算机信息,2007,23(7):67-69.
[4]Serdean C V,Ibrahi m M K.Wavelet and Multi waveletWatermarking[J].IET I mage Process.,2007,1(2):223-230.
[5]Mahmoud I Khalil.Digital I mage Watermarking:ScalarWavelet Versus Multi wavelet[J].IET I mage Process.,2007,1(2):223-230.
[6]Shen L,et al.Symmeritic and Anti-symmeritic OrthonormalMulti wavelet and Related Scalar Wavelet[J].Appl.Comput.Harmon.Anal.,2000,8(5):258-279.
[7]张华熊,仇佩亮.置乱技术在数字水印中的应用[J].电路与系统学报,2001,6(3):32-36.
图像分解范文
声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。如若本站内容侵犯了原著者的合法权益,可联系本站删除。