HSI颜色空间
HSI颜色空间(精选4篇)
HSI颜色空间 第1篇
图像修复的定义是一种填充图像中缺失信息并尽量不引起视觉不合理特性的方法[1]。图像修复技术在解决一系列图像处理问题时得到了广泛的应用, 例如图像编辑、物体移除、图像恢复、图像编码、修复在传输中丢失的图像信息等。发展至今, 图像修复算法可以分为几个大类。第一类是基于扩散的方法, 通过传播等高线将线性结构 (或称等照度线) 用基于偏微分方程的方法[1,2,3,4]或其他方法[5]扩散到图像的待修复区域内。这种基于扩散的方法的缺点是计算量大, 耗时长, 并在大区域修复时会造成一定的模糊失真现象。
第二类方法, 是受纹理合成技术的启发[6,7,8], 而提出的基于像素的纹理合成方法。文献[6]首先提出一种非参数采样纹理合成技术, 采用已知纹理信息, 以像素块代替单个像素为单位合成所需纹理。文献[7]中提出了一种方法, 利用纹理的局部稳定性, 通过对与待修复块匹配度最佳的纹理块的中心像素取样和复制, 对待修复块中的未知像素进行填充。自此类算法提出以来, 一系列此类方法的改进也被提了出来, 例如文献[9]和文献[10]提出了多尺度的修复的方法并改进了合成次序。文献[11]提出了空间相关性约束的方法。虽然基于像素的纹理合成方法较之扩散方法在纹理区域的修复效果要更加优秀, 但是此种方法经常会导致合成误差传播和视觉不合理的重复图样, 在包含随机纹理的图像中尤甚。
基于像素块的纹理合成方法摒弃了每次只合成一个像素的思路, 而是每次合成一个像素块, 这样就克服了上述的缺点。如今“基于样例的图像修复”一般是指基于像素块的纹理合成方法, 在最近几年里得到了显著的改进, 例如改进了像素块的取样方式[8], 改进了位置像素块的修复优先权, 对具有较强结构信息的像素块进行优先修复[12]。
Criminisi等[12]提出了一种等照度线驱动的采样填充修复算法。该方法以优先权和样本块为关键因素, 较好地完成了图像结构和纹理的传播。近年来, 又提出了很多基于此方法的改进方法。文献[13]提出了利用增强填充块与匹配块之间的全局时空相关性, 采用EM算法实现了视频修复。文献[14, 21]提出了利用小波变换检测不完整的凸结构, 运用线性拟合和扩展进行补全, 然后进行基于样例块的纹理合成修复。文献[15]提出了使用结构张量来定义填充次序优先级和样例匹配度, 并提出一个K-最近邻域算法来减少搜索最佳匹配块时的计算量。文献[16]提出了利用小波变换将图像分为结构子图像和纹理子图像, 对结构子图像使用基于偏微分方程的扩散方法, 对纹理子图像使用基于样本块的纹理合成方法进行修复, 然后利用两个修复完成的图像对原始图像进行重建。文献[17]利用了对不同尺度和方向上角点冗余的检测, 借助非下采样轮廓波变换, 改进了置信度参数的计算方式, 并用累计色散获取待修复块的最优匹配块。文献[18]提出了利用邻域嵌入方法对位置像素值进行估计的方法。文献[19]提出了利用等照度线的曲率对优先权值进行改进, 对结构线性程度高的像素块进行优先修复。文献[20]提出利用剪切波变换对图像进行分解然后进行修复, 这种算法的修复效果要优于利用小波变换的图像修复算法。文献[22]提出了利用归一化的互相关系数用于检索最佳匹配块。文献[23]提出了一种基于模式相似性的图像修复算法, 利用样本纹理的亮度变化和空域特性寻找最佳匹配模块。
然而, Criminisi算法无法充分利用图像中的结构信息, 容易造成纹理的错误传播, 利用小波变换等的算法运算量过大, 导致算法耗时过长, 而利用偏微分方程改进的算法依然会引入一些模糊性失真。针对这些不足之处, 本文基于Criminisi算法, 提出了利用HSI色彩空间对修复优先权值的计算进行改进, 利用已知像素梯度模的统计特性对信息量参数进行改进, 并利用图像的邻域相似性改进了最佳匹配块的检索, 通过上述改进措施, 使得修复次序更加合理, 修复速度得到提升, 修复结果得到明显的改善。
1 Criminisi算法简介
2004年, Criminisi提出了一种基于样例的图像修复算法[12], 结合了“纹理合成”与“图像修补”技术的优势, 在大区域的图像修复方面具有良好的效果, 如图1所示, 令I表示图像, Ω表示待填充区域, 令Φ=1-Ω表示图像中的已知区域 (源区域) , δΩ表示填充边界。Ψp表示一个大小为9×9的待填充像素块, 中心像素为像素p。修复过程主要由三个步骤组成:
第一步 计算填充边界上各个像素点的优先权值P (p) , 找出优先权值最大的点, 对以其为中心的像素块进行优先修复, P (p) 的计算公式如下:
其中C (p) 为置信度参数:
其中:
D (p) 为信息量参数:
其中为p点法向量, 为p点等照度向量, 其方向与梯度向量正交, 模与梯度向量相等。α为归一化系数, 对于24位RGB图像, α=255×3。
第二步 通过计算待修复块与候选样本块Ψq对应的已知像素的颜色差值平方和, 找出颜色差值平方和最小的候选样本块作为最佳匹配模块中的待填充像素, 用中对应位置的像素值进行填充, 实现结构和纹理的传播。
其中I、I'分别表示、Ψq中对应的已知像素点的颜色值。
第三步 更新填充像素的置信度参数值:
重复以上三步直至全部被填充。
2 对Criminisi算法的改进
由Criminisi算法的修复结果显示, 对湖岸、屋顶等位置的修复效果欠佳。究其原因, 是由于在计算信息量参数时, 所用的等照度向量是由分别计算RGB三个分量的梯度后进行简单的线性相加后再经过正交化之后得到的, 实际上就是彩色图像转化为灰度图像的梯度值。使用RGB模型表示图像是比较简单的, 适合于硬件实现, 但是RGB模型属于线性表示系统, 不能很好地适应实际人对颜色的解释, 另外RGB空间中两点的欧式距离与实际颜色距离不是线性关系, 容易导致颜色无法正确分离。
针对这一问题, 本文提出将图像映射到HSI色彩空间中, 分别计算它的色调梯度、饱和度梯度和灰度梯度, 令前两者作为后者的补充。为表述方便, 称之为HSI梯度。利用HSI梯度对信息量参数做出改进。
2.1 HSI色彩空间简介
HSI色彩空间是由美国色彩学家孟塞尔提出的[24], 反映了人的视觉系统感知色彩的方式, 该模型将亮度分量与色彩信息分开, 以色调、饱和度和强度三种基本特征量来对颜色进行表征。其中, 色调H (Hue) 与光的频域特性有关, 用于表示人对不同颜色的感受。饱和度S (Saturation) 表示颜色的纯度, 纯光谱色是完全饱和的, 加入白光会降低饱和度, 饱和度与颜色的鲜艳程度为正相关。强度I (Intensity) 对应图像亮度或图像灰度, 表示颜色的明亮程度。HSI模型的建立基于两个事实:一, 强度分量与彩色信息无关;二, 色调分量和饱和度分量与人对颜色的感受方式联系密切。HSI模型非常适合彩色特性检测与分析, 在图像处理方面有着很广泛的应用。
对于HSI模型, 颜色矢量与红色矢量的夹角表示色调分量, 颜色矢量的长度表示饱和度分量, 颜色矢量所在平面与下圆锥体顶部的距离表示强度分量, 即灰度分量给定一幅RGB彩色格式的图像, 每个RGB像素的H、S、I分量计算方法如下[24]:
色调分量:
其中:
饱和度分量:
强度分量:
RGB模型与HSI模型的对关系如图2所示。
2.2 对优先权值函数的改进
HSI梯度向量为:
其中, gradi表示灰度梯度, gradh表示色调梯度, grads表示饱和度梯度。灰度、色调和饱和度的计算方式在上文中已经做过介绍。λ, η为规范化因子, 一般取值为λ, η∈ (0, 1) , 本文中取值为λ=0.3, η=0.03。
为p点等照度向量, 其方向与梯度向量正交, 模与梯度向量相等:
图3为对蹦极图片分别进行灰度梯度和本文提出的HSI梯度提取图的对比。如图3 (c) 、 (d) 两图所示, 本文提出的HSI梯度对结构信息的表示 (例如湖岸部分) 更加充分, 将其引入到优先权值的函数中, 使得修复次序更加合理。
注: (a) 、 (b) 分别为原始图像和掩模图像, (c) 、 (d) 分别为灰度梯度图像和本文提出的HSI梯度图像, 可以看出本文的HSI梯度对结构信息的表示 (尤其是湖岸部分) 比RGB梯度更加充分
信息量参数的计算公式为:
优先权值的计算函数不变:
在D (p) 中, E[|grad (p) |]、V[|grad (p) |]分别表示待填充模块中已知像素p处的HSI梯度向量模的均值和方差。τ为一个规范化因子, 由于方差的值一般都远小于1, 因此τ取值一般都比较大, 在本文中取值为5。对于待填充块来说, 梯度向量的模分布在[0, 1]区间之内, 方差越大, 表示靠近区间两端的元素越多, 即已知区域包含有较大的均匀区域, 图像的杂乱性或随机性越少, 结构性较强;均值越大, 则表示已知区域中的相邻区域变化越剧烈, 包含的信息量就越大。修复的优先级就应该越高。
2.3 对最佳匹配块搜索的改进
Criminisi方法中, 在对每一个待填充块检索最佳匹配块时, 都要遍历整幅图像, 这导致了运算时间过长, 效率低下等问题。根据图像的邻域相似性[25], 可知待填充块的最佳匹配块就在其邻域内, 因此对最佳匹配块检索进行优化, 不再遍历整幅图像, 而是在以相邻的像素的子图像中的像素作为中心像素的像素块中进行检索。实验证明, 在修复效果没有受到明显影响的前提下, 运算速度得到了一定的提升。
2.4 改进算法的流程
1) 确定修复边界δΩ。
2) 计算边界δΩ上各点的修复优先权值, 对优先级最高的点, 对以其为中心的像素块进行优先修复, δΩt表示经过t次修复之后的修复边界。
3) 在以点为中心的50×50的区域内, 搜索使颜色差值平方和最小的像素块, 作为最佳匹配块
4) 对待修复像素块中的未知像素, 用最佳匹配块中对应位置的像素值进行填充。
5) 对新填充的像素进行置信度赋值:
6) 重复以上2) -5) , 直到
3 实验结果分析
本文使用了MATLAB 8.1进行了仿真, 硬件平台为Intel i74700+8 G RAM PC, 对Criminisi算法[12]、Wexler算法[13]、Guillemot算法[18]和本文提出的算法分别进行了仿真, 并对修复结果进行了比较。
图4为对图3所示的蹦极图片中蹦极人移除的实验, 图片的尺寸为像素。 (a) 、 (b) 、 (c) 分别为Criminisi算法, Wexler算法, Guillemot算法的修复结果, 可以看出他们在屋顶、屋檐下阴影处、房屋后的树林和湖岸位置都有不同程度的误差, 并且Wexler算法还造成了模糊失真; (d) 为本文算法的修复结果, 可以看出, 对上述问题都有了非常显著的改善。
图5为Criminisi、Wexler、Guillemot和本文算法对同一幅图像中前景人物移除修复效果的对比, 图片的尺寸为像素。图5 (a) 和 (b) 分别为原始图像和掩模图像, 图5 (c) 、 (d) 、 (e) 分别为Criminisi、Wexler和Guillemot算法的修复结果, 图5 (f) 为本文算法的修复结果。可以看出, Criminisi算法造成了结构上的较大失真, 而Wexler和Guillemot算法没有将结构信息作适当的延伸, 导致了非常明显的模糊现象, 该三种算法对此幅图像的修复效果都不够理想, 而本文算法的结果, 既保留了主要的结构信息, 又抑制了模糊的失真, 视觉可接受程度要高于前三者。
图6为Criminisi、Wexler、Guillemot和本文算法对同一幅图像中多目标移除修复效果的对比。图片的尺寸为像素。图6 (a) 和 (b) 分别为原始图像和掩模图像, 图6 (c) 、 (d) 、 (e) 分别为Criminisi、Wexler和Guillemot算法的修复结果, 图6 (f) 为本文算法的修复结果。由图中可以看出, Criminisi算法在台阶处和背景树木位置造成了结构上的失真, 而Wexler和Guillemot算法则在这些位置导致了比较明显的模糊现象, 该三种算法对此幅图像的修复效果都不够理想。而本文算法对台阶和树木的修复效果要优于前三者, 是一个可接受程度较高的修复结果。由此可见, 本文对多目标移除修复也能取得比较优秀的修复效果。
从峰值信噪比对两种方法做比较, 见表1所示。可知相比于Criminisi算法[12]、Wexler算法[13]和Guillemot算法[18], 本文方法提高了图像修复的PSNR值。
4 结语
针对RGB梯度无法提供充分的结构信息这一问题, 本文在Criminisi算法的基础上, 在计算待修复区域的信息量参数时将图像映射到HSI色彩空间, 用色调梯度、饱和度梯度和强度梯度的加权和 (称之为HSI梯度) 代替RGB梯度。在计算信息量参数时引入了HSI等照度向量模的均值和方差两种统计特性作为信息量参数的补充, 改善了待修复区域的填充次序的自动排列。在检索用于填充的最佳匹配块时, 根据图像的邻域相似性, 将检索区域控制在待修复区域一定的邻域内, 提高了运算速度。实验结果证明, 本文算法在单目标、多目标、纹理明显和结构明显等不同图像的修复上, 较之Criminisi算法和其他一些算法, 具有可接受程度更高的视觉效果。
摘要:针对Criminisi图像修复算法的修复次序没有充分利用图像结构特征等特点, 提出一种使用HSI颜色空间改进的基于样例的图像修复算法。通过在计算优先权值函数时将图像映射到HSI色彩空间, 引入色调梯度和饱和度梯度等概念, 并在信息量参数中引入梯度的均值和方差等统计量, 充分提取图像的结构特征, 使得修复次序趋于合理。另外, 通过利用图像的邻域相似特性, 减少了修复过程的运算量。对比实验结果表明, 该算法对各类图像的修复质量都有较好的改善。
HSI颜色空间 第2篇
在本实验中,北方小麦粉来自于新乡新良粮油加工有限公司,南方小麦粉来自于张家港市面粉食品有限公司。使用佳能扫描仪获得北方各等级小麦粉图像各取40幅图像,南方各等级小麦粉也各取40幅图像。因为小麦粉比较明显的特征是粉色和麸星含量,本文以此为基础对小麦粉的颜色特征进行提取,并结合K-means算法[2]和欧式距离设计小麦粉分类器。
1 小麦粉颜色特征提取
颜色特征空间的选取,不仅要满足人的视觉感知特点,还要便于计算机对其进行图像处理的相关操作。本实验获取的图片主要是以RGB颜色模型表示,而RGB颜色模型中各颜色间的距离与人眼睛感知的颜色距离有很大的偏差。但根据人的视觉特性,眼睛对颜色和亮度比较敏感,HSI颜色空间[3]中色度H代表颜色,饱和度S代表颜色深浅,亮度I代表颜色明暗程度,另外,在HSI颜色空间中图像处理和计算机视觉的算法都可以方便使用,并在很大程度上减少了图像分析和处理的工作量,所以HSI颜色空间比RGB颜色空间更合适。因此本实验使用HSI颜色空间来提取小麦粉的颜色特征。HSI颜色空间与RGB颜色空间转换关系如下:
取每个等级的小麦粉图像各30幅作为训练样本,使用HIS颜色空间对这180幅图像提取特征,各等级小麦粉颜色特征均值如表1:
2 小麦粉麸星含量
OTSU算法[4]是大津于1979年提出,是一种自适应的阈值确定算法,把图像分割成前景和背景两部分,因为其计算简单,不受图像亮度和对比度的影响,所以用其对小麦粉图像的分割,从而求的麸星含量。假设前景和背景的分割阈值为t,w0为前景点数占图像总点数的比例,u0为平均灰度;w1为背景点数占图像总点数的比例,平均灰度为u1。图像的总平均灰度为:u=w0*u0+w1*u1。从最小灰度值到最大灰度值遍历t,当t使得值g=w0*(u0-u)2+w1*(u1-u)2最大时,t即为分割的最佳阈值。利用OTSU算法对小麦粉图像分割后的效果图如图1所示:
取提取过颜色特征训练样本图像,使用OTSU算法对这180幅小麦粉样本图像进行分割,计算得到各个等级的小麦粉麸星含量均值如表2:
3 K-means聚类算法
k-means算法是基于距离的聚类算法,评价指标是使用两个对象距离的相似性,即距离越近,则两个对象的相似度就越大。输入聚类个数k和n个数据对象的数据库,输出满足方差最小标准的k个聚类。
k-means算法的工作流程:
1)输入个对象作为初始聚类中心,和个数据对象
2)寻找n个对象与聚类中心的相似度,进行聚类
3)计算新的聚类中心
4)直到以均方差为标准的标准测度函数收敛,否则重复步骤(2)和(3)。
小麦粉分为6个等级,所以K为6。本实验取每个等级的小麦粉图像为30幅作为数据库样本,所以数据对象n为180,K-means聚类算法求出180幅图像的六个聚类中心即为六个等级小麦粉图像的聚类中心。
4 小麦粉分类器设计
利用欧氏距离计算测试样本与各等级小麦粉聚类中心的距离,n维空间里的两个点A=(a[1],a[2],…,a[n]),B=(b[1],b[2],…,b[n]),A和B之间的欧式距离。取六个等级的小麦粉图像各10幅,作为测试样本,实验结果表明,分类器的正确率达到80%。
5 结论
本实验根据小麦粉的特点,利用图像处理中的HSI颜色空间提取小麦粉的颜色特征和OTSU算法提取小麦粉的麸星含量,基于K-means聚类算法和欧式距离设计小麦粉分类器,实验结果表明,利用HIS颜色空间和OTSU算法可以有效地提取小麦粉的特征,使得该小麦粉分类器的识别正确率达到80%,测试平均时间为5秒。从而使小麦粉精度识别不再受人为因素的影响,实现了检测过程的客观、科学和高效。本实验利用图像处理设计的小麦粉分类器达到了理想的分类效果。
摘要:小麦粉和大众生活息息相关,我国目前的小麦粉精度检测方法以目测为主,耗时长,且容易受到主观因素的影响。本文以图像处理和模式识别为基础,提取小麦粉的颜色特征和麸星含量,设计小麦粉分类器,对小麦粉精度进行自动识别,实验结果表明,该分类器对小麦粉精度的识别达到了理想的分类效果。
关键词:HSI颜色空间,OTSU算法,K-means算法,欧式距离
参考文献
[1]中华人民共和国国家标准.小麦粉加工精度检测GB/T5504—2011[S].
[2]赵蔷.基于PCA-K-means的卫星遥感图像的颜色特征提取技术[J].微电子学与计算机,2012,29(10):64-68.
[3]庞晓敏.基于HIS和LAB颜色空间的彩色图像分割[J].广西大学学报,2011,36(6):976-980.
基于HSI空间的车牌字符分割 第3篇
关键词:字符分割,颜色空间,车牌识别,投影
1. 引言
智能交通系统 (ITS) 是一个热点研究领域, 它把信息技术与交通系统结合在一起, 大大提高了交通效率和管制水平。其中车牌自动识别系统是智能交通系统的重要组成部分, 在交通管理方面有着重要的应用价值。传统上一般把车牌自动识别系统分为四个部分:图像采集, 车牌定位, 字符分割和字符识别。由于摄取的图像受到各种环境因素的影响, 在经过车牌的定位之后仍然会存在各种各样的噪声。因此, 准确地字符分割对于后面的字符识别环节有着直接的影响。
文章针对字符分割问题提出了一种基于色彩空间的车牌字符分割问题。由于在车尾的牌照中, 大型车和其他车的车尾牌照的字符的排列规则和车牌的大小规格并不一样, 因此我们在颜色空间中利用树形判决结构, 对车牌的类型进行判别。车牌字符的排列具有很强的规律性, 我们可以根据字符规则利用投影形成空格区向量, 通过搜索符合规则的向量准确分割车牌区域中的字符。
2. 车牌和字符的特征分析
目前国内的车牌为九二式车牌[1], 车牌和字符具有如下一些特征:
(1) 普通车牌一共有7个字符。第一个字符为汉字, 第二个字符为字母, 第三和第四个字符为字母或者数字, 后三个字符为数字。小型车辆的后车牌的样式为单层车牌, 其车牌的标准规格尺寸为440mm*140mm, 所有的字符外接矩形大小相等, 第二个和第三个字符之间间隔最大, 并且有一个间隔点, 其他字符间隔相等。大型车辆的后车牌样式为双层车牌, 其车牌的标准规格尺寸为440mm*220mm, 每层字符的大小分别相等, 上层两个字符偏小, 为正方形。
(2) 车牌颜色包括车牌字符颜色和车牌底色。车牌颜色种类少, 搭配固定。所有种类的车牌共有蓝色, 黄色, 黑色, 白色以及红色五种颜色。车牌字符区域的颜色对比度很强, 一般有黑底白字, 黄底黑字, 蓝底白字, 白底红字等。
(3) 在进行车牌图像采集时, 车牌区域的大小可能随着摄像机采集的角度的不同而有所变化, 但在交通系统的正常采集情况下, 摄像机与车牌基本垂直, 车牌区域的长, 宽, 高比例是固定的, 字符区域的长宽比, 字符间的间距和每个字符的长宽比也是基本固定的。这些可作为字符分割的一个先验知识。
3. 基于颜色空间判断车牌类型
一般的方法是用牌照颜色中的R, G, B分量的相对差值来判断牌照的颜色, 然而在实际环境中, 由于光线的变化 (太暗或太亮) 而导致了牌照RGB值变化, 在很多情况下会形成误判。
HIS模型用色度 (Hue) , 饱和度 (Saturation) , 亮度 (Intensity) 来描述颜色。色度描述出色的属性。饱和度给出一种纯色被白光稀释的程度的度量。亮度为图像的灰度值信息。这三个分量是独立的, 因此该模型可以在消除亮度影响的情况下提取彩色信息。从RGB模型到HIS模型的转换公式如下:
把H分量乘上180/!转化为0到360范围, 和圆周角度相对应。色度值H是区分颜色的主要依据, 在圆周上从0度开始依次为红色、黄色、绿色、青色 (Cyan) 、蓝色以及紫红色 (Magenta) 。黑色和白色用亮度值I区分。并且当饱和度S的值较低时, 用色度来区分颜色也是不可靠的, 饱和度为0时为白色。
根据上述分析本文把车牌颜色按照判断顺序分为两类:第一类为平均饱和度低的黑底白字或白底黑字;第二类为平均饱和度高的蓝底白字或黄底黑字车牌。根据实际情况, 我们判断已定位的车牌区域内像素点的颜色种类依次按照以下顺序:
对车牌类型判断为:定义一个变量n Type用于记录颜色的类型, 定义一个数组color Type用于记录每个颜色类型的像素点数量;对各颜色类型的像素数量进行统计, 由大到小进行排列;根据排列前两位的颜色确定车牌类型。
4. 车牌字符分割
车牌字符分割是指将车牌区域分割成各个单个的字符区域。如果某一列都是背景点, 这样的列我们定义为空格线, 由相邻的空格线组成的区域称为空格区, 非空格区域即有投影值的区域称为投影区。图1显示二值车牌的投影结果。
分析投影结果, 图像中存在相互间隔的投影区和空格区两个序列, 记录空格区的左右边界位置, 设为向量P。P= (p1, p2, ...pm) , 其中p2k-1为空格区左边界, p2k为空格区右边界, 空格区数量为m/2。每个投影区不都是字符, 投影区包括字符区域和非字符区域。这里存在两个情况:一是由于车牌左右边界不能精确到字符, 因而包含部分车身区域, 或者车牌污损, 产生非字符的投影区;二是由于光照条件、车牌污损或车牌褪色的影响, 可能造成车牌字符连结, 即多个字符只产生一个投影区。
分割车牌的步骤如下:
1) 图像预处理, 对车牌图像进行灰度化, 二值化, 用数学形态学[3]进行图像优化等一系列预处理;
2) 对车牌图像进行竖直投影。对大型车牌先进行垂直投影, 分割出上下两排车牌字符, 再对上下两排字符分别进行操作;
3) 合并空格区。这个步骤主要利用是利用一些字符规则的先验知识, 消除一部分非字符的投影区。二值图中的字符上下边界的最高点和最低点都是达到或接近车牌区域的上下边界, 高度过小的为非字符区域;字符的宽度为高度的1/2, 宽度过小的为非字符区域或字符"1", 但是字符"1"至少有一边存在较大的空格区, 因此, 宽度过小且两边都不存在可拓展空格的区域为非字符区域。调整向量p, 合并非字符区域两边的空格区为一个空格区。
4) 切分连结字符区域。扫描每一个连结字符区域, 设车牌高为Plate Height, 这里判断字符区域是否存在连结的宽度阈值T=Plate Height×0.8。寻找前后3列投影值之和最低的列进行切分, 然后继续寻找连结区域进行切分。
5) 拓展字符"1"两边空间。字符"1"是车牌字符中最特殊的字符, 其它字符的外轮廓宽度都等于外接矩形的宽度, 宽度约为高度的1/2, 字符"1"根据投影法产生的字符区域宽度仅有字符高度的约1/7至1/5 (字符微倾斜会导致宽度增加) 。设当前的投影区即字符区的宽度Cru Char Len=p2i-p2i-1+1, 字符区左边的空格区宽度Left Spqce Len=p2i-1-p2i-1+1, 右边的空格区宽度RightSpqce Len=p2i+1-p2i+1, 前一个字符区宽度为, 车牌高度为PChar Len=p2-2-p2i-3+1。从左到右检查字符区, 当前字符判断为字
三个条件。当判断为字符"1"后对字符区的宽度进行适当的调整。
6) 寻找正确的字符序列。普通小型车车牌的字符排列有个明显的特征, 即在发牌机关代号和注册编码, 即第二个和第三个字符间存在大空格区。
根据向量p求得两个序列, 空格宽度序列S= (s1, s2, ...sn) 以及字符宽度序列C= (c1, c2, ...cn) 。其中ck分别为sk空格的后一个字符 (k=1, 2, ...p) 。我们计算车牌7个字符中的6个空格。设i=1, 2, ...p, 在C中寻找这样的子序列Si以及Ci, Si= (si1, si2, si1, si3, si4, si5, si6) , 其中满足si2=max (sik) , k=1, ...6。当存在多个Si时, 计算Ci的方差
为ci平均值。!2最小的序列作为最终结果输出。
空格序列的计算结果如图2, 图中上一步的其它空格已被消除, 显示最终找到的子序列位置。根据这个子序列的空格分割出空格后面的字符位置, 得到我们所需的车牌字符图像序列。
普通大型车的黄牌和其它特殊车牌都有自己的字符规则, 同样可以根据字符规则找到正确的字符位置。
5. 实验结果及分析
本文测试的样本采用福州电子警察系统中实际拍摄的图片。图3为小型车牌分割后的结果, 图4为大型车后车牌分割后的结果。
在对实验结果进行分析测试中, 我们对1193张图片进行字符分割。结果53张图片未能正确分割出所有字符, 其中2张图片因灰度值太低未能分割到字符, 42张图片因字符模糊和车牌图片质量较差等原因只能分割出部分字符, 9张图片因不能准确定位而造成不能分割出准确字符。实验可得整个车牌的分割正确率为95.6%。
6. 结论
本文在HIS颜色空间上利用树形判决结构区分出不同型号的车牌, 解决了由于车牌结构不同带来的字符分割问题。使用基于字符排列规则的投影法对车牌进行字符分割, 能有效的对车牌进行字符分割。通过实验结果表明, 该方法能更准确, 清晰的对车牌图片进行字符分割, 并在实际系统的运用中取得了理想的效果。
参考文献
[1].中华人民共和国机动车号牌[S].中华人民共和国公共安全行业标准GA36-92.
[2].Rafael C.Gonzalez, Richard E.Woods著.阮秋琦等译.数字图像处理 (第二版) [M]北京:电子工业出版社, 2003.
[3].Mei Yu, Yong Deak Ki.An approach to Korean license plate recognition based on vertical edge matching[J].Systems, Man and Cybernetics, 2000IEEE International Conference on Volume4, 8-11Oct.2000Page (s) :2975-2980.
[4].Cheokman Wu, Lei Chan On et al.A Macao license plate recognition system[C].Proceedings of the Fourth International Conference on Machine Learning and Cybernetics, Guangzhou, 18-21August2005.
HSI颜色空间 第4篇
在国内,较小功率汽车使用的是蓝底白字牌照,大功率汽车所使用的是黄底黑字牌照,军用或警用汽车所使用的是白底黑字。本文的算法主要是针对在小功率汽车牌照的,但由于使用的是汽车牌照的边缘特征和几何特征等多重特征来进行定位,因此该算法也同样适用其他类型的牌照。
1 车牌自动定位算法
对于小功率汽车,牌照的主要特征是:蓝底白字、宽高比和丰富的边缘。由于汽车类型的多样性和背景的复杂性,任何一个特征都无法高识别率,高鲁棒性地定位车牌,因此必须综合各个特征。Shyang-Lih Chang[8]提出了把这些特征经过一定的模糊聚类集合到某一个算子上,再由该算子来确定车牌的候选区域。与单个特征相比,这个算子的识别率能有明显的提高。但考虑的气候变化与背景的复杂性,在很多情况下,可以由某一个特征定位出来的车牌,但有时该算法会定位失败。本文在该算法的基础上提出了多步骤定位车牌的算法:先根据车牌的HSI特征和宽高比来确定车牌的位置,如果定位失败,则利用车牌的边缘和车牌的宽高比来确定车牌的位置,如果仍未定位成功,则结合车牌的HSI特征图和边缘特征图,然后再利用车牌的多重特征来定位车牌。车牌定位算法的流程图如图1所示。
设R、G、B分别代表彩色图像的红色分量、绿色分量和蓝色分量,H、S、I分别代表彩色图像的色调、饱和度和亮度。根据文献[2]可把RGB空间到HSI空间。
如R、G、B已归一化到范围[0,1],则计算出来的H、S、I的值也在[0,1]之间。如前所述,由于复杂的背景,车牌颜色与车身颜色的相近和光照变化等原因,因此,H、S、I的任何一个特征都无法准确定位车牌,但可以把这些特征结合起来形成一个算子来对车牌进行较准确的定位。因此从HSI的分量图上可以分别得到各自的特征图,这些特征图都是灰度图。比如对于蓝底白字的车牌,在H特征图上,色调是蓝色的部分其灰度值最大,离蓝色越远的色调其灰度值越低,黄色像素的灰度最低。在S特征图上,由于车牌的蓝色部分的饱和度很高,所以饱和度越高的像素其灰度值越大。在I特征图上,车牌的白字部分其亮度值很高,因此亮度越高的像素其灰度值也越大。然后把三幅都是灰度图的特征图按照它们区分车牌区域与其它部分的能力映射的一幅灰度图上,再根据灰度值的大小就可以确定车牌的候选位置。在这些候选的车牌位置中,利用车牌的宽高和特征和来进一步筛选车牌位置。如没有找到车牌位置,则考虑利用车牌的边缘特征来定位车牌。
摄像机获得的图像是彩色图像,很多车牌定位算法先把彩色图像转换为灰度图像,再在灰度图像里寻找边缘。考虑到我们只需要定位车牌,也就是说只需要集中寻找车牌的边缘,因此可以考虑直接利用彩色图像的边缘来定位,如蓝白边缘、黄黑边缘和白黑边缘。以小功率汽车车牌的蓝底白字为例,先提取车牌的RGB分量,并进行归一化。理论上讲,白色像素的(r,g,b)值应该是(1,1,1),而蓝色像素的(r,g,b)值应该是(0,0,1)。它们的差(Δr,Δg,Δb)是(1,1,0),或是(-1,-1,0),因此,白色像素和蓝色像素的红色分量的差与绿色分量的差应该具有相同的符号,而蓝色分量的幅度应该小于红色分量的幅度和绿色分量的幅度。这个性质应该在各种环境下都是相当稳定的。也就是说只要是蓝白的边缘都应该具有这个性质。同样,对于黄黑边缘,黄色像素的(r,g,b)值应该是(1,1,0),黑色像素的(r,g,b)值应该是(0,0,0),不难发现,黄黑边缘的像素与绿白边缘像素具有同样的性质。这给我们的检测带来很大的方便,因为这个性质同时符合小功率汽车和大功率汽车的牌照。因此如果一个像素与它的边缘像素符合下列两个条件:(1)sign(Δr)=sign(Δg),(2)|Δb|<|Δr|且|Δb|<Δg|,则该像素被认为是蓝色像素与白色像素的边缘点或是黄色像素与黑色像素的边缘点。并存储min{|Δr|,|Δg|}作为边缘的幅度,为下面计算边缘的特征图使用。对于黑白边缘,黑色像素的(r,g,b)值是(0,0,0),白色像素的(r,g,b)值是(1,1,1),因此,如果一个像素与它的边缘像素符合sign(Δr)=sign(Δg)=sign(Δb),则认为该像素是黑白边缘的像素。并存储min{Δr,Δg,Δb}作为边缘的幅度,不是边缘的像素,其像素值为零。
2 算法的实现
为了加快算法的运算速度,先调整图像的大小,再把图像转换成HSI格式[9]。然后根据车牌的特征分别得出三个分量的特征图。由于同一个车牌在不同环境下,由不同的摄像机所得到的图像数据有很大的不确定性。因此在算法的实现中必须要考虑到这个不确定性。在这里我们用模糊融合来处理这个不确定性。对符合车牌特征的像素其亮度值更大。
2.1 H特征图
对于车牌的蓝色背景,H特征图是对应与H分量图上蓝色像素的值,它的值最大,离蓝色越远,值越小。可由下面的公式导出H特征图。
a是正的常数,在本算法实现中取3。hb是蓝色的归一化h值,约等于0.666 7。这样在H特征图上与hb一样的值,它的值是1,与hb相差越大,值越小。根据不同的a值有不同的下降速度。
2.2 S特征图
纯蓝色的饱和度应该是1,车牌底色是饱和度很高的蓝色,这些像素的饱和度应该接近于1。先把S分量图进行一定的对比度拉升,再利用下面的公式得到S特征图:
式(2)表明饱和度越高的像素是车牌的可能性就越大。
2.3 I特征图
H特征图和S特征图都是针对车牌的底色而言,尚未考虑字的颜色。对于小功率车牌是白字,对于其它车牌是黑字,若希望在I特征图上白色和黑色部分都能显示出高亮度的灰度值,可以利用下面的公式:
i是整幅图像的灰度平均值。黑色与白色是整幅图像亮度的两个极端,这个式子表明,在整幅图像的低亮度和高亮度部分,是车牌的可能性比较大。
2.4 模糊集合
每一幅特征图都对输入图像的车牌位置提供了一定的信息。有两种方法可以从这三幅图像中得出车牌的可能位置。第一种方法是从每一张特征图上寻找车牌的可能位置,然后从三幅特征图中的所有可能位置得出车牌的位置。第二种方法是先把这三幅图按照不同的比例合并成一张图,然后从这张图上得出车牌的位置。本文采取第二种方法,因为该方法省去在每一幅特征图上计算车牌阈值,且在总特征图上也能较准确的定位车牌。总特征图由三幅特征图的模糊融合,接下来是如何决定每幅图的系数。假定H特征图、S特征图、I特征图的系数分别为Ch、Cs和Ci。则总特征图为:
在每一幅特征图上,像素的灰度值越大表明车牌位置的可能性越大。但对于属于蓝色色调车身的小功率汽车(如浅蓝色),它的H特征图里绝大部分像素的亮度值非常高,所以用这幅特征图来确定车牌的位置的重要性不是很大。所以在这种情况下,H特征图的系数应该较小。再假如对于红色车身的汽车,它的S特征图里绝大部分像素亮度值非常高,所以在这种情况下,S的特征图的系数应该比较小。又如,在雨天或者晚上拍摄的图像,由于整个图像的亮度值较低,导致整个图像的饱和度值增加,像素间的亮度值变化较小,导致在S特征图和I特征图里大部分像素的值都非常高,在这种情况下,这两个特征图的系数都应该较小。综上所述,系数的大小是由特征图上具有高亮度值的像素的多少来决定。高亮度的像素越小,该特征图的系数就应越大,对于确定车牌的位置的意义也越大。因此,我们先对每幅特征图进行二值化,再根据二值图中白色像素的总数占整幅图像的比例来决定系数。因此采用式(5)来计算系数
M、N分别是图像的大小,aij是像素值,t是阈值。t=(amax+amin)/2,amax和amin图像像素的最大值和最小值。
从公式(8)得到的系数代入公式(7)中可得到总特征图g,对g进行归一化、二值化、形态学等一系列操作可以得到车牌的候选区域,再根据车牌的宽高比等特征对这些候选区域进行筛选,如果结果只有一个连通区域,则认为已经找到车牌,如果有多个连通区域或全部像素值都是零,则认为通过HSI定位失败,然后程序转向从车牌的边缘特征来定位车牌。
2.5 E特征图
H、S、I特征图是针对车牌区域的每一个像素的,尚未考虑边缘等特征。其实车牌区域具有最丰富的边缘。因此如果利用HSI特征图没有准确定位车牌位置,则可以利用车牌的边缘来定位。车牌的彩色边缘幅度越大,属于车牌区域的可能性就越大。与车牌背景和前景相比,边缘的像素个数比较少,而且往往是孤立的,为了不被腐蚀掉或因为连通区域的像素数太少而被误去掉,本文利用附近水平方向的像素的边缘幅度一起来求某一点的边缘特征值。因此可用式(6)来定义E特征图:
(6)式中Np是在求像素p的特征值时在水平方向的范围,ek是Np内像素k的边缘幅度,dpk是像素p和像素k的欧几里德距离。需要说明一下,式(6)不考虑像素本身的边缘幅度值,否则式(6)中像素p的边缘幅度值的权重太大,不利于后面的分割。
如果E特征图也无法准确定位车牌,那么就考虑用HSI的总特征图和E特征图结合起来对车牌定位,利用公式(5)求出它们各自的系数。
3 实验结果
为了验证所提出算法的有效性,本文对200幅图像进行了测试,图2是对小功率汽车的车牌定位。在图2中,本算法先利用车牌的HSI特征图来定位,但没有成功,然后通过它的边缘特征来定位,定位成功。
4 结束语
本文根据车牌的HSI特征、边缘特征和尺寸特征等多重特征,提出一种定位车牌的综合算法。本文对200幅图片进行测试,只有9幅定位不准确。在对算法速度要求不高的场合,如果要进一步提高定位的准确率,可以在定位失败的情况下通过修改参数或其他算法来定位。
摘要:首先把图像的RGB空间转换成HSI空间,根据车牌区域在HSI空间的特征并结合模糊集合理论可分别得到H特征图、S特征图和I特征图。如果根据这三幅特征图定位车牌失败,则根据车牌的彩色边缘得到边缘特征图。如果边缘特征图也无法定位车牌,则把HSI特征图和边缘特征图结合起来再对车牌重新定位。进行的实验中共有200辆车辆图像,只有9辆定位失败,准确率达到95%。
关键词:车牌定位,HSI空间,边缘检测,模糊集合
参考文献
[1]Anagnostopoulos C N,Anagnostopoulos I,Loumos V,et al.A license plate recognition algorithm for intelligent transportation system appli-cations.In:IEEE Transactions on Intelligent Transportation Systems,2006:377—392
[2]Li Gang,Yuan Rongdi,Yang Zuyuan,et al.A yellow license plate lo-cation method based on RGB model of color image and texture of plate.In:Digital Object Identifier,2007:42—46
[3]Li Jia,Xie Mei.A color and texture feature based approach to license plate location.In:Digital Object Identifier,2008:376—380
[4]Wang Feng,Man Lichun,Wang Bangping.Fuzzy-based algorithm for color recognition of license plates.In:Pattern Recognition Letters,2008;29(7):1007—1020
[5]Lin Chienchou,Huang Wenhuei.Locating license plate based on edge features of intensity and saturation subimages.In:Proceeding of the2007Second International Conference on Innovative Computing,In-formation and Control,2007:227—227
[6]Zhao Jiyin,Zheng Ruirui,Li Min,et al.License plate recognition based on genetic algorithm.In:Proceedings of the2008IEEE Inter-national Conference on Computer Science and Software Engineering,2008:965—968
[7]Faradji F,Rezaie A H,Ziaratban M.A morphological-based license plate location.In:Proceedings of the2007IEEE International Con-ference on Image Processing,2007;I-57-I-60
[8]Chang Shyanglih,Chen Lishien,Chung Yunchung,et al.Automatic license plate recognition.In:IEEE Transactions on Intelligent Trans-portation Systems,2004:42—53
HSI颜色空间
声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。如若本站内容侵犯了原著者的合法权益,可联系本站删除。


