电脑桌面
添加盘古文库-分享文档发现价值到电脑桌面
安装后可以在桌面快捷访问

人体检测与跟踪

来源:漫步者作者:开心麻花2025-09-191

人体检测与跟踪(精选9篇)

人体检测与跟踪 第1篇

传统的人体检测与跟踪技术主要实现一台摄像机中的单个人体的检测与跟踪, 而对于单摄像机中多个人体的检测与跟踪, 由于容易受到遮挡等因素的干扰, 往往造成人体的漏检和跟踪错误。提出了一种遮挡情况下的人体检测与跟踪算法。针对遮挡情况的人体检测, 采用RGB颜色模型和均值漂移算法, 提取人体头肩轮廓特征, 结合神经网络分类器进行人体检测。针对单摄像机拍摄视角的局限性, 采用三台摄像机实现多视角人体跟踪, 利用映射关系找出遮挡人体的跟踪位置, 完成遮挡人体的跟踪。

1 人体检测

人体检测是实现人体跟踪的前提。摄像机视频中的运动目标除人体外, 可能包含车辆, 宠物, 飞鸟等运动目标, 目前常用的人体检测方法有HOG描述特征与SVM分类器相结合, 基于粗集的人体识别和基于轮廓特征与神经网络分类器相结合的方法等。其中HOG描述特征与SVM分类器相结合的方法由于图像的HOG特征向量维数较大, 同时SVM训练样本多, 使得计算量相对较大, 人体部件逻辑的人体识别采用决策树的思想对人体服饰、肢体等信息进行归类, 同时需要与标准人体做匹配, 适用于独立人体的识别, 而无法满足遮挡频繁的行人检测。本文采用基于轮廓特特征与神经网络分类器相结合的人体检测方法, 该方法计算量小且有较高的识别率。通过观察可见, 人体头肩部位被遮挡的几率较低, 可以提取头肩轮廓的特征信息作为人体的描述特征。由于头肩轮廓特征的维数较低, 可采用神经网结构进行分类, 计算量小, 满足系统实时性的要求。

傅里叶描述子[7,8]通常用来描述轮廓特性, 由轮廓点的傅里叶变换获得。以轮廓某一位置 (x0, y0) 为起始点, 按照逆时针的方向获得曲线的轮廓坐标Z (m) = (xm, ym) , m=0, 1, …, N-1, 在复平面上, 轮廓可以表示为p (k) =x (n) +jy (n) , n=0, 1, …, N-1。对轮廓做傅里叶变换,

为了使傅里叶描述子与起始位置无关, 文献[9]对傅里叶描述子做了归一化处理,

称d (k) 为归一化傅里叶描述子, 具有平移、旋转和缩放不变性。

混合高斯分割出的运动目标经过预处理得到目标的二值图像, 按照文献[3]的方法, 提取头肩模型。将轮廓的坐标点按照逆序排列, 根据式 (1) 和式 (2) 计算傅里叶变换, 变换后的系数归一化后得到头肩模型的傅里叶描述子。

神经网络分类器是一种低阶多项式结构, 通过不断更新权值以满足输出的要求, 适用于低维特征向量的分类。文献[10]提出了基于L-M算法的BP神经网络分类器, 其训练次数少而分类准确度高。头肩模型的傅里叶描述子通过神经网络分类器, 分类出人体和非人体。

遮挡情况下, 混合高斯分割出的目标包含人体等多个目标, 利用文献[3]的方法得到的头肩轮廓由于可能包含多个人体而产生畸变, 最终导致分类错误。为解决这个问题, 采用头发模型和均值漂移聚类[11]的方法, 对目标区域进行多人体聚类。

首先, 利用设置RGB颜色阈值, 阈值满足头发颜色, 如褐色, 黑色和金色, 对目标区域分割出多个满足阈值的小区域, 称作头发模型。以头发模型为基准, 其宽度近似为头部宽度, 按照标准人体比例估计头肩模型的高度H, 再以头发模型的三倍宽度记为宽度W, 在以H和W组成的矩形区域内利用均值漂移算法进行聚类。均值漂移算法依赖于全体采样点信息, 适用于任何形状的图像分布。首先要把聚类范围内的像素转化为由空间信息和色彩信息构成的采样点。采用均值漂移算法对聚类范围内的像素点进行聚类的具体做法如下:

(1) 将目标图像像素空间转化为特征空间中的5维采样点X, X= (x, y, r, g, b) , X是由目标图像的空间信息和色彩信息组成的特征向量;

(2) 以头肩模型聚类范围内, 除背景以外的每一采样点X为圆心, 以搜索带宽h为半径, 计算圆内所有采样点的均值, 计算方法如式 (3) 所示。

式 (3) 中, Xi是圆内除采样点X以外的采样点, n是圆内除采样点X以外的采样点的总数, g (X) =-k' (X) , h为初始化带宽。k (X) 是积分方差MISE准则下的核函数[5];

(3) 计算均值漂移向量, 计算方法如式 (4) 所示。

式 (4) 中, Mh (X) 是均值漂移向量, X是当前采样点, Mh (X) 是采样点X的均值;

(4) 判断均值漂移向量‖Mh (X) ‖<ε是否成立, 若成立, 停止计算, 若不成立, 则以均值mh (X) 为圆心, 重复步骤 (2) 和步骤 (3) , 直到均值漂移向量‖Mh (X) ‖<ε, 停止迭代。获得采样点X的收敛向量mh (X) ;

(5) 判断各个收敛向量的空间信息和色彩信息之间的欧氏距离, 满足阈值的采样点归为一类;

(6) 保留满足人体结构的类, 按行提取各个类型的列最大值和列最小值, 得到人体头肩模型的初始轮廓, 利用三次样条差值, 对初始轮廓间断处进行平滑处理, 获得完整的人体头肩轮廓。对于目标区域的多个头肩轮廓, 分别计算轮廓的傅里叶描述子, 参与分类。

2 粒子滤波人体跟踪

三台摄像机分别对检测到的人体目标做跟踪处理。由于人体运动是一种非线性非高斯系统的运动, 因此采用适用于非线性非高斯系统的粒子滤波器对人体进行跟踪。粒子滤波器[12]是采用一系列蒙特卡洛方法, 利用粒子权重{wk (Xkt) , k=1, …, N}估计后验概率公式p (Xt|T1:t) ,

通俗来讲粒子滤波器的基本思想是, 首先获取目标的描述特征, 然后在搜索范围内均匀撒点, 每个探测点反馈当前的描述特征, 判断是否满足目标的描述特征, 依据其与目标描述特征的相似度重新分配探测点的权重, 对与目标描述特征相似度大的区域增加探测点的数目, 反之减少探测点的数目, 直至找到与目标描述特征最相似的位置, 即目标位置。

具体做法如下。

STEP1:初始化权重, 所有像素的权重相等,

STEP2:采用颜色分配模型来描述目标[5]。定义长轴和短轴分为Hx、Hy的椭圆为搜索窗口, 生成目标的颜色分布向量, N是搜索窗口内的像素个数, 用来调整搜索窗口大小, 边缘处的颜色容易受到背景或遮挡的影响, 为了减弱边缘对结果的影响, 给边缘像素分配较小的权重, 函数表明, 离搜索越远对结果造成的影响越低。R是归一化系数, 确保。得到t时刻的搜索区域的颜色分布向量

STEP3:计算t时刻和t-1时刻特征向量的巴氏距离[13], 。更新权重

Step4:获得目标位置

3 遮挡情况下人体跟踪

3.1 单应映射

平面的单应映射被定义为从一个平面到另一个平面的投影映射。摄像机获取的图像平面与世界坐标系中的水平面可以通过单应性矩阵相联系[14]。

X表示世界坐标系中水平面的坐标向量, x表示图像平面的坐标向量, H表示单应性矩阵, 是一个3×3的矩阵。单应性矩阵可以通过两个平面的四组匹配点对求取。

单应映射是平面之间的映射, 摄像机拍摄的图像中, 大部分像素不在同一个平面上, 无法获得两幅图像之间的单应映射关系。但是图像中的地面区域近似为平面, 每两幅图像之间的地面区域存在单应性关系, 因此可以将图像中的地面作为主平面, 获取每两幅图像关于主平面的单应矩阵。经过单应映射后, 地面以上的物体由于不满足单应性, 其映射投影将产生畸变, 但是同一物体的单应映射投影在主平面上相交, 相交区域的中心点可以作为多摄像机针对同一物体在主平面上的公共模型[15]。单应矩阵的可以通过两个平面之间的匹配点获得, 匹配点对最少需要4组, 可以采用NCC算法计算每两幅图像的地面区域的匹配点对。

3.2 遮挡情况的目标跟踪

人体目标的遮挡主要有人体与人体间的遮挡和人体与背景之间的遮挡两种形式。对于单摄像机, 无法对图像平面上存在遮挡的目标进行定位, 使用多摄像机可以解决这个问题。

摄像机标记为C1、C2、C3, 以Ci图像中的地面为主平面, Cj关于主平面的单应矩阵为Hij。例如以摄像机C1中地面作为主平面, C2、C3在主平面的投影如图 (1) 所示。蓝色阴影和黄色阴影分别为C2和C3的映射投影。经过单应映射, 三幅图像的地面部分相互重合, 地面上的人体交汇于主平面上的共同点。

存在遮挡的情况下, 以图2为例, 对单摄像机C1来说, 人体A被严重遮挡, 对跟踪造成了困难, 而对摄像机C2和C3来说, 人体A没有被遮挡。其中利用粒子滤波器, 摄像机C2和C3中的人体A获得跟踪结果分别是X2A和X3A。

经过单应映射后, 同一个人体在主平面上相互重合, 同一个人体的人体的中轴线将相交于主平面上的一点。l1、l2和l3分别是C1、C2、C3中人体A的中轴线的单应映射, 交点O即人体A在主平面上的位置。O点经过反向单应映射, 可以确定该点在摄像机C1、C2、C3中的位置为O1、O2和O3, 进而确定摄像机C1、C2、C3中人体A的高度H1、H2和H3。人体A被确定在高宽为Hi、Wi的矩形内, i=1, 2, 3。分别计算摄像机C2和C3的跟踪位置X2A和X3A在对应矩形内的位置比例有

计算摄像机C1中人体跟踪位置在矩形内的比例有

最后, 根据摄像机C1中人体A的比例关系, 确定跟踪结果X1A。

4 实验结果

算法以MATLAB为开发平台, 人体识别部分训练样本和测试样本均来自于索尼HDR-CX390E摄像机拍摄的室外视频, 视频分辨率为1 440×1 080, 调整视频分辨率为800×600, 25帧/s。采用带动力的梯度下降法训练神经网络, 输入层、隐层和输出层分别设置为7, 15, 1, 对200组训练样本进行训练, 训练时间为0.05 s, 网络性能达到3.43×1011, 对每个摄像机视频中的某200帧图像进行测试, 人体检测结果如表1所示。

录制视频前, 在地面上标记6个点, 用来计算地面之间的单应矩阵。单应矩阵的准确性由匹配点对决定, 首先依次手动选择6个点, 然后采用NCC算法精确匹配点对。C1和C2、C1和C3的单应矩阵分别为

部分帧的跟踪结果如图3-图5所示。

在跟踪方面, 由于利用了三台摄像机之间的映射关系, 发生遮挡的人体经过其余两个视角的辅助可以得到准确定位, 从而降低了由于遮挡带来的跟踪失误。该算法与文献[5]所述的传统的基于单摄像机的跟踪算法做了比较。取视频中的300帧, 采用文献[5]方法, 分别对左中右三个角度的视频做跟踪处理, 与本文的跟踪结果进行比较, 结果如表2所示, True positive rate表示正确跟踪目标的比例, 可见, 本方法很大程度地提高了跟踪效率。

5 结论

本文对当前计算机人工智能方面的热点问题人体识别与跟踪算法进行了研究, 并提出利用多摄像机进行改进的方法, 能够有效地提升人体检测的识别率和追踪的准确性, 对复杂环境下人群的人体检测有较好的鲁棒性。本文的方法可以应用于地铁、商场等人员密集的大型公共场合, 能够实现人员准确的检测与跟踪, 有很好的应用前景。

摘要:人体检测与跟踪技术在智能视频监控中有很好的应用价值。提出了一种遮挡情况下的人体检测与跟踪算法。人体检测部分, 利用RGB颜色模型与均值漂移算法, 从混合高斯分割出的含有遮挡人体的目标中提取多个人体头肩模型, 计算人体头肩模型的轮廓特征。采用傅里叶描述子与神经网络分类器实现人体检测。人体跟踪部分, 采用基于颜色线索的粒子滤波器作为基本的跟踪算法, 为了解决遮挡问题, 采用三台摄像机实现多视角跟踪人体, 利用三台摄像机之间关于主平面的映射关系确定遮挡人体的跟踪结果。该算法提高了人体检测的准确率和人体跟踪的可靠性, 可以广泛应用于复杂环境中的多个人体的检测与跟踪。

一种新的运动目标检测与跟踪算法 第2篇

一种新的运动目标检测与跟踪算法

常用的.运动目标检测算法无法解决在摄像机运动-目标运动情况下的运动目标检测,为此提出了背景匹配法.通过相关匹配算法使背景对齐,结合帧间差分技术有效地将运动目标提取出来;然后利用卡尔曼预测器对运动目标在图像中的位置进行预测,结合增量式带死区的PID控制算法,控制摄像机对准目标.实验结果表明,匹配块的选择加快了处理速度和提高了算法的稳定性,卡尔曼预测器使得跟踪更为平稳可靠.本方法具有简单、通用、抗噪等特点.

作 者:潘锋 王宣银 向桂山 梁冬泰 作者单位:浙江大学,流体传动及控制国家重点实验室,浙江,杭州,310027刊 名:光电工程 ISTIC PKU英文刊名:OPTO-ELECTRONIC ENGINEERING年,卷(期):32(1)分类号:V556 TP391.4关键词:目标检测 目标跟踪 背景匹配 卡尔曼预测器 PID控制

人体检测与跟踪 第3篇

运动目标的检测和跟踪是计算机视觉研究的主要问题之一,它融合了图像处理、模式识别、自动控制、人工智能及计算机等许多领域的先进技术,在无人机视觉导航、视频监控、医疗诊断、智能交通等方面都有广泛的应用。在此主要围绕这两个方面的内容展开研究。

运动检测的目的是从序列图像中将变化区域从背景图像中提取出来,运动区域的有效分割对于目标分类、跟踪和行为理解等后期处理是非常重要的。然而,由于背景图像的动态变化,如天气、光照、影子及混乱干扰等影响,使得运动检测成为一项相当困难的工作。在此,只研究在背景静止状况下的人的运动[4]。

所谓跟踪,就是对图像序列中的运动物体,通过提取它的某些特征,并且把这些特征从一幅图像到另一幅图像匹配起来,这个过程叫作跟踪。运动跟踪主要通过建立目标链来实现,目的是获得运动物体的运动轨迹。如果把所有的这些图像重叠起来,就可以得到这个运动物体的运动轨迹,所以运动物体的跟踪也可以看作是对运动物体的运动状态进行估计。

本文主要利用基于背景剪除方法检测出运动目标,然后利用Kalman滤波实现运动估计与跟踪。

1 人体运动检测原理及具体实现

在本文中,由于系统的实时性、稳定性等可实现性问题,根据行人检测系统对实时性的要求,这里采用背景差法提取运动行人。算法主要包括图像预处理、背景提取、动态选取阈值和运动行人分割等。基本流程图如图1所示。

背景差分法是利用视频图像中每一帧图像与确定的背景图像相减,比较其中的偏差得到运动区域,并通过阈值化差分图像检测出运动物体,求取运动行人。背景差分方法是以固定摄像机为前提条件,该方法很大程度上依赖于背景图像的可靠性,背景图像需不断地被更新,以迎合环境光线、阴影和天气的变化等。背景更新中的误差累计和光线变化是影响背景差分法精度的主要因素。它可用式(1)描述。

d(x,y)={0,|f1(x,y)-f2(x,y)|<Τh1,(1)

式中:f1(x,y)为输入图像帧;f2(x,y)为背景图像帧。如果输入图像帧中不含行人,则与背景图像帧相同,此时d(x,y)=0;相反,如果输入图像帧中包含行人,则与背景图像帧不同,此时根据阈值Th的大小判定d(x,y)可能不为0。下面是目标检测流程中用到的方法。

1.1 图像预处理

图像预处理主要用于消除图像的基本噪声、增强图像对比度等,以改善图像质量,使图像变得较为清晰,以便后续处理和分析,如图像分割等。

对图像滤波方法的选择取决于噪声与图像的关系以及处理的具体要求,图像常被强度随机信号(也称为噪声)所污染。考虑到实际场景图像中的噪声特性,这里主要采用高斯滤波法,来滤除图像中包含的高斯噪声。

1.2 背景提取

背景图像为不含前景目标的场景图像。这里采用自适应背景提取方法,即首先将输入的第一帧图像作为原始背景,从第二帧开始对当前帧间差分图像进行二值化处理,由二值图找到运动区域和非运动区域[2]。为了消除纹理相似的前景交叠区域作为背景提取的不足,这里采用的方法中引入了数学形态学运算对帧差分图像的进一步处理,准确提取出非运动区域;然后用当前帧图像中的非运动区域部分更新当前背景图像,而运动区域部分的背景图像则保持不变,经过一定数量图像的迭代便可提取出背景。

1.3 运动行人分割

在采用背景差法检测运动行人过程中,除了得到清晰的背景图像之外,选取合适的阈值也是准确分割出运动的行人中至关重要的一步,是运动行人检测的一个重点和难点。由于场景中背景基本无动态变化,且行人的服装颜色与背景差别较大,经反复实验,人工确定动态图像序列中差分图像二值化的阈值为30(灰度值)。

1.4 提取运动区域

分割后的连通区域受噪声影响很大,图像中存在一些小的噪声干扰点,这些干扰的存在必然影响行人检测的质量。首先,对二值化之后的图像进行中值滤波,消除小的噪声;然后,采取数学形态学处理中的腐蚀和膨胀算子对二值图进行操作,去除噪声前景点和填补目标区域的小孔,从而得到行人较为清晰和完整的轮廓,如图2所示。

图2为两人面对面行走的图像。对得到的差分二值图像进行标记,显示出检测到的运动目标(人)。用行人的外接矩形表示检测到的行人轮廓,矩形的四个边分别表示行人的上下左右四个边界位置,矩形的中心位置即为检测出的行人位置。

从行人通行情况下的检测效果图来看,效果比较明显,可以准确检测到场景中运动的行人。但是由于运动产生的噪声因素影响,轮廓有时不是十分准确。

2 目标跟踪关键技术分析

运动跟踪主要通过建立目标链来实现,目的是获得运动物体的运动轨迹。如果把所有这些图像重叠起来,就可以得到这个运动物体的运动轨迹,所以运动物体的跟踪也可以看作是对运动物体运动状态的估计。

在此,选用基于Kalman滤波的运动跟踪系统,通过估计出运动目标的下一位置,对运动目标进行实时跟踪[3]。

在处理每帧图像的过程中,提取并记录每个目标对应的位置信息,可以利用这些检测出的位置信息对行人的运动进行预测,预测出行人目标在下一帧的位置,对运动行人进行连续检测和跟踪。最后,根据图像序列中依次确定的目标位置,得到行人的运动轨迹。

2.1 行人的运动预测

运动预测通常利用了运动的连续性约束和平滑性约束。运动的连续性约束是指相邻帧间目标的运动位移很小,运动的平滑性约束是指相邻帧间目标的运动不会发生突变。因而当起始帧目标的位置标定完成以后,可以通过前几帧的检测结果来估计新一帧图像中目标的位置,从而简化对后续帧目标的检测,加速对目标的识别[4]。

在对行人跟踪过程中,需要在图像序列中连续不断地检测到行人,如果对每帧图像的处理都采用搜索整幅图像的方法,则系统的处理速度必然得不到保证[5];同时在行人的检测过程中,图像中同时出现的两个行人在运动过程中也经常发生相互间遮挡现象。由于这些问题的存在,为了提高系统的实时性和解决目标短时间内被遮挡时的跟踪问题,可以考虑采用运动预测的方法对被遮挡目标的位置加以估计,利用预测的目标位置继续跟踪目标,达到实时检测和连续跟踪运动行人的目的。

2.2 Kalman滤波在运动目标跟踪中的应用

Kalman滤波以其实时性较好而得到了广泛的应用,在此选用Kalman滤波进行运动估计。

在视频监控中对运动物体进行跟踪时,最简单的方法是利用空间、时间特性来描述运动目标,采用基于像素的区域搜索匹配方法进行目标的运动预测和判别,该方法只有目标在两个连续帧的运动变化很小时才适用,当目标运动发生跳跃变化或受到其他因素干扰时,如被其他物体遮挡或在视频传输时发生丢帧现象,则算法便会失败。

基于Kalman滤波的目标跟踪是将运动目标的运动模型看作是一个Kalman滤波器模型,根据运动目标的运动历史预测它在下一帧中的位置信息。目标跟踪过程中Kalman循环滤波的过程如图3所示。

首先在进行时间分析处理时,不需要定义一个精确的运动模型,它能够通过一个简单的运动学模型有效地跟踪真实对象的运动轨迹;其次,Kalman滤波算法是一种基于运动学模型的反馈结构算法,当运动目标发生跳跃变化时,可以根据对象以前的运动轨迹和运动模型继续对其运动进行预测[6]。当这些对象再次在场景中出现时,可以帮助跟踪系统识别这个对象。Kalman滤波在运动目标预测中的具体实现如下:

X表示目标状态向量,(x,y)和(vx,vy)分别为目标特征点在图像中的坐标位置和运动速度,则X=(x,y,vx,vy)T,若Y=(x,y)T表示观测向量。根据Kalman滤波理论,建立的系统状态估计Kalman滤波模型如下:

状态方程:

X(k)=A(k|k-1)X(k-1)+w(k-1)(2)

观测方程:

Y(k)=Η(k)X(k)+v(k)(3)

式(2)和式(3)中:A(k|k-1)为从k-1时刻到k时刻系统的状态转移矩阵;H(k)为观测矩阵;w(k-1)和v(k)分别为零均值的系统噪声向量和观测噪声向量,其中:

A(k|k-1)=[10100010000100001](4)Η(k)=[10000100](5)

假设两个人做匀速直线运动,通过计算得知每个人的运动速度,则根据离线实验可得初始状态的预测误差协方差矩阵P、系统噪声向量w(k)和观测噪声向量v(k)的协方差矩阵Q,R分别为:

Ρ=[100000010000002500000]Q=[4000040000100001]R=[1001](6)

根据式(2)~(6),可以很容易地实现计算机的程序,完成对运动目标跟踪任务的实现。

2.3 OpenCV介绍

该实验是在开源系统Linux平台上用OpenCV函数库建立起模型并实现算法的。OpenCV是Intel公司开发的开源数据库。作为一个基本的计算机视觉、图像处理和模式识别的开源项目,OpenCV可以直接应用于很多领域,作为第二次开发的理想工具。比如实时计算机视觉领域中人机交互目标的分割和识别、人脸识别、手势识别、运动跟踪、自我运动、运动理解、移动机器人等。它由以下类库组成:

(1) CXCORE。包含了图像处理和数学运算,特别是矩阵运算的相关函数。

(2) CV。包含图像处理和分析的一些函数,同时还包含了其他诸如结构分析、极线几何、模式识别、结构分析等一些函数。

(3) HighGUI。与平台相关的用户界面函数,主要用以控制图像窗口、按钮等控件。

(4) CVCAM。与视频设备输入/输出相关的函数。

在该程序中,主要利用了CV库中现有的图像处理函数,如边缘检测、图像叠加、灰度转换及图像翻转等。在此基础上开发自己的一些函数,如演算图像运动历史(Motion History of Image)等。

3 目标跟踪试验与仿真

在本次试验中,充分利用OpenCV封装的函数库。其中,在跟踪阶段用到两个重要的函数为:

(1) KalmanPredict

估计后来的模型状态 :

const CvMat* cvKalmanPredict( CvKalman* kalman,const CvMat* control=NULL );

#define cvKalmanUpdateByTime cvKalmanPredict

(2) KalmanCorrect

调节模型状态:

const CvMat* cvKalmanCorrect( CvKalman* kalman,const CvMat* measurement );

#define cvKalmanUpdateByMeasurement cvKalmanCorrect

得到的实验结果如图4所示。

图4中标注白色线框的为检测到并进行了标记的运动人体前景图像,黑色线框为利用Kalman滤波技术对人体进行预测跟踪的结果。其中,两个中点为各自方框的中心点。

4 结 语

该实验结果表明,Kalman滤波的估计值与实际测量值比较接近,误差在很小的范围之内,可以很好地跟踪运动目标,而且处理速度比较快,能够满足一般情况下实时性的要求。此外利用Kalman滤波可以很好地解决实验中两人握手时运动目标间遮挡的问题。

通过Kalman滤波器的预测估计可以大大缩小图像处理的范围,因此极大地提高了处理速度和信息反馈的时间,减少或消除视觉通道反馈信息的时间滞后问题。但是,一个明显的缺陷是该实验只对目标一个方向上的估计跟踪效果比较好,而对另一个目标的预测则明显呈现滞后现象,这一点可以在今后对代码的不断完善中完成。Kalman滤波存在初值选取、噪声参数确定的问题,该实验是在多次反复试验的基础上选定的各个参数及初值,而且假设运动目标做匀速直线运动,这也是Kalman滤波的局限性之一。

摘要:通过摄像机拍摄到的一段视频,对其中运动的人进行检测与跟踪。在目标检测方面,获取运动行人图像序列,利用自适应背景提取方法得到背景,根据将目标与背景进行分离的分割阈值,对差分图像进行分割,提取运动区域,检测出人体运动目标;在目标跟踪方面,选用基于Kalman滤波的运动跟踪系统,通过估计出运动目标的下一位置,对运动目标进行实时跟踪。这里的实验是在Linux平台上利用Intel的开源OpenCV函数库建立起模型并实现算法。经过多次仿真测试表明,使用Kalman滤波可以很好地解决实验中两个人握手时运动目标间遮挡的问题,并跟踪运动目标,而且处理速度比较快,能够满足一般情况下的实时性要求。

关键词:图像序列,目标检测,Kalman滤波,实时跟踪

参考文献

[1]王亮,胡卫明,谭铁牛.人运动的视觉分析综述[J].计算机学报,2002,25(3):225-237.

[2]侯志强,韩崇昭.视觉跟踪技术综述[J].自动化学报,2006(4):603-617.

[3]宋磊,黄祥林,沈兰荪.视频监控系统概述[J].测控技术,2003(5):33-35.

[4]陈-,蔡自兴.基于DirectShow技术的移动机器人视频采集系统[J].华中科技大学学报:自然科学版,2004(Z1):87-89.

[5]刘雷.人体运动建模仿真方法研究[J].计算机仿真,2009(1):166-168.

[6]孙剑,李克平.行人运动建模及仿真研究综述[J].计算机仿真,2008(12):12-16.

[7]Neri A,Clonnese S,Russo G,et al.Automatic Moving Ob-ject and Background Separation[J].Signal Processing,1998,66:219-232.

[8]Peter Meer.Real-Time Tracking of Non-Rigid Objects using Mean Shift[A].IEEE CVPR[C].2000.

人体检测与跟踪 第4篇

一、选择题

1.下列有关生态系统中信息传递的叙述,正确的是()A.生态系统中的信息分为物理信息和化学信息两大类 B.生态系统中的信息来源于生物群落中的各种生物

C.牧草生长旺盛时,为食草动物提供采食信息,这对食草动物有利,对牧草不利 D.植物生命活动过程中产生的生物碱、有机酸等代谢产物就是化学信息 2.下列有关生态系统稳定性的叙述,错误的是()A.抵抗力稳定性弱的生态系统恢复力稳定性一定强 B.生态系统自我调节能力的基础是负反馈调节

C.适当增加草原生态系统的物种丰富度可有效提高其抵抗力稳定性 D.“野火烧不尽,春风吹又生”体现了生态系统的恢复力稳定性

3.环境问题是全世界人民密切关注的问题,以低能耗、低污染、低排放为基础的低碳经济模式越来越成为促进国家经济持续增长和可持续发展的重要经济模式。下列说法正确的是()A.煤、石油和天然气的大量燃烧,致使大气中的CO2急剧增加 B.大气中CO2进入生物群落的方式只能是植物的光合作用 C.生物群落中的碳元素进入大气的方式只能是微生物的分解作用 D.大力植树造林是缓解温室效应的唯一方法 4.下列事例中,属于恢复力稳定性的是()A.由于乱砍滥伐,长江流域森林面积急剧减少,引发了百年不遇的洪涝灾害 B.当天气干旱时,草原生态系统中的动植物种类和数量一般不会有太大变化 C.乡村一个池塘,每天都有人到池塘边洗东西,可每天早晨池水依然清澈如故 D.一个相对封闭的生态系统中闯入某种大型肉食动物后,生态系统的各种成分相互作用直到恢复原来的状态

5.某池塘演变早期,藻类大量繁殖,食藻浮游动物水蚤随之大量繁殖,导致藻类数量减少,接着又引起水蚤减少。后期因排入污水,引起部分水蚤死亡,加重了污染,导致更多水蚤死亡。关于上述过程的叙述,正确的是()A.早期不属于负反馈调节,后期属于负反馈调节 B.早期属于负反馈调节,后期属于正反馈调节 C.早期、后期均属于负反馈调节 D.早期、后期均属于正反馈调节

6.据了解,野生扬子鳄种群的雌、雄比例一般稳定在5∶1左右,这样的性别比是由孵化时的温度所决定的。繁殖季节雄性扬子鳄发出“轰轰”的声音,雌性扬子鳄则根据声音大小选择巢穴位置。当声音大时,雌鳄选择将巢穴筑于山凹浓荫潮湿温度较低处,则产生较多的雌鳄。以上事实说明生态系统中信息传递()A.能够调节生物种间关系,以维持生态系统的稳定 B.影响生物种群的繁衍,维持种群数量的稳定 C.维持生物体正常生命活动,调节生物内环境的稳态 D.对生物进行自然选择,促进生物进化

7.(2015·泰州模拟)下图表示生态系统各组成成分之间的能量流动、物质循环及信息传递过程,则图甲、图乙、图丙可依次表示()

A.能量流动、碳的循环、信息传递 B.能量流动、信息传递、碳的循环 C.碳的循环、能量流动、信息传递 D.信息传递、能量流动、碳的循环

8.(2015·西安模拟)下面是某城市人工湿地示意图,需要补充完善的碳循环过程包括()

A.植物光合作用大气中CO2 B.动物―――→大气中CO

2C.植物光合作用大气中CO2和动物―――→大气中CO2

D.以上均错误

9.(2015·南昌调研)下面是某农业生态系统模式图,有关该系统的叙述错误的是()呼吸作用

呼吸作用呼吸作用呼吸作用

A.微生物利用的是农作物通过光合作用固定的能量 B.多途径利用农作物可提高该系统中能量的传递效率 C.沼渣、沼液作为肥料还田可以促进物质循环再利用 D.食用菌、产甲烷杆菌及蚯蚓是该生态系统中的分解者

10.(2015·合肥质检)下面为生物圈中碳元素的循环过程,下列有关叙述正确的是()

A.④过程代表绿色植物的光合作用,③过程代表化能合成作用 B.图中甲、乙、丙分别代表消费者、生产者和分解者 C.物质循环是指碳元素在甲、乙、丙间以有机物的形式传递 D.图中甲、乙、丙包含的所有种群共同构成生物群落

11.下图一为科学家提供的大气中近40年每月平均CO2浓度图,图乙为碳元素在生态系统中循环的模式图,“甲、乙、丙”表示生态系统的生物成分,“a~g”表示生理过程。下列相关叙述中,正确的是()

A.图一所示CO2浓度逐年升高,主要原因是植物被破坏,使CO2的消耗减少 B.图二中c过程代表光合作用,f过程代表微生物的呼吸作用 C.图二中甲代表的营养级在生态系统的食物链中占有的碳元素最多 D.图二中丙所代表的生物的细胞内没有成形的细胞核

12.生态系统的一个重要特点是它常常趋向于稳态。下图甲代表载畜量对草原中生产者的净生产量的影响(净生产量即生产者光合作用所制造的有机物总量与自身呼吸消耗量的差值)。图乙表示生殖数量、死亡数量与种群大小的关系。下列说法错误的是()

A.从图甲可知,c点以后生态系统的稳态将受到破坏 B.从图甲可知,适量的放牧不会破坏草原生态系统的稳态 C.从图乙可知,P点时种群的年龄组成为衰退型

D.从图乙可知,F点表示该环境所能维持的种群最大数量

二、非选择题

13.(2015·湖北八市联考)下面为生物圈中碳循环示意图,其中①至⑩表示过程,Ⅰ至Ⅳ表示细胞中的某些结构。据图分析回答下列相关的问题:

(1)图中表示绿色植物光合作用过程的是________,表示呼吸作用过程的是________(请用图中数字符号填写)。

(2)甲代表的生态系统成分是________,该成分包括绿色植物和X,其中的X在过程①中与绿色

要的不

是__________________________________________________。

丙代表分解者,其中的Y主要指________类生物。

(3)图中结构Ⅲ与 Ⅳ最主要的区别是___________________________________________ ________________________________________________________________________。(4)正常情况下,①=②+③+④,故大气中的CO2含量相对平衡,但是⑥这一途径使地层中经过千百万年而积存的碳元素在很短的时间内大量释放,打破了生物圈中碳循环的平衡,导致温室效应,对人类的生存构成威胁。请你提出降低温室效应的措施(至少两条):

________________________________________________________________________ ________________________________________________________________________。14.下图1是某生态系统中碳循环模式图,图2为某生态农业发展模式图,据图回答下列问题:

(1)图1中甲代表的生物成分是________,B代表的生理过程是__________。造成温室效应的主要原因是____________________。若第二营养级的生物具有食用和药用价值,则说明生物多样性具有________价值。

(2)图2中农作物所积累的有机物中能量的去向有_________________________________ ________________________________________________________________________。从生态系统的主要功能分析,该生态农业较好地实现了____________________________。

(3)如果要提高该农业生态系统的抵抗力稳定性,依据生态系统中生物种群间的相互关系,应科学增加农田中的________。

(4)图2中属于图1中丙代表的生物有_________________________________________。15.(2015·银川模拟)淡水鱼类养殖是将鱼种投放到水体中并加以一定的饲养管理,或对水体中的鱼类资源进行繁殖和保护,从而获得高产的养殖方式。养殖技术人员对某池塘生态系统的营养结构和能量流动情况调查后,得到了下面甲图所示的食物网,乙图表示某生态系统功能随时间的变化曲线。请分析回答下列问题:

(1)甲图的生物中,含能量最少的是________,因为能量流动的特点是________________________________________________________________________。

该生态系统中有食物链________条,鲫鱼处于第________营养级。

(2)如果去除该生态系统中的浮游动物和双翅目幼虫,则黑鱼的产量将________,生态系统的抵抗力将________。

(3)甲图的食物网中,浮游植物为摇蚊幼虫提供了可以采食及栖息的信息,黑鱼能够根据鲫鱼量的信息控制繁殖,这说明了生态系统中信息传递的作用是________________________ ________________________________________________________________________。(4)乙图中两条虚线之间的部分表示___________________________________________。(5)y表示外来干扰对生态系统的影响,y越大,说明该生态系统______________;x越大,说明该生态系统____________;一个生态系统的x与y组成的面积越大,该生态系统____________。

1.选D 生态系统中的信息包括物理信息、化学信息和行为信息三大类;生态系统中的信息可以来自生物,也可以来自无机环境;牧草生长旺盛时,为食草动物提供采食信息,这对食草动物有利,对牧草也有利,这样可以调节生物的种间关系,维持生态系统的稳定。

2.选A 抵抗力稳定性弱的生态系统恢复力稳定性不一定强,如极地苔原生态系统,生物种类少,抵抗力稳定性弱,但由于温度极低,条件恶劣,恢复力稳定性也很弱。

3.选A近代工业的迅速发展,导致化学燃料大量燃烧,打破了生物圈中碳循环的平衡,因此减缓温室效应的重要措施是减少化学燃料的燃烧。光合作用和化能合成作用都能够固定大气中的CO2。动植物的呼吸作用和微生物的分解作用都能释放CO2。

4.选D A项为生态系统稳定性被破坏后对自然环境的影响;B、C项均表现为“抵抗干扰、保持原状”,故为抵抗力稳定性;D项表现为“遭到破坏,恢复原状”,故为恢复力稳定性。

5.选B 负反馈调节是指某一成分的变化所引起的一系列变化抑制或减弱最初发生变化的那种成分所发生的变化,题干中所述的早期符合负反馈调节的机制。正反馈调节是指某一成分的变化所引起的一系列变化促进或加强最初所发生的变化,题干中所述的后期属于正反馈调节。

6.选B 根据题干信息可知,生态系统中信息传递能够影响生物种群的繁衍,维持种群数量的稳定。

7.选C 图甲表示生态系统中的碳循环,图乙表示生态系统的能量流动,图丙体现双向性,因此为信息传递。

8.选C 图中只有生物成分之间及微生物与大气中CO2间的碳流动过程,缺乏植物和动物与大气间的CO2交换过程,大气中的CO2进入生物群落主要依赖于植物的光合作用,生物群落中的碳进入大气主要通过植物、动物和微生物的呼吸作用(图中已有微生物的分解作用)。

9.选B 流经该生态系统的能量是生产者固定的太阳能总量,因此微生物利用的是农作物通过光合作用固定的能量;多途径利用农作物,可提高能量利用率,不能提高能量传递效率;沼渣、沼液肥田可以促进物质循环利用;营腐生生活的食用菌、产甲烷杆菌及蚯蚓都是该生态系统中的分解者。

10.选D 由图示信息可知,甲代表分解者,乙代表生产者,丙代表消费者,④过程代表光合作用和化能合成作用,③过程代表呼吸作用;碳循环是指碳元素在生物群落和无机环境间进行的循环;图中的生产者、消费者和分解者共同构成了生物群落。

11.选C 图一中CO2浓度逐年升高主要是由化学燃料的燃烧造成的;

图二中甲是生产者,乙是消费者,丙是分解者,丁是无机环境中的CO2库,c过程为消费者的呼吸作用,f过程为分解者的呼吸作用;甲是生态系统的第一营养级,固定的有机物中的能量是流经生态系统的总能量,因此占有的碳元素最多;丙是分解者,其中有真核生物也有原核生物,真核生物有成形的细胞核。

12.选C 根据图甲可知,c点以后生产者的净生产量小于a点,生产系统的稳态将遭到破坏;由图甲可知适量的放牧使生产者的净生产量增加,不会破坏草原生态系统的稳态;根据图乙可知P点时种群的出生率等于死亡率,其年龄组成为稳定型;F点表示该环境所能维持的种群最大数量,即“S”型曲线中的K值。

13.解析:(1)图中过程①表示光合作用或化能合成作用利用二氧化碳的过程,过程②③④分别表示生产者、消费者和分解者通过呼吸作用释放CO2。(2)甲是自养型生物,因此属于生产者;生产者除绿色植物外,还包括能通过化能合成作用合成有机物的生产者,与绿色植物比较,这类生物将无机物转化为有机物所利用的能量来自体外环境中某些无机物氧化释放的化学能。分解者主要是指营腐生生活的细菌和真菌,则Y主要指真菌。(3)结构Ⅲ和Ⅳ分别是真核细胞的细胞核和原核细胞的拟核,细胞核有核膜包被,拟核没有核膜包被。(4)温室效应是由大气中CO2含量增加引起的,降低温室效应,可以增加大气中CO2的“去路”,即可以通过植树造林来消耗大气中更多的CO2,同时减少大气中CO2的“来源”,即可以通过减少化学燃料的燃烧,同时开发新能源替代化学燃料来实现。

答案:(1)① ②③④(2)生产者 不能利用光能,但是能利用体外环境中的某些无机物氧化释放的化学能来制造有机物 真菌(3)Ⅲ有以核膜为界限的细胞核,而Ⅳ没有(4)①植树造林;②减少煤和石油的燃烧;③开发新型能源(答案合理即可)14.解析:结合图1分析碳循环过程可知,甲代表生产者、乙代表消费者、丙代表分解者,A代表的生理过程是光合作用、B代表的生理过程是细胞呼吸,主要是有氧呼吸。产生温室效应的主要原因是大气中CO2过多,而大气中CO2过多是人类大量燃烧化学燃料造成的。图2中农作物起着重要的作用,其固定的有机物中能量的去向有:流向下一个营养级、自身呼吸消耗、被分解者分解。生态农业的建立实现了物质的循环利用和能量的多级利用,减少了能量的浪费和环境污染。生态系统的抵抗力稳定性与其营养结构的复杂程度有关,生物种类越多,其抵抗力稳定性越高。图1中丙代表分解者,图2中属于分解者的生物有蚯蚓、食用菌。

答案:(1)生产者 细胞呼吸 化学燃料过快过多的燃烧 直接(2)流向下一个营养级、自身呼吸消耗、被分解者分解 物质的循环利用和能量的多级利用(3)生物种类(4)食用菌、蚯蚓 15.解析:(1)甲图中黑鱼所占的营养级最高,其所含能量最少,原因是能量流动具有单向流动、逐级递减的特点。该食物网中食物链有3条,分别为:浮游植物→浮游动物→双翅目幼虫→鲫鱼→黑鱼,浮游植物→浮游动物→鲫鱼→黑鱼,浮游植物→摇蚊幼虫→鲫鱼→黑鱼。鲫鱼处于第三和第四营养级。(2)如果除去浮游动物和双翅目幼虫,必然导致摇蚊幼虫增多,可推出黑鱼的产量将会上升;因为物种丰富度减少,所以该生态系统的抵抗力会降低。(3)浮游植物为摇蚊幼虫提供了可以采食及栖息的信息,黑鱼能够根据鲫鱼量的信息控制繁殖,这些体现了信息传递调节生物种间关系、维持生态系统稳定性的功能。(4)乙图的虚线部分表示处于动态平衡,说明是生态系统的稳定性。(5)y表示外来干扰对生态系统的影响,偏离程度越大,说明越容易受到破坏,抵抗力越小;x表示破坏后恢复平衡的时间,x越大则恢复平衡越慢,说明恢复力越小。

人体跟踪技术研究 第5篇

1 目标跟踪中的mean shift

用于目标跟踪的mean shift算法, 并不是完全智能的算法, 因为在跟踪初始帧的时候, 需要将被跟踪的区域使用鼠标进行划分, 自己不能独立运作, 起始的时候需要手动参与, 通过鼠标划分好区域后, 也就确定了核函数所作用的区域, 鼠标划分出来区域的半径就是核函数的带宽, 即跟踪窗口的半径[1]。

在被跟踪区域的所有像素点, 首先要对被跟踪的目标进行描述, 可以通过计算特征空间中每个特征值的概率来得到, 然后通过Bhattacharyya (巴特查理亚) 系数, 来检查差异性, 因为初始帧的目标模型是在跟踪前就选定的确定量[2], 而每一帧中的候选模型不同, 所以我们要引入Bhattacharyya巴氏系数, 求其最大值。因为巴氏系数的主要作用就是用来描述两个样本之间相似的程度, 并用一个确定的值来做结论, 在跟踪领域, 求其最大值, 就是来计算下一帧中可能的目标中, 与上一帧目标最相似的目标, 也就是真实的目标。进而就可以得到每一帧中候选模型与初始帧的目标模型相似度最高的时候, 当相似性最高这个条件满足时, 就可以得到mean shift向量, 整个原理就是mean shift向量从初始帧目标区域的位置, 在收敛的前提下, 经过一定程度的迭代, 当迭代结束后, 最终指向正确的位置, 也就是选定区域中密度最高处。如图1所示为迭代过程图。

其中xin代表的是窗口中的中心点, 如图中空心的圆圈所示, 右上角n表示需要迭代的次数, 实心的圆点表示窗口中的任意样本点, 虚线圆圈的直径与密度估计窗口大小保持一致, 箭头表示的就是mean shift向量的运动轨迹[3], 由于mean shift向量是收敛的, 所以无论迭代次数多少, 终将移动到密度的极大区域, 也就是图1所示的xin空心圆圈所示, 从而实现了跟踪。整个跟踪过程流程图如图2所示。此流程清晰地表示了整个系统运行的过程, 初始帧的选择, 目标模型、候选模型的选择与确定, 到最后的判定情况与收敛情况。

2 结果分析

本实验的实验环境在windows7操作系统下运行, 该计算机配置为双核intel i3处理器, 其主频为2.53 GHz, 4 GB内存, 并且配备显存为512 M的独立显卡, 该型配置足以顺利运行Matlab R2008a。首先我们选用Matlab数据库自带的范例视频做一次测试, 该视频容量很小, 不到1 M, 背景几乎无光线变化, 且目标与背景相差较大, 无遮挡, 计算机足以处理, 本次试验的目的就是测试mean shift算法是否能成功跟踪到目标, 实验结果如图3所示。

由跟踪结果可以看出来, mean shift算法在背景简单的情况下成功了跟踪了目标。

摘要:目标跟踪技术, 特别是对人体等移动目标的追踪, 在计算机视觉技术中, 是一个融合了图像图形学, 模式识别, 计算机技术与仿真, 人工智能, 人机工程学等多项技术的最具有活力的分支。在国防安全, 公安侦破, 交通监管等领域起着日渐凸起的重要作用。本论文通过对大量的移动目标追踪技术相关参考文献的认真研究分析, 依据密度估计理论, 采用mean shift算法的基本形式, 对其目标跟踪技术做了深入的研究与分析。

关键词:目标跟踪,mean shift,计算机视觉

参考文献

[1]Simon Denman Vinod Chandran Sridha Sridharan.An Adaptive Optical Flow Technique for Person Tracking Systems[J].Pattern Recognition Letters, 2007, 28 (10) :1232-1239.

[2]Dorin Comaniciu Visvanathan Ramesh, Peter Meer.Realtime Tracking of Non-Rigid Objects Using Mean Shift[G].In Proc.of IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR2000) , 2000, 2, 2142-2149.

话题检测与跟踪关键技术研究 第6篇

1 话题检测与追踪的主要任务

作为一项能够对舆情进行充分分析的重要技术手段, 话题检测与追踪是近十年自然语言处理和信息检索领域的热点研究课题。TDT的主要任务是依据资源对信息源的时序性进行分析, 譬如娱乐话题的分析。话题检测是指检测系统尚未纳入的新型话题, 具体话题是指一些相同时间内的报道。话题跟踪是指将系统已纳入的话题与新输入的话题进行联系整合。TDT的本原问题是判定新闻报道的主题是否一致, 往往需要划分报道内容的层次结构、识别和分析报道内部子话题间的相互关系以及抽取主题思想, 因此, 有助于促进事件抽取领域开展相关研究。而报道内容的合理分析必然涉及语法、句法和语义等相关技术的应用, 从而间接促进自然语言处理领域内相关研究的发展。话题检测与跟踪在面向门户网站的新闻话题自动识别与组织、面向特定用户的话题定制与推送、敏感话题监控与跟踪、商业情报侦测与预警、国际局势跟踪与预测等领域有着重要应用价值, 有着很好的市场应用前景。

2 TDT国内外研究方向

TD报道切分、报道关联性检测、话题检测与跟踪以及针对各项任务的跨语言技术是TDT主要研究方向。TDT所有研究方向都存在交织关系, 即每一方向之间相辅相成, 缺一不可。譬如, 对于TDT技术来说, 报道切分是所有研究内容中最基础的一项研究, 若想充分应用TDT系统并且完成话题检测与跟踪, 首先要做的是将新闻报道流进行充分归纳以及有效切分。报道关联性检测主要是指检测不同报道的主要论述内容是否相同, 检测不同话题与一个报道间或者几个报道间的联系性也是话题跟踪与检测的主要工作内容, 所以说报道关联性检测是TDT核心内容, 也是TDT系统实现其功能的主要技术。话题检测系统是指在信息量巨大的新闻报道中检测出新型话题, 这是采用话题跟踪系统的先决条件。话题跟踪系统是指将已跟定的话题进行全面跟踪与归纳, 并充分识别与纳入其后续报道。话题检测是进行话题跟踪的基础技术, 话题跟踪是完善话题检测的重要工作。随着网络系统大范围融合, 信息资源中包含了不同语言形式的新闻资源, 所以跨语言技术应运而生, 该技术为话题检测与跟踪系统带来了技术性支持。综上所述, TDT的不同研究方向之间是相互辅助且密切关联的, 在TDT技术应用中, 各个研究方向缺一不可。然而实际需要并不只局限于以上方向, 在实际研究应用中, 还可以将TDT研究划分成多个子问题。TDT研究体系涉及多个研究方向, 各个组成部分之间相互依托并有机结合。由于TDT与信息检索、信息过滤、信息抽取以及文本挖掘等传统信息处理研究具备很多共性, 因此, 面向这些领域的相应方法与技术在TDT研究初期得到了广泛应用。随着TDT研究逐步深入, 独立于TDT特点的相应问题成为该领域的研究热点, 比如话题的突发性、时间信息以及报道内容层次差异等。近期, 相关研究主要集中于不同概率模型以及自然语言处理技术在TDT领域中的应用。

3 TDT典型算法分析

对于新事件识别算法, 卡内基梅隆大学 (CMU) 采用经典的向量空间模型来计算文档相似度。CMU使用Single-pass将输入的新闻应用聚类算法进行有序处理, 每处理一篇摘要及内容不同的新闻, 聚类就会有所更新。麻省理工大学阿默斯特分校 (UMass) 应用的算法是新事件识别算法, 该算法的主要实现方式是应用Inquery系统对事件进行排序检索, 根据详细的反馈将信息进行提取和选择, 最终应用In Route中路由框架实现最终算法。宾夕法尼亚大学 (UPenn) 使用的算法是将每个事件应用单链接的聚类方法进行表示, 新的事件是一项新的聚类, 新闻产生时这个聚类就会形成, 若后续报道中有重合内容较多, 则这些报道就会被划分到一个统一的聚类中。目前, 有K决策树分类、最近邻分类和Rocchio分类这三种主要的事件跟踪方法。KNN分类方法的主要技术方法是建立一个2 路KNN来代表每一事件, 进而能够简化传统的M路分类问题。若产生一个新的报道事件, KNN系统就能够将其应用方法转化成向量, 之后再将转化过后的向量与训练文档进行比较, 比较之后就会产生一个相应的余弦相似度值, 根据这一相似值能够确定K个最近邻居。决策树分类方法主要是构建一个根节点, 即确定事件的最大信息增益的特征, 并将其作为根节点, 然后利用根节点的特征值对数据进行分类, 最后将这一方法应用到每个分支中。作为最为经典的相似度查询方法, Rocchio方法的主要运行模式是对话题进行经验性模拟构造, 首先是规定话题的正确特征, 其次是加强能够正确描述相关话题的特征权限, 削弱不相关的描述权限。

TDT系统采用的方法在各个子任务中已取得很大进展, 尤其是话题跟踪, 但也有很多问题。纵观TDT系统发展进程以及研究内容, 能够充分确定其未来应增强对加强概率统计的功能性和自然语言的融合性研究, 而且概率统计这一极具特色的能将新闻资料进行充分整合利用的课题将成为一个新的研究热点。

4 结语

由于网络信息数量极大, 以及数据来源的多样性, 人们很难在不同且单一的信息之间进行充分了解, 因此, 往往很难融合某一事件的片面信息, 在理解某一事件上会出现不同程度的偏差。针对这一问题, TDT技术应运而生, 该技术作为一种信息处理工具, 能够将所有与某一事件相关的内容进行充分整合, 帮助用户全面了解某一事件。但是随着网络的兴起, 网络中的关联信息越来越丰富, 特别是新兴社交网络工具论坛、微博、微信等公众平台的广泛应用, 面向突发事件的特定需求和面向社会网络数据的新兴应用的话题检测具有越来越重要的意义, 因此, 将极大促进话题检测与跟踪技术的深入研究与应用。

参考文献

[1]赵华, 赵铁军, 赵霞.时间信息在话题检测中的应用研究[J].计算机科学, 2008 (35) .

[2]陈友, 程学旗, 杨森.面向网络论坛的突发话题发现[J].中文信息学报, 2010 (3) .

[3]徐会杰, 蔡皖东, 陈桂茸.面向论坛的突发性热点话题快速发现与跟踪[J].中南大学学报 (自然科学版) , 2014 (8) .

人体检测与跟踪 第7篇

人体运动检测是利用传感器, 将人体在三维空间运动状况的数据实时上传至计算机并对数据进行处理, 得到驱动三维人体模型的数据, 由此驱动构建人体骨架模型, 从而实现人体动作的再现。

目前主要使用的动作捕捉技术有光学式, 机械式, 电磁式, 声学式及基于视频序列的捕捉方式。这些捕捉方式各有优缺点:机械式优点是实时高速、采集范围没有限制、没有自遮挡问题, 但是运动受限、且传感器设置固定;电磁式优点是实时、没有自遮挡问题, 缺点是精度不高、工作范围小、附着于人体的传感器和线圈较多、对电磁干扰很敏感:主动式光学捕获设备, 优点是标记之间不存在模糊性, 缺点是标记点数量受限。被动式光学捕获设备, 优点是高速 (最高可达2000Hz) 、标记点放置灵活, 缺点是采集环境相对受限、标记点存在自遮挡问题、后处理过程比较繁琐;声学式成本较低, 但是对运动的捕捉有较大的延迟和滞后, 实时性较差, 精度也不高;基于视频序列的方式优点是成本低, 人体无需佩戴传感器等, 缺点是算法较为复杂, 单摄像头无法记录三维信息, 多摄像头存在标定的问题, 而且对光线环境等要求较高。综上, 在不同的环境与需求下选取恰当的途径才能收到令人满意的效果。

本文介绍了一种简便的人体运动检测系统的实现方法。通过一个摄像头捕捉人体运动图像序列, 以VC++、OpenCV和OpenGL为工具, 在背景为静态、不考虑人体运动产生的阴影、且光线稳定的情况下, 能够实时地读取并分析摄像头传回的数据, 提取出运动人体轮廓的关键点, 并在仿真窗口显示出运动人体的轮廓。

1. 系统概述

在进行人体动作捕捉之前, 需要首先提取出一张符合计算机处理要求的背景图像。虽然要求背景是静止不变的, 但是考虑到摄像头捕捉的图像存在大量的噪声干扰, 而且还要光线变化会带来扰动, 所以, 不能简单、直接的抓取一张图像作为背景图像, 而是将连续的N张视频图像序列每个像素进行处理后, 提取出背景图像。

为了应对背景光线的微小变化, 再对背景图像进行更新。更新的条件是某个像素的像素值在一定时间段内保持相对的稳定, 且其值与原背景差值在一定范围内。更新的时候, 不是以当前图像的某个像素值完全代替背景, 而是以一定的权重更新背景。

然后, 将人体动作的图像与背景图像使用背景差分算法处理得到前景图, 将彩色的差值图像转化为灰度图像后, 使用自动阈值算法对灰度图像进行二值化处理。最后对二值图像进行数学形态学处理与空洞填充, 得到较好的运动点团。

经过二值图像提取出的边界线, 通常不完全封闭。将边界线转换为多段线, 然后将这些多段线顺次连接成一条封闭的轮廓线。而后对这条轮廓线进行化简, 并求出关键点。人体轮廓提取与直线拟合:

最后针对上一步求出的关键点, 在仿真窗口进行绘制, 实现三维重建, 重现运动人体轮廓。

2. 系统实现的关键点

2.1 背景的提取

背景的提取有很多种算法。本系统在背景提取时, 首先连续捕捉了N张图像, 然后对这N张图像的每个像素进行升序排序。排序结束后, 每张图像都变得和原来不一样。第一张图像上每个像素的像素值都是N张图像中同一像素位置上的最小值。同理, 第N张图像上每个像素的像素值都是N张图像中同一像素位置上的最大值。噪声将排在两边, 排在中部的是背景, 取排在中间的像素作为背景结果, 避免了由于某些像素出现极大或者极小值而造成整张图像不准确的情况。

本系统N取9, 所以对像素进行排序之后, 取第5张图像作为背景图像。

N的取值要合适。假如N太小, 则无法有效地较少噪声。假如N太大, 则运算量过大, 且效果也不明显。

由于背景提取是整个系统的第一个步骤, 所以很可能出现一开摄像头就开始捕捉背景的情况。这里要强调的是, 不能刚一启动摄像头就开始捕捉图像。经试验发现, 摄像头刚被启动的时候, 返回的画面都是不准确的, 像素值比正常值要低很多。返回的画面由全黑到正常需要一个过程, 本机测试的结果是需要25帧左右就可以达到稳定了, 视具体情况而异。所以摄像头刚启动的时候, 作任何分析处理都需要放弃掉前几帧图像, 待返回的图像稳定之后再做处理。

这里还要强调帧率的问题。本系统采用VC++作为开发工具, 所以传感器是指摄像头, 那么控制器就是计算机。作为一个实时分析人体运动的系统, 处理流程是:捕捉一张图像, 然后对图像内容进行分析计算, 接着捕捉下一张图像, 然后接着分析计算, 循环往复。假设CPU处理对于一张图像的时间是T, 那么当T非常小的时候 (例如1毫秒) , 是否意味着计算机每秒中要处理大约1000张图像。但是对于物体的低速运动 (例如人们的日常动作) , 因为相邻几帧的画面几乎没有差别, 处理结果肯定也是相似的, 根本不必要每秒处理那么多次。另外, 普通摄像头帧率一般在25Hz-120Hz范围内, 达不到每秒更新1000次图像。所以, 假如CPU过于频繁地向摄像头索取图像数据, 得到的图像数据可能是得到上一帧图像数据, 或是得到处理到一半的图像数据, 也可能是得到所有像素为0的图像。所以, 为了结果的正确性, 必须保证CPU索取图像的频率低于摄像头更新图像的频率。

2.2 运动人体检测

目前运动人体检测的算法主要有三种:光流法、帧差法、背景差分法。本系统采用背景差分法, 即用当前帧图像减去背景图像, 可得到差值图像。但此图像不能直接作为当前景图像使用。主要有两个原因:1.得到的差值图像为彩色图像, 每个像素由R、G、B三个通道组成, 每个通道的取值范围都是0-255, 不方便处理;2.此图像包含大量无用信息, 并不能直接反应运动人体。所以通过三个步骤进一步处理差值图像, 简化信息量。首先采用通用的转换公式:

将彩色图像转换为灰度图像, 然后是自动阈值获取方法得到阈值对图像作二值化处理, 最后使用OpenCV提供的腐蚀运算去除二值图像中的孤立点, 使图像得以细化和收缩, 再通过膨胀运算填充和连接二值图像中的对象。

2.3 人体轮廓提取与直线拟合

首先需要提取前景图像的轮廓, 前景图像为二值图像, 调用OpenCV中的边缘提取函数提取轮廓, 效果较好;然后将组成这些轮廓的像素点转换为空间几何点, 并将这些点以多段线的形式顺序存储;接着去除小段的多段线, 将其与的多段线以就近原则顺次连接;最后找出这条多段线的关键点, 达到直线拟合的目的。

将像素点转换为空间几何点的意义在于把图像处理问题转换为几何数学问题。依据每个轮廓点在图像中所在的像素位置, 对应转换为坐标为 (x, y) 的空间几何点即可。几何点的存放顺序与图像中每个轮廓点的连接顺序要一致。由于图像轮廓线不一定是封闭的, 所以得到的几何多段线也是多条。这一步完成之后要去除长度较短的多段线, 这样可以消除很多杂线、乱线, 方便下一步的处理。

3. 结束语

本系统实现了人体动作的捕捉及仿真, 并在实现过程中解决了系统实现的关键问题。运动目标检测和跟踪是基于道路交通的实验场景的, 然而运动目标检测与跟踪不仅仅能用于道路交通, 对其他需要监控的地方, 例如小区防盗、银行监控等等, 运动目标检测与跟踪都是最核心的部分。如何将运动目标检测与跟踪用于这些地方, 需要对算法和参数做哪些改进, 都是可以进一步研究的方向。

摘要:本文实现了一种基于计算机视觉技术的人体运动捕获方法, 以简单的摄像头录制的单视图视频作为素材, 从图像序列中提取并描述人体轮廓的运动, 然后对其进行识别, 捕获得到人体运动骨架模型, 最后利用三维虚拟人进行三维仿真。

关键词:视觉技术,运动捕获,三维仿真

参考文献

[1]R.Cucchiara, C.Grana, M.Piccardi.A.Prati Statistic and Knowledge-based Moving Object Detection in Traffic Scenes Intelligent Transportation Systems, 2000.Proceedings.2000 IEEE27-32

[2]Lipton A, Fujiyoshi H, Patil R.Moving target classification and tracking from realtime video[C]PPDARPA Image Understanding Workshop.Priceton, New Jersey:Proc of WACV, 1998:8-14

[3]Chen B S, Lei Y Q, Li W W.A novel background model for realtime vehicle detection[C]PP7th Int.Conf.on Signal Processing.Beijing:Proc, ICSP, 2004:1278-1281

复杂背景下运动目标检测与实时跟踪 第8篇

关键词:背景剪除,互相关,快速傅里叶变换,Mean Shift,目标追踪

0 引言

视频序列中运动目标的追踪通常是从场景序列中剪除背景区域, 找出运动目标的前景, 尽可能抑制图像干扰, 得到感兴趣的运动目标。它可以提供运动目标的位置、速度和加速度等基本信息, 在智能交通、人机交互、安防及监控等领域均有广泛的应用[1]。运动目标的检测追踪有直接构造背景模型[2]、基于区域一致性的图像分割[3]、训练分类器目标识别[4,5]等方式。在复杂背景中, 很可能存在与运动目标相似的特征[6], 同时由于环境影响, 可能存在目标遮挡问题, 所以直接采用模版匹配、特征提取等方法对视频序列中运动目标进行实时追踪会出现一些问题。

考虑到视频序列图象帧间的连续性, 利用背景剪除法[7]对待检测帧中静态背景部分予以剪除, 在复杂环境视场中会出现很多自然干扰和对目标物体的遮挡。本文在融合互相关和Mean Shift算法的基础上, 利用快速傅里叶变换, 先得到模版图片与待检测图片相关极值点所在的位置, 利用极值点位置设置Mean Shift的初始搜索窗口, 用爬山算法找到与目标模版最匹配的位置。使用一个连续的大小为1080*1920的428帧图片作为测试集, 实验结果显示, 使用本文的方法可以稳定、有效地追踪到目标。

1 复杂背景目标追踪

在复杂自然场景中, 由于背景中存在大量的相似特征[8], 以及自然环境的干扰, 需要对运动目标的追踪进行处理。如图1所示, 追踪到图片大小为1 080*1 920的视频序列中船的位置时, 背景相似性干扰、光照变换、水面对船体遮挡十分严重, 静态部分背景变化不大, 因此可以通过背景剪除去掉复杂场景中的静态背景, 剔除部分与运动目标相似的特征, 得到追踪的基准图像。

2 基于互相关信息的Mean Shift追踪算法

2.1 互相关系数计算

互相关在理论上不受两幅图像间对比度、亮度线性差异的影响, 特征稳定[9]。因此, 基于互相关系数的算法在反映模版匹配和目标跟踪相似程度中的应用十分广泛[10], 两幅图像I (x, y) , M (x, y) 互相关的定义为:

式 (1) 中M (k, l) 是大小为m*n的模版图像在 (k, l) 位置点处的灰度值;I (k, l) 是大小为m*n的基准图象子块位于基准模版 (x, y) 位置点时的灰度值;p (x, y) 是模版图像的中心位于基准模版 (x, y) 位置点时模版图像和基准图象的相关系数。

由相关和卷积的关系可知, 将式 (1) 中模版图像M (k, l) 旋转180°, 即可求两幅图像I (k, l) 、M (-k, -l) 的卷积。根据卷积的特性, 待追踪的基准帧图片越大, 匹配时要求的精度就越高, 相关或卷积的计算量就越大[11]。为降低运算的复杂程度, 可以通过快速傅里叶变换求得:

其中, I (u, v) 为图像I (k, l) 的傅里叶变换;M* (u, v) 为模版图像M (k, l) 旋转180°后的傅里叶变换, 即为模版图像M (k, l) 傅里叶变换的共轭。由此可知, 待匹配图像子区域与模版图像的相关性可用快速傅里叶变换来计算。如图2为皮划艇运行到不同区域傅里叶变换后图片。

可利用Mean Shift寻找待追踪的基准图像与模版匹配所得的极大值max_Val及其所在位置实现追踪。

2.2 基于Mean Shift算法的目标追踪

Mean Shift算法为在一组数据的密度分布中寻找局部极值的稳定方法[12], 通过基准图象中得到的极大值位置, 利用先验知识设置初始窗口, 计算初始搜索窗口内基准图象与模版图像的相关性, 找到当前搜索窗口内相关系数的极大值及其对应位置。如果当前搜索窗口的相关系数极大值大于阈值, 搜索窗口内找到目标图像, 则利用相关系数极大值的位置更新窗口, 更新后的窗口即为此基准帧图片的目标追踪窗口, 将更新后的搜索窗口位置作为下一个基准帧图像的初始输入窗口;如果当前搜索窗口的相关系数极大值小于阈值, 说明被追踪的目标不在该基准帧, 应该分视频序列开始视频帧序列和结束视频帧序列;如果为开始视频帧, 应更新基准帧, 继续寻找目标图像;如果为结束视频帧, 则应该停止搜索。

基于快速傅里叶变换的Mean Shift算法如下:

输入:基准图像, 模版图像。

输出:运动目标位置。

Step 1:将基准图像转换为灰度值图像, 对基准灰度值图像用快速傅里叶变换得到基准图像和模版图像的互相关性, 找出相关性极大值和极大值对应的位置;

Step 2:查看极大值是否大于阈值, 如果小于阈值则认为该基准帧图片不包含运动目标, 更新基准图像并返回Step 1继续下一帧基准帧搜索;如果极大值位置大于阈值, 则认为找到第一帧包含目标图像的基准帧, 转Step 3;

Step 3:根据上一帧的极大值位置设置下一帧的初始搜索窗口;

Step 4:用快速傅里叶变换得到搜索窗口内图像与仅包含运动目标的模版图像的相关性图像;

Step 5:利用Mean Shift得到相关性图像的重心, 并记录此时重心处相关系数及其位置。此时重心处相关系数即为当前搜索窗口的相关系数极大值, 且重心位置即为当前基准帧图像与前一副基准帧图像的相对位移;

Step 6:根据当前搜索窗口的位置及中心位置确定当前基准帧图像的追踪窗口。

Step 7:将当前基准帧的追踪窗口作为下一基准帧图像的初始搜索窗口, 转Step 4, 直到目标图像离开视频序列, 算法结束。

2.3 实验结果

实验环境为Pentium (R) Dual-Core 4500+2.3GHz处理器、2G内存、Win8操作系统, 使用VS2010+Opencv2.3.1开发平台实现复杂背景下运动目标的追踪, 实验用到的视频序列是在自然条件下所采集, 图像分辨率为1 080*1 920。

图3 (a) 为运动目标刚进入摄像头范围时的追踪结果;图3 (b) 为光照条件发生变化, 且部分运动目标被水面遮挡的情况下的追踪情况;图3 (c) 为运动目标即将离开摄像头, 且进入水面波动剧烈的区域时目标的追踪情况。

图4为视频序列中目标追踪所花时间, 横坐标为帧序列数, 纵坐标为运行一帧图片找到运动目标花费的时间 (ms) 。其中下半部分为本文所使用的算法时间, 上半部分为背景剪除后用Mean Shift找到运动目标花费的时间。可以看出, 本文所提出的算法极大地节省了目标追踪所用时间, 其中耗时较多的点为目标被水面遮挡, 同时进入水面波动剧烈的部分。

3 结语

在背景剪除的基础上, 通过基于快速傅里叶变换的MeanShift目标追踪算法, 利用快速傅里叶变换得到基准图片与模版的相关性分布, 通过Mean Shift找到相关性分布的极大值位置点, 可准确追踪视频序列中目标的位置。所提出的算法在连续的428帧复杂背景图片上进行了测试, 在图片光照条件发生变化和运动目标进入水面剧烈波动甚至水面遮挡住时均能稳定有效地追踪到运动目标。

参考文献

[1]LU XIANG YIN, HUANG CHAO-CHAO, LING YONG-SHUN.Analysis of infrared image tracking algorithms performance and application[J].Infrared Technology, 2004, 26 (4) :11-16.

[2]STAUFFER C, GRIMSON W.Adaptive background mixture models for real-time tracking[C].1999.

[3]PUNDLIK S, BIRCHFILED S.Motion segmentation at any speed[C].2006.

[4]OKUMA K, TALEGHANI A, FREITAS Dl.A boosted particle filter:multitarget detection and tracking[C].2004:28-39.

[5]PAPAGEORGIOU C, OREN M, POGGIO T.A general framework for object detection[C].1998.

[6]刘进.不变量特征构造及在目标识别中的应用[D].武汉:华中科技大学, 2005.

[7]M PICCARDI.Background subtraction techniques:a review in IEEE International Conference on Systems, Man and Cybernetics, pp.3099-3104, 2004.

[8]BROWN L.A Survey of image registration techniques[J].ACM Computing Surveys, 1992:325-376.

[9]W K PRATT.Correlation techniques of image registration[C].IEEE Transactions on Aerospace and Electronic Systems, 1974.

[10]高广珠, 李忠武, 余理富, 等.归一化互相关系数在图像序列目标检测中的应用[J].计算机工程与科学, 2005 (3) .

[11]LI ZHUO, QIU HUI JUAN.Fast image matching based on correlation coefficient[J].Transactions of Beijing Institute of Technology, 2007, 27 (11) :998-1000.

基于DM6437的车辆检测与跟踪 第9篇

在智能交通系统中,车辆的检测与跟踪是解决日益突出的交通运输所带来的交通拥堵、交通事故等负面效益的前提。现有的车辆检测与跟踪算法大部分都是基于高成本的PC平台,而DSP拥有专用信号处理的硬件结构和流水线技术,在图像处理的某些方面其性能已经超过了PC平台。随着嵌入式时代的到来,人们对系统体积、性价比、功耗等因素的要求更高,使得基于DSP平台的车辆检测与跟踪成为可能,本文基于DM6437利用图像背景提取以及车辆检测与跟踪算法,实现实时车辆检测与跟踪,为后续车辆图像的提取、统计,车辆颜色、车型、车牌的分析与识别打下了坚实的基础[1]。

1 系统硬件架构

系统的硬件架构如图1所示。核心处理部件DM6437采用C64+内核,频率高达600MHz,其内部具有80kB的LID、32kB的LIP高速缓存和128kB L2高速缓存,可获得高达4800MIPS的计算速度,并在此基础上增加了很多外设以满足视频和图像处理的应用,包括视频处理子系统VPSS,2个32位133MHz外部存储器接口,分别通过片选连接128M DDR2和256M Norflash,主机接口(HPI),I2C、GPIO等[2]。

图1中,视频处理子系统的前端(VPFE)是数字信号的输入接口,视频处理后端(VPBE)是后端显示接口,系统利用CCD摄像头将采集到的视频信息传入VPFE,VPFE将模拟信号转换为数字信号并传给DM6437处理器,处理器通过车辆检测与跟踪算法对视频信息进行处理和运算,最后将处理结果通过VPBE输出到显示器上,系统的DDR2用于临时存储程序代码,图像数据,运算变量的临时数据等,Nor Flash可以在系统掉电的情况下存储整个程序的代码。

2 系统软件设计

软件处理模块主要有三个任务:视频图像的采集、存放和处理。在实时环境下,需要考虑运算量的原因,基于DM6437硬件采集的数据格式为Y:Cb:Cr(4:2:2)的图像,由于运动物体出现的区域和背景亮度差异较大,为提高系统处理速度,本文仅处理图像的亮度信号而忽略色度信号,同时选用单高斯模型提取前景[3]。对于车辆检测和跟踪工作主要包括三个方面:背景建模和提取、形态学滤波、区域连通标记和跟踪目标[4]。

2.1 背景建模和提取

2.1.1 单高斯模型

单高斯模型算法是指通过对固定背景建立一定模型,将当前图像与之逐像素比较,按规定法则进行判定,从而分离出较大的区域作为前景的方法,背景模型关于运动对象的检测能获得较准确可靠的结果,但是极易受光照条件,空间噪声等影响,因此在实际应用中要对背景模型的参数动态的更新以适应环境的变化。

高斯背景模型运动检测是为视频图像的每一个像素点建立高斯分布模型,通过判断当前帧中的每一个像素点是否属于背景来分离背景和前景,从而完成运动对象的检测,单高斯背景模型首先由Christopher Richard Wren等人提出来,用于人体检测和跟踪[1]。

对于一个背景图像,特定像素亮度的分布满足高斯分布,即对背景图像每个像素表示为f(x,y),而f(x,y)~N(u,δ2),在这样的背景模型中,每个象素属性包括均值和方差两个参数。f(x,y,i)表示为i时刻像素的亮度值,由公式(1)和公式(2)可获得到高斯模型参数:

u=1ti=1tf(x,y,i)(1)δ2=1ti=1t(f(x,y,i)-u)2(2)

其中,1<i<t,t为时间。

本文为满足实时性,选择系统加电后的第一张图像的每个像素为均值,方差初始化为130,即可获取初始化背景模型。

2.1.2 背景提取与更新

当新的一帧到达时,将图像的每一个像素点与背景模型相应的像素点做差,按公式(3)进行:

{,|f(x,y)-u|Τ,(3)

其中,f(x,y)为当前像素灰度值,(x,y)为坐标值,T为阈值,一般取λδ,λ为常数,一般取2.5。即可完成背景的提取,之后就是背景模型参数的更新[5]。

若当前像素被判断为背景,则利用公式(4)和公式(5)进行计算。

ut+1=(1-α)ut+αft+1(x,y) (4)

δt+12=(1-α)δt2+α(ft+1(x,y)-ut)2 (5)

其中,α为[0.1]之间的常数,本文设置为0.6,更新的速度更趋向于最新的图像值。背景模型的更新和背景与前景的分离是同时进行的,当前帧的某一点像素被判断为背景时,马上进行参数更新,作为下一帧的检测模型,当被判断为前景时,与背景分离开来,作为前景,其对应的背景参数不改变,并基于此模型将图像转换成二值图像。

2.2 形态学滤波

经高斯模型变换后的视频变为二值图像序列,在二值图像中可能出现因错判而导致的空洞和细小的噪声,需要进一步经形态学滤波处理以连接相关区域和去噪,具体的操作是腐蚀和膨胀[6]。腐蚀的作用是从二值图像中消除不相关细节,膨胀可以使裂缝桥接起来,先腐蚀后膨胀的过程具有消除细小的物体,在纤细点处分离物体和平滑较大的边界而又不明显地改变其面积。先膨胀后腐蚀的过程具有填充物体内部细小空洞、连接邻近物体、在不明显改变其边界的情况下平滑边界的作用。本文中选择33像素大小的模板对二值图像进行膨胀和腐蚀操作。在室内无遮挡,光照均匀等环境下玩具小车经过处理后的二值图像效果如图2所示,图3所示的是室外马路上有树遮挡,并且树叶有晃动,光照强度不断变化的情况下,捕获实际运动车辆及其处理后二值图像效果,图中左上方区域为整个图像的二值图像。

2.3 连通区域标记和跟踪目标

所谓4-邻域是指像素p上、下、左、右4个像素{p1,p3,p4,p6}构成的集合。互为4-邻域的像素叫4-邻接。所谓8-邻域是指像素p上下左右4个像素和4个对角线像素即{p0-p7}构成的集合,互为8-邻域的两像素叫8-邻接,如图4所示。

为实现多目标跟踪,需要对膨胀和腐蚀后的图像进行区域连通,从而把图像中的对象进行目标的划分,本文中选择8-邻域对图像进行区域划分,即图像中每个像素的8-邻域为同一个区域,为实现目标的跟踪需要找出每个区域的坐标的最大值Max(x,y)和最小值Min(x,y),据此在图像中绘制矩形,矩形区域就是系统所要检测跟踪的运动目标。

3 系统测试

为了测试系统检测与跟踪的速度与准确度,本文选择在两种不同的环境下进行测试,一种是室内环境,在光照无变化,无遮挡时,以遥控玩具车为运动车辆进行检测与跟踪。另一种是室外环境,有光照变化,有遮挡物,马路上实际运动车辆为运动目标进行检测与跟踪。系统所采用的CCD摄像头的速度为25帧/秒,部分视频处理截图效果如图5-6所示。

图5是室内环境下的跟踪效果,图6是室外恶劣环境下如有树叶晃动,光照强度变化的跟踪效果。矩形框区域就是系统所检测到的运动目标,该矩形框会随着目标的运动而运动,从而实现跟踪。

4 结束语

本文在分析和研究单高斯模型的基础上,以DM6437为硬件平台,运用腐蚀膨胀、区域联通等技术最终实现了基于单高斯模型提取的运动车辆,进而跟踪其运动。系统在25fps的视频流下能够实时准确地检测与跟踪运动车辆,达到了预期目标,为后续车型、车牌等的分析和处理打下了坚实的基础,但系统对光照变化和阴影所造成的负面效果需进一步处理和完善。

参考文献

[1]王圣男,郁梅,等.智能交通系统中基于视频图像处理的车辆检测和跟踪方法综述[J].计算机应用研究,2005(9):10-14.

[2]Texas Instruments Incorporated TMS320DM6437 Digital Media Pro-cessor[M].2007.

[3]Christopher Richard Wren Real-Time Tracking of the Human Body[C].IEEE trans on Pattern Analysis and Machine Intelligence,1997,19(7):780-785.

[4]Suzuki K,Horiba I,Sugie N.Fast connected-component labelingbased on sequential local operations in the course of forward rasterscan followed by backward raster scan[C]//Proc.15th Int.Conf.Pattern Recognition,Barcelona,Spain,2000(2):434-437.

[5]CHRISTOPHE B.Initializing EM using the properties of its trajecto-ries in Gaussian mixtures module[J].Statistics and Computing,2004,14(3):267-279.

人体检测与跟踪

人体检测与跟踪(精选9篇)人体检测与跟踪 第1篇传统的人体检测与跟踪技术主要实现一台摄像机中的单个人体的检测与跟踪, 而对于单摄像机...
点击下载文档文档内容为doc格式

声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。如若本站内容侵犯了原著者的合法权益,可联系本站删除。

确认删除?
回到顶部