检测与跟踪范文
检测与跟踪范文(精选11篇)
检测与跟踪 第1篇
1 话题检测与追踪的主要任务
作为一项能够对舆情进行充分分析的重要技术手段, 话题检测与追踪是近十年自然语言处理和信息检索领域的热点研究课题。TDT的主要任务是依据资源对信息源的时序性进行分析, 譬如娱乐话题的分析。话题检测是指检测系统尚未纳入的新型话题, 具体话题是指一些相同时间内的报道。话题跟踪是指将系统已纳入的话题与新输入的话题进行联系整合。TDT的本原问题是判定新闻报道的主题是否一致, 往往需要划分报道内容的层次结构、识别和分析报道内部子话题间的相互关系以及抽取主题思想, 因此, 有助于促进事件抽取领域开展相关研究。而报道内容的合理分析必然涉及语法、句法和语义等相关技术的应用, 从而间接促进自然语言处理领域内相关研究的发展。话题检测与跟踪在面向门户网站的新闻话题自动识别与组织、面向特定用户的话题定制与推送、敏感话题监控与跟踪、商业情报侦测与预警、国际局势跟踪与预测等领域有着重要应用价值, 有着很好的市场应用前景。
2 TDT国内外研究方向
TD报道切分、报道关联性检测、话题检测与跟踪以及针对各项任务的跨语言技术是TDT主要研究方向。TDT所有研究方向都存在交织关系, 即每一方向之间相辅相成, 缺一不可。譬如, 对于TDT技术来说, 报道切分是所有研究内容中最基础的一项研究, 若想充分应用TDT系统并且完成话题检测与跟踪, 首先要做的是将新闻报道流进行充分归纳以及有效切分。报道关联性检测主要是指检测不同报道的主要论述内容是否相同, 检测不同话题与一个报道间或者几个报道间的联系性也是话题跟踪与检测的主要工作内容, 所以说报道关联性检测是TDT核心内容, 也是TDT系统实现其功能的主要技术。话题检测系统是指在信息量巨大的新闻报道中检测出新型话题, 这是采用话题跟踪系统的先决条件。话题跟踪系统是指将已跟定的话题进行全面跟踪与归纳, 并充分识别与纳入其后续报道。话题检测是进行话题跟踪的基础技术, 话题跟踪是完善话题检测的重要工作。随着网络系统大范围融合, 信息资源中包含了不同语言形式的新闻资源, 所以跨语言技术应运而生, 该技术为话题检测与跟踪系统带来了技术性支持。综上所述, TDT的不同研究方向之间是相互辅助且密切关联的, 在TDT技术应用中, 各个研究方向缺一不可。然而实际需要并不只局限于以上方向, 在实际研究应用中, 还可以将TDT研究划分成多个子问题。TDT研究体系涉及多个研究方向, 各个组成部分之间相互依托并有机结合。由于TDT与信息检索、信息过滤、信息抽取以及文本挖掘等传统信息处理研究具备很多共性, 因此, 面向这些领域的相应方法与技术在TDT研究初期得到了广泛应用。随着TDT研究逐步深入, 独立于TDT特点的相应问题成为该领域的研究热点, 比如话题的突发性、时间信息以及报道内容层次差异等。近期, 相关研究主要集中于不同概率模型以及自然语言处理技术在TDT领域中的应用。
3 TDT典型算法分析
对于新事件识别算法, 卡内基梅隆大学 (CMU) 采用经典的向量空间模型来计算文档相似度。CMU使用Single-pass将输入的新闻应用聚类算法进行有序处理, 每处理一篇摘要及内容不同的新闻, 聚类就会有所更新。麻省理工大学阿默斯特分校 (UMass) 应用的算法是新事件识别算法, 该算法的主要实现方式是应用Inquery系统对事件进行排序检索, 根据详细的反馈将信息进行提取和选择, 最终应用In Route中路由框架实现最终算法。宾夕法尼亚大学 (UPenn) 使用的算法是将每个事件应用单链接的聚类方法进行表示, 新的事件是一项新的聚类, 新闻产生时这个聚类就会形成, 若后续报道中有重合内容较多, 则这些报道就会被划分到一个统一的聚类中。目前, 有K决策树分类、最近邻分类和Rocchio分类这三种主要的事件跟踪方法。KNN分类方法的主要技术方法是建立一个2 路KNN来代表每一事件, 进而能够简化传统的M路分类问题。若产生一个新的报道事件, KNN系统就能够将其应用方法转化成向量, 之后再将转化过后的向量与训练文档进行比较, 比较之后就会产生一个相应的余弦相似度值, 根据这一相似值能够确定K个最近邻居。决策树分类方法主要是构建一个根节点, 即确定事件的最大信息增益的特征, 并将其作为根节点, 然后利用根节点的特征值对数据进行分类, 最后将这一方法应用到每个分支中。作为最为经典的相似度查询方法, Rocchio方法的主要运行模式是对话题进行经验性模拟构造, 首先是规定话题的正确特征, 其次是加强能够正确描述相关话题的特征权限, 削弱不相关的描述权限。
TDT系统采用的方法在各个子任务中已取得很大进展, 尤其是话题跟踪, 但也有很多问题。纵观TDT系统发展进程以及研究内容, 能够充分确定其未来应增强对加强概率统计的功能性和自然语言的融合性研究, 而且概率统计这一极具特色的能将新闻资料进行充分整合利用的课题将成为一个新的研究热点。
4 结语
由于网络信息数量极大, 以及数据来源的多样性, 人们很难在不同且单一的信息之间进行充分了解, 因此, 往往很难融合某一事件的片面信息, 在理解某一事件上会出现不同程度的偏差。针对这一问题, TDT技术应运而生, 该技术作为一种信息处理工具, 能够将所有与某一事件相关的内容进行充分整合, 帮助用户全面了解某一事件。但是随着网络的兴起, 网络中的关联信息越来越丰富, 特别是新兴社交网络工具论坛、微博、微信等公众平台的广泛应用, 面向突发事件的特定需求和面向社会网络数据的新兴应用的话题检测具有越来越重要的意义, 因此, 将极大促进话题检测与跟踪技术的深入研究与应用。
参考文献
[1]赵华, 赵铁军, 赵霞.时间信息在话题检测中的应用研究[J].计算机科学, 2008 (35) .
[2]陈友, 程学旗, 杨森.面向网络论坛的突发话题发现[J].中文信息学报, 2010 (3) .
[3]徐会杰, 蔡皖东, 陈桂茸.面向论坛的突发性热点话题快速发现与跟踪[J].中南大学学报 (自然科学版) , 2014 (8) .
一种新的运动目标检测与跟踪算法 第2篇
一种新的运动目标检测与跟踪算法
常用的.运动目标检测算法无法解决在摄像机运动-目标运动情况下的运动目标检测,为此提出了背景匹配法.通过相关匹配算法使背景对齐,结合帧间差分技术有效地将运动目标提取出来;然后利用卡尔曼预测器对运动目标在图像中的位置进行预测,结合增量式带死区的PID控制算法,控制摄像机对准目标.实验结果表明,匹配块的选择加快了处理速度和提高了算法的稳定性,卡尔曼预测器使得跟踪更为平稳可靠.本方法具有简单、通用、抗噪等特点.
作 者:潘锋 王宣银 向桂山 梁冬泰 作者单位:浙江大学,流体传动及控制国家重点实验室,浙江,杭州,310027刊 名:光电工程 ISTIC PKU英文刊名:OPTO-ELECTRONIC ENGINEERING年,卷(期):32(1)分类号:V556 TP391.4关键词:目标检测 目标跟踪 背景匹配 卡尔曼预测器 PID控制
检测与跟踪 第3篇
【摘要】淄博市公路管理局中心试验室通过室内试验研究了不同配合比条件下,二灰稳定赤泥材料的抗压强度、冻融稳定性和水稳性等路用性能。根据试验结果铺筑试验路,优化了二灰稳定赤泥底基层的施工流程,解决了相应的技术难点,并进行多年的使用性能和环境影响跟踪监测。
【关键词】赤泥;室内配合比设计;施工技术
【Abstract】Zibo City Highway Authority central laboratory were studied through laboratory under different mixing ratio, compressive strength flyash stabilized material of red mud, freeze-thaw stability and water stability and other road performance. According to the test results of the test paving the way to optimize the flyash stabilized red mud subbase construction process to solve the corresponding technical difficulties, and years of use and performance tracking and monitoring of environmental impact.
【Key words】Red mud;Cement mix design;Construction technology
1. 序言
赤泥是铝厂经各种物理和化学处理,制取氧化铝后所剩余的红色粉泥状高含水量的强碱性固体废料,本文将二灰稳定赤泥用作道路底基层材料,对不同材料配比进行了室内对比试验,选择合适的配合比铺筑试验路段,并对其铺筑工艺和路用性能做了详细的分析论述,为赤泥在道路建设中的大规模应用提供依据(见图1)。
2. 二灰稳定赤泥道路材料的室内试验分析
2.1 室内试验的主要目的是掌握赤泥路基材料的基本物理力学性能,确定赤泥底基层混合料的配合比,研究含水率、块状赤泥等因素对赤泥底基层性能的影响,为赤泥底基层材料的应用和推广提供理论支持。
本次室内试验和试验路段现场所用的赤泥原料取自山东铝厂赤泥第一堆场东坝底的陈赤泥,这些赤泥堆存的年份至少在30年以上,其典型化学组成的分析结果见表1。其矿物组成见如表1所示。
2.2 赤泥底基层混合料配合比优化。
2.2.1 配合比优化试验包括:(1)通过重型击实试验确定配合比对应的最佳含水率和最大干密度。(2)根据重型击实试验结果进行无侧限抗压强度试验。以标养条件下的7天和28天抗压强度为主要指标,兼顾工作性和经济性,以最大限度的消耗赤泥为出发点,全面、系统地探讨三种原料之间的相互影响关系,优化配合比设计。试验方案与结果,见表2。
2.2.2 对试验结果进行分析对比可得出以下几点结论:
(1)混合料7天无侧限饱水抗压强度均能满足高速和一级公路对底基层的抗压强度要求。可见,这种混合料的道路底基层材料在强度指标上是完全有保证的。
(2) 从表2中可以看出在一定范围内增加混合料中的石灰剂量时,混合料的强度将随之提高,但超过相应范围后,增加混合料中的石灰剂量时,强度反而有所降低。
(3)从技术经济和大量应用赤泥的条件出发,结合施工现场的原材料情况,对试验结果分析确定,推荐采用配合比为赤泥:粉煤灰:石灰=75:15:10; 80:10:10; 85:7.5:7.5进行试验段铺筑。
3. 二灰稳定赤泥底基层试验段施工
(1)2008年中心试验室组织泰和公路公司在淄博市淄川区凤凰路铺筑二灰稳定赤泥底基层试验路铺筑。凤凰路长702m,宽27m,日平均交通量14693次,路面结构为2cm沥青混凝土+5cm沥青混凝土+下封层+17cm水泥稳定碎石+17cm二灰碎石。其中17cm二灰碎石设计改为20cm二灰稳定赤泥设计。通过对数据分析确定分别使用配合比为赤泥:粉煤灰:石灰=75:15:10; 80:10:10; 85:7.5:7.5进行试验段铺筑。压实完成后,立即对各项指标自检,自检合格,向赤泥底基层补充水分,使含水率比最佳含水率大3%~5%,然后覆盖养生。养生期间封闭交通,保护表层不受破坏。当施工中断,临时开放交通时,必须采取保护措施。石灰、粉煤灰稳定赤泥强度检验结果,见表3。
4. 施工排水
(1)施工前应先做好截水沟、排水沟等排水及防渗设施,特别是在多雨地区和雨季施工更应加强这方面的工作。
(2)施工间断期间,注意采取防水措施。若施工期间被雨水淋湿或被水浸泡,进行下一步施工前,必须晾晒至含水率许可范围内。
(3)如底基层地面在地下水位以下,必须做好防水、排水设计,杜绝水浸泡赤泥。
(4)各施工层表面做成2%~4%的排水横坡,确保在施工过程中,能及时使雨水排走。
5. 质量检测与跟踪监测
(1)质量检测。
试验路底基层按上述施工方法和注意事项修筑完成后,根据《公路工程质量检验评定标准》进行检测,所有检测项目均满足要求,达到二级公路质量标准。
(2)路用性能跟踪监测。
通过对试验铺筑完成后5d~360d的取芯分析,不同配合比二灰稳定赤泥材料芯样在底基层完工15d后都基本成型,表面光滑,个别底部存在脱落;完工一年一个月后,三种配合比的底基层材料芯样均达到完全成型,表面光滑。
对二灰稳定赤泥底基层的强度进行跟踪监测,见表4所示。
由表4可见,二灰稳定赤泥材料强度具有一定的延续性,随着时间的推移不断增长,能够较好的适应公路建设的需要。但早期强度相对较低,一定程度上影响了施工进度,所以在施工过程中要做好早期的养生和质量控制。
2009年5月检测各配比路段弯沉值均不大于20mm,满足设计弯沉指标要求。
(3)环境跟踪监测。
根据赤泥的特点委托淄博市环保局对水质与环境射线针对性进行了部分指标检测,如表5所示:
(4)通过施工前后的水质检测结果对比表5可以看出,赤泥的使用未对附近的地下水造成污染;
6. 结论
本文采用铝厂工业废渣赤泥为主要原料,配合一定比例的石灰、粉煤灰加以稳定构成二灰稳定赤泥,作为新型道路底基层填筑材料,取得良好的路用性能和经济效益。主要得到以下结论:
(1)以底基层材料抗压强度为主要指标,以技术经济和最大程度使用赤泥为出发点,进行配合比优化设计研究,确定了合理的配合比范围:赤泥75%~80%,石灰7.5%~15%,粉煤灰7.5%~10%,为不同条件下底基层材料配合比设计提供了选择依据。
(2)二灰稳定赤泥材料在确定的配合比范围内的7d和28d抗压强度均满足相关规范要求,并且具有较好的抗冻稳定性、干缩性和温缩性。试验路经过一年的运营,未出现早期病害,效果良好,表明二灰稳定赤泥可以作为高速和一级公路底基层材料。
(3)作为工业废渣的赤泥材料性质容易不稳定,筑路摊铺前要进行抽样检测,视其质量不同,适当调整配合比;修筑过程中要严格控制含水量和压实率。
(4)二灰稳定赤泥材料的应用,可以大大降低筑路成本,变废为宝,具有良好的经济效益。
(5)赤泥中含有少量Na2O,随着雨水的冲刷可能会污染地下水。试验路的环境跟踪监测表明,使用存放时间较长的陈赤泥可以较好的解决地下水污染的问题,取得良好的环境效益。
参考文献
[1] 中华人民共和国交通运输部.公路路面基层施工规范[R].北京:人民交通出版社,2000.
[2] 中华人民共和国交通运输部.公路路面基层施工技术规范[S].北京:人民交通出版社,2000.
[3] 中华人民共和国交通运输部.公路工程质量检验评定标准[S].北京:人民交通出版社,1998.
基于本体的话题检测与跟踪技术 第4篇
关联性检测的主要任务是检测随机选择的两篇报道是否论述同一话题。传统基于概率统计的TDT研究, 报道与话题或者报道与报道之间的相关性, 都是通过检验两者之间共有特征的覆盖比例进行评判。大部分针对关联性检测的研究都将问题的重心集中于文本描述以及特征选择。James Allan[1]是最早使用自然语言处理技术 (NLP) 解决TDT问题的学者之一。其采用VSM描述话题和报道, 并对模型中的命名实体赋予更高的权重, 以此执行TDT中的新事件检测 (NED) 任务。Nallapati[2]对这种方法进行了改进, 其首先将特征划分到不同的语法类别, 比如词性中的名词类和动词类, 以及命名实体中的时间类、地点类和人名类。在这个基础上采用语言模型的概率统计方法, 估计特征产生于不同语法类别的概率, 并以此标记特征的权重。Juha Makkonen[3]提出构建语义类, 通过语义类的相似度来判别文档相似性的方法, 以解决TDT中的关联性检测问题。
WordNet是Princeton大学的一组心理词汇学家和语言学家于1985年开始开发的一部语义词典数据库, WordNet根据词义而不是词形来组织词汇信息。WordNet 包含名词、动词、形容词和副词。WordNet按语义关系组织词典。由于语义关系是一种词义之间的关系, 而词义可以用同义词集合来表示, 因此很自然的把语义关系看作为同义词集合之间的一些指针。语义关系有同义关系、反义关系、上下位关系和部分关系等[4]。从WordNet的这些特点可以看出, WordNet与本体非常相似。TDT是针对自然语言报道而进行的研究, 在文本的相似性检测方面, 对于地理名词的相似性, 可以通过地理本体来扩展其语义特征。对于报道中的名实体和行为概念, 则可以通过WordNet来计算其概念信息度。
以往多数的文档相似性研究对句子的结构及句子中的词性未作深入的分析, 检索过程中忽略了文本的语法结构信息。S.Shehata等[5]分析了句子的动词结构, 结合传统的TF-IDF技术, 将文档句子结构中不同的、重要的概念赋以不同的权重, 改进了TF-IDF技术中出现次数相同的词有相同的权重的缺点, 但该文献在句子结构的分析上还不够深入。黄承慧等人[6]提出了基于主谓宾结构的文本语义检索算法, 该算法充分利用了句子的结构特征, 在计算句子的相似度研究中取得了比较好的效果。
基于前人研究成果, 提出对文档特征矢量选取的看法, 并在TDT研究中通过对本体技术的引入, 拓展了文档概念相似度技术在TDT中的应用, 并借助句子结构信息提高文档相似度的计算精确性。在特征词的使用方面, 给特征词增加重要度的方法也是一种新的提法。通过以上技术, 构造出新的TDT系统框架。
1 语义类模型
1.1 语义类分析
TDT系统模型主要有概率模型和向量空间模型, 向量空间模型不断发展, 到后来由几个向量来表示一篇文档, 进而有将文档用语义类[7]来表示文档的方法。Juha Makkonen[3]的研究中, 一篇文档划分为4个语义类:LOCATIONS、TEMPORALS、NAMES和TERMS类。这4个语义类的划分是通过事实观察得出的:某个事件是发生在特定某个时间段, 特定地点, 有某些特殊的人或事物相关。这些特征通过整理得出这4个分类。这种划分方式仍然不够细致。通过分析, 事件不但和某些特殊的人或事物相关, 而且还会涉及一些特殊的行为。一个事件, 是某些行为主体在某个时空范围内发生某些行为造成的, 涉及到4类特征:时间、地点、与事件相关的人或事物、所产生的行为。分析认为, 这4类特征必不可少而且唯一的决定一个事件, 而且这4类特征是一个事件必不可少的元素, 所以, 将这4类特征作为语义类是比较合理的划分方法。本文中, 特征词被划分为TEMPORALS、LOCATIONS、ENTITIES、ACTIVITIES等4个语义类。
语义类这样划分还有一个优点, 就是在句子结构分析时会涉及到主、谓语成份, 这个在后文中可以看到, 句子三元组的构成需要一些名词性和动词性的特征词, 而这些特征词都存在于ENTITIES和ACTIVITIES类。
1.2 词项处理
一篇文档首先要经过词语切分和识别提取出其中的特征词。这里特别指出, 由于汉语文本中的歧义较多, 汉语语句的切分有一定难度, 国内在文本消歧方面也有很多的研究。文档经过词语切分以后, 就要进一步识别出词段的词性, 这就需要查找语义词典给相应的词段赋于词性, 对于多词性的词段要通过所在句子的句法构成来进行词性判别, 找到符合句法逻辑关系的词性, 这时候也要用到一个句法判别系统。在判定词性的过程中, 要将一些对文章特征贡献不大的词舍弃, 留下对文档比较有用的特征词, 比如描述时间和地理位置的词段, 及名词性词段、人名、专有名词和动词词段。这些词将按照前面所分的语义类进行归类并计算其对文章的重要度。
对于描述时间段的词段, 在预处理阶段要尽可能的规范化, 即将其映射在全局统一时间轴线上。如果文中有某个明确的时间点能使某个时间描述映射在统一时间轴线上, 则这个时间描述应该保留, 否则就应该舍弃;因为无法确定的时间描述是无法计算其相似度的。
整个过程形式化说明如下。
定义D={d1, d2, , d∣D∣}, D表示一篇文档。
筛选D中的特征词并划分为4个语义类来表示, 即D={T, L, S, A}。
其中T={t1, t2, , t∣T∣}, L={l1, l2, , l∣L∣}, E={e1, e2, , e∣E∣}, A={a1, a2, , a∣A∣}分别表示4个语义类TEMPORALS、LOCATIONS、ENTITIES和ACTIVITIES。E中的词为名词词性, A中的词为动词词性。
语义类中的特征词都要增加重要度属性, 以T为例, T变为{ (t1, IMPt1) , (t2, IMPt2) , , (t∣T∣, IMPt∣T∣) }, 其他语义类与此类似。
2 相似度计算
2.1 重要度值的确定
由于新闻报道都有一个主题, 有些词段可能和这个主题非常接近, 而有些词段可能与主题关系不是很密切。在计算文档的相似度时, 如果一个词段在文中出现的频度较高, 则认为该词段更接近主题, 对于文章相似性的比较来说更重要一些。词段的这个特性要通过重要度来体现, 重要度的计算采用以下方法。
首先, 计算名词和动词性特征词在文档中的词频。然后, 将这些特征词按词频值的高低降序排列, 排列后的自然数序号分配给该特征词作为其对该文档中的重要度, 即频度越高的词其重要度的数值越小。对于TEMPORLS和LOCATIONS类的特征词, 其重要度不能以其词频来决定, 则将其与所在段落, 所在句子中的名词和动词的特征词词频高的重要度对应。
2.2 TEMPORALS类的相似度计算
设Tx、Ty为两个文档的TEMPORALS类, tx、ty分别是它们的两个时间段分量, 单位为天, tx∈Tx, ty∈Ty, 则tx和ty的相似度为
SIM (tx, ty) =2*INTERSECTION (tx, ty) / (tx+ty)
式中:INTERSECTION (tx, ty) 表示tx、ty这两个时间段的交集, 单位为天。
这里两个时间段的相似度要再用其重要度进行修正。
SIM′ (tx, ty)
=0.8SIM (tx, ty) +0.2max-1 (IMPtx, IMPty)
式中:max-1表示最大值的倒数。
这里用重要度进行修正只是将重要度最大值取倒数并与前面计算得到的相似度值作了加权, 因为重要度值越大表示该特征词的排序越靠后, 对文档主题越不重要。即使是所比较的两个特征词词形完全一致, 但因为其对文档的重要度不同, 进行修正后相似度也不会是1。由于计算中给重要度倒数值分配了0.2的权重, 因此修正的结果也不会因为重要度值的介入而变化过大。
假设Tx中有n个时间段, Ty中有m个时间段。Tx中的某个时间段tx要和Ty中的m个时间段都比较一次, 就会有m个结果, 选取其中的最大值表示tx与Ty的相似度。当tx中的n个时间段都和Ty中的m个时间段进行比较过后, 就会有n个这样的最大值。计算这些最大值的算术平均值即为Tx, Ty的相似度, 即
undefined
2.3 LOCATIONS类的相似度计算
地理位置的相关性最适合借助地理本体来计算, 任何两个地理位置的相似度用其在地理本体中路径的相似性来表示。用这两个地理位置的公共路径的2倍去除以它们分别到根节点的路径总和, 用它们的商来表示这两个地理名词的相似度[3]。
假设Lx、Ly为两个文档的LOCATIONS类, lx、ly分别是Lx、Ly的两个分量, lx∈Lx, ly∈Ly, 则lx和ly的相似度为
SIM (lx, ly) =2*λ (LAST-SHARE (lx, ly) ) /λ (lx) +λ (ly) )
式中:λ (x) 表示在树状地理本体中地理名词节点到地理根节点的距离;LAST-SHARE (lx, ly) 表示两个地理名词最后一个共享节点。
与TEMPORALS类类似, 两个地理名词段的相似度要用重要度进行修正。
SIM′ (lx, ly) =0.8SIM (lx, ly) +0.2max-1 (IMPl1, IMPl2)
与TEMPORALS类类似, Lx, Ly的相似度为
undefined
2.4 ENTITIES和ACTIVITIES类的相似度计算
ENTITIES类和ACTIVITIES类的相似度计算采用基于WordNet的计算特征词语义距离的方法。
WordNet是层次树结构。概念在WordNet树中有深度和宽度, 深度是指概念离根节点的路径长度, 宽度指概念孩子节点的个数。一般来说概念的深度越大, 说明概念的分类越细, 概念的相似度就越高;对于同一深度的概念, 概念的宽度越大, 表明概念划分的比较细, 概念的相似度就高。因此, 在计算两个特征词的语义距离时应该考虑其深度和宽度对相似度的影响, 相应的修改语义距离的权重。
语义距离的计算如下[8]。
undefined
式中:C1, C2表示两个概念;wi表示两个概念之间最短路径上的权重。
定义Dep (C) 为概念C在WordNet中的深度, Dep (C) 表示概念C到根节点的路径长度。定义Wid (C) 为概念C在WordNet中的宽度, Wid (C) 表示概念C的子节点的数目。定义Weight (C) 为由概念C引出的边的权重[8]。
undefined
式中:当C为根节点时, Weight (C) =1/wid (C) ;当C为其他节点时, Weight (C) 为其父节点的权重乘1/2, 再除以其宽度。这里如果C节点如为叶子节点, 则令1/wid (C) =1。
这样当C为根节点时, 深度为0, 权重为其宽度的倒数, 宽度越大, 权重越小, 距离也就越短。当C为其他节点时, 随着深度的加深, 到节点C, 每次给上位节点的权重都乘1/2并除以其宽度, C的权重就越来越小, 其路径也就变短, 表示概念C的权重随深度的加深和宽度的加大, 距离也越短。
按照两个概念间的语义距离越短, 两个概念越相似的原则, 列出一个求两个概念相似度的公式[8]。
undefined
当求得ENTITIES类或ACTIVITIES类中两个特征词的相似度后, 语义类的相似度计算都类似之前TEMPORALS类的算法, 再不赘述。
2.5 句子结构的相似度计算
采用句法分析工具LingPipe[6], 分析句子的主谓宾成份并构造句子的三元组形式。这个三元组形式将是计算句子结构相似度的依据。
在句子三元组的基础上增加了时间和地理的特征词, 变成句子五元组。句子中的特征词在比较计算时不需要用重要度做再修正, 这是因为这里的计算是比较两个句子语义是否相似, 不必考虑特征词是否接近文档主题。虽然这里不必考虑特征词的重要度, 但由于句子对文章主题的重要性不同, 因此也给句子三元组增加了重要度的属性。句子的重要度为IMPs=max (IMPei, IMPaiin ST) , 表示这个值为句子中所有名词和动词的重要度值的最大值。
定义句子ST={s, v, o, t, l}, s、v、o分别为作主语、谓语、宾语的特征词集合, s, o⊂E, v⊂A;t、l分别表示与句子相关的时间或地点的特征词集合t⊂T, l⊂L。
假设ST1, ST2为两篇文档中的两个句子, s1, s2分别为它们的主语。s1i, s2j分别是其主语中的特征词, 特征词相似度的计算方法见前文。则s1, s2的相似度为
undefined
其他成份的相似度计算与此类似。
计算出这些句子成分的相似度后, 则两个句子的语义相似度为
SIM (ST1, ST2) =w1*SIM (s1, s2) +w2*SIM (v1, v2) + w3*SIM (o1, o2) +w4* SIM (t1, t2) +w5* SIM (l1, l2)
式中:wi为相应成份的权重, i=1, 2, 3, 4, 5。
最后, 通过句子的重要度对两个句子的相似度进行修正。
SIM′ (ST1, ST2)
=0.8SIM (ST1, ST2) +0.2max-1 (IMPs1, IMPs2)
2.6 整篇文档的相似度计算
当计算出了五个语义类矢量的相似度和句子结构的相似度后, 就可以求出两篇文档的相似度。一般文档的相似度是这些相似度分量的一个加权和。
设SIM (T1, T2) , SIM (L1, L2) , SIM (E1, E2) , SIM (A1, A2) 分别是TEMPORALS、LOCATIONS、ENTITIES和ACTIVITIES的相似度, SIM (ST1, ST2) 是句子结构的相似度, 则两篇文档D1, D2的相似度为
SIM (D1, D2) =w1SIM (T1, T2) +w2SIM (L1, L2) +w3SIM (E1, E2) +w4SIM (A1, A2) +w5SIM (ST1, ST2)
这个公式中的权重wi的值可以通过用典型数据对系统进行训练调整, 确定出比较合理的wi值。
3 结论
话题检测与跟踪技术自提出以来到现在技术不断深入, 研究任务也不断提高。尽管如此, 该项技术的核心研究即文档的关联性检测方面仍需要不断挖掘其潜力, 以降低文档相似度比较中的漏检和误检。本体作为一种新出现的技术目前在话题检测与跟踪技术中的应用比较少, 将本体应用于TDT研究也促进了TDT技术的发展。
在前人所提出的文档语义类矢量这种特征词的分类法的基础上进行改进, 提出将动词特征词单列为一个语义类。在特征词的相似度计算方面, 引入本体技术, 通过语义词典WordNet计算特征词的概念相似度, 改进系统只能识别同词形的词, 而对同义词漏检的缺陷。提出给特征词增加重要度属性的办法, 使文档的主要特征更突出。增加了句子结构相似度的判断, 借此提高文档相似度判断的准确性。
话题检测和跟踪技术的研究, 要由自然语义理解技术来推动, 本体技术在自然语义理解方面有很大的潜力, 可以相信将来本体技术在TDT研究中会得到更广泛的应用。
参考文献
[1]ALLAN J, JIN H, RAJMAN M, et al.Topic-based novel-ty detection[C]//Proceedings of the Johns HopkinsSummer Workshop[C].CLSP, Baltimore, 1999.
[2]NALLAPATI R.Semantic language models for topic de-tection and tracking[C]//Proceedings of HL T-NAACL2003 Student Research Workshop[C].Edmon-ton, 2003.
[3]MAKKONEN J.Investigations on event evolution in TDT[C]//Proceedings of HLT-NAACL 2003 Student Re-search Workshop[C].Edmonton, 2003:43-48.
[4]MILLER G A, BECKWITH R, FELLBAUM C, etal.Introduction to WordNet:An on-Line lexical data-base, in Five Papers on WordNet, CSL report[R].Princeton, USA:Princeton University, 1993.
[5]SHEHATA S, KARRAY F, KAMEL M.A Concept-based Model for Enhancing Text Categorization[C]//Proceedings of KDD 2007.San Jose, California, USA, 2007:629-637.
[6]黄承慧, 印鉴, 侯昉.一种基于主谓宾结构的文本检索算法[J].计算机科学, 2010, 37 (9) :173-176.
[7]MAKKONEN J, AHONEN-MYKA H, SALMENKIVIM.Topic detection and tracking with spatio-temporalevidence[C]//ECIR, Pisa, 2003:251-265.
检测与跟踪 第5篇
一、选择题
1.下列有关生态系统中信息传递的叙述,正确的是()A.生态系统中的信息分为物理信息和化学信息两大类 B.生态系统中的信息来源于生物群落中的各种生物
C.牧草生长旺盛时,为食草动物提供采食信息,这对食草动物有利,对牧草不利 D.植物生命活动过程中产生的生物碱、有机酸等代谢产物就是化学信息 2.下列有关生态系统稳定性的叙述,错误的是()A.抵抗力稳定性弱的生态系统恢复力稳定性一定强 B.生态系统自我调节能力的基础是负反馈调节
C.适当增加草原生态系统的物种丰富度可有效提高其抵抗力稳定性 D.“野火烧不尽,春风吹又生”体现了生态系统的恢复力稳定性
3.环境问题是全世界人民密切关注的问题,以低能耗、低污染、低排放为基础的低碳经济模式越来越成为促进国家经济持续增长和可持续发展的重要经济模式。下列说法正确的是()A.煤、石油和天然气的大量燃烧,致使大气中的CO2急剧增加 B.大气中CO2进入生物群落的方式只能是植物的光合作用 C.生物群落中的碳元素进入大气的方式只能是微生物的分解作用 D.大力植树造林是缓解温室效应的唯一方法 4.下列事例中,属于恢复力稳定性的是()A.由于乱砍滥伐,长江流域森林面积急剧减少,引发了百年不遇的洪涝灾害 B.当天气干旱时,草原生态系统中的动植物种类和数量一般不会有太大变化 C.乡村一个池塘,每天都有人到池塘边洗东西,可每天早晨池水依然清澈如故 D.一个相对封闭的生态系统中闯入某种大型肉食动物后,生态系统的各种成分相互作用直到恢复原来的状态
5.某池塘演变早期,藻类大量繁殖,食藻浮游动物水蚤随之大量繁殖,导致藻类数量减少,接着又引起水蚤减少。后期因排入污水,引起部分水蚤死亡,加重了污染,导致更多水蚤死亡。关于上述过程的叙述,正确的是()A.早期不属于负反馈调节,后期属于负反馈调节 B.早期属于负反馈调节,后期属于正反馈调节 C.早期、后期均属于负反馈调节 D.早期、后期均属于正反馈调节
6.据了解,野生扬子鳄种群的雌、雄比例一般稳定在5∶1左右,这样的性别比是由孵化时的温度所决定的。繁殖季节雄性扬子鳄发出“轰轰”的声音,雌性扬子鳄则根据声音大小选择巢穴位置。当声音大时,雌鳄选择将巢穴筑于山凹浓荫潮湿温度较低处,则产生较多的雌鳄。以上事实说明生态系统中信息传递()A.能够调节生物种间关系,以维持生态系统的稳定 B.影响生物种群的繁衍,维持种群数量的稳定 C.维持生物体正常生命活动,调节生物内环境的稳态 D.对生物进行自然选择,促进生物进化
7.(2015·泰州模拟)下图表示生态系统各组成成分之间的能量流动、物质循环及信息传递过程,则图甲、图乙、图丙可依次表示()
A.能量流动、碳的循环、信息传递 B.能量流动、信息传递、碳的循环 C.碳的循环、能量流动、信息传递 D.信息传递、能量流动、碳的循环
8.(2015·西安模拟)下面是某城市人工湿地示意图,需要补充完善的碳循环过程包括()
A.植物光合作用大气中CO2 B.动物―――→大气中CO
2C.植物光合作用大气中CO2和动物―――→大气中CO2
D.以上均错误
9.(2015·南昌调研)下面是某农业生态系统模式图,有关该系统的叙述错误的是()呼吸作用
呼吸作用呼吸作用呼吸作用
A.微生物利用的是农作物通过光合作用固定的能量 B.多途径利用农作物可提高该系统中能量的传递效率 C.沼渣、沼液作为肥料还田可以促进物质循环再利用 D.食用菌、产甲烷杆菌及蚯蚓是该生态系统中的分解者
10.(2015·合肥质检)下面为生物圈中碳元素的循环过程,下列有关叙述正确的是()
A.④过程代表绿色植物的光合作用,③过程代表化能合成作用 B.图中甲、乙、丙分别代表消费者、生产者和分解者 C.物质循环是指碳元素在甲、乙、丙间以有机物的形式传递 D.图中甲、乙、丙包含的所有种群共同构成生物群落
11.下图一为科学家提供的大气中近40年每月平均CO2浓度图,图乙为碳元素在生态系统中循环的模式图,“甲、乙、丙”表示生态系统的生物成分,“a~g”表示生理过程。下列相关叙述中,正确的是()
A.图一所示CO2浓度逐年升高,主要原因是植物被破坏,使CO2的消耗减少 B.图二中c过程代表光合作用,f过程代表微生物的呼吸作用 C.图二中甲代表的营养级在生态系统的食物链中占有的碳元素最多 D.图二中丙所代表的生物的细胞内没有成形的细胞核
12.生态系统的一个重要特点是它常常趋向于稳态。下图甲代表载畜量对草原中生产者的净生产量的影响(净生产量即生产者光合作用所制造的有机物总量与自身呼吸消耗量的差值)。图乙表示生殖数量、死亡数量与种群大小的关系。下列说法错误的是()
A.从图甲可知,c点以后生态系统的稳态将受到破坏 B.从图甲可知,适量的放牧不会破坏草原生态系统的稳态 C.从图乙可知,P点时种群的年龄组成为衰退型
D.从图乙可知,F点表示该环境所能维持的种群最大数量
二、非选择题
13.(2015·湖北八市联考)下面为生物圈中碳循环示意图,其中①至⑩表示过程,Ⅰ至Ⅳ表示细胞中的某些结构。据图分析回答下列相关的问题:
(1)图中表示绿色植物光合作用过程的是________,表示呼吸作用过程的是________(请用图中数字符号填写)。
(2)甲代表的生态系统成分是________,该成分包括绿色植物和X,其中的X在过程①中与绿色
植
物
最
主
要的不
同
之
处
是__________________________________________________。
丙代表分解者,其中的Y主要指________类生物。
(3)图中结构Ⅲ与 Ⅳ最主要的区别是___________________________________________ ________________________________________________________________________。(4)正常情况下,①=②+③+④,故大气中的CO2含量相对平衡,但是⑥这一途径使地层中经过千百万年而积存的碳元素在很短的时间内大量释放,打破了生物圈中碳循环的平衡,导致温室效应,对人类的生存构成威胁。请你提出降低温室效应的措施(至少两条):
________________________________________________________________________ ________________________________________________________________________。14.下图1是某生态系统中碳循环模式图,图2为某生态农业发展模式图,据图回答下列问题:
(1)图1中甲代表的生物成分是________,B代表的生理过程是__________。造成温室效应的主要原因是____________________。若第二营养级的生物具有食用和药用价值,则说明生物多样性具有________价值。
(2)图2中农作物所积累的有机物中能量的去向有_________________________________ ________________________________________________________________________。从生态系统的主要功能分析,该生态农业较好地实现了____________________________。
(3)如果要提高该农业生态系统的抵抗力稳定性,依据生态系统中生物种群间的相互关系,应科学增加农田中的________。
(4)图2中属于图1中丙代表的生物有_________________________________________。15.(2015·银川模拟)淡水鱼类养殖是将鱼种投放到水体中并加以一定的饲养管理,或对水体中的鱼类资源进行繁殖和保护,从而获得高产的养殖方式。养殖技术人员对某池塘生态系统的营养结构和能量流动情况调查后,得到了下面甲图所示的食物网,乙图表示某生态系统功能随时间的变化曲线。请分析回答下列问题:
(1)甲图的生物中,含能量最少的是________,因为能量流动的特点是________________________________________________________________________。
该生态系统中有食物链________条,鲫鱼处于第________营养级。
(2)如果去除该生态系统中的浮游动物和双翅目幼虫,则黑鱼的产量将________,生态系统的抵抗力将________。
(3)甲图的食物网中,浮游植物为摇蚊幼虫提供了可以采食及栖息的信息,黑鱼能够根据鲫鱼量的信息控制繁殖,这说明了生态系统中信息传递的作用是________________________ ________________________________________________________________________。(4)乙图中两条虚线之间的部分表示___________________________________________。(5)y表示外来干扰对生态系统的影响,y越大,说明该生态系统______________;x越大,说明该生态系统____________;一个生态系统的x与y组成的面积越大,该生态系统____________。
答
案
1.选D 生态系统中的信息包括物理信息、化学信息和行为信息三大类;生态系统中的信息可以来自生物,也可以来自无机环境;牧草生长旺盛时,为食草动物提供采食信息,这对食草动物有利,对牧草也有利,这样可以调节生物的种间关系,维持生态系统的稳定。
2.选A 抵抗力稳定性弱的生态系统恢复力稳定性不一定强,如极地苔原生态系统,生物种类少,抵抗力稳定性弱,但由于温度极低,条件恶劣,恢复力稳定性也很弱。
3.选A近代工业的迅速发展,导致化学燃料大量燃烧,打破了生物圈中碳循环的平衡,因此减缓温室效应的重要措施是减少化学燃料的燃烧。光合作用和化能合成作用都能够固定大气中的CO2。动植物的呼吸作用和微生物的分解作用都能释放CO2。
4.选D A项为生态系统稳定性被破坏后对自然环境的影响;B、C项均表现为“抵抗干扰、保持原状”,故为抵抗力稳定性;D项表现为“遭到破坏,恢复原状”,故为恢复力稳定性。
5.选B 负反馈调节是指某一成分的变化所引起的一系列变化抑制或减弱最初发生变化的那种成分所发生的变化,题干中所述的早期符合负反馈调节的机制。正反馈调节是指某一成分的变化所引起的一系列变化促进或加强最初所发生的变化,题干中所述的后期属于正反馈调节。
6.选B 根据题干信息可知,生态系统中信息传递能够影响生物种群的繁衍,维持种群数量的稳定。
7.选C 图甲表示生态系统中的碳循环,图乙表示生态系统的能量流动,图丙体现双向性,因此为信息传递。
8.选C 图中只有生物成分之间及微生物与大气中CO2间的碳流动过程,缺乏植物和动物与大气间的CO2交换过程,大气中的CO2进入生物群落主要依赖于植物的光合作用,生物群落中的碳进入大气主要通过植物、动物和微生物的呼吸作用(图中已有微生物的分解作用)。
9.选B 流经该生态系统的能量是生产者固定的太阳能总量,因此微生物利用的是农作物通过光合作用固定的能量;多途径利用农作物,可提高能量利用率,不能提高能量传递效率;沼渣、沼液肥田可以促进物质循环利用;营腐生生活的食用菌、产甲烷杆菌及蚯蚓都是该生态系统中的分解者。
10.选D 由图示信息可知,甲代表分解者,乙代表生产者,丙代表消费者,④过程代表光合作用和化能合成作用,③过程代表呼吸作用;碳循环是指碳元素在生物群落和无机环境间进行的循环;图中的生产者、消费者和分解者共同构成了生物群落。
11.选C 图一中CO2浓度逐年升高主要是由化学燃料的燃烧造成的;
图二中甲是生产者,乙是消费者,丙是分解者,丁是无机环境中的CO2库,c过程为消费者的呼吸作用,f过程为分解者的呼吸作用;甲是生态系统的第一营养级,固定的有机物中的能量是流经生态系统的总能量,因此占有的碳元素最多;丙是分解者,其中有真核生物也有原核生物,真核生物有成形的细胞核。
12.选C 根据图甲可知,c点以后生产者的净生产量小于a点,生产系统的稳态将遭到破坏;由图甲可知适量的放牧使生产者的净生产量增加,不会破坏草原生态系统的稳态;根据图乙可知P点时种群的出生率等于死亡率,其年龄组成为稳定型;F点表示该环境所能维持的种群最大数量,即“S”型曲线中的K值。
13.解析:(1)图中过程①表示光合作用或化能合成作用利用二氧化碳的过程,过程②③④分别表示生产者、消费者和分解者通过呼吸作用释放CO2。(2)甲是自养型生物,因此属于生产者;生产者除绿色植物外,还包括能通过化能合成作用合成有机物的生产者,与绿色植物比较,这类生物将无机物转化为有机物所利用的能量来自体外环境中某些无机物氧化释放的化学能。分解者主要是指营腐生生活的细菌和真菌,则Y主要指真菌。(3)结构Ⅲ和Ⅳ分别是真核细胞的细胞核和原核细胞的拟核,细胞核有核膜包被,拟核没有核膜包被。(4)温室效应是由大气中CO2含量增加引起的,降低温室效应,可以增加大气中CO2的“去路”,即可以通过植树造林来消耗大气中更多的CO2,同时减少大气中CO2的“来源”,即可以通过减少化学燃料的燃烧,同时开发新能源替代化学燃料来实现。
答案:(1)① ②③④(2)生产者 不能利用光能,但是能利用体外环境中的某些无机物氧化释放的化学能来制造有机物 真菌(3)Ⅲ有以核膜为界限的细胞核,而Ⅳ没有(4)①植树造林;②减少煤和石油的燃烧;③开发新型能源(答案合理即可)14.解析:结合图1分析碳循环过程可知,甲代表生产者、乙代表消费者、丙代表分解者,A代表的生理过程是光合作用、B代表的生理过程是细胞呼吸,主要是有氧呼吸。产生温室效应的主要原因是大气中CO2过多,而大气中CO2过多是人类大量燃烧化学燃料造成的。图2中农作物起着重要的作用,其固定的有机物中能量的去向有:流向下一个营养级、自身呼吸消耗、被分解者分解。生态农业的建立实现了物质的循环利用和能量的多级利用,减少了能量的浪费和环境污染。生态系统的抵抗力稳定性与其营养结构的复杂程度有关,生物种类越多,其抵抗力稳定性越高。图1中丙代表分解者,图2中属于分解者的生物有蚯蚓、食用菌。
答案:(1)生产者 细胞呼吸 化学燃料过快过多的燃烧 直接(2)流向下一个营养级、自身呼吸消耗、被分解者分解 物质的循环利用和能量的多级利用(3)生物种类(4)食用菌、蚯蚓 15.解析:(1)甲图中黑鱼所占的营养级最高,其所含能量最少,原因是能量流动具有单向流动、逐级递减的特点。该食物网中食物链有3条,分别为:浮游植物→浮游动物→双翅目幼虫→鲫鱼→黑鱼,浮游植物→浮游动物→鲫鱼→黑鱼,浮游植物→摇蚊幼虫→鲫鱼→黑鱼。鲫鱼处于第三和第四营养级。(2)如果除去浮游动物和双翅目幼虫,必然导致摇蚊幼虫增多,可推出黑鱼的产量将会上升;因为物种丰富度减少,所以该生态系统的抵抗力会降低。(3)浮游植物为摇蚊幼虫提供了可以采食及栖息的信息,黑鱼能够根据鲫鱼量的信息控制繁殖,这些体现了信息传递调节生物种间关系、维持生态系统稳定性的功能。(4)乙图的虚线部分表示处于动态平衡,说明是生态系统的稳定性。(5)y表示外来干扰对生态系统的影响,偏离程度越大,说明越容易受到破坏,抵抗力越小;x表示破坏后恢复平衡的时间,x越大则恢复平衡越慢,说明恢复力越小。
信誉测评与跟踪系统 第6篇
测量模型的内外指标
企业信誉是企业在市场和社会中获得的美誉和信任以及由此转化形成的无形价值。从资产角度讲,信誉资本是由品牌和与相关者利益关系所蕴含的市场和社会资本构成的。
确定内部细分指标:通过多年大量理论和实证研究,国际信誉研究院发现,企业信誉与企业的产品和服务、公司业绩、公司治理、创新力、领导力、社会责任、工作制度以及细分指标高度相关。为此,我们开发了企业信誉指标测量分析模型(RepTrakAnalytlcal Modeling)。
建立与企业市值的关联度:通过信誉指标测量分析模型对北美上市公司的实证研究,我们逐步确定了模型的可靠性,并应证了信誉指标综合分值与企业市场价值成正相关。由此我们确定信誉指标综合分值即代表企业的信誉度。
实证研究表明,从总体上看,信誉度提高5%相当于公司市场价值增加0.5%到2.5%。具体细分指标上,要提高公司5%的信誉度,公司需要对产品和服务的认可提高10%,或是在工作制度方面提高26名,或是在社会责任方面提高24%,或是在业绩方面提高55%,等等。究,我们发现企业信誉高低主要表现在五个方面:
■知名度:不论多好的企业如果没有知名度就没有真正意义上的信誉。
■独特性:企业区别于竞争对手的重要要素,也是企业信誉信息平台的重要组成部分。
■一致性:在不同对象、时空条件下呈现一致的企业形象、核心价值观、策略方向等。
■透明度:公开交流,表明自信、可靠和负责任,有利于建立、保持和维护信誉。
■诚信度:真诚守信,表明可靠,引发信任,触动情感。
知名度100
由此,我们开发了企业信誉度外部测量模型,(RepTrak Pulse Score)将其主要用于对企业信誉的外部市场调查。为了解决市场调查在时空上和调查人员专业知识上的局限,我们的信誉度外部测量模型转而由喜爱度、羡慕度、尊敬度、信任度四方面组成。
通过北美上市公司的数据实证研究证明:使用信誉度外部测量模型和使用企业信誉指标测量分析模型所得出的结果高度一致,从而可以对接使用。这样,我们将信誉调查结果通过信誉度外部测量模型得出分值,然后通过企业信誉指标测量分析得到细分指标的贡献值。
四大跟踪子系统的完善
通过广泛的国际性研究,我们发现公司的信誉主要受这几方面的影响:组织功能协调的配合度与一致性、外部战略的沟通交流成效、利益相关者关系的认同与支持,媒介管理的角度与时机。
为使企业负责人在日常管理中能系统地考察和分析影响企业信誉的这些因素。在测量模型之外,国际信誉研究院还专门开发出了信誉跟踪系统,该套系统由四组产品构成:信誉测评、媒体测评、战略协调、通讯测评。每组产品可以单独使用,也可以合并为一个综合系统使用。
信誉测评(RepTrakTM Monitor):
跟踪分析利益相关者尤其是监管、客户、员工、股东的意见以反映他们如何看待公司的表现。
公司遭遇困难时,他们会做出怎样的反应?驱动利益相关者的原则性问题是什么?通过什么方式和内容更有效地获得利益相关者的信赖和支持?要有效地管理公司信誉并提高公司的经济效益,弄清上述问题至关重要。
深度调研包括:
■企业本体调研:对企业经营管理、品牌建设、企业文化建设、工作环境等方面进行深入的调查研究,掌握企业第一手信息资料。
一市场调研:主要是对企业产品销售及服务的调研,了解市场及消费者的满意程度。主要调查对象是消费者及潜在的消费者。
■其他利益相关者调研:包括投资者、社区、竞争对手等利益相关者,了解他们对该企业品牌信誉的满意程度。
信誉积分卡(RepTrakTMScorecard)可以即时监测锁定的各细分利益相关者群体的行为,以及外部企业战略沟通管理、媒介管理、内部组织功能协调管理的成效。
企业信誉监测以竞争对手、行业标杆,或其他选定指标为参照,进行对比分析。
媒体测评(Media RepTrakTM):
跟踪分析平面和多维媒体对公司报道的动向。
媒体测评(Media RepTrak)是指运用科学的手段来跟踪有关公司的实时媒体报道动向。无论报道出现在世界的哪个角落,媒体测评都能给企业提供全方位的视角,并分析公司信誉是如何形成的。
媒体对公司信誉有很大的影响。客户、股东、分析家、政治家、员工,不管企业是否意识到这点,事实上所有媒体的报道都会影响到公司的信誉。媒体的报道态度会影响到客户选择购买哪家产品,影响到员工选择为哪家公司服务。媒体在报道中所体现出的态度和情感因素会影响到相关利益者对公司的支持度。
媒体测评能够及时反馈结果。它让管理者了解关于自己公司的舆论,根据舆论动态来分析问题和采取对策。媒体测评为高级行政人员提供了一个至关重要的战略管理工具,能够使他们识别问题的重要程度:同时对来自世界各地的报道做出理智的回应。媒体测评首先使用高端识别检索技术搜集平面、多维媒体关于公司的报道并跟踪相关的报道,然后将其归类,与公司战略目标计分卡中的7大驱动因素和23项指标相对应。
通讯测评(RepTrakTM Messaging):
跟踪和分析企业通讯与交流成效。
通讯测评采用严格的方法来检查公司信息沟通状况。它的测评对象是员工、股东、客户、消费者和媒体等。
一般涉及的问题有:
■请问您是怎样看待自己的公司的?
■您是以公司简讯的方式持续向员工传递信息吗?
■您的网站传达了应传达的信息吗?
■您对外新闻发布是否通过公司的信誉平台?
■公司能否进行良好的信息交流和传递信
战略协调测评(ECQ):
跟踪和分析企业组织功能战略协同性。
战略协调测评的核心是实现对员工的高效管理。员工对公司战略目标的理解和支持度越高,组织的运作就会越好。我们把这样的理解与支持称为战略商业联盟活动,目的在于让所有的员工理解、认同并且使其行动与组织战略目标保持一致。我们通过对公司的研究,确立并开发了员工支持行为的四个等级指标:即意识、理解、态度和能力。
很多公司意识到员工是最具价值和实现目标最关键的资产。因此,从战略角度看,充分了解员工对公司的理解和认同是至关重要的。许多企业管理者鼓励内部交流,旨在提高员工队伍把握公司战略的主动性水平。
战略协调性测评通过以下环节产生作用:
一对员工中的主动性支持行为进行等级评估。
■识别调动和促进员工主动性的动力。
■为公司设定目标,帮助公司采取最有效的措施提升员工交流。
■提供公司内部和外部员工团队间的对比。
遮挡情况下的人体检测与跟踪 第7篇
传统的人体检测与跟踪技术主要实现一台摄像机中的单个人体的检测与跟踪, 而对于单摄像机中多个人体的检测与跟踪, 由于容易受到遮挡等因素的干扰, 往往造成人体的漏检和跟踪错误。提出了一种遮挡情况下的人体检测与跟踪算法。针对遮挡情况的人体检测, 采用RGB颜色模型和均值漂移算法, 提取人体头肩轮廓特征, 结合神经网络分类器进行人体检测。针对单摄像机拍摄视角的局限性, 采用三台摄像机实现多视角人体跟踪, 利用映射关系找出遮挡人体的跟踪位置, 完成遮挡人体的跟踪。
1 人体检测
人体检测是实现人体跟踪的前提。摄像机视频中的运动目标除人体外, 可能包含车辆, 宠物, 飞鸟等运动目标, 目前常用的人体检测方法有HOG描述特征与SVM分类器相结合, 基于粗集的人体识别和基于轮廓特征与神经网络分类器相结合的方法等。其中HOG描述特征与SVM分类器相结合的方法由于图像的HOG特征向量维数较大, 同时SVM训练样本多, 使得计算量相对较大, 人体部件逻辑的人体识别采用决策树的思想对人体服饰、肢体等信息进行归类, 同时需要与标准人体做匹配, 适用于独立人体的识别, 而无法满足遮挡频繁的行人检测。本文采用基于轮廓特特征与神经网络分类器相结合的人体检测方法, 该方法计算量小且有较高的识别率。通过观察可见, 人体头肩部位被遮挡的几率较低, 可以提取头肩轮廓的特征信息作为人体的描述特征。由于头肩轮廓特征的维数较低, 可采用神经网结构进行分类, 计算量小, 满足系统实时性的要求。
傅里叶描述子[7,8]通常用来描述轮廓特性, 由轮廓点的傅里叶变换获得。以轮廓某一位置 (x0, y0) 为起始点, 按照逆时针的方向获得曲线的轮廓坐标Z (m) = (xm, ym) , m=0, 1, …, N-1, 在复平面上, 轮廓可以表示为p (k) =x (n) +jy (n) , n=0, 1, …, N-1。对轮廓做傅里叶变换,
为了使傅里叶描述子与起始位置无关, 文献[9]对傅里叶描述子做了归一化处理,
称d (k) 为归一化傅里叶描述子, 具有平移、旋转和缩放不变性。
混合高斯分割出的运动目标经过预处理得到目标的二值图像, 按照文献[3]的方法, 提取头肩模型。将轮廓的坐标点按照逆序排列, 根据式 (1) 和式 (2) 计算傅里叶变换, 变换后的系数归一化后得到头肩模型的傅里叶描述子。
神经网络分类器是一种低阶多项式结构, 通过不断更新权值以满足输出的要求, 适用于低维特征向量的分类。文献[10]提出了基于L-M算法的BP神经网络分类器, 其训练次数少而分类准确度高。头肩模型的傅里叶描述子通过神经网络分类器, 分类出人体和非人体。
遮挡情况下, 混合高斯分割出的目标包含人体等多个目标, 利用文献[3]的方法得到的头肩轮廓由于可能包含多个人体而产生畸变, 最终导致分类错误。为解决这个问题, 采用头发模型和均值漂移聚类[11]的方法, 对目标区域进行多人体聚类。
首先, 利用设置RGB颜色阈值, 阈值满足头发颜色, 如褐色, 黑色和金色, 对目标区域分割出多个满足阈值的小区域, 称作头发模型。以头发模型为基准, 其宽度近似为头部宽度, 按照标准人体比例估计头肩模型的高度H, 再以头发模型的三倍宽度记为宽度W, 在以H和W组成的矩形区域内利用均值漂移算法进行聚类。均值漂移算法依赖于全体采样点信息, 适用于任何形状的图像分布。首先要把聚类范围内的像素转化为由空间信息和色彩信息构成的采样点。采用均值漂移算法对聚类范围内的像素点进行聚类的具体做法如下:
(1) 将目标图像像素空间转化为特征空间中的5维采样点X, X= (x, y, r, g, b) , X是由目标图像的空间信息和色彩信息组成的特征向量;
(2) 以头肩模型聚类范围内, 除背景以外的每一采样点X为圆心, 以搜索带宽h为半径, 计算圆内所有采样点的均值, 计算方法如式 (3) 所示。
式 (3) 中, Xi是圆内除采样点X以外的采样点, n是圆内除采样点X以外的采样点的总数, g (X) =-k' (X) , h为初始化带宽。k (X) 是积分方差MISE准则下的核函数[5];
(3) 计算均值漂移向量, 计算方法如式 (4) 所示。
式 (4) 中, Mh (X) 是均值漂移向量, X是当前采样点, Mh (X) 是采样点X的均值;
(4) 判断均值漂移向量‖Mh (X) ‖<ε是否成立, 若成立, 停止计算, 若不成立, 则以均值mh (X) 为圆心, 重复步骤 (2) 和步骤 (3) , 直到均值漂移向量‖Mh (X) ‖<ε, 停止迭代。获得采样点X的收敛向量mh (X) ;
(5) 判断各个收敛向量的空间信息和色彩信息之间的欧氏距离, 满足阈值的采样点归为一类;
(6) 保留满足人体结构的类, 按行提取各个类型的列最大值和列最小值, 得到人体头肩模型的初始轮廓, 利用三次样条差值, 对初始轮廓间断处进行平滑处理, 获得完整的人体头肩轮廓。对于目标区域的多个头肩轮廓, 分别计算轮廓的傅里叶描述子, 参与分类。
2 粒子滤波人体跟踪
三台摄像机分别对检测到的人体目标做跟踪处理。由于人体运动是一种非线性非高斯系统的运动, 因此采用适用于非线性非高斯系统的粒子滤波器对人体进行跟踪。粒子滤波器[12]是采用一系列蒙特卡洛方法, 利用粒子权重{wk (Xkt) , k=1, …, N}估计后验概率公式p (Xt|T1:t) ,
通俗来讲粒子滤波器的基本思想是, 首先获取目标的描述特征, 然后在搜索范围内均匀撒点, 每个探测点反馈当前的描述特征, 判断是否满足目标的描述特征, 依据其与目标描述特征的相似度重新分配探测点的权重, 对与目标描述特征相似度大的区域增加探测点的数目, 反之减少探测点的数目, 直至找到与目标描述特征最相似的位置, 即目标位置。
具体做法如下。
STEP1:初始化权重, 所有像素的权重相等,
STEP2:采用颜色分配模型来描述目标[5]。定义长轴和短轴分为Hx、Hy的椭圆为搜索窗口, 生成目标的颜色分布向量, N是搜索窗口内的像素个数, 用来调整搜索窗口大小, 边缘处的颜色容易受到背景或遮挡的影响, 为了减弱边缘对结果的影响, 给边缘像素分配较小的权重, 函数表明, 离搜索越远对结果造成的影响越低。R是归一化系数, 确保。得到t时刻的搜索区域的颜色分布向量
STEP3:计算t时刻和t-1时刻特征向量的巴氏距离[13], 。更新权重
Step4:获得目标位置
3 遮挡情况下人体跟踪
3.1 单应映射
平面的单应映射被定义为从一个平面到另一个平面的投影映射。摄像机获取的图像平面与世界坐标系中的水平面可以通过单应性矩阵相联系[14]。
X表示世界坐标系中水平面的坐标向量, x表示图像平面的坐标向量, H表示单应性矩阵, 是一个3×3的矩阵。单应性矩阵可以通过两个平面的四组匹配点对求取。
单应映射是平面之间的映射, 摄像机拍摄的图像中, 大部分像素不在同一个平面上, 无法获得两幅图像之间的单应映射关系。但是图像中的地面区域近似为平面, 每两幅图像之间的地面区域存在单应性关系, 因此可以将图像中的地面作为主平面, 获取每两幅图像关于主平面的单应矩阵。经过单应映射后, 地面以上的物体由于不满足单应性, 其映射投影将产生畸变, 但是同一物体的单应映射投影在主平面上相交, 相交区域的中心点可以作为多摄像机针对同一物体在主平面上的公共模型[15]。单应矩阵的可以通过两个平面之间的匹配点获得, 匹配点对最少需要4组, 可以采用NCC算法计算每两幅图像的地面区域的匹配点对。
3.2 遮挡情况的目标跟踪
人体目标的遮挡主要有人体与人体间的遮挡和人体与背景之间的遮挡两种形式。对于单摄像机, 无法对图像平面上存在遮挡的目标进行定位, 使用多摄像机可以解决这个问题。
摄像机标记为C1、C2、C3, 以Ci图像中的地面为主平面, Cj关于主平面的单应矩阵为Hij。例如以摄像机C1中地面作为主平面, C2、C3在主平面的投影如图 (1) 所示。蓝色阴影和黄色阴影分别为C2和C3的映射投影。经过单应映射, 三幅图像的地面部分相互重合, 地面上的人体交汇于主平面上的共同点。
存在遮挡的情况下, 以图2为例, 对单摄像机C1来说, 人体A被严重遮挡, 对跟踪造成了困难, 而对摄像机C2和C3来说, 人体A没有被遮挡。其中利用粒子滤波器, 摄像机C2和C3中的人体A获得跟踪结果分别是X2A和X3A。
经过单应映射后, 同一个人体在主平面上相互重合, 同一个人体的人体的中轴线将相交于主平面上的一点。l1、l2和l3分别是C1、C2、C3中人体A的中轴线的单应映射, 交点O即人体A在主平面上的位置。O点经过反向单应映射, 可以确定该点在摄像机C1、C2、C3中的位置为O1、O2和O3, 进而确定摄像机C1、C2、C3中人体A的高度H1、H2和H3。人体A被确定在高宽为Hi、Wi的矩形内, i=1, 2, 3。分别计算摄像机C2和C3的跟踪位置X2A和X3A在对应矩形内的位置比例有
计算摄像机C1中人体跟踪位置在矩形内的比例有
最后, 根据摄像机C1中人体A的比例关系, 确定跟踪结果X1A。
4 实验结果
算法以MATLAB为开发平台, 人体识别部分训练样本和测试样本均来自于索尼HDR-CX390E摄像机拍摄的室外视频, 视频分辨率为1 440×1 080, 调整视频分辨率为800×600, 25帧/s。采用带动力的梯度下降法训练神经网络, 输入层、隐层和输出层分别设置为7, 15, 1, 对200组训练样本进行训练, 训练时间为0.05 s, 网络性能达到3.43×1011, 对每个摄像机视频中的某200帧图像进行测试, 人体检测结果如表1所示。
录制视频前, 在地面上标记6个点, 用来计算地面之间的单应矩阵。单应矩阵的准确性由匹配点对决定, 首先依次手动选择6个点, 然后采用NCC算法精确匹配点对。C1和C2、C1和C3的单应矩阵分别为
部分帧的跟踪结果如图3-图5所示。
在跟踪方面, 由于利用了三台摄像机之间的映射关系, 发生遮挡的人体经过其余两个视角的辅助可以得到准确定位, 从而降低了由于遮挡带来的跟踪失误。该算法与文献[5]所述的传统的基于单摄像机的跟踪算法做了比较。取视频中的300帧, 采用文献[5]方法, 分别对左中右三个角度的视频做跟踪处理, 与本文的跟踪结果进行比较, 结果如表2所示, True positive rate表示正确跟踪目标的比例, 可见, 本方法很大程度地提高了跟踪效率。
5 结论
本文对当前计算机人工智能方面的热点问题人体识别与跟踪算法进行了研究, 并提出利用多摄像机进行改进的方法, 能够有效地提升人体检测的识别率和追踪的准确性, 对复杂环境下人群的人体检测有较好的鲁棒性。本文的方法可以应用于地铁、商场等人员密集的大型公共场合, 能够实现人员准确的检测与跟踪, 有很好的应用前景。
摘要:人体检测与跟踪技术在智能视频监控中有很好的应用价值。提出了一种遮挡情况下的人体检测与跟踪算法。人体检测部分, 利用RGB颜色模型与均值漂移算法, 从混合高斯分割出的含有遮挡人体的目标中提取多个人体头肩模型, 计算人体头肩模型的轮廓特征。采用傅里叶描述子与神经网络分类器实现人体检测。人体跟踪部分, 采用基于颜色线索的粒子滤波器作为基本的跟踪算法, 为了解决遮挡问题, 采用三台摄像机实现多视角跟踪人体, 利用三台摄像机之间关于主平面的映射关系确定遮挡人体的跟踪结果。该算法提高了人体检测的准确率和人体跟踪的可靠性, 可以广泛应用于复杂环境中的多个人体的检测与跟踪。
基于DSP实现舰船目标检测与跟踪 第8篇
船用导航雷达和ARPA自动雷达标绘仪是舰船航行的重要安全设备,为实现自动雷达标绘仪所需要目标位置和运动参数,需要对雷达信号进行目标检测、互联、跟踪、滤波、平滑和预测等处理,同时DSP是一种基于精简指令集的可编程数学计算芯片,可以对数字信号进行时频域变换、频谱分析和滤波等处理,广泛应用于多媒体系统、雷达、卫星系统、移动通信、网络会议、医学仪器、实时图像识别与处理、导航、联合战术无线电系统和智能基站等领域[1]。重点介绍C6416在导航雷达目标检测与跟踪处理系统中的典型应用。
1 DSP硬件平台
目前导航雷达普遍采用磁控管发射非相参脉冲串,具有短脉冲、中脉冲和长脉冲3种工作方式,接收带宽分别为20 MHz、5 MHz和1 MHz,为满足各种带宽的需要,模拟回波的模数转换频率选择50 MHz,每个方位的采集点数为14 816点,点距3 m,采用8位采集时,目标检测和跟踪距离24 n mile以内的目标,存储一周4 096个方位回波数据需要60 686 336 bytes,同时系统需要存储回波二分层数据和噪声门限等数据,SDRAM存储器的容量选用256 Mbyte。DSP选用TI公司的C6416[2],为实现快速读取数据,由FPGA将4个8位数据组合成32位传送给DSP,同时DSP可以通过PCI总线实现目标跟踪数据和回波数据的高速传输,硬件原理框图如图1所示。
2 目标检测与跟踪
2.1 目标检测门限计算
雷达信号的检测总是在干扰背景下进行的,检测系统的主要任务就是从噪声和杂波环境中提取出有用目标的信号。对舰船目标而言,这些干扰主要包括海浪杂波干扰、雨雪杂波干扰和接收机内部噪声干扰。检测性能一般的适用性准则是Neyman-Pearson准则:即在保持虚警概率近似恒定的前提下,使检测概率尽可能大。本系统采用杂波图恒虚警技术,即通过对目标距离单元在不同扫描周期的杂波回波进行时域上的处理,获得对该距离单元背景干扰强度的估计并产生自适应门限。处理时杂波的选择,根据试验数据分析[3] 海杂波干扰包络PDF更符合对数正态分布,所取门限根据雷达要求的虚警率产生。
2.2 目标检测
回波与门限进行比较后,对回波进行二分层,大于门限的置“1”,小于门限的置“0”。然后采用滑窗检测器进行检测目标的位置,其每个方位目标距离滑窗的实现原理如下:沿一个方位检测N个采集点,N大于发射脉冲宽度,并小于脉冲宽度与目标最大目标宽度之和。通过检测这N个径向距离单元中的“1”的个数,当“1”的个数超过预先设定的门限值个数时就确定为目标距离起始和目标方位起始,当检测到目标起始并“1”的个数低于预先设定的门限值个数时就确定为目标距离终止,此检测即作为本方位内目标的起始距离和终止距离。方位的滑窗检测与距离类似,保存前M个方位的回波信号,检测连续M个方位内,在距离范围内都存在目标的个数,当个数小于预先设置的方位个数时即确定目标方位终止,如果不满足,说明目标方位没有结束,继续方位滑窗检测[4]。其中M的最小值与天线波束宽度有关,计算如下:
假设天线方向图为高斯形状的,则其双向方向图为:
根据天线参数中提供的单向半功率角θ0.5,按式(2)求出天线的双向半功率角θ,其计算公式为:
得到θ=0.706 2θ0.5。
M的最小值可以计算为:
最后通过计算每个方位的目标起始距离和目标终止距离,以及目标的起始方位和终止方位就可以计算出目标的位置及大小特性。
2.3 目标跟踪
在导航雷达中广泛使用的跟踪方式是边扫描边跟踪算法(TWS)[5],
航迹起始、目标与航迹关联、目标特性输出、目标平滑滤波等操作流程随天线的转动周而复始地运行,如图2所示。
2.3.1 航迹起始
航迹起始是多目标航迹处理中的首要问题,包括采用面向目标的顺序处理技术和面向量测的批处理方法[6],前者比较适合海面稀疏的工作环境,同时计算量小,易于工程实现,后者效果较好,但计算量太大。该系统采用前者中的直观法,即连续N次连续扫描中有M个观测值满足速度和加速度条件时,就认定起始一条航迹。
2.3.2 目标与航迹互联
目标与航迹的互联是完成录取目标与航迹之间的匹配关系,可概括2类:极大似然滤波算法和贝叶斯类滤波算法。其中极大似然类滤波算法以观测序列的似然比为基础,主要包括人工标图法、航迹分叉法、联合似然算法、0-1整数规划法和广义相关法等;贝叶斯类滤波算法以贝叶斯准则为基础,主要包括GNN(全局最临近准则)、JPDA(联合概率数据关联)和MHT(多假设跟踪)等算法,本系统中采用的是准GNN算法,即先设置跟踪波门,落入跟踪波门内的量测即作为候选回波,若落入相关波门内的测量值只有1个,则测量值可被直接用于航迹互联,否则区距离最小的候选回波目标与航迹互联。
2.3.3 目标平滑滤波
在线形滤波算法中主要包括卡尔曼滤波、α-β与α-β-γ滤波、两点外推滤波以及线性自回归滤波方法等。其中卡尔曼滤波为线性时变系统的一种线性无偏差最小均方误差估计,具有很好的滤波和预测性能,α-β与α-β-γ滤波在稳态时与卡尔曼滤波是等效的,在暂态时,卡尔曼滤波性能优于其他滤波方法,另外两点外推滤波以及线性自回归滤波方法是更简单计算量更少的计算方法[6]。考虑舰船运动速度较慢,在满足性能要求的条件下选择α-β滤波算法,其α-β滤波算法的滤波和预测方程为[7]:
xs(n)=x(n|n)=xp(n)+α[x0(n)-xp(n)];
xp(n)=xs(n|n-1)=xs(n-1)+Tvs(n-1)。
式中,xs(n)为第n次扫描的观测值;T为采样间隔;α、β为滤波系数,下标“P”和“S”分别表示预计值和平滑值。滤波器的初始状态为:
xs(1)=xp(2)=x0(1);
vs(1)=0;
当β=α2/(2-α)时,可以减小观测噪声和跟踪滤波器残余(跟踪误差)之间的差异。
3 软件实现
3.1 软件平台及组成
采用CCS集成开发环境进行开发,使DSP运行在DSP/BIOS嵌入式操作系统,根据功能进行线程划分,并采用不同的线程类型,以实现优先级调度,具体线程分配如表1所示。
3.2 各线程实现
3.2.1 数据读取线程
数据的读取采用外部中断5的方式实现,数据的传送采用EDMA方式,中断5和EDMA方式的关联采用系统提供的EDMA_open函数实现。EDMA读取的数据采用系统的EDMA_config实现数据读取。读取后SWI_post(&SWI_AZI)启动方位检测线程,其中SWI_AZI为方位检测线程对象。
3.2.2 方位探测线程
循环探测每个目标航迹的波门,如果当前方位存在目标航迹波门即可根据当前波门的门限对回波数据进行二分层量化。如果一个方位存在于多个波门要分别根据波门的门限进行量化。量化后通过系统函数SEM_post(&目标检测)传送信号灯信号,启动目标检测线程。
3.2.3 目标检测线程
目标检测线程通过完成一个方位内目标航迹距离滑窗的检测,同时进行方位的滑窗判断,如果判断满足一个目标结束,下一个方位将停止该目标的判断。待检测的目标航迹采用链表的形式,以方便目标联合时进行全目标的搜索,当检测完一个航迹波门时,发送SEMpost(&目标联合)信号灯启动目标联合线程。
3.2.4 目标联合线程
目标互联通过对比波门内检测的目标与航迹滤波后的预测目标位置进行对比,选择最满足条件的目标作为目标新航迹点,波门内的其他目标将丢弃,如果波门内没有目标与航迹关联将用航迹滤波位置作为本次关联的目标新航迹点。航迹互联流程如图3所示,最后发送SEMpost(&平滑滤波)信号灯启动平滑滤波线程。
3.2.5 平滑滤波线程
平滑滤波线程根据目标的不同时刻的位置信息,通过滤波计算出下一时刻航迹的波门,为下次检测提供波门信息,同时计算出目标的速度和加速度等运动参数。
4 试验结果
试验对实际海面舰船目标进行了检测和跟踪,DSP计算速度和处理方法满足对舰船目标的检测与跟踪,实际分布如图4所示,检测结果如表2所示。
5 结束语
上述研究了C6416平台下,利用DSP/BIOS实时操作系统实现舰船目标检测与跟踪的实现方法。首先进行硬件分析和目标检测和跟踪的方法模型,进而进行软件规划与实现,试验证明该方法完全能够满足导航雷达对舰船目标检测和跟踪的要求。
摘要:DSP作为数字信号处理平台,随性能的不断提高其应用越来越广泛。TI公司的C64XX系列,主频达到1.1 GHz,处理速度达到9 000 MIPS。基于单片C6416的DSP处理系统可以实现导航雷达中目标杂波的恒虚警处理、目标量化检测与跟踪,充分结合DSP的特点,采用DSP/BIOS实时内核,根据功能的不同采用硬件中断、软件中断和任务的方式实现功能的分配和调度,可以在24 n mile的覆盖范围内,每周4 096个方位。A/D采集点距离分辨率3 m的条件下,检测和跟踪200个目标,跟踪算法选用α-β滤波算法。
关键词:DSP,导航雷达,α-β滤波,目标检测与跟踪
参考文献
[1]张燕,黄晓斌.一种改进的海面舰船目标跟踪方法[J].计算机工程与应用,2011,47(25):239-240.
[2]王军宁,何迪,马娟.TI DSP/BIOS用户手册与驱动开发[M].北京:清华大学出版社,2007:67-124.
[3]卞红雨,纪祥春,乔钢.TMS320C6000系列DSP的CPU与外设[M].北京:清华大学出版社,2007:113-127.
[4]BUGallo M F.Performance Comparison of EKF and ParticleFiltering Methods for Maneuvering Targets[J].Digital Sig-nal Processing,2007(17):774-786.
[5]LOMBARDO P,GRECO M,FARINA A.Radar ClutterModeling[R].RADAR 2005,2005:14-20.
[6]何友,修建娟,张晶炜,等.雷达数据处理及应用[M].北京:电子工业出版社,2006:31-35.
基于视觉的手势检测与跟踪技术简述 第9篇
随着各种各样的计算机应用深入到人们的生活各个层面, 人与计算机的交互日趋频繁及多样化, 同时用户对人机交互舒适程度要求越来越高, 传统的人机交互方式如键盘和鼠标越来越显出其局限性。研究符合人际交流习惯的新型人机交互技术变得异常活跃, 图像处理、计算机视觉、模式识别、人工智能等相关学科的发展更是推动该领域研究的进展, 越来越多的新颖的人机交互技术被引入, 如语音识别、人脸识别、面部表情识别、头部运动跟踪、手势识别等等。人机交互技术已经从以计算机为中心逐步转移到以人为中心。手势作为一种自然、直观、易于学习的交互方式, 越来越多地受到关注。微软家用视频游戏主机Xbox 360的体感外设Kinect的热卖[1], 见证了这种新型交互技术带来的全新体验对用户的强大吸引力。
手势识别方法按输入设备不同可分为基于数据手套的手势识别和基于计算机视觉手势识别。基于数据手套的手势识别系统能更准确的刻画手势的空间运动轨迹和手指弯曲角度等信息, 但是此类的系统设备比较复杂, 而且价格昂贵, 戴在手上会影响手部的灵活度。基于视觉的手势识别方法成本比较低, 只需要一个摄像头和软件, 非接触式的手势动作采集方式使交互更加自然与舒适。较多的研究机构从事基于计算机视觉的手势识别的研究。
基于视觉的手势识别系统包括手势的定位、跟踪、识别三个关键部分。手势定位与跟踪是手势识别的前提和基础, 其效果直接影响最终识别的准备率与效率。当前的手势识别系统往往有多种限制条件, 比如须穿长袖上衣、光照条件合适、手的运动速度不能太快、手不能经过脸前方等。这样能降低整个识别系统实现难度, 但为人为增加的诸多限制不利于自然的人机交互, 影响其应用到现实当中。而这些限制, 往往是在手势定位与跟踪阶段算法鲁棒性不够。因此, 对手势检测和跟踪算法进行研究, 具有重要的理论意义和实用价值。
1、手势检测技术
手势检测从视频序列中检测到手并定位手的区域, 该过程对于特征的选择与处理相当关键, 肤色及运动信息是经常被采用的两个有效的特征。但是, 现实环境中由于光照变化、背景复杂及其它不可预知的干扰, 仅一个特征往往不能有效地定位出手, 需要多种特征互补。我们将手势检测方法方法分为基于肤色信息、基于运动信息及多信息结合三类来介绍。
1.1 基于肤色信息的方法
颜色是人手表面最为显著的特征之一, 利用肤色检测人手是一个自然的想法。肤色特征具有一定的稳定性, 对缩放、平移、旋转具有相当强的鲁棒性, 且对图像本身的尺寸、方向和视角的依赖性较小[2], 因此, 肤色信息在手势识别系统中的手势检测阶段被广泛使用。当然肤色信息还是有它的局限性, 人类个体肤色差异、光照条件不同、人体其他肤色区域的干扰等诸多因素影响, 使得利用肤色信息检测人手仍面临巨大挑战。
1.2 基于运动信息的方法
运动信息也是手势检测经常使用的特征, 它能有效地把运动的人体从背景中分割出来。但是, 使用运动信息分割出人手要求手的运动是场景中的主要的运动目标, 一些早期的工作[3,4,5], 假设人手的运动是场景中唯一的运动目标。但在现实场景中往往会有其他人或者其他物体在场景中移动, 甚至当摄像头移动时整个背景都是运动的, 因此, 当下运动信息主要用来与其他特征结合来进行手势检测, 比如文献[6, 7]。
1.3 多信息结合的方法
为了克服单种特征的局限性, 使得在现实环境中的各种干扰下能够准备地检测到手, 当前多数研究人员采用多种特征结合的方法。肤色与运动信息结合经常被采用, 另外还有形状、纹理等。越来越多的研究人员会参考人脸的信息[6,8]。一方面人脸检测技术已经比较成熟, 另外通常脸是图像中最大的一块皮肤区域较容易定位, 并且脸与手的色度差别不大。利用脸的大小和位置可以估计手的尺寸及出现范围。文献[8]先检测到脸, 用除掉眼睛、鼻孔和嘴巴的肤色区域建立肤色模型, 即使光线不好或者使用者肤色比较特殊, 仍能很好地定位到手。文献[6]同样在检测到脸后利用脸的肤色信息进行颜色分割, 再利用帧差法去除背景静止的肤色干扰物得到手的区域。
2、手势跟踪
如果在跟踪过程中每次都对从实时视频流中提取的图片做整张搜索定位出手, 无疑会增加很大的计算量, 降低跟踪效率。因此, 研究人员提出各种各样的跟踪算法, 试图使跟踪有较好的鲁棒性与效率。本文重点关注基于二维表示的手势跟踪, 我们将手势跟踪方法分为:基于特征点的手势跟踪 (feature-based hand tracking) 、基于活动轮廓的手势跟踪 (active-contourbased hand tracking) 、基于区域的手势跟踪 (regionbased hand tracking) 三类。
2.1 基于特征点的手势跟踪方法
基于特征点的跟踪方法是通过提取目标物体的一些个体特征, 在图像之间匹配这些特征点来进行跟踪。它不考虑跟踪目标的整体特征[9]。这些特征可以是点、线或者曲线。文献[10]先检测到指尖, 然后利用卡曼滤波 (Kalman Filter) 方法分别对多个指尖进行跟踪从而得到手及各个指头的运动路径。基于特征匹配跟踪的缺点在于特征点会由于遮挡或者光线变化而不可见, 这将导致跟踪失败[9]。
2.2 基于活动轮廓的手势跟踪方法
基于活动轮廓的跟踪算法利用封闭的曲线轮廓来表示被跟踪目标, 且该轮廓可以自适应更新以实现对被跟踪目标的连续跟踪。Isard和Blake[11]采用参数化的B样条曲线来表示手的轮廓, 利用粒子滤波 (Particle Filter) 方法跟踪轮廓实现对手的跟踪。相对于基于区域的跟踪方法, 轮廓表达有计算量低的优点, 而缺点是存在初始化困难的问题, 且通常要限制手在运动中保持几个预定的形状。
2.3 基于区域的手势跟踪方法
基于区域匹配的跟踪是把图像中目标物体的连通区域的共有特征信息作为跟踪检测值的一种方法。在连续的图像中可以采用多种区域信息, 例如纹理信息, 颜色信息等等。文献[12]提出一结合均值漂移的粒子滤波 (MSEPF) 手势跟踪算法, 用大概包括手部区域的矩形来表示图像中的人手, 把手的运动简化为矩形的运动, 结合手部区域的肤色和运动信息对手进行跟踪。
3、结论与展望
基于手势的人机交互技术是当前人机交互领域的研究热点, 要实现一鲁棒性及计算效率满足应用需求的手势识别系统, 手势检测及手势跟踪是相当关键的两个基础步骤。本文对这两方面的用到的主要方法进行了介绍, 下一步的工作主要是进一步设计并实现手势检测与跟踪方法, 使得使用者在现实环境中应用且不需要过多限制。
摘要:自然的交互技术成为时下人机交互领域研究的热点。手势是一种自然且直观的人机交互方式, 近一二十年来许多研究人员在从事手势识别系统的研究与开发。但是, 成功的商业应用产品并不多。手势识别相关的技术有待进一步的研究与发展。手势检测与手势跟踪这两个步骤是整个手势识别系统的基础工作, 对整个手势识别系统的最终识别效果至关重要。本文阐述了这两样技术的主要方法及这些方法的优缺点。
检测与跟踪 第10篇
运动目标的检测和跟踪是计算机视觉研究的主要问题之一,它融合了图像处理、模式识别、自动控制、人工智能及计算机等许多领域的先进技术,在无人机视觉导航、视频监控、医疗诊断、智能交通等方面都有广泛的应用。在此主要围绕这两个方面的内容展开研究。
运动检测的目的是从序列图像中将变化区域从背景图像中提取出来,运动区域的有效分割对于目标分类、跟踪和行为理解等后期处理是非常重要的。然而,由于背景图像的动态变化,如天气、光照、影子及混乱干扰等影响,使得运动检测成为一项相当困难的工作。在此,只研究在背景静止状况下的人的运动[4]。
所谓跟踪,就是对图像序列中的运动物体,通过提取它的某些特征,并且把这些特征从一幅图像到另一幅图像匹配起来,这个过程叫作跟踪。运动跟踪主要通过建立目标链来实现,目的是获得运动物体的运动轨迹。如果把所有的这些图像重叠起来,就可以得到这个运动物体的运动轨迹,所以运动物体的跟踪也可以看作是对运动物体的运动状态进行估计。
本文主要利用基于背景剪除方法检测出运动目标,然后利用Kalman滤波实现运动估计与跟踪。
1 人体运动检测原理及具体实现
在本文中,由于系统的实时性、稳定性等可实现性问题,根据行人检测系统对实时性的要求,这里采用背景差法提取运动行人。算法主要包括图像预处理、背景提取、动态选取阈值和运动行人分割等。基本流程图如图1所示。
背景差分法是利用视频图像中每一帧图像与确定的背景图像相减,比较其中的偏差得到运动区域,并通过阈值化差分图像检测出运动物体,求取运动行人。背景差分方法是以固定摄像机为前提条件,该方法很大程度上依赖于背景图像的可靠性,背景图像需不断地被更新,以迎合环境光线、阴影和天气的变化等。背景更新中的误差累计和光线变化是影响背景差分法精度的主要因素。它可用式(1)描述。
式中:f1(x,y)为输入图像帧;f2(x,y)为背景图像帧。如果输入图像帧中不含行人,则与背景图像帧相同,此时d(x,y)=0;相反,如果输入图像帧中包含行人,则与背景图像帧不同,此时根据阈值Th的大小判定d(x,y)可能不为0。下面是目标检测流程中用到的方法。
1.1 图像预处理
图像预处理主要用于消除图像的基本噪声、增强图像对比度等,以改善图像质量,使图像变得较为清晰,以便后续处理和分析,如图像分割等。
对图像滤波方法的选择取决于噪声与图像的关系以及处理的具体要求,图像常被强度随机信号(也称为噪声)所污染。考虑到实际场景图像中的噪声特性,这里主要采用高斯滤波法,来滤除图像中包含的高斯噪声。
1.2 背景提取
背景图像为不含前景目标的场景图像。这里采用自适应背景提取方法,即首先将输入的第一帧图像作为原始背景,从第二帧开始对当前帧间差分图像进行二值化处理,由二值图找到运动区域和非运动区域[2]。为了消除纹理相似的前景交叠区域作为背景提取的不足,这里采用的方法中引入了数学形态学运算对帧差分图像的进一步处理,准确提取出非运动区域;然后用当前帧图像中的非运动区域部分更新当前背景图像,而运动区域部分的背景图像则保持不变,经过一定数量图像的迭代便可提取出背景。
1.3 运动行人分割
在采用背景差法检测运动行人过程中,除了得到清晰的背景图像之外,选取合适的阈值也是准确分割出运动的行人中至关重要的一步,是运动行人检测的一个重点和难点。由于场景中背景基本无动态变化,且行人的服装颜色与背景差别较大,经反复实验,人工确定动态图像序列中差分图像二值化的阈值为30(灰度值)。
1.4 提取运动区域
分割后的连通区域受噪声影响很大,图像中存在一些小的噪声干扰点,这些干扰的存在必然影响行人检测的质量。首先,对二值化之后的图像进行中值滤波,消除小的噪声;然后,采取数学形态学处理中的腐蚀和膨胀算子对二值图进行操作,去除噪声前景点和填补目标区域的小孔,从而得到行人较为清晰和完整的轮廓,如图2所示。
图2为两人面对面行走的图像。对得到的差分二值图像进行标记,显示出检测到的运动目标(人)。用行人的外接矩形表示检测到的行人轮廓,矩形的四个边分别表示行人的上下左右四个边界位置,矩形的中心位置即为检测出的行人位置。
从行人通行情况下的检测效果图来看,效果比较明显,可以准确检测到场景中运动的行人。但是由于运动产生的噪声因素影响,轮廓有时不是十分准确。
2 目标跟踪关键技术分析
运动跟踪主要通过建立目标链来实现,目的是获得运动物体的运动轨迹。如果把所有这些图像重叠起来,就可以得到这个运动物体的运动轨迹,所以运动物体的跟踪也可以看作是对运动物体运动状态的估计。
在此,选用基于Kalman滤波的运动跟踪系统,通过估计出运动目标的下一位置,对运动目标进行实时跟踪[3]。
在处理每帧图像的过程中,提取并记录每个目标对应的位置信息,可以利用这些检测出的位置信息对行人的运动进行预测,预测出行人目标在下一帧的位置,对运动行人进行连续检测和跟踪。最后,根据图像序列中依次确定的目标位置,得到行人的运动轨迹。
2.1 行人的运动预测
运动预测通常利用了运动的连续性约束和平滑性约束。运动的连续性约束是指相邻帧间目标的运动位移很小,运动的平滑性约束是指相邻帧间目标的运动不会发生突变。因而当起始帧目标的位置标定完成以后,可以通过前几帧的检测结果来估计新一帧图像中目标的位置,从而简化对后续帧目标的检测,加速对目标的识别[4]。
在对行人跟踪过程中,需要在图像序列中连续不断地检测到行人,如果对每帧图像的处理都采用搜索整幅图像的方法,则系统的处理速度必然得不到保证[5];同时在行人的检测过程中,图像中同时出现的两个行人在运动过程中也经常发生相互间遮挡现象。由于这些问题的存在,为了提高系统的实时性和解决目标短时间内被遮挡时的跟踪问题,可以考虑采用运动预测的方法对被遮挡目标的位置加以估计,利用预测的目标位置继续跟踪目标,达到实时检测和连续跟踪运动行人的目的。
2.2 Kalman滤波在运动目标跟踪中的应用
Kalman滤波以其实时性较好而得到了广泛的应用,在此选用Kalman滤波进行运动估计。
在视频监控中对运动物体进行跟踪时,最简单的方法是利用空间、时间特性来描述运动目标,采用基于像素的区域搜索匹配方法进行目标的运动预测和判别,该方法只有目标在两个连续帧的运动变化很小时才适用,当目标运动发生跳跃变化或受到其他因素干扰时,如被其他物体遮挡或在视频传输时发生丢帧现象,则算法便会失败。
基于Kalman滤波的目标跟踪是将运动目标的运动模型看作是一个Kalman滤波器模型,根据运动目标的运动历史预测它在下一帧中的位置信息。目标跟踪过程中Kalman循环滤波的过程如图3所示。
首先在进行时间分析处理时,不需要定义一个精确的运动模型,它能够通过一个简单的运动学模型有效地跟踪真实对象的运动轨迹;其次,Kalman滤波算法是一种基于运动学模型的反馈结构算法,当运动目标发生跳跃变化时,可以根据对象以前的运动轨迹和运动模型继续对其运动进行预测[6]。当这些对象再次在场景中出现时,可以帮助跟踪系统识别这个对象。Kalman滤波在运动目标预测中的具体实现如下:
若X表示目标状态向量,(x,y)和(vx,vy)分别为目标特征点在图像中的坐标位置和运动速度,则X=(x,y,vx,vy)T,若Y=(x,y)T表示观测向量。根据Kalman滤波理论,建立的系统状态估计Kalman滤波模型如下:
状态方程:
观测方程:
式(2)和式(3)中:A(k|k-1)为从k-1时刻到k时刻系统的状态转移矩阵;H(k)为观测矩阵;w(k-1)和v(k)分别为零均值的系统噪声向量和观测噪声向量,其中:
假设两个人做匀速直线运动,通过计算得知每个人的运动速度,则根据离线实验可得初始状态的预测误差协方差矩阵P、系统噪声向量w(k)和观测噪声向量v(k)的协方差矩阵Q,R分别为:
根据式(2)~(6),可以很容易地实现计算机的程序,完成对运动目标跟踪任务的实现。
2.3 OpenCV介绍
该实验是在开源系统Linux平台上用OpenCV函数库建立起模型并实现算法的。OpenCV是Intel公司开发的开源数据库。作为一个基本的计算机视觉、图像处理和模式识别的开源项目,OpenCV可以直接应用于很多领域,作为第二次开发的理想工具。比如实时计算机视觉领域中人机交互目标的分割和识别、人脸识别、手势识别、运动跟踪、自我运动、运动理解、移动机器人等。它由以下类库组成:
(1) CXCORE。包含了图像处理和数学运算,特别是矩阵运算的相关函数。
(2) CV。包含图像处理和分析的一些函数,同时还包含了其他诸如结构分析、极线几何、模式识别、结构分析等一些函数。
(3) HighGUI。与平台相关的用户界面函数,主要用以控制图像窗口、按钮等控件。
(4) CVCAM。与视频设备输入/输出相关的函数。
在该程序中,主要利用了CV库中现有的图像处理函数,如边缘检测、图像叠加、灰度转换及图像翻转等。在此基础上开发自己的一些函数,如演算图像运动历史(Motion History of Image)等。
3 目标跟踪试验与仿真
在本次试验中,充分利用OpenCV封装的函数库。其中,在跟踪阶段用到两个重要的函数为:
(1) KalmanPredict
估计后来的模型状态 :
const CvMat* cvKalmanPredict( CvKalman* kalman,const CvMat* control=NULL );
#define cvKalmanUpdateByTime cvKalmanPredict
(2) KalmanCorrect
调节模型状态:
const CvMat* cvKalmanCorrect( CvKalman* kalman,const CvMat* measurement );
#define cvKalmanUpdateByMeasurement cvKalmanCorrect
得到的实验结果如图4所示。
图4中标注白色线框的为检测到并进行了标记的运动人体前景图像,黑色线框为利用Kalman滤波技术对人体进行预测跟踪的结果。其中,两个中点为各自方框的中心点。
4 结 语
该实验结果表明,Kalman滤波的估计值与实际测量值比较接近,误差在很小的范围之内,可以很好地跟踪运动目标,而且处理速度比较快,能够满足一般情况下实时性的要求。此外利用Kalman滤波可以很好地解决实验中两人握手时运动目标间遮挡的问题。
通过Kalman滤波器的预测估计可以大大缩小图像处理的范围,因此极大地提高了处理速度和信息反馈的时间,减少或消除视觉通道反馈信息的时间滞后问题。但是,一个明显的缺陷是该实验只对目标一个方向上的估计跟踪效果比较好,而对另一个目标的预测则明显呈现滞后现象,这一点可以在今后对代码的不断完善中完成。Kalman滤波存在初值选取、噪声参数确定的问题,该实验是在多次反复试验的基础上选定的各个参数及初值,而且假设运动目标做匀速直线运动,这也是Kalman滤波的局限性之一。
摘要:通过摄像机拍摄到的一段视频,对其中运动的人进行检测与跟踪。在目标检测方面,获取运动行人图像序列,利用自适应背景提取方法得到背景,根据将目标与背景进行分离的分割阈值,对差分图像进行分割,提取运动区域,检测出人体运动目标;在目标跟踪方面,选用基于Kalman滤波的运动跟踪系统,通过估计出运动目标的下一位置,对运动目标进行实时跟踪。这里的实验是在Linux平台上利用Intel的开源OpenCV函数库建立起模型并实现算法。经过多次仿真测试表明,使用Kalman滤波可以很好地解决实验中两个人握手时运动目标间遮挡的问题,并跟踪运动目标,而且处理速度比较快,能够满足一般情况下的实时性要求。
关键词:图像序列,目标检测,Kalman滤波,实时跟踪
参考文献
[1]王亮,胡卫明,谭铁牛.人运动的视觉分析综述[J].计算机学报,2002,25(3):225-237.
[2]侯志强,韩崇昭.视觉跟踪技术综述[J].自动化学报,2006(4):603-617.
[3]宋磊,黄祥林,沈兰荪.视频监控系统概述[J].测控技术,2003(5):33-35.
[4]陈-,蔡自兴.基于DirectShow技术的移动机器人视频采集系统[J].华中科技大学学报:自然科学版,2004(Z1):87-89.
[5]刘雷.人体运动建模仿真方法研究[J].计算机仿真,2009(1):166-168.
[6]孙剑,李克平.行人运动建模及仿真研究综述[J].计算机仿真,2008(12):12-16.
[7]Neri A,Clonnese S,Russo G,et al.Automatic Moving Ob-ject and Background Separation[J].Signal Processing,1998,66:219-232.
[8]Peter Meer.Real-Time Tracking of Non-Rigid Objects using Mean Shift[A].IEEE CVPR[C].2000.
高速公路车道线检测与跟踪算法研究 第11篇
当今社会,公路交通事故已经成为人们普遍关注的问题,尤其高速公路上发生事故的几率正呈逐年上升的趋势,其造成的危害也是各类交通事故中最为严重的。为了提高驾驶的安全性和操作的简单性,世界各国都在积极研究开发汽车辅助驾驶系统。基于机器视觉的车道线检测与跟踪是智能车辆辅助驾驶系统的关键技术之一,他是实现车道偏离报警、车道保持等主动安全功能的基础。目前已经提出了很多车道线识别方法,简单算法对于车道线大部分被遮挡、各种交通参与者存在的情况,往往出现误识别;复杂算法抗干扰能力强,但是实时性又不好。如何准确、快速地检测车道线已成为智能车辆视觉导航中的一个重要问题。
针对高速公路的特点以及对车道线识别的实时性和鲁棒性的要求,本文提出了一种基于Hough变换(Hough Transform,HT)和Kalman预测的快速车道线检测与跟踪算法。采用PEST2001图像序列(一组车辆正前方的单目图像序列)作为测试序列(图片大小为768576),取得了很好的检测效果。
2 车道线检测
车道线初始检测的准确性直接影响了后续跟踪的效果,检测算法的选择十分关键。检测算法主要分为两步:图像预处理和车道线识别。
2.1 图像预处理
本文采用基于二维特征的算法,仅利用灰度特征和灰度差分特征。用33的滑动窗口进行中值滤波,保留细节,去除干扰噪声,再根据图像灰度直方图进行灰度变换,提高对比度,然后利用大津自动阈值分割法自适应求得图像阈值,最后用卷积核为的Sobel边缘检测算子检测车道线边界点,得到二值图像。这种卷积核的优点是增强45°和135°方向的边界线,同时可以消除其他方向边界线,减少其他物体边缘对于车道线识别的干扰。
2.2 车道线识别
2.2.1 建立车道线模型
高速公路属于结构化道路,其车道线的检测与跟踪需基于以下假设:
(1) 车道线直线性假设:在文献[1,2,3]中分别采用多项式曲线、回旋曲线和样条曲线匹配车道线,这些方法受到模型的影响很大,而且曲线拟合的运算相对复杂,在有阴影等干扰下可能失效。由于高速公路的特点,车辆大部分时间是行驶在直线车道上,在高速公路上即使有弯道,弯道的曲率也很小,可近似当作直线车道处理。
(2) 车道线连续性假设[4]:对于虚线车道线,假设其间断区域也存在虚拟的边缘点,将虚线车道线当作连续的车道线来处理。
(3) 边缘点位置的可预测性假设:对序列图像进行实时处理,由于车速较高,连续采集的两帧图像中车道线位置偏差不会太大,边缘点位置具有可预测性。
2.2.2 Hough变换检测车道线
HT是一种依据全局统计信息的直线提取方法,他基于图像空间点向参数空间对应位置投票累加并搜索参数空间峰值获得直线方程。
HT的基本原理如图1所示。式(1)为图1(a),(b)的直线方程,式(2)为该直线对应的极坐标表示,其中(ρ,θ)定义了一个从原点到直线上最近点的向量。可以看出x,y平面上的任意一点对应于ρ,θ平面上的一条正弦曲线,x,y平面上的任意一条直线对应ρ,θ平面上的一个点,如图1(b),(c)所示。
为了找到x,y平面上的直线,可以将ρ,θ空间量化成等间隔的小直网格,这个直网格对应一个计数阵列,每个小格对应一个计数阵元。根据式(2)每一个(x0,y0)点对应ρ,θ平面上的一条曲线,这条曲线所经过的小格,对应的计数阵列元素加1。于是计数阵元的数值等于通过对应小格的曲线的数目。根据摄像机的安装位置和投影理论,路面区域均位于图像的下半平面,为了减少计算量,避免道路背景中复杂的自然景物对车道线识别的影响,在检测模块中将感兴趣区域取为图像下半部分。遍历感兴趣区域中的全部(x,y)点,对小格进行检验,大计数值的小格对应于共线点,其(ρ,θ)可用做直线拟合参数。其中小计数值的小格则认为是孤立点,不构成直线,应该去除。
用Hough变换识别车道线,抗噪性能强,对直线断裂、局部遮挡等缺陷不敏感,能将断开的边缘连接起来,非常适合用于检测不连续的车道线。
3 车道线跟踪
由于序列图像的时空连续性,连续两帧图像的车道线位置偏差不会太大,利用相邻帧之间车道线位置具有的相关性,可以用前一帧图像获得的信息指导下一帧车道线的检测,提高处理速度和鲁棒性,这就是车道线跟踪。
3.1 基于Kalman预测器动态建立感兴趣区域(ROI,Region of Interest)
基于车道线直线性假设,以左车道线为例,用(kl,bl)表示直线的斜率和截距,用(vkl,vbl)表示斜率和截距变化率,状态向量为xl=(kl,bl,vkl,vbl),观测向量为zl=(kl,bl)。则Kalman预测器的状态方程和观测方程如下:
其中w(n)和v(n)为具有零均值的白噪声。
状态转移矩阵可以表示为[5]:
为了观测道路区域的各个状态变量,选取系统测量矩阵为[5]:
本文将车道线检测模块检测到的车道线参数作为Kalman预测器的状态变量的初始值,可防止预测器发散。由于误差协方差矩阵可以随着图像动态更新,可以给他一个较大的初值。
根据文献[5],误差协方差矩阵的对角元素应是以状态变量的初始状态为圆心的一定区域内的值,由此系统状态方程式(3)和观测方程式(4)的误差协方差矩阵Q和R可以表示如下:
Kalman预测器方程[6]为:
其中x(n+1|n)为n+1时刻的预测值,p(n+1|n)为相应于x(n+1|n)的预测误差方差矩阵。
由式(5)~(9)可以得到下一帧图像的状态向量xl(n+1|n)和相应的协方差矩阵pl(n+1|n)。协方差矩阵pl(n+1|n)表示ROI位置的不确定范围。当pl(1,1)和pl(2,2)越大,估计值越不稳定,搜索区域也就越大,搜索区域自动进行调整。如图2所示,最终确定左边车道线的ROI为[5]:
右边车道线的ROI为[6]:
(krup,brup,krdown,brdown)=(xr(n+1|n)(1)-pr(1,1),xr(n+1|n)(2)+pr(2,2),xr(n+1|n)(1)+pr(1,1),xr(n+1|n)(2)-pr(2,2))
3.2 扫描线法搜索车道线边界点
以左边车道线为例,在如图3所示的左边车道线的ROI中采用扫描线法搜索车道线边界点,其基本思路是从图像的最下边界开始搜索,在同一条扫描线上,以直线(kldown,bldown)上的点作为起始点向左搜索,直到搜索到第一个边界点,然后再进入上一行扫描线继续进行搜索;对于虚线车道线,由于存在间断区域,可能在ROI内都没有搜索到边界点,则采用Kalman预测器预测的当前帧车道线参数来估计边界点的位置,并将此位置作为当前扫描行中车道线边界;如果在图像的某一行没有搜索到车道线边界点,同时又没有预测的边界点时,则舍弃记录该行边界点位置。由于采用Kalman预测器来预测车道线边界点位置,减少了搜索范围,提高了车道线识别的实时性和鲁棒性。搜索算法流程图如图4所示。
3.3 失效判别模块
当受到严重干扰时,如车道线受前方行驶车辆遮挡很严重,或者在车辆换道、转弯时,算法会产生较大误差甚至失效。因此,系统加入算法失效判别模块,一旦判定算法失效则启动车道线检测模块对车道线进行识别。本文判定算法失效方法如下:
(1) 当前帧的车道线信息与上一帧比较发生突变(一般认为直线的斜率和截距的变化量不应超过某个阈值,否则认为车道线的信息发生突变)则认为算法失效。
(2) 在ROI中检测到车道线的实际边界点数目若小于某个阈值,则认为算法失效。
(3) 判断车道线置信度,包括车道线的平行度、宽度等,如果低于置信度指标,则认为算法失效。
4 实验结果
车道线检测与跟踪算法流程图如图5所示。算法启动后,前几帧图像用车道线检测模块进行识别,对检测到的车道线置信度进行确认,包括车道线的平行度、宽度等,如果通过置信度检测,则进入车道线跟踪模块。
车道线跟踪模块首先进行图像预处理(与车道线检测模块相同)得到二值图像,然后通过Kalman预测器预测的参数动态建立ROI,在ROI中搜索车道线边界点,用最小二乘法拟合车道线,将得到的车道线参数送入Kalman预测器,预测下一帧车道线参数,再进入判别模块判断算法是否失效,如果没有失效则继续用跟踪算法处理下一帧图像,否则转到车道线检测模块进行处理。
车道线检测和跟踪算法仿真实验结果如图6所示。
本算法使用VC++6.0编程实现,进行了大量仿真实验,选取其中的600帧虚线车道线图像序列进行分析。前6帧用车道线检测模块进行识别,然后进入跟踪模块,直到第299帧跟踪算法都能准确地识别车道线,到第300帧时出现偏差,到第400帧偏差很大,系统自动启动检测模块,则第401帧能很好地识别车道线,之后系统又能很好地进行车道线跟踪。在检测模块一帧图像处理时间大概70 ms,跟踪模块平均运行时间在38 ms左右。由仿真结果可看出本算法基本满足高速公路上汽车辅助驾驶系统的实时性和鲁棒性要求。
5 结 语
本文在车道线检测模块采用Hough变换识别车道线,具有准确性和鲁棒性的优点。在跟踪模块利用Kalman预测参数动态建立ROI,采用扫描线法搜索边界点,有效解决车道线识别中计算量大和由于CCD抖动或路面不平等随机因素的影响,提高了车道线识别的快速性和鲁棒性,尤其对虚线车道线检测具有很好的识别效果。由于加入算法失效判别模块,系统能及时处理跟踪算法失效的情况,更适合于实际应用。
摘要:为提高高速公路上车道线识别的快速性和鲁棒性,提出了一种有效的车道线检测与跟踪方法。采用霍夫变换进行车道线检测,具有较强的抗干扰能力,能够准确地识别车道线。车道线跟踪利用Kalman预测参数建立感兴趣区域,然后用扫描线法搜索车道线边界点,在车道线间断区域利用Kalman预测器定位车道线边界。由于搜索限制在预测范围内,提高了搜索精度,减少了搜索范围,保证了实时性能,且对虚线车道线识别特别有效。仿真实验结果表明,对于不同的天气状况和车道线种类,该算法均有较好的识别效果。
关键词:车道线检测与跟踪,Hough变换,Kalman预测器,感兴趣区域
参考文献
[1]Kenue K S Lanelok.An Algorithm for Extending the LaneSensing Operating Range to 100 Feet[J].Mobile Robots V,1990:222-233.
[2]Redmill K A,Upadhya S,Krishnamurthy A.A Lane Track-ing System for Intelligent Vehicle Applications[J].IEEE,2001:273-279.
[3]Wang Yue,Shen Dinggang,Teoh E K.Lane Detection UsingSpline Model[J].Pattern Recognition Letters,2000,21:677-689.
[4]董因平,高振海.基于统计预测的车道边缘点搜索算法[J].微计算机应用,2004,25(3):348-352,356.
[5]游峰.智能车辆自动换道与自动超车控制方法的研究[D].吉林:吉林大学,2005.
检测与跟踪范文
声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。如若本站内容侵犯了原著者的合法权益,可联系本站删除。


