毕业论文课题相关文献综述
人体行为识别的研究意义,国内外研究现状、水平和发展趋势
对人的运动模式进行分析和识别,并用自然语言等加以描述。相比而言,以前大多数的研究都集中在运动检测和人的跟踪等底层视觉问题上,这方面的研究较少。近年来关于这方面的研究越来越多,逐渐成为热点之一。
人体行为识别是计算机视觉领域的研究热点和难点,在智能监控、高级人机交互、体育运动分析和基于语义的视频检索等方面有着重要的意义和广阔的应用前景。计算机理解人体动作和行为将成为未来高层计算机视觉技术发展的重要方向。
动态场景中运动人体的快速完整分割、非刚性运动分析、目标遮挡、形状姿态以及光照处理等,涉及到图像处理、模式识别、机械学习等领域的和核心问题,对视频人体监测与行为分析带来挑战,受到许多研究者的广泛关注,有着非常高的理论价值。
由于运动人体监测和与行为识别在商业国防安全和军事方面的广泛应用前景和潜在商机激发了广大科研工作者及相关机构的浓厚兴趣。尤其在美国和英国。1997年美国军方监理VSAM的视觉监控重大项目。2000年启用远距离人体辨识项目(HID)实现远距离人体检测和识别。1999年欧盟设立包含人群和个体行为模式分析、人机交互等的公共交通安全管理ADVISOR项目。
与之相比,中国的起步则玩的多。单许多大学和研究机构正着力于这方面的研究,如中科自动化研究院、微软亚洲研究院、北京大学视觉与信息处理国家重点实验室等。现在视觉运动人体检测与行为意识在一些权威期刊和智能视频监控学术会议上受到了高度重视。它主要对包含人体的运动图像序列进行跟踪检测,以及行为的特征与识别属于图像处理分析和理解的范畴。目前,人体行为识别的研究尚处于初级阶段,尽管在单一背景的简单动作识别上取得了一定的进展,但是由于人体行为的复杂性、特征提取的时间复杂度高等问题,真实场景下的人体行为识别仍然面临着许多困难,如实时性差、识别率未达到实际应用等。
视频监控系统人体行为识别和提取的实现步骤
环境建模要进行场景的视觉监控,环境模型的动态创建和更新是必不可少的。在摄像机静止的条件下,环境建模的工作是从一个动态图像序列中获取并自动更新背景模型。其中最为关键的问题在于怎样消除场景中的各种干扰因素,如光照变化、阴影、摇动的窗帘、闪烁的屏幕、缓慢移动的人体以及新加入的或被移走的物体等的影响。
运动检测运动检测的目的是从序列图像中将变化区域从背景图像中提取出来。运动区域的有效分割对于目标分类、跟踪和行为理解等后期处理是非常重要的,因为以后的处理过程仅仅考虑图像中对应于运动区域的像素。然而,由于背景图像的动态变化,如天气、光照、影子及混乱干扰等的影响,使得运动检测成为一项相当困难的工作。
目标分类:对于人体监控系统而言,在得到了运动区域的信息之后,下面一个重要的问题就是如何将人体目标从所有运动目标中分类出来。不同的运动区域可能对应于不同的运动目标,比如一个室外监控摄像机所捕捉的序列图像中除了有人以外,还可能包含宠物、车辆、飞鸟、摇动的植物等运动物体。为了便于进一步对行人进行跟踪和行为分析,运动目标的正确分类是完全必要的。但是,在已经知道场景中仅仅存在人的运动时(比如在室内环境下),这个步骤就不是必需的了。
人体跟踪:人体的跟踪可以有两种含义,一种是在二维图像坐标系下的跟踪,一种是在三维空间坐标系下的跟踪。前者是指在二维图像中,建立运动区域和运动人体(或人体的某部分)的对应关系,并在一个连续的图像序列中维持这个对应关系。从运动检测得到的一般是人的投影,要进行跟踪首先要给需要跟踪的对象建立一个模型。对象模型可以是整个人体,这时形状、颜色、位置、速度、步态等等都是可以利用的信息;也可以是人体的一部分如上臂、头部或手掌等,这时需要对这些部分单独进行建模。建模之后,将运动检测到的投影匹配到这个模型上去。一旦匹配工作完成,我们就得到了最终有用的人体信息,跟踪过程也就完成了。
多摄像机数据融合:采用多个摄像机可以增加视频监控系统的视野和功能。由于不同类型摄像机的功能和适用场合不一样,常常需要把多种摄像机的数据融合在一起。在需要恢复三维信息和立体视觉的场合,也需要将多个摄像机的图像进行综合处理。此外,多个摄像机也有利于解决遮挡问题。
行为理解和描述:事件检测、行为的理解和描述属于智能监控高层次的内容。它主要是对人的运动模式进行分析和识别,并用自然语言等加以描述。相比而言,以前大多数的研究都集中在运动检测和人的跟踪等底层视觉问题上,这方面的研究较少。近年来关于这方面的研究越来越多,逐渐成为热点之一。
人体行为识别方法分类
人体行为识别前已有的方法主要分为三大类:基于模板的方法,基于概率统计的方法和基于语义的方法。
模板匹配法是一种较早用在人体运动识别上的方法,将运动图像序列转化为一个或一组静态的模板,通过将待识别样本的模板与已知的模板进行匹配获得识别结果。在行为识别中,基于模板匹配的算法可以分为帧对帧匹配方法和融合匹配方法。主要方法有:运动能量图像(MEI)和运动历史图像(MHI),基于轮廓的平均运动形状(MMS)和基于运动前景的平均运动能量(AME)等。
概率统计法进行运动识别是把运动的每一种静态姿势定义为一个状态或者一个状态的集合,通过网络的方式将这些状态连接起来,状态和状态之间的切换采用概率来描述。主要有隐马尔科夫模型HMM,最大熵马尔科夫模型(MEMM),条件随机场(CRF)等。
参考文献:
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。