a&s专业的自动化&安全生态服务平台
公众号
安全自动化

安全自动化

安防知识网

安防知识网

手机站
手机站

手机站

大安防供需平台
大安防供需平台

大安防供需平台

资讯频道横幅A1
首页 > 资讯 > 正文

视频图像识别分析软件简析

目前,大规模视频监控带来的海量视频信息成为了系统安装后的处理难题。系统利用率低、有效信息提取困难,而视频图像识别分析技术则可以解决这个问题。本文介绍了视频图像识别分析技术的发展状况、主要应用类型及选购要点,供读者参考。\r\n
资讯频道文章B

    近年来,随着信号处理技术的进步,视频和图像处理技术得到迅速发展,并逐步渗透到我们的社会生活中。大量的视频监控应用已经出现,我们可能都已经看到,视频监控几乎无所不在:银行柜台和ATM机,小区、酒店、写字楼、机场等公共场所的安全管理,高速公路和停车场的车辆收费管理,以及道路交通的流量管理等等。

    与此同时,大规模视频监控带来的海量视频信息成为了系统安装后的处理难题。系统利用率低、有效信息提取困难,而视频图像识别分析技术则可以解决这个问题,智能视频分析软件就是基于此点迅速发展起来。

技术发展状况
    视频图像识别分析技术源自计算机视觉(CV,Computer Vision)技术。计算机视觉技术是人工智能(AI,Artificial Intelligent)研究的分支之一,它能够在图像及图像描述之间建立映射关系,从而使计算机能够通过数字图像处理和分析来理解视频画面中的内容。而视频监控中所提到的智能视频技术主要指的是:“自动分析和抽取视频源中的关键信息。”如果把摄像机看作人的眼睛,而智能视频系统或设备则可以看作人的大脑。人脸辨识、车牌识别以及行为分析三项技术则是智能视频软件的核心技术。

人脸辨识技术
    人脸辨识是一个相当古老的题目,早在1981年便有人发明模拟人脸,做人脸辨识的计算机视觉系统,在1991年以及1997年分别有两个重要的人脸辨识方法发表,其分别是Eigenface以及Fisherface。

    Eigenface法是假设所有人脸可以用一组基底人脸的线性组合所表示,作者以PCA组成分析原理(Principle Components Analysis)找出这组基底。

    Fisherface法则是进一步利用LDA线性判别式分析法(Linear Discriminant Analysis ),强制将不同的人脸在投射空间中尽量分开,因而提高了辨识率。

    基本上人脸辨识可以分为两种主要方法,一是整体特征方法,一是局部特征方法。

    整体特征方法:直接将整张人脸当作单一特征来做辨识;局部特征方法:先找出脸上的局部特征,通常是眼睛、鼻子和嘴巴,然后分别根据这些局部特征做辨识,最后将个别局部特征的结果统合而得到最后结果。近来的研究发现局部特征方法要比整体特征方法有更高的准确率,但局部特征方法存在局部特征的对位问题,在实际应用上有较高的困难度。

    大部分的人脸辨识方法会先将原始影像数据经过降维的程序,在投射的子空间进行辨识,如此一来降低了运算量,例如前述的利用PCA或LDA方法。

    近来也有方法是利用不连续余弦转换法DCT(Discrete Cosine Transform)来做降维,其与PCA 和LDA不同处在于DCT法抽取的是影像的低频部分作为特征,并且不用象PCA或LDA需要很多样本(sample)来计算转置矩阵,而是利用单一公式直接对每个样本降维。

    在抽取出特征后(不管是原始影像或是降维空间),做辨识通常是利用最近邻居法( Nearest-Neighbor),Eigenface以及Fisherface皆属于这种方式。比较快速的方式是利用中枢网络法(Neural Network),再配合DCT的处理结果作为特征后,在Yale以及ORL人脸数据库有不错的辨识率。[nextpage]

    近来非常热门的Support Vector Machine(SVM)方法也被应用到人脸辨识的题目上,其直接取原始影像作为特征,或是经过PCA降维后当作特征,再训练出SVM来做辨识。

    一个很有创意的人脸辨识方法是利用DCT加上Hidden Markov Model(HMM)来做人脸辨识,其是利用了人脸由上而下,眼睛、鼻子和嘴巴这些特征是有一定顺序的性质。

    人脸辨识目前公认存在的难题有两个,一是不同光源的问题,一是不同角度的问题。由于同一张人脸在不同光线以及角度下常常会有很大的差别,所以传统的方法通常会失败。

    近来有不少方法致力于处理上述两问题,在处理光线问题方面有Illumination Cone、 Quotient Image以及Self Quotient Image和Intrinsic Illumination Subspace四种方法。

    Illumination Cone提出建立3D脸部模型,理论上可以重建固定视角下所有光源的脸2D样貌,因而处理了光线变化的问题。

    Quotient Image、Self Quotient Image和Intrinsic Illumination Subspace概念上都是一种前处理的手段,三者皆先将欲辨识的人脸转成删除光源信息的格式,再做人脸辨识。

    在处理不同角度方面有Morphable model、View-Base Eigenspaces、Elastic Bunch Graph Matching和Active appearance model四种方法。

    Morphable model 与Active appearance model提供将视角为非正面输入影像转换成正面影像,因而去除了不同视角的因素,在此条件下做人脸辨识自然有较高的精确度。

    View-Base Eigenspaces是基于Eigenface的方法,但根据不同的视角都个别去做,因而数据库中储存了同一人在不同视角下的数据。

    Elastic Bunch Graph Matching方法则是根据人脸上的特征点建立一个图(graph),藉由允许此图变形而使得不同视角下脸部的特征点仍位于脸上相同位置,因此藉由这些特征点来做人脸辨识便排除了不同视角的因素。

    上述的这些方法皆是利用2D的模型来进行人脸辨识。另外一类的方法使用3D模型来进行人脸辨识,如在FRVT 2002中三维Morphable模型的测试被证明可以有效地改善不同视角的辨識率。

    传统的人脸辨识使用单张影像,相对于此种静态影像辨识方法外,利用影片中连续的多张影像来做辨识的方法则称为动态影像辨识。动态影像相对于静态影像有许多优势,一是多张影像提供的信息比单张影像丰富,其中包括了不同的视角,相邻影像的信息等,这些信息都能够增加人脸辨识的准确度。

    总结来说,光线和视角仍是目前人脸辨识的难题,虽然有相当多的研究是针对这两点的,但并没有完全解决。近来的研究趋向利用动态影像来得到更高的精确度,而利用3D的人脸模型来进行辨识也因为在视角改变的状况下有不错的表现,在近几年也受到重视。[nextpage]

车牌识别技术
    车牌识别是基于光学字符识别(简称OCR,即Optical Character Recognition)技术对车辆牌照进行识别,从而辨识车辆身份的一种技术。近几年该技术发展迅速,国内有许多研究机构和厂家掌握了汉字和基本字符的关键识别技术,并已广泛应用于智能交通领域。

    车辆图像采集是从实际环境中或者交通视频中获取,即可通过照相设备直接获取,也可以使用图像采集卡采集。车牌识别技术均基于对图像进行分析识别,这一步骤提供了识别对象的原始信息。

    车牌定位是在车辆的整幅图像中,正确找到车牌所在的位置,提取车牌部分的图像,并判别出车牌的颜色。

    字符分割是按规定的车牌格式,正确分割车牌的每一个字符,为字符的识别做准备。

    字符识别是OCR的核心技术,经过字符识别最终获得车牌号码(有时还包括如车牌颜色,牌照位置等其他重要信息)。

    经过多年的发展,车牌识别技术已经相对成熟,已有较多的厂商的整牌识别率都可以达到95%以上,基本满足了实际应用需要。在最新的车牌识别系统中,已有厂家推出了车型识别功能,可以定位到是何种品牌的汽车,如奔驰、宝马、本田、丰田、夏利等。

    困扰车牌识别技术多年的光线问题,也随着光源补偿技术的发展得到了极大改善。可以预计车牌识别技术已经具备广泛推广的基础。

行为识别分析技术
    行为识别分析技术是近几年发展比较迅速的智能识别技术,并迅速进入产品化,其中以美国Object Video公司为代表。

    目前,针对生活中的各类安全预警事件的最新行为检测功能纷纷推出,如烟火探测、异常行为探测、动物探测等等。这些功能的实现,加速了图像识别分析软件的大规模使用。

    困扰行为识别分析技术的环境变化因素由于“自学习”技术的发展,也得到了很大改善。

应用类型
    在应用方面,主要分为与安全相关类应用与非安全相关类应用两类。

与安全相关类应用
    安全相关类的应用是目前市场上存在的主要智能视频应用,特别是在“911”恐怖袭击、马德里爆炸案以及伦敦爆炸案发生之后,市场上对于此类应用的需求不断增长。这些应用主要作用是协助政府或其他机构的安全部门提高室外大地域公共环境的安全防护。此类应用主要包括:

    1、高级视频移动侦测(Advanced VMD):在复杂的天气环境中(例如雨雪、大雾、大风等)精确地侦测和识别单个物体或多个物体的运动情况,包括运动方向、运动特征等。[nextpage]

    2、物体追踪(Motion Tracking):侦测到移动物体之后,根据物体的运动情况,自动发送PTZ控制指令,使摄像机能够自动跟踪物体,在物体超出该摄像机监控范围之后,自动通知物体所在区域的摄像机继续进行追踪。

    3、人面部识别(Facial Detection):自动识别人的脸部特征,并通过与数据库档案进行比较来识别或验证人物的身份。此类应用又可以细分为“合作型”和“非合作型”两大类。

    4、车辆识别(Vehicle Identification):识别车辆的形状、颜色、车牌号码等特征,并反馈给监控者。此类应用可以用在被盗车辆追踪等场景中。

    5、非法滞留(Object Persistence):当一个物体(如箱子、包裹、车辆、人物等)在敏感区域停留的时间过长,或超过了预定义的时间长度就产生报警。典型应用场景包括机场、火车站、地铁站等。

与安全非相关类应用
    除了安全相关类应用之外,智能视频还可以应用到一些非安全相关类的应用当中。这些应用主要面向零售、服务等行业,可以被看作管理和服务的辅助工具,用以提高服务水平和营业额。此类应用主要包括:

    1、人数统计(People Counting):统计穿越入口或指定区域的人或物体的数量。例如为业主计算某天光顾其店铺的顾客数量。

    2、人群控制(Flow Control):识别人群的整体运动特征,包括速度、方向等等,用以避免形成拥塞,或者及时发现异常情况。典型的应用场景包括超级市场、火车站等人员聚集的地方。

    3、注意力控制(Attention Control):统计人们在某物体前面停留的时间。可以用来评估新产品或新促销策略的吸引力,也可以用来计算为顾客提供服务所用的时间。

    4、交通流量控制(Traffic Flow):用于在高速公路或环线公路上监视交通情况,例如统计通过的车辆数、平均车速、是否有非法停靠、是否有故障车辆等等。

结语
    目前,视频监控技术正在向着数字化、网络化、智能化的方向发展。网络化、智能化的基础是数字化,而智能化则是“三化”的最高境界。系统由目视解释转变为自动解释是视频监控技术的飞跃,是安防技术发展的必然。

参与评论
回复:
0/300
文明上网理性发言,评论区仅供其表达个人看法,并不表明a&s观点。
0
关于我们

a&s是国际知名展览公司——德国法兰克福展览集团旗下专业的自动化&安全生态服务平台,为智慧安防、智慧生活、智能交通、智能建筑、IT通讯&网络等从业者提供市场分析、技术资讯、方案评估、行业预测等,为读者搭建专业的行业交流平台。

免责声明:本站所使用的字体和图片文字等素材部分来源于互联网共享平台。如使用任何字体和图片文字有冒犯其版权所有方的,皆为无意。如您是字体厂商、图片文字厂商等版权方,且不允许本站使用您的字体和图片文字等素材,请联系我们,本站核实后将立即删除!任何版权方从未通知联系本站管理者停止使用,并索要赔偿或上诉法院的,均视为新型网络碰瓷及敲诈勒索,将不予任何的法律和经济赔偿!敬请谅解!
© 2020 Messe Frankfurt (Shenzhen) Co., Ltd, All rights reserved.
法兰克福展览(深圳)有限公司版权所有 粤ICP备12072668号 粤公网安备 44030402000264号
用户
反馈