0 引 言
随着我国社会经济的不断进步,公众对安全防范的意识也在逐步提升,视频监控系统越来越多的被应用于企业、学校、银行、居民区中。 但是目前,多数的视频监控系统都只是提供实时图像给工作人员,由人工监视处理。 这样的监控方式存在着诸多的不足:第一,绝大多数的此类系统不可能在数量上按照1:1 的比例配置摄像机和监视器,那么大部分的监视点都不能时刻处于监控状态;第二,有试验显示,人如果连续观察2 个以上的监视器,10分钟后,将错过45 %的场景,22 分钟后,会错过95 %的场景,效率极其低下;第三,既然实时监看不符合人的心理与生理特征,为了不漏掉没有发现的情况,只好进行24 小时视频录像,以便事后调阅。 这就产生了大量无用信息,少量的有用信息淹没在其中,想获取这些有用信息变得更加困难;第四,业务功能单一,由于不具备智能分析能力和联动处理能力,只能“监”视,而缺少防“控”处置的能力。
智能视频监控系统是采用人工智能、模式识别、概率论和图像处理技术,借助计算机强大的数据处理能力来分析视频数据,过滤掉图像中的无用信息或干扰信息、抽取视频源中的关键信息、判断有无异常情况,并以最快、最佳的方式进行处理。 智能视频监控系统能有效进行事前预警、事中处理、事后及时取证,是全自动、全天候、实时监控的智能系统。
1 智能视频监控系统功能分析
首先,智能视频监控系统可以对采集到的视频数据进行智能分析,并在此基础上实现各种应用,例如,当侦测到有目标进入监控区域时,系统自动锁定该目标、并进行跟踪拍摄录像、同时触发相应报警联动;可以实现人脸识别和车牌识别,智能记录人员和车辆的出入情况;结合图像融合算法,实现红外光和可见光图像的融合,增强夜间监控的可靠性。
其次,智能视频监控系统能有效集成其他安防设备,例如门禁系统、红外探测器、烟温感探头、警铃等,实现安防工作的一体化、集成化,充分发挥系统的最大效能。 比如当红外探测器发现不明目标进入监控区域,系统会迅速发出指令要求相应的网络摄像机转到对应的预置位,拉响警铃,并提示管理员查看该路视频信号。 这种集成的系统监测方式多样,能大大降低误报率,提高安防工作的效率。
第三,智能视频监控系统能感知前端摄像机的工作状态,如视频模糊、视频遮挡、视频丢失、视角变换等。 譬如在一个大型的监控系统中,通常会有几百乃至几千路监控点,监控中心的值班人员最多只能监视其中几十路视频图像而已,当其中某一路视频被有意或无意遮挡时,值班人员很难及时发现,从而带来重大安全隐患。 系统具备一定的自我检测能力,能及时发现、修复系统问题,保障系统正常运行。
第四,智能视频监控系统对录像提供自动证据视频检索,该功能利用目标侦测技术获得目标的类型、形状、大小、速度、位置、颜色、以及其他特定的目标标志信息,从而生成丰富的视频索引,实现特定视频段检索或者目标事件检索。 例如输入“8月23日14:00”到“8月23日16:00”间,走过“6 kV配电间”的“戴蓝帽子”人员,系统能根据这些关键信息点为用户查找到相关录像,极大的提升了视频分析的效率。
2 智能视频监控系统的架构设计
2.1 系统架构设计
文中提出的智能视频监控系统架构设计可分成软件和硬件两大部分(如图1 所示)。 软件部分由系统后台监控端、管理端、服务端和数据库四部分组成;硬件部分主要包括:网络视频摄像机、I/O 电子控制器、各类报警传感器、探照灯、门禁读卡器、门禁控制器等。
2.1.1 软件部分组成
(1)监控端:它是智能视频监控系统的信息处理单元,承担着连接用户与中心服务器的任务,是信息的中转站,也是确保用户能第一时间接收到视频信息和报警的关键。 它的主要功能有:查看实时监控图像,接收报警提示,查询历史告警记录,遥控操作各类报警设备。
(2)管理端:主要用于人员权限配置,硬件设备配置,系统联动报警方案设定、定时计划方案管理。
(3)服务端:作为智能视频监控系统的神经中枢,它承担着硬件设备的管理、数据通信、历史视频记录管理、网络拥塞控制、报警智能处理等众多职责。
为了保证系统的安全性、稳定性及易用性,监控端、管理端、服务端均采用C#语言编写,运行于微软的WINODWS操作系统之上。
(4)数据库:采用微软的SQL2005数据库,它的性能较为优异,操作相对简单,有比较高的安全性。 系统里所有的硬件信息、人员信息、报警处置方案、报警历史记录、视频索引全在储存在这里,便于修改调用。
3 智能视频分析的实现
对视频图像的采集、分析工作主要由前端摄像机内置的嵌入式微处理器来完成。 这种数据处理方式可以使得系统对原始或最接近原始的图象进行分析,第一时间做出快速而准确的判断。
一个完整的视频图像分析处理过程需要融合图像处理技术、模式识别技术等多种技术手段才能达到较好的实践效果。 其工作过程包括图像的预处理、图像分割、特征提取和图像分类,工作流程图如图3所示。
系统的图像识别设计借鉴运动检测的思路来实现:首先根据各坐标的像素值在整个序列中的统计信息对背景进行恢复,如有异常情况,则提取出来;然后再利用统计方法识别该异常情况的所属类别。
图像的识别主要运用帧间变化检测方法来实现,其基本流程分为:
(1)图像预处理,根据图像的模糊情况采用各类特殊技术来突出图像中的某些细节信息并削弱或消除无关信息,从而达到增强图像的整体或局部特征的目的。
(2)图像的背景恢复及异常提取,根据各坐标处像素值在整个序列中的统计信息对图像背景进行恢复,然后利用当前帧与恢复出来的背景相减,提取出发生了异常情况的区域;(3)图像分类,利用当前帧与恢复出来的静态背景相减,提取出所有可能发生了异常情况的区域。
3.1 图像预处理
常见的图像增强从处理的作用域出发,可分为空间域和频率域两大类,其中空间域增强是直接在图像所在空间中进行处理,对图像的像素灰度值直接进行运算处理。 空间域图像增强技术可用公式1来描述:
式中:F(x,y)为处理前的图像,G(x,y)为处理后的图像,H(x,y)为空间运算函数频率域图像增强是将原空间的图像以某种形式转换到其他空间,然后利用该转换空间的特有性质进行处理,最后再转换回原空间中。 其过程可用图4来描述:
3.2 图像背景恢复及异常提取
视频序列的帧与帧之间有很强的相关性,如果只利用单帧信息来进行分析处理,错误率很高,当前分析效果较好的方法是联合多帧进行处理。 基于这一思想,可以根据各个坐标处像素值在整个序列中的统计信息对背景进行恢复。 文中设计的系统采用静态背景恢复进行处理:
首先,我们将图像序列定义为B(x,y,i),其中x,y代表空间坐标,i代表帧数(i=1, …, N),N为序列总帧数。 视频帧差CDM反映了相邻帧之间的灰度变化:
式中:阈值T用来去除噪声。 对固定的坐标位置(x,y),CDM(x,y,i)可以表示为帧数i的函数,它记录了像素点(x,y)沿时间轴的变化曲线。 可以根据CDM(x,y,i)是否大于零将这条曲线分段,并将其用集合
表示。
系统操作步骤具体为:
(1)读出相邻两帧数据,进行比较,并计算出它们的差值;(2)对得到的两帧图像差进行二值化处理,将二值化后的图像在特定的腐蚀窗口条件下进行腐蚀处 理,随后计算出经腐蚀处理后的图像的标准帧间偏移;(3)重复步骤(1)和步骤(2);(4)对每一个像素点跟踪最大长度设定为0,并记录其最大长度中的 中间帧标号;(5)遍历整个序列,跟踪、记录下单个点连续为0的最大长度;(6)遍历整帧图像,设置背景数据,恢复得到静态背景。
3.3 图像分类
从一个复杂的场景中提取出目标物体后,为了便于识别,需要对目标物体的尺寸特征、形状特征等进行测量计算。 这些特征必须相对于特定的物体具有一定的稳定性,例如当图像发生旋转、平移时,物体的面积、周长不会出现明显变化;当图像由于目标物体与摄像机距离的不同 而导致摄入的图像大小不同时,比例特征不会发生改变。 系统可以借助这些较为稳定的特征来区别不同的物体,从而准确识别进入场景的目标。 在本系统中,主要采用面积和比例特征来区分运动对象。
系统图像分类采用统计模式识别方法,该方法事先定义了若干的类型或范畴,它认为图像可能包含一个或多个物体,并且每个物体都将属于某一类事先定义的类型或范畴. 其中完成“分类”工作的器件是“分类器”. 分类器的类型有许多,比如参数的和非参数的,线性的和非线性的。 本系统设计选择了线性分类器,并利用最小距离分类法对物体进行辨识分类。 该方法是用输入模式和特征空间作为模板的点之间的距离作为分类的准则。 设有m个类别的图像,其类别分别为W1,W2,…,Wm. 现要判断任一个给定的图像是这m个类别中的哪一类,则可以通过提取图像的特征来进行判断。
当图像类别很多时,特征一般也较多。 为了分析和分类的方便,可用图像的d(假设图像有d个特征)个特征组成d维空间中的特征向量X来表示,如果有m个类别,就有m个这样的特征向量。
因此,从图像中提取到全部特征后,组成d维向量,采用最小距离分类法与样本库中的图像类的特征向量进行匹配运算,如果其与第i(0
4 小 结
针对视频监控领域的发展现状和存在的问题,基于前人的研究结果和作者多年来的工作实践,文中提出了一种基于智能视频分析的监控系统设计,从硬件架构和软件架构上都做了分析说明,为监控系统的设计提供了一种新的方法和思路。
智能视频监控技术的应用前景非常广大,停车场、高速路、工厂、军事基地的安全管理都急需它的帮助,而且伴随着硬件处理能力和软件分析能力的不断提高,智能 视频监控系统的工作效能还将继续提升,新的功能也将不断涌现,它必将取代现有的传统监控,开启安防管理工作新的篇章。