音视联动,声色兼顾—为智慧城市建设打造一副“顺风耳”

微纳感知超远场拾音解决方案
2019-09-25 17:39:08 来源:安防知识网 作者:编辑部
测评中心频道文章B

[摘要] 长期以来,机器视觉始终是我们在平安城市建设过程中的绝对核心,而听觉系统则一定程度上地被忽略了,然而正是因为有微纳感知这样不断钻研、持续深耕的专注者,他们让人们看到了机器听觉在智慧城市建设中的巨大潜力和应用价值。视频能够提供城市监控、特征识别、视觉获取等方方面面的信息,而“听觉”将进一步丰富和完善城市感知系统的维度,未来智慧城市建设不应只有视频监控这双“千里眼”,拥有一副“顺风耳”同样举足轻重,只有音视联合,声色兼顾,才能让城市管理迈向精细化、智能化、科技化。

  众所周知,在安防领域中,视频监控一直占据绝对主角地位,其所采集、传输、存储的数据类型70%以上都是来自于视频监控的图像数据,但事实上对于城市公共安全、交通管理等绝大多数安防场景而言,声音无疑是图像信息最重要的补充,应用价值巨大,从无声到有声,声音让单一画面视频变得更有价值与意义,从而直接影响到事件的准确研判与综合分析。

  自中国安防产业崛起以来,“海大宇”、“AI视觉四小龙”等基于人工智能视觉技术和智能视频处理技术的企业急速扩张,智能视频监控和视觉识别技术得到充分发展,如今视频监控的可视范围已经达到上百米甚至更高,然而声音的有效拾音范围却仍停留在室内环境的应用场景下,针对远场的技术还停留在军用等特殊领域,随着智慧城市建设的不断推进,将远场拾音和视频监控相结合,实现基于异常声音触发的音视联动已经是大势所趋。

  深圳市微纳感知计算技术有限公司(以下简称:微纳感知)就是一家基于复杂场景下的机器听觉解决方案专注者。从2013年起,微纳感知便一直致力于机器听觉技术及应用的深度探索,经过六年的持续深耕,微纳感知正式进军安防市场,与诸多主流安防企业达成了战略合作关系,共同推出了一系列覆盖公安监所、交通管控、远程教育、会议系统等细分领域的音视频联动产品及方案。

1.png

  麦克风阵列+智能算法,超远距离精准拾音

  与光学传播过程不同,复杂场景下的声音处理之所以一直没有实现大规模应用,主要是因为技术层面确实存在较大困难,首先要将声音从复杂环境中清晰的采集下来,其次要分析声音包含的信息,而在声音的传播过程中,其能量不断地被周围环境所吸收,传播距离越远,声音的衰减越剧烈,加上复杂环境下的噪声干扰,声学复杂度与声场距离呈正相关,以至于超过一定距离后,声音就不易被人耳所能听到,因此远距离拾音技术首先要解决的就是噪声干扰难题。

2.png

  微纳感知采用麦克风阵列智能远场拾音算法,通过在复杂声场环境下的主动自适应降噪和精准去混响,滤除环境干扰噪声(车辆引擎声、刹车声、电动 车鸣笛声、建筑噪声等),实现60米以上超远距离声音信号拾取,输出清晰自然的高保真语音;实现基于异常声音事件检测及特定目标空间位置触发的音视联动处理,针对特殊音频事件的音视频监测及预警告警处理。

  AI声音识别+音视联动,全面感知多维态势

  作为微纳感知核心技术之一,麦克风阵列信号处理主要包括回声消除、噪声&混响抑制等,将声音清晰采集下来后传送到后端人工智能引擎,然后基于AI技术实现准确率超过90%的声音识别分析,比如识别枪声、鸣笛声、建筑工地施工噪音以及人声声纹检测、连续语音识别等,从而满足城市公共安全管理、建筑施工管理、道路交通管理、噪音治理等场景的各类应用需求。

  与此同时,微纳感知还将机器听觉系统与摄像头监控系统进行了深度融合,在平安城市视频监控的“千里眼”基础之上,定制化打造了一副“顺风耳”,通过100毫秒极速音频识别并联动摄像机抓拍,实现基于异常声音事件检测及特定目标空间位置触发的音视联动处理,针对特殊音频事件(如枪声、爆炸声等)的音视频监测及预警告警处理,以及针对特定目标空间位置,误差小于0.5m的高精度定位处理,真正意义上做到声色兼顾,所视即所听。

  覆盖多元化应用场景,有效解决城市管理难题

  在城市管理业务中,微纳感知超远场拾音产品及方案可有效满足不同场景下的多元化需求,其中包括:

3.png

  车辆鸣笛抓拍

  全国主要一二线城市均已颁布禁止鸣笛规定,多数城市已对鸣笛进行处罚,鉴于鸣笛声音信号取证难,执法难,鸣笛抓拍系统可有效管控车辆乱鸣笛,提升城市文明管理水平。

  微纳感知鸣笛抓拍系统通过专业声学雷达,滤除环境干扰噪声,精准锁定目标噪声源位置,准确定位到违章鸣笛车辆,其捕获率高达95%以上,准确率高达99%以上,同时还实现了声音的可视化,为后台智能管理系统提供直观准确的车辆鸣笛执法证据。

4.png

  公关安全管理

  而在人流密集的广场、公园、商场、车站等公共场所,方案可实现有效监督非法集会、人群聚集,对特征词汇进行人声识别和预警,从而有效监控公共场所突发事件,快速响应并采取预警措施,同时还能自动监控呼救、谩骂、威胁等音频信息,抓拍音视频数据并入库。

5.png

  机器人听觉系统

  巡检机器人集成远场拾音听觉能力后,除视觉识别外,可有效探测几十米内特殊音频信号(如呼救、爆炸、巨响、撞击等声音),并实时转动摄像头进行定向巡视,形成音视频立体防控的综合能力,在远场环境中解决复杂声学结构、舵机噪音以及运动状态下阵列移摆等问题,同时检测异常声音事件并精准定位,实现音视联动、及时预警,扩大基础感知范围,提升机器人复杂场景侦查和感知能力。

6.png

  平安城市基建

  远场拾音终端可安装于路灯灯杆、监控杆、信号杆等基础设施,结合现有摄像头进行音视频立体监控,无需依赖光线即可实时获取监控范围内的声音信号,有效改善过去“有画面,无声音”的监控痛点,提升甄别效率,预防聚众、非法集会等行为,此外还能够检测噪声,反映城市噪声分布情况。

7.png

  点评:

  长期以来,机器视觉始终是我们在平安城市建设过程中的绝对核心,而听觉系统则一定程度上地被忽略了,然而正是因为有微纳感知这样不断钻研、持续深耕的专注者,他们让人们看到了机器听觉在智慧城市建设中的巨大潜力和应用价值。视频能够提供城市监控、特征识别、视觉获取等方方面面的信息,而“听觉”将进一步丰富和完善城市感知系统的维度,未来智慧城市建设不应只有视频监控这双“千里眼”,拥有一副“顺风耳”同样举足轻重,只有音视联合,声色兼顾,才能让城市管理迈向精细化、智能化、科技化。

0
[责任编辑:宋笑旭]

《安防知识网》一个服务号 二个订阅号 微信服务全面升级

不得转载声明: 凡文章来源标明“安防知识网”的文章著作权均为本站所有,禁止转载,除非取得了著作权人的书面同意且注明出处。违者本网保留追究相关法律责任的权利。

您可能需要

专栏推荐

阅读推荐

【实测】去繁从简—POE+门禁系统安装只需一根CAT6! 2019-09-30 09:32  来源:安防知识网|0