定向音频侦测

十二月, 2025

引言

传统安防摄像机主要依赖于视频进行事件侦测。然而,音频能够提供关键的环境信息,尤其对于发生在摄像机视野范围之外的事件。

定向音频侦测功能正是音频技术真正发挥价值的典范。它能侦测到突然的、响亮的声音,例如:枪声、玻璃破碎声或尖叫声。当侦测到声音时,该功能会计算声音的发出位置。这可用于触发录像、提醒操作员,并使兼容的 PTZ 摄像机转向声源方向。

本白皮书阐述了该技术及其工作原理、部署注意事项和局限性。

侦测音频事件

定向音频侦测通过摄像机的多个声学传感器持续监视环境。该系统可识别幅度快速上升且超过可配置触发阈值的声音。当侦测到声音时,系统会计算指向声源的水平转动角度,并在可能的情况下也计算垂直转动角度。生成的信息以 VAPIX 事件的形式发送至 PTZ 摄像机,该摄像机可据此进行水平转动以查看音频源。

AXIS Q6300-E 网络摄像机集成了定向音频侦测功能。PTZ 摄像机与 AXIS Q6300-E 兼容,支持定向音频侦测功能。

初始设置

安装选项

AXIS Q6300-E 可安装在平坦墙面、外墙角、立杆或桅杆上。为获得更好的定向音频侦测性能,杆式安装或外角安装通常是更佳选择。

根据安装指南的规定,安装 AXIS Q6300-E 时必须使其正面朝前。如摄像机安装指南所示,摄像机顶部的凹槽和外缘的箭头(平移零位标记)均标明了此位置。

部分 PTZ 摄像机需要手动配置。在这种情况下,设置助理将引导您完成操作。

启用定向音频侦测

该功能默认关闭。您必须在摄像机的网页界面中进行激活后,才能使用该功能。如果您还希望该功能能够重定向 PTZ 摄像机,则必须同时启用该选项。您可以在摄像机的网页界面中找到相关设置:分析 > AXIS Audio Analytics > 定向音频检测

校准水平转动角度

AXIS Q6300-E 和 PTZ 摄像机可能具有不同的水平转动角度参考值。部分 PTZ 型号已预先校准,但某些型号必须先校准水平转动角度,才能使用定向音频侦测功能。在这种情况下,设置助理将全程引导您完成校准。

调整垂直转动预设值

当侦测到声音时,定向音频侦测会计算指向音频源的水平转动和垂直转动角度。虽然水平转动角度始终可以计算,但垂直转动角度并不总是能确定。这通常发生在声音是从水平面而不是从下面传来的情况。若未计算垂直转动角度,定向音频侦测将采用预设值。您可以在摄像机的网页界面中,通过 PTZ 选项卡调整该值。

运行

网页界面

在摄像机的网页界面中,您可在以下路径找到定向音频检测的设置:分析功能 > AXIS Audio分析功能 > 定向音频检测。例如,您还可以通过摄像机概览查看四画面显示。当侦测到声音时,您可以通过相应摄像机视图周围的黄色矩形看到声音来自哪个区域。

网页界面包含来自摄像机概览的四画面显示,以及用于设置侦测阈值和持续时间的滑块。

在网页界面中,您还可以控制阈值和持续时间的设置。

  • 阈值。规定声音必须比背景声音高出多少分贝。阈值越高,声音就需要越响亮或越急促才能触发定向音频检测。

  • 持续时间。 定义在第一个音频事件之后忽略新音频事件的时间。

音频事件日志

音频事件会被记录,并可导出为 CSV 文件。

响应规则触发器

定向音频侦测可用于触发 VMS 中的自动响应,例如启动录像。有多个触发器可提供。

  • 侦测到的音频。 此触发器在不同音频事件发生时都会被激活。例如,它可用于在 VMS 中启动录像、创建书签,或记录侦测结果,以便操作员轻松找到和浏览。

  • 在摄像机“X”的视图中侦测到音频。如果侦测到的声音的水平转动和垂直转动角度与固定摄像机之一相对应,则该触发器被激活。当侦测到声音时,该触发器可用于在相关摄像机视图上显示叠加,以便识别音频源。

  • 在任何摄像机画面外侦测到的音频。 当侦测到的声音不在任一固定摄像机视图范围内时,此触发器被激活。

优先于 autopilot 功能

Autopilot 功能通过多方向摄像机监视一个关注区域,并利用 PTZ 摄像机对人、车辆或其他移动目标进行追踪和分类。

定向音频侦测优先于 autopilot 功能。这意味着,当定向音频检测被触发时,若 autopilot 在主动追踪某个目标,该追踪将被中断,而 PTZ 摄像机将转向音频源方向。短时暂停后, autopilot 将从新的位置继续追踪,并跟随发出声响的目标(如可见)。

侦测范围

侦测性能取决于多种因素,例如:音频源的响度和距离显然是关键因素,但环境声级及其他环境因素同样重要。

可调灵敏度

您可以通过调整阈值来定制侦测灵敏度。它定义了声音必须比环境噪音等级高出多少,才能触发定向音频侦测。

物理障碍

建筑物或大型目标可以反射或阻挡声音。这会导致某些方向传来的声音的侦测距离比预期更短。

气候条件

风雨会影响声音的传播与感知。

滤除雨噪声

大雨的声音会很吵。然而,要触发定向音频侦测,声音的振幅必须快速增加并超过背景噪音等级加上设置的阈值。由于雨噪声属于背景噪音,因此会被过滤掉,通常不会触发定向音频侦测。

滤除风噪

当风吹过建筑物、电线杆和电线等固定物体时,就会产生风噪声。这会发出呼呼声或其他持续性声音。摄像机本身在遭遇强风或阵风时也会产生噪音。阵风通常持续时间短暂,仅数秒,但其强度可达平均风速的两到三倍,并会引发短暂的噪音。然而,风噪声被摄像机的声学传感器感知的方式不同,因此会被定向音频侦测功能丢弃。

风对声音传播的影响

强风会影响声音传播,从而对侦测范围产生影响。

在有风的地区传播的声音可能会被认为更响或更轻,这取决于它们受到风的影响程度。一般来说,近地面的风速要比高空的风速慢。速度差产生的风速梯度可以有效地改变声波的方向,因此顺风传播时声音趋于向下弯折,而逆风传播时声音则会出现向上弯折。这意味着站在顺风处(和地面上)的人会比站在逆风处的人听到的声音更大。这种效应在更远距离和更高风速下会增强。

隐私与完整性

定向音频侦测的设计以隐私保护和数据安全为基本原则。

定向音频侦测利用声学传感器进行音量测量和基础声音三角定位。该系统会监测声音级别,但在技术上无法记录或传输对话或语音,无法识别单词、语言或语音,也无法将音频内容传输到任何外部系统。

所有音频处理都完全在设备内部进行,没有音频数据离开摄像机。当超过设置的声音阈值时,系统产生元数据事件,并将元数据事件传输给 VMS。这些事件包含侦测的时间戳、声强级以及用于 PTZ 定位的计算坐标。不传输任何音频内容、录像或可识别的声音特征。

定向音频侦测中的系统架构和数据流。摄像机不会输出任何音频内容。