充分挖掘场景元数据的潜能
概述
在视频监控领域,元数据以文本方式描述视频中的内容。例如侦测到了哪些目标对象,或是对场景本身的高级描述。这还包括与对象或场景相关的属性,例如车辆和衣服的颜色、确切位置或行进方向。元数据是实时创建的,可以在摄像机中直接创建,也可以由能够运行视频分析功能的另一系统组件创建。
元数据还提供事件背景信息,并允许对大量视频素材进行快速排序和搜索。这使功能可被广泛分类为三个领域:
事后取证搜索。 基于不同搜索参数来搜索目标对象或事件,将搜索范围缩小到数量有限的候选对象。对象分类数据则可以帮助您进行广泛的细节搜索。
实时使用。 帮助操作人员快速响应情况变化,或提供输入来支持决策或实现自动化响应。
识别趋势、模式和洞察。 进行统计报告的物联网 (IoT) 和运营效率平台可以通过元数据自动收集访客计数、速度测量、交通流量数据和其他类型数据。
有些摄像机可以解码音频来检索音频元数据。特定的声音模式可以被侦测到并进行标记,如同在视频中侦测和标记对象类别一样。例如,音频识别系统可以识别攻击性语言或侦测到玻璃破碎的声音。
当整合来自多个输入源(如视觉、音频、活动相关和流程相关来源)的元数据时,您可以获得比单一来源更全面的洞察。开放的协议和行业标准对于无缝整合元数据至关重要。
引言
元数据是从视频中收集情报的基础。它通过描述场景中的关键细节,为视频内容赋予数字含义。利用元数据,您可以快速查找并评估大量视频中的重要内容,从而采取相应行动。这也是为何元数据被越来越多地应用于高效的安保、安全和业务运营中的原因。
本白皮书讨论了监控和运营效率领域中的元数据。我们将详细介绍元数据的好处,以及它在视频管理系统和其他应用中的使用方式。
什么是元数据?
元数据是关于其他数据的数据。在视频监控领域,元数据以文本形式描述视频中的内容,例如侦测到哪些目标对象,或是对场景本身的高级描述。这可以包括与对象或场景相关的属性,例如车辆和衣服的颜色、确切位置或行进方向。元数据是实时创建的,可以在摄像机中直接创建,也可以由系统中能够运行视频分析功能的另一组件创建。

在边缘生成元数据
过去,高性能视频分析是基于服务器的,因为它们通常需要比边缘设备具备更强大的处理能力。近年来,随着算法的开发和边缘设备处理能力的增强,在边缘运行高级分析也成为了可能。这意味着元数据在设备中生成,并且可以被设备中的其他智能分析直接使用。视频流和元数据流还可以传输到 VMS(视频管理系统)或其他应用以进行进一步处理。
基于边缘的分析能够超低延迟访问未压缩的视频材料。这实现了快速的实时应用,同时还避免了将视频移动到系统其他位置进行处理的额外成本和复杂性。基于边缘的分析还具有更低的硬件和部署成本,因为系统中需要的服务器资源更少。
在边缘生成元数据意味着数据是直接从视频中提取的,不会因压缩或传输而丢失信息。这使得元数据和视频内容分析都变得更加准确。图像质量越好,元数据越准确。
用例
元数据不仅提供场景中对象的相关细节,还提供事件背景信息,并允许对大量视频素材进行快速排序和搜索。这使功能可被广泛分类为事后取证搜索、实时使用以及趋势、模式和洞察识别等领域。
实时使用,立即响应
元数据可以实时使用,帮助操作人员快速响应情况变化。元数据还可以提供有价值的洞察来支持决策或实现自动化响应。结合高质量元数据,实时边缘分析程序可以帮助您保护人员、场地和建筑物的安全,以避免故意或意外的伤害。您可以快速侦测、核实和评估威胁,并采取有效的应对措施。
取证搜索
元数据有助于高效、快速地搜索目标对象或事件。这可以为调查人员节省很多宝贵时间,尤其是需要搜索来自多个视频源的大量视频时。您可以基于不同搜索参数来搜索对象,例如人和车辆,将搜索范围缩小到数量有限的候选对象。搜索参数可以包括动作、时间和对象特征等。
元数据类别 | 侦测内容 | 示例 |
---|---|---|
运动 | 对象如何移动 | 方向、速度、其他行为 |
时间 | 对象何时出现 | 星期几、一天中的具体时间、停留时间 |
位置 | 对象位于何处 | 场所、摄像机视野 |
对象分类 | 对象属于什么类别 | 人、车辆(汽车、巴士、卡车、自行车/摩托车) |
对象属性 | 对象有哪些特征 | 服装、配饰(帽子或包等)、服装颜色等物理特征 |
即使仅可访问某一类元数据(例如时间),这也将对您查找需要的结果产生重要作用。
动作类元数据让您能够基于对象的相对速度和移动方向展开搜索。对象分类数据则可以帮助您进行更广泛的细节搜索。具有深度学习处理单元 (DLPU) 的摄像机通常可以提供丰富的元数据和更精细的对象分类,例如,您可以搜索“绿色卡车”或“穿蓝色外套的人”。
识别趋势和模式以获得洞察
进行统计报告的物联网 (IoT) 和运营效率平台可以通过元数据自动收集访客计数、速度测量、交通流量数据和其他类型数据。这些数据经过分析生成可采取行动的洞察。
元数据可以用在哪里?
利用元数据来了解场景的特征和内容的好处有很多。元数据的主要消费者可以分为以下几类。
边缘应用。在摄像机上运行的分析程序可以对场景中的对象的信息应用逻辑筛选条件和规则。由此,分析程序可以根据定义的阈值或特定行为触发响应,例如根据场景中侦测到的人员和移动来控制 PTZ 摄像机。
视频管理系统 (VMS)。在视频监控领域中,元数据通常用在 VMS 中,以呈现场景中潜在目标对象周围的视觉叠加。随着更先进的对象侦测和分类算法被开发出来,操作人员现在还能够根据具体特征(例如衣服颜色)来定位目标对象。能够运用这些数据点来进行搜索查询大大减少了手动查看大量视频素材的需要。
物联网平台。商业智能平台可以收集并直观地呈现元数据,并通过分析实时和历史趋势来生成可行动的洞察。基于顾客流或客户体验的统计分析可以促使由数据驱动的决策,从而提升运营效益。
双重分析。有些应用需要基于边缘和基于服务器的处理相结合,以执行更高级的分析。预处理在摄像机上进行,进阶处理在服务器上进行。这种混合系统可以仅将相关的视频和元数据串流到服务器,以便执行经济高效的分析缩放。
- 边缘应用
- VMS
- 物联网平台
- 双重分析
元数据是如何传输的?
生成的元数据可以根据预期用途用不同的方法传输。在实时使用中,元数据需要应要求被不断地传输给消费者,因为这对于确保适当的响应和态势感知非常重要。而在无需实时响应的其他非关键应用中, 元数据可以在传输给消费者之前进一步整合,例如基于场景中每个特定对象的轨迹。这减少了需要存储和处理的数据总量。
- 第 1 帧侦测到对象 A 和 B,并将 A 分类为“穿红色衣服的人”,将 B 分类为“穿蓝色衣服的人”。
- 在第 2 帧中,摄像机更新了分类,确定对象 A 实际上穿着蓝色衣服,对象 B 穿着黄色衣服。尽管场景中的对象与第一帧相同,但他们的颜色属性发生了变化,这反映在元数据中。
- 第 3 帧显示对象 B 不再存在,摄像机仅跟踪对象 A,他仍被分类为“穿蓝色衣服的人”。
- 在第一帧中,显示了对象 B 的详细信息,包括他第一次和最后一次被侦测到、轨迹摘要以及在追踪期间侦测到的属性。对象 B 有 50% 的可能性穿黄色衣服,50% 的可能性穿蓝色衣服。
- 第二帧反映了对象 A 的同样格式的信息,显示他有 33% 的可能性穿红色衣服,67% 的可能性穿蓝色衣服。
这种整合传输的好处是,摄像机仅在侦测到场景中有对象时才传输元数据,极大地减少了传输给消费者的数据量,并且会对元数据进行汇总(整合),以便于解读。流式传输方法提供对每一帧场景的完整描述,即使没有活动或对象存在,消费者则需要根据自己的特定需求理解这些数据。如上所述,流式传输方法有利于实时用例,而对于消费者不需要立即采取行动的后处理应用,整合传输则是更优选择。
了解每种方法的优点和局限性对于设计系统架构至关重要。例如,基于元数据生成洞察的物联网平台更适合接收关于场景中对象的事后摘要,因为这些服务通常受到带宽和存储容量的限制。
此外,还可以根据目标消费者的特定需求和偏好,通过多种不同的通信协议和文件格式来传输元数据。
音频元数据
有些摄像机可以解码音频来检索音频元数据。音频识别分析可以侦测声音模式并突出现场和录制音频中的目标声音。通过将音频识别系统整合到视频监控设备中,可以提醒操作人员注意正在发生的潜在事件,同时引导他们观看相关的摄像机画面。例如,系统可以识别攻击性语言以防止事件升级和袭击事件,侦测玻璃破碎声以防止闯入,或者提供关于患者发病的提前预警。操作人员不仅能看到而且能听到场景中发生的事情,声音识别系统可以实现早期发现、快速干预,在许多情况下能够防止事态升级。声音识别也可以作为辅助验证手段。
经过训练来识别声音模式的智能分析通常可以监听一系列特征,包括从分贝级别到随时间变化的不同频率上的能量。特定的声音模式可以被侦测到并进行标记,如同在视频中侦测和标记对象类别一样。
整合多个来源的元数据
与多个输入源(例如视觉、音频、活动相关和流程相关输入)结合时,元数据的真正潜能才被激发出来。在不同站点的管理中,RFID(无线射频识别)跟踪、GPS 坐标、防破坏报警、仪表读数(例如温度或化学等级)、噪音侦测和销售点交易数据等都是宝贵的数据源。而所有这些来源的数据都可以基于其时间戳对齐。
整合来自不同来源的元数据意味着将获得比单一来源时更全面的洞察。开放的协议和行业标准对于无缝整合元数据至关重要。