장면 메타데이터의 잠재력 극대화

1월, 2024

요약

영상 감시의 맥락에서 메타데이터는 비디오에 포함된 내용을 텍스트로 설명합니다. 여기에는 영상에서 보이는 관심 객체 또는 장면 자체에 대한 높은 수준의 설명이 포함될 수 있습니다. 여기에는 차량이나 옷의 색깔, 정확한 위치 또는 이동 방향과 같이 객체 또는 장면과 관련된 속성도 포함될 수 있습니다. 메타데이터는 카메라에서 직접 실시간으로 생성되거나, 비디오 분석을 실행할 수 있는 다른 시스템 구성 요소에 의해 실시간으로 생성됩니다.

여기에 더해 메타데이터는 이벤트에 대한 컨텍스트를 제공하고 대량의 영상을 빠르게 정렬하고 검색할 수 있게 해줍니다. 이를 통해 크게 세 가지 영역으로 분류할 수 있는 기능을 사용할 수 있습니다.

이벤트 후 포렌식 검색. 제한된 수의 후보로 검색 범위를 좁힐 수 있는 다양한 검색 매개변수를 기반으로 관심 객체 또는 관심 이벤트를 검색할 수 있습니다. 객체 분류 데이터는 광범위한 디테일을 포함하는 검색을 가능하게 합니다.
실시간 사용. 운영자가 상황 변화에 신속하게 대응하도록 도울 수 있거나, 의사 결정을 지원하거나 자동화된 조치를 가능하게 하는 데이터를 제공할 수 있습니다.
트렌드, 패턴 및 인사이트 파악. 통계 보고를 위한 IoT 및 운영 효율성 플랫폼은 방문자 수 집계, 속도 측정, 트래픽 흐름 데이터 및 기타 유형의 자동화된 데이터 수집을 위해 메타데이터를 사용할 수 있습니다.

일부 카메라는 오디오를 디코딩하여 오디오 메타데이터를 검색할 수 있습니다. 비디오에서 객체 클래스를 감지하고 라벨을 지정하는 것과 유사한 방식으로 특정 사운드 패턴을 감지하고 라벨을 지정할 수 있습니다. 오디오 인식 시스템은 폭언 상황을 식별하거나 유리 파손을 감지할 수 있습니다.

시각적 소스, 오디오 소스, 활동 관련 소스 및 프로세스 관련 소스 등 여러 데이터의 메타데이터를 결합하면 각 데이터만으로는 얻을 수 없는 훨씬 더 많은 인사이트를 얻을 수 있습니다. 원활한 메타데이터 통합을 위해서는 개방형 프로토콜과 업계 표준이 필수적입니다.

서론

메타데이터는 동영상에서 정보를 수집하기 위한 기반입니다. 메타데이터는 장면의 주요 디테일을 설명하여 비디오 콘텐츠에 디지털 의미를 부여합니다. 메타데이터를 사용하면 대량의 비디오에서 중요한 내용을 빠르게 찾고, 평가하고, 조치를 취할 수 있습니다. 그렇기 때문에 메타데이터는 효율적인 보안, 안전 및 비즈니스 운영에서 점점 더 필수적인 요소가 되고 있습니다.

이 백서에서는 메타데이터를 보안 감시 맥락과 운영 효율성 맥락 모두에서 설명합니다. 메타데이터의 장점과, 영상 관리 시스템 및 기타 애플리케이션에서 메타데이터가 사용되는 방식을 자세히 설명합니다.

메타데이터란 무엇인가요?

메타데이터는 다른 데이터에 대한 데이터입니다. 영상 감시의 맥락에서 메타데이터는 영상에 있는 것을 텍스트로 설명합니다. 예를 들어 어떤 관심 객체가 보이는지 또는 장면 자체에 대한 높은 수준의 설명입니다. 여기에는 차량이나 옷의 색깔, 정확한 위치 또는 이동 방향과 같이 객체 또는 장면과 관련된 속성이 포함될 수 있습니다. 메타데이터는 카메라에서 직접 실시간으로 생성되거나, 비디오 분석을 실행할 수 있는 시스템의 다른 구성 요소에 의해 실시간으로 생성됩니다.

관심 객체를 감지하고 분석하여 메타데이터를 생성하는 비디오 프레임의 예.

에지에서 메타데이터 생성

고성능 비디오 분석 애플리케이션은 일반적으로 에지 장치가 제공할 수 있는 것보다 더 많은 처리 능력이 필요했기 때문에 서버 기반이었습니다. 최근에는 알고리즘 개발과 에지 장치의 처리 능력 향상으로 에지에서도 고급 분석을 실행할 수 있게 되었습니다. 이는 메타데이터가 장치에서 생성되어 다른 분석 애플리케이션이 장치에서 직접 사용할 수 있음을 의미합니다. 비디오 스트림과 메타데이터 스트림은 추가 처리를 위해 VMS 또는 다른 애플리케이션으로 전송할 수도 있습니다.

에지 기반 분석은 지연 시간이 매우 짧은 비압축 비디오 자료에 액세스할 수 있습니다. 이는 빠른 실시간 애플리케이션을 사용할 수 있도록 하며, 시스템 내의 다른 곳에서 처리하기 위해 모든 비디오를 이동하는 데 드는 추가 비용과 복잡성을 방지합니다. 에지 기반 분석은 시스템에 필요한 서버 리소스가 더 적기 때문에 하드웨어 및 배치 비용을 절감해 줍니다.

에지에서 메타데이터를 생성한다는 것은 압축이나 전송 시 정보 손실 없이 비디오에서 데이터를 추출한다는 것을 의미합니다. 이를 통해 더 정확한 메타데이터와 비디오 콘텐츠에 대한 더 정확한 분석이 가능합니다. 이미지 품질이 좋을수록 메타데이터도 좋아집니다.

사용 사례

메타데이터는 장면의 객체에 대한 세부 정보만 제공하는 것이 아닙니다. 여기에 더해 이벤트에 대한 컨텍스트를 제공하고 대량의 영상을 빠르게 정렬하고 검색할 수 있게 해줍니다. 이를 통해 이벤트 후 포렌식 검색, 실시간 사용, 그리고 트렌드, 패턴 및 인사이트 파악 등의 영역으로 넓게 분류될 수 있는 기능을 사용할 수 있도록 합니다.

즉각적인 조치를 위한 실시간 사용

메타데이터는 운영자가 상황 변화에 신속하게 대응할 수 있도록 실시간으로 사용할 수 있습니다. 의사 결정을 지원하거나 자동화된 조치를 가능하게 하는 중요한 데이터를 제공할 수도 있습니다. 고품질 메타데이터와 함께 작동하는 실시간 에지 분석 애플리케이션은 사람, 사이트 및 건물을 안전하게 보호하고 의도적이거나 우발적인 피해로부터 보호하는 데 도움이 될 수 있습니다. 따라서 위협을 신속하게 탐지, 확인 및 평가하여 효율적으로 처리할 수 있습니다.

포렌식 검색

메타데이터를 사용하면 관심 있는 객체나 이벤트를 효율적이고 빠르게 검색할 수 있습니다. 특히 여러 비디오 소스에서 제공하는 방대한 양의 비디오를 검색할 때 조사자의 시간을 절약할 수 있습니다. 다양한 검색 매개변수를 기반으로 사람이나 차량과 같은 객체를 검색하여 제한된 수의 후보로 검색 범위를 좁힐 수 있습니다. 검색 매개변수에는 모션, 시간, 객체 특성 등이 포함될 수 있습니다.

다양한 메타데이터 카테고리를 사용하여 검색을 용이하게 합니다.
메타데이터 카테고리	무엇이 감지되나요?	예
모션	객체가 움직이는 방식	방향, 속도, 기타 동작
시간	객체가 나타나는 시간	요일, 시간, 체류 시간
위치	객체가 있는 위치	카메라의 위치, 화각
객체 분류	객체의 종류	사람, 차량(승용차, 버스, 트럭, 자전거/오토바이)
객체 속성	객체의 특성	의류, 모자나 가방과 같은 액세서리, 의류 색상과 같은 물리적 특징

예를 들어 시간이라는 한 가지 메타데이터 카테고리에만 액세스할 수 있는 경우에도, 필요한 결과를 찾는 데 중요한 역할을 할 수 있습니다.

모션에 대한 메타데이터는 상대적인 객체의 속도와 이동 방향을 기반으로 검색을 가능하게 합니다. 객체 분류 데이터는 더 광범위한 디테일을 포함하는 검색을 가능하게 합니다. 딥러닝 처리 장치(DLPU)가 장착된 카메라는 일반적으로 더 세분화된 객체 분류를 통해 풍부한 메타데이터를 제공할 수 있으므로, 녹색 트럭이나 파란색 코트를 입은 사람 등을 검색할 수 있습니다.

트렌드와 패턴을 파악하여 인사이트 확보

통계 보고를 위한 IoT 및 운영 효율성 플랫폼은 방문자 수 집계, 속도 측정, 트래픽 흐름 데이터 및 기타 유형의 자동화된 데이터 수집을 위해 메타데이터를 사용할 수 있습니다. 이러한 데이터를 분석하여 실행 가능한 인사이트를 생성합니다.

메타데이터는 어디에 사용되나요?

메타데이터 활용은 장면의 특성과 내용을 이해하는 데 많은 이점이 있습니다. 메타데이터의 주요 소비 애플리케이션/시스템은 다음과 같이 분류할 수 있습니다.

에지 애플리케이션. 카메라에서 실행되는 분석 애플리케이션은 장면의 객체에 대한 정보에 논리적 필터와 규칙을 적용할 수 있습니다. 따라서 분석 애플리케이션은 정의된 임계값 또는 특정 동작을 기반으로 작업을 트리거할 수 있습니다(예: 장면에서 사람의 감지 및 움직임에 따라 PTZ 카메라 제어).

영상 관리 시스템(VMS). 영상 감시의 맥락에서 메타데이터는 일반적으로 장면에서 관심 있는 잠재적 객체 주위에 시각적 오버레이를 표시하기 위해 VMS 내에서 사용되어 왔습니다. 고급 객체 감지 및 분류 알고리즘이 개발된 덕분에, 이제 운영자는 옷의 색깔과 같은 특정 특성을 기반으로 관심 객체를 찾을 수도 있습니다. 이러한 데이터 포인트를 사용하여 검색 쿼리를 수행할 수 있게 됨에 따라 대량의 영상을 수동으로 검토할 필요성이 크게 줄어들었습니다.

IoT 플랫폼. 메타데이터를 수집하고 비즈니스 인텔리전스 플랫폼에서 시각적으로 표시하여 실시간 및 과거 동향을 분석하여 실행 가능한 인사이트를 생성할 수 있습니다. 고객 흐름 또는 고객 경험에 기반한 통계 분석을 통해 데이터 기반 의사 결정을 내리고 운영을 개선할 수 있습니다.

두 번째 분석 계층. 일부 애플리케이션은 고급 분석을 수행하기 위해 에지 기반 처리와 서버 기반 처리의 조합을 요구합니다. 카메라에서 사전 처리를 수행하고 서버에서 추가 처리를 수행할 수 있습니다. 이러한 하이브리드 시스템은 관련 비디오와 메타데이터만 서버로 스트리밍하여 비용 효율적으로 분석 애플리케이션을 확장을 용이하게 할 수 있습니다.

메타데이터 소비 애플리케이션/시스템

에지 애플리케이션
VMS
IoT 플랫폼
두 번째 분석 계층

메타데이터는 어떻게 전달되나요?

생성된 메타데이터는 용도에 따라 다양한 접근 방식을 활용하여 전달할 수 있습니다. 실시간 애플리케이션의 경우, 메타데이터는 요구 시 소비 애플리케이션/시스템에 지속적으로 스트리밍되어야 합니다. 적절한 대응과 상황 인식을 보장하는 데 필수적이기 때문입니다. 실시간 작업이 필요하지 않은 다른 덜 중요한 애플리케이션의 경우, 메타데이터는 소비 애플리케이션/시스템에 전달되기 전에 장면에 있는 각 특정 객체의 추적에 기반하여 더욱 통합될 수 있습니다. 이를 통해 저장 및 처리해야 하는 데이터의 총량이 줄어듭니다.

이 그림은 카메라의 연속적인 메타데이터 프레임이 실시간 장면 정보를 제공하는 메타데이터 스트리밍을 보여줍니다. 각 프레임은 과거 이벤트와 무관하게 특정 순간의 장면을 캡처합니다.

프레임 1은 객체 A와 B를 감지하여 A를 빨간색 옷을 입은 사람으로, B를 파란색 옷을 입은 사람으로 분류합니다.
프레임 2에서 카메라는 분류를 업데이트하여 객체 A가 실제로 파란색 옷을 입고 있고 객체 B가 노란색 옷을 입고 있다고 판단합니다. 객체는 프레임 1과 동일하게 유지되지만 색깔 속성이 변경되고 이는 메타데이터에 반영됩니다.
프레임 3은 카메라가 여전히 파란색 옷을 입은 사람으로 분류된 객체 A만 추적하고 객체 B가 없음을 보여줍니다.

이 그림은 통합된 메타데이터 전달을 보여줍니다. 카메라는 장면에서 객체를 연속적으로 감지하고 추적하여 통합된 형식으로 정보를 제공합니다. 각 객체의 프레임은 객체의 추적 지속 시간 중에 알려진 모든 디테일을 포함합니다.

첫 번째 프레임에는 첫 번째 및 마지막 감지, 궤적 요약, 추적 중에 감지된 속성을 포함하는 객체 B에 대한 디테일이 표시됩니다. 객체 B는 노란색 옷을 입을 확률이 50%, 파란색 옷을 입을 확률이 50%였습니다.
두 번째 프레임은 객체 A에 대해 이 형식을 반영하여 빨간색 옷일 확률을 33%, 파란색 옷일 확률을 67%로 표시합니다.

통합 방식의 장점은 카메라가 장면에 객체가 있을 때만 메타데이터를 전달하고, 이 경우 쉽게 해석할 수 있도록 요약(통합)하여 소비 애플리케이션/시스템에 전송되는 데이터의 양을 크게 줄인다는 점입니다. 스트리밍 방식은 활동이나 객체가 존재하지 않고 소비 애플리케이션/시스템이 특정 필요에 따라 데이터를 이해해야 하는 경우에도 모든 프레임에서 장면에 대한 완전한 설명을 제공합니다. 앞서 언급했듯이 스트리밍 방식은 실시간 사용 사례에 유용하며, 통합 방식은 소비 애플리케이션/시스템이 즉각적인 조치를 취할 필요가 없는 사후 처리에 최적입니다.

시스템 아키텍처를 설계하려면 각 접근 방식의 강점과 한계를 이해하는 것이 필수적입니다. 예를 들어, 메타데이터를 기반으로 인사이트를 생성하는 IoT 플랫폼은 사고 후 장면의 객체에 대한 요약을 수신하는 것의 이점을 활용합니다. 이러한 서비스가 일반적으로 대역폭과 스토리지 제한으로 인해 제약을 받기 때문입니다.

이외에도, 메타데이터는 대상 소비 애플리케이션/시스템의 특정 요구와 선호도에 따라 다양한 통신 프로토콜과 파일 형식을 통해 전달될 수 있습니다.

오디오 메타데이터

일부 카메라는 오디오를 디코딩하여 오디오 메타데이터를 검색할 수 있습니다. 오디오 인식 분석 애플리케이션은 사운드 패턴을 감지하고 실시간 오디오 및 녹음된 오디오에서 관심 있는 사운드를 강조할 수 있습니다. 이러한 방식으로 영상 감시 장치와 결합된 오디오 인식 시스템은 운영자에게 진행 중인 잠재적 사고에 대해 경고하고 관련 카메라 보기로 안내할 수 있습니다. 예를 들어, 이 시스템은 폭언 상황을 식별하여 상황의 확대와 폭행을 방지하고, 유리 파손을 감지하여 침입을 방지하며, 응급 상태의 환자에 대한 조기 경고를 제공할 수 있습니다. 운영자가 장면에서 발생하는 것을 볼 수 있을 뿐만 아니라 들을 수 있도록 함으로써, 사운드 인식 시스템은 조기 감지, 신속한 개입 및 많은 경우 추가적인 확대를 방지할 수 있습니다. 사운드 인식은 2차 확인 수단으로도 사용될 수 있습니다.

사운드 패턴을 인식하도록 훈련된 분석 애플리케이션은 일반적으로 시간 경과에 따라 데시벨 레벨부터 다양한 주파수의 에너지에 이르기까지 다양한 특성의 조합을 청취합니다. 비디오에서 객체 클래스를 감지하고 라벨을 지정하는 것과 유사한 방식으로 특정 사운드 패턴을 감지하고 라벨을 지정할 수 있습니다.

여러 소스의 메타데이터 결합

메타데이터의 진정한 잠재력은 시각적 데이터, 오디오 데이터, 활동 관련 데이터 및 프로세스 관련 입력과 같은 여러 입력에 적용될 때 실현됩니다. RFID 추적, GPS 좌표, 변조 경고, 계량기 판독값(예: 온도 또는 화학 물질 수준), 소음 감지 및 POS 거래 데이터와 같은 데이터 소스는 모든 사이트 관리에서 중요합니다. 모든 소스의 데이터는 타임스탬프를 기준으로 정렬할 수 있습니다.

서로 다른 소스의 메타데이터를 결합하면 각각의 소스에서 얻을 수 있는 것보다 훨씬 더 많은 인사이트를 얻을 수 있습니다. 원활한 메타데이터 통합을 위해서는 개방형 프로토콜과 업계 표준이 필수적입니다.