심한 기침 및 스트레스 음성 감지

5월, 2024

요약

심한 기침 및 스트레스 음성 감지는 하루 24시간 연중 내내 주변 소리를 청취하여 사고를 감지하는 오디오 분석 애플리케이션입니다.

이 애플리케이션은 마이크가 내장된 일부 Axis 카메라에 사전 설치되어 있습니다. 이 애플리케이션은 두 가지 감지 알고리즘으로 구성되어 있으며, 이 중 하나만 사용하거나 둘 다 사용하도록 선택할 수 있습니다.

기침 감지기는 한 번의 기침이나 심한 기침 소리를 감지하여 직원이 도움이 필요한 사람에게 신속하게 대응할 수 있도록 합니다. 스트레스 음성 감지기는 협박, 분노 또는 공포와 관련된 소리 패턴을 식별하여 범죄 예방 및 폭행 감소에 효과적일 뿐만 아니라 도움이 필요한 사람을 알리는 데 효과적인 도구입니다.

심한 기침 및 스트레스 음성 감지는 제대로 작동하기 위해 오디오 데이터를 저장할 필요가 없으므로 개인정보가 보호됩니다. 명시적으로 오디오 녹음을 활성화하지 않는 한 오디오는 녹음되지 않습니다.

몇 가지 설정을 사용 사례에 맞게 분석 기능이 최적으로 작동하도록 구성할 수 있습니다. 심한 기침 및 스트레스 음성 감지는 적절한 작동을 확인하기 위해 지속적인 상태 확인도 수행합니다.

서론

카메라의 오디오 감지 분석 기능은 영상 감시를 보완하는 강력한 기능입니다. 오디오 감지 분석 기능을 통해 잠재적인 사고를 영상에서 발견하기 전에 조기에 감지하고 경고할 수 있습니다.

심한 기침 및 스트레스 음성 감지는 하루 24시간 연중 내내 주변 소리를 청취하여 소리를 분류하고 필터링하는 오디오 분석 애플리케이션입니다. 심한 기침이나 스트레스 음성이 감지되면 애플리케이션에서 경고를 생성합니다.

이 백서에서는 심한 기침 및 스트레스 음성 감지와 최적의 감지를 위해 이를 구성하는 방법을 소개합니다.

기침 감지기 및 스트레스 음성 감지기

심한 기침 및 스트레스 음성 감지는 마이크가 내장된 일부 Axis 카메라에 사전 설치되어 있습니다. 이 감지기는 카메라에서 직접 실시간으로 사고의 청각적 징후를 포착합니다. 두 감지기 중 하나만 사용하거나 둘 다 사용하도록 선택할 수 있습니다.

기침 감지기는 기침을 감지하고 일정 시간 내의 기침 횟수를 계수하는 방식으로 작동합니다. 기침 감지기를 사용하면 누군가 기침을 하거나 심한 기침을 할 때 직원이 신속하게 대응할 수 있습니다. 기침 감지기는 설정 방법에 따라 심한 기침을 감지하거나 한 번의 기침을 감지할 수 있습니다.

매우 짧은 시간 내의 여러 개의 이벤트 알림을 줄이기 위해 첫 번째 기침이 계수되는 즉시 5초의 차단 시간이 시작됩니다. 분석이 30초 이내의 3회의 기침으로 설정된 경우, 이전 기침 후 최소 5초가 지난 경우에만 다음 기침을 계수합니다. 5초 차단 시간 내의 중간 기침은 계수되지 않습니다. 따라서, 이 설정을 사용하면 각 기침 사이에 5초 이상의 간격으로 3회의 기침이 계수된 후에만 알림이 전송됩니다.

스트레스 음성 감지기는 사람의 목소리에서 강압, 분노, 공포와 관련된 소리 패턴을 식별합니다. 인식되면 시스템이 시각적 경고를 통해 또는 알람을 트리거하여 직원에게 자동 알림을 보냅니다. 조기 경고를 통해 직원이 신속하게 대응할 수 있습니다. 도움이 필요한 사람에게 도움을 제공하거나 상황 악화를 방지하여 물리적 공격으로 이어지지 않도록 하는 데 도움이 됩니다.

  1. 의료 환경에서 사용되는 심한 기침 및 스트레스 음성 감지

최적의 오디오 감지 활성화

  • 카메라 배치. 분석 기능을 탑재한 카메라는 HVAC 시스템, PA 시스템 또는 스피커, 쾅 닫히는 도어와 같은 간섭 소음원으로부터 최소 1.5미터(5 피트) 떨어진 곳에 배치해야 합니다. 또한, 카메라는 오디오를 감지하려는 영역의 가시선을 따라 배치하는 것이 좋습니다. 가시선이 필수 요건은 아니지만, 가시선을 통해 더 정확한 감지가 가능할 수 있습니다. 모서리나 장애물 주변에서 소리가 휘어질 때 소리가 영향을 받을 수 있기 때문입니다. 예를 들어, 모든 주파수가 같은 정도로 휘어지는 것은 아닙니다.

  • 감도. 감도 설정을 통해 감지 시스템을 미세 조정할 수 있습니다. 감도가 높을수록 더 많이 감지할 수 있습니다. 감도 증가는 원치 않는 감지(허위 알람)의 위험을 높이지만, 감지를 절대로 놓치지 않는 것이 중요한 경우에는 필요할 수 있습니다. 감도를 낮추면 소리가 올바르게 분류된 것이 확실할 때만 감지가 보고됩니다. 감도 감소는 잠재적인 사고를 놓칠 위험을 높이지만, 허위 알람이 많이 발생하는 경우에는 낮은 감도가 필요할 수 있습니다.

  • 데이터 수집 모드. 설치 후 일정 기간 동안 데이터 수집 모드를 사용하여 감지되는 오디오 유형에 대한 인사이트를 얻을 수 있습니다. 결과 및 분석은 특정 설치에 가장 적합한 감도 수준에 대한 정보를 제공할 수 있습니다.

  • 기침 감지 임계값. 기침을 감지하는 데 필요한 기침 횟수에 대한 임계값을 설정할 수 있습니다. 지정된 기간 동안 기침 횟수가 임계값에 도달할 때만 알람이 트리거됩니다.

  • 고급 설정 고급 설정은 숙련된 사용자만 사용할 수 있습니다. 고급 설정을 변경하면 올바르지 않은 감지를 야기하거나 감지가 전혀 이루어지지 않을 수 있습니다. 그러나 특정 시나리오의 경우 고급 설정을 변경해야 할 수도 있습니다. 고급 설정 변경은 시스템 전문가의 조언을 받거나 시스템 전문가와 상의한 경우에만 수행해야 합니다.

멀티 센서 인식

예를 들어 인접한 룸에 카메라들을 서로 가까이 배치하면, 여러 대의 카메라에서 동일한 오디오 사고가 감지될 수 있습니다. 이로 인해 사고가 발생한 위치를 정확히 파악하기 어려울 수 있습니다.

이러한 경우 멀티 센서 인식 기능이 스트레스 음성을 감지에 도움이 될 수 있습니다. 이 기능이 활성화되어 여러 대의 카메라가 동일한 스트레스 음성을 포착하면, 먼저 포착한 카메라에서만 알림이 트리거됩니다. 이에 따라, 주변 카메라가 함께 작동하여 잘못된 이벤트를 줄이고 동일한 이벤트에 대한 중복 알림을 줄일 수 있습니다.

  1. 멀티 센서 인식 없음: 인접한 룸에 있는 카메라가 동일한 스트레스 음성 이벤트를 감지하여 여러 개의 알람을 생성합니다.
  2. 멀티 센서 인식 기능을 사용하면 가장 가까운 카메라만 감지를 보고합니다.

멀티 센서 인식 기능을 사용하면 피어 그룹을 생성하여 서로의 오디오 포착 범위 내에 있는 주변 카메라를 그룹으로 묶을 수 있습니다. 몇 가지 제한이 적용됩니다.

  • 모든 피어는 NTP 시간 동기화를 사용하도록 구성되어야 합니다.

  • 모든 피어는 동일한 버전의 심한 기침 및 스트레스 음성 감지를 실행하고 있어야 합니다.

  • 모든 피어는 네트워크를 통해 서로 연결할 수 있어야 합니다.

위의 사항 중 하나라도 실패하면 피어는 독립 실행형 모드로 돌아가 성능 저하 상태로 표시됩니다.

오버레이

실시간 스펙트로그램과 애플리케이션 알림을 동영상 피드에 오버레이할 수 있습니다. 오버레이의 크기를 사용자 지정하고 원하는 위치로 드래그할 수 있습니다. 슬라이더를 사용하여 오버레이 불투명도를 조정할 수 있습니다.

애플리케이션 알림에는 카메라가 감지한 이벤트와 애플리케이션 상태가 표시됩니다.

스펙트로그램은 오디오의 시각적 표현을 제공합니다. 오디오를 들으면서 동시에 시각적 표현을 확인하면 사고의 심각도를 빠르게 판단하는 데 도움이 됩니다.

이벤트 유형 및 상태

기침 감지기 및 스트레스 음성 감지기에서 생성된 이벤트는 상태 비연결이며, 감지에 의해 트리거되는 순간적인 이벤트입니다. 이벤트 차단 시간(5초, 구성 가능)이 만료되면 감지 기능이 새 이벤트를 생성합니다.

심한 기침 및 스트레스 음성 감지의 상태는 상태 연결 이벤트를 사용하여 반영됩니다. 상태 연결 이벤트를 사용하면, 조건이 발생하는 동안 이벤트 상태가 활성 상태로 유지되고 조건이 해결된 경우에만 전환됩니다.

상태 확인 기능이 내장되어 있어 제대로 작동하는지 확인하고, 문제가 발생하면 알려줍니다. 심한 기침 및 스트레스 음성 감지에 대해 상태를 세 가지로 구분할 수 있습니다.

  • 정상 상태: 정상 작동 감지가 가능합니다.

  • 성능 저하 상태: 작동이 성능 저하 모드에서 이루어집니다. 이는 일반적으로 피어 카메라의 손실, 매우 큰 소리로 인한 오디오 클리핑 또는 오디오 버퍼 오버런과 같은 일시적인 요인으로 인해 발생합니다. 성능 저하 상태에서는, 감지가 가능하지만 허위 감지 또는 누락된 감지가 더 많을 수 있습니다. 성능 저하 상태는 일반적으로 저절로 해결됩니다.

  • 오작동 상태: 작동하지 않음. 감지가 불가능합니다. 이는 일반적으로 장치 설정에서 오디오 지원이 비활성화되어 있거나 오디오 입력 게인이 음소거되어 있는 것과 같이 저절로 해결되지 않는 요인으로 인해 발생합니다.

성능 저하 상태와 오작동 상태는 정보 패널과 텍스트 오버레이(활성화된 경우)에 표시되므로, 운영자는 애플리케이션이 성능 저하 또는 오작동 감지 상태에서 실행 중임을 알 수 있습니다.

하트 비트 이벤트는 60초마다 트리거됩니다(활성화된 경우, 시간 설정 가능). 수신단에서는 이를 사용하여 분석 기능이 실행 중인지 확인하고 하트 비트 수신이 없는 경우 경고할 수 있습니다. 오작동 상태가 활성화되어 있는 동안에는 하트 비트 이벤트가 전송되지 않습니다.

개인정보 보호

오디오 데이터는 카메라에서 처리 및 분석되며, 심한 기침 및 스트레스 음성 감지가 제대로 작동하기 위해 오디오 데이터를 저장할 필요는 없습니다. 명시적으로 활성화한 경우에만 이벤트 중 오디오가 녹음됩니다. 이는 사고 조사 시 포렌식이나 허위 경보 보고 시 문제 해결에 유용할 수 있을 뿐만 아니라, 영상 관리 시스템에서 지원하지 않는 경우 사고를 다시 듣는 데도 유용할 수 있습니다.