Потенциал встроенного аудио
Краткая информация
Средства приема звука, встроенные в готовом виде в видеокамеру или использующие внешний микрофон, открывают много новых возможностей. Ответственное, профессиональное использование “аудионаблюдения“ может стать важнейшим дополнением и источником преимуществ для системы безопасности. Например, звук может быть решающим доказательством при расследовании происшествия или позволить обнаружить в реальном времени события, требующие немедленного реагирования охраны или персонала медучреждения. Даже само наличие аудионаблюдения может иметь отпугивающий эффект и предотвращать преступления.
Технология приема звука (часто в сочетании с мгновенной аналитической обработкой и действиями) может быть внедрена как автономное решение, имеющее целый ряд применений для предупреждения преступлений, обеспечения безопасности и расследования происшествий.
Но в сочетании с видеонаблюдением прием звука может стать ценнейшим дополнением в большинстве существующих моделей применения. Например, оператор системы безопасности может существенно лучше понимать события на объекте, если к видеопотоку добавить звуковой.
Подобно тому как можно развернуть несколько типов видеоаналитики для автоматического обнаружения событий и подачи тревог по видео, аудиоаналитика позволяет контролировать аудиопоток и реагировать, если происходит что-то необычное.
Программное обеспечение для аудиоаналитики можно настроить на инициирование автоматических сигналов тревоги и других действий, когда микрофон регистрирует крики, звон бьющегося стекла или выстрелы. Это обеспечивает своевременное уведомление и оперативное реагирование на происшествия.
Аудиоаналитика также позволяет, например, определить, откуда раздался неожиданный звук, и автоматически переориентировать на источник звука PTZ-камеру. В больнице или доме престарелых ПО видеоаналитики позволит обнаружить недомогание пациента и автоматически отправить уведомление медсестре. В этой модели применения может быть полезна технология визуализации звука, облегчающая одновременный контроль звука из множества мест.
Между приемом и записью звука есть разница. Во многих применениях необходимость записи звука отсутствует, и это может быть полезно для решения проблем приватности и соблюдения нормативных требований в отношении персональных данных. Как правило, средства аудиоаналитики не ведут постоянную запись звука. Обычно они только обрабатывают входящий сигнал в поисках характерных структур, громкости или тембра. Если средства аналитики работают на периферии системы (в камере), цифровые аудиоданные могут вообще не покидать камеры, вовне поступают только результаты анализа - метаданные или сигналы управления.
Axis не предоставляет юридических рекомендаций. Законы в отношении наблюдения различны в разных регионах, штатах и странах, и ответственность за соблюдение всех требований в отношении систем наблюдения несет пользователь продукции (обычно конечный заказчик). Как и в случае видеонаблюдения, перед установкой аудионаблюдения необходимо изучить и понять юридические аспекты такой системы.
После того как приняты все меры по соблюдению законодательных требований, необходимо тщательно продумать места установки и конфигурацию оборудования. Может потребоваться определенная работа по планированию, но в целом это несложно, при том что даже простые меры позволяют существенно повысить практическое качество звука.
Введение
Аудиоинформация может быть ценным активом для предотвращения преступлений, обеспечения безопасности и расследования происшествий. Принятый звук также может обработаться в режиме реального времени аналитическим ПО, обеспечивающим эффективный мониторинг для обнаружения определенных действий, поведения и событий.
В этом техническом обзоре описываются потенциальные возможности аудионаблюдения в отрасли безопасности с многочисленными примерами типичных применений. Рассматриваются различные виды аудиоаналитики и дается краткий обзор принципов их работы.
Здесь не дается никаких юридических рекомендаций, но приводятся различные технические решения, которые могут быть полезны при создании системы наблюдения. В зависимости от того, как вы решите реализовать аудиоаналитику, вам следует изучить законодательство и рекомендации для вашего региона и использовать эти мощные инструменты там, где это уместно.
В этом обзоре мы ограничиваемся приемом и, возможно, записью, то есть получением звука. Другое распространенное применение аудиотехнологий в решениях для безопасности касается трансляции звука, то есть его вывода – обычно воспроизведения голосовых сообщений или предупреждений для отпугивания нарушителей и воров. Подробнее о применении трансляции звука в сфере безопасности можно прочитать на странице www.axis.com/products/audio.
Прослушивание без записи
Звук можно принимать и использовать, не записывая. Прием звука по сути означает его оцифровку и преобразование в форму, пригодную для программной обработки. Это делается путем преобразования звуковых волн в воздухе в аналоговый электрический сигнал с помощью микрофона, преобразования аналогового сигнала в цифровую форму и передачи полученного цифрового сигнала на обработку.
Если принятый звук не сохраняется на постоянном носителе, например, флеш-накопителе или жестком диске, то записи не происходит. Запись может быть не нужна во многих вариантах применения, например, когда принятый звук прослушивается в реальном времени оператором. В некоторых ситуациях могут быть конкретные причины для отказа от записи звука. На запись и простой прием звука могут налагаться разные законодательные ограничения.
Как правило, средства аудиоаналитики не ведут постоянную запись звука. Для своей работы они временно буферизуют аудиоданные. Многие системы можно настроить таким образом, чтобы записывать только данные, буферизованные незадолго до и после момента обнаружения события, чтобы обеспечить надежную проверку обнаружения и, возможно, сохранить звук в качестве свидетельства для последующего расследования.
Что говорят законы и нормативы?
Как и в случае видеонаблюдения, перед установкой аудионаблюдения необходимо изучить и понять юридические аспекты такой системы. В случае необходимости требуется подать соответствующие заявки и получить разрешения. Там, где необходимо, должны быть установлены информационные знаки и уведомления.
Использование и/или запись звука могут быть запрещены или могут требовать специального рассмотрения по различным причинам, в соответствии с национальным законодательством или разного рода местными законами и нормативами. В некоторых регионах и ситуациях прием звука может быть разрешен, а запись запрещена. Компании также могут запрещать использование аудионаблюдения на своей территории.
Практика США
Законы и нормативы в США различны в разных штатах.
В некоторых штатах для ведения аудиозаписи требуется согласие одной стороны. Это значит, что наблюдение будет законным, если на него согласна хотя бы одна сторона разговора.
В других штатах требуется согласие всех (или обеих) сторон, то есть перед ведением аудиозаписи необходимо получить согласие всех участников. Исключением из требования согласия всех сторон может быть аудиозапись в общественных местах, где присутствующие не могут рассчитывать на конфиденциальность.
Проводимый вами анализ законов в некоторых регионах может привести к другому результату, если речь идет о приложениях аудиоаналитики, не записывающих звук. Поэтому вам необходимо изучить законы и нормативы, действующие в вашем конкретном регионе.
Европейская практика
В странах Европы аудионаблюдение регулируется национальными законами. Поэтому вам необходимо изучить законы и нормативы, действующие в вашей конкретной стране.
Записи звука могут содержать персональные данные, подпадающие под действие регламента GDPR. GDPR не запрещает аудиозапись как таковую, но прием и запись звука требуют особого рассмотрения. При добавлении аудионаблюдения к имеющейся системе видеонаблюдения необходимо оценить, применимы ли к этой ситуации ваши законные основания для обработки персональных данных в соответствии с GDPR.
Исследуйте возможности
Существует заблуждение, что запись звука при видеонаблюдении запрещена категорически. Это заблуждение настолько широко распространено, что возможность усиления системы видеонаблюдения звуковым каналом зачастую даже не рассматривается.
Однако во многих ситуациях запись звука может быть разрешена, например, если присутствующие проинформированы, выразили свое согласие и т.д. Изучите законы и нормативы, действующие в вашем регионе в отношении вашего варианта применения. Даже если запись и хранение аудиоинформации для вашей охранной системы могут быть не разрешены, многие варианты применения можно адаптировать таким образом, чтобы не нарушать права на конфиденциальность - например, прослушивание и реагирование, прослушивание и свидетельство, обнаружение инцидентов с помощью аудиоаналитики.
Расположение имеет значение
Размещение микрофона на объекте существенно зависит от поставленных задач. Прежде чем устанавливать аудиооборудование, необходимо тщательно проработать его размещение и конфигурацию. Может потребоваться определенная работа по планированию, но в целом это несложно, при том что даже простые меры позволяют существенно улучшить практическое качество звука.
Продуманное расположение микрофона в акустически удачной точке повышает вероятность успешного решения задач наблюдения. Разумеется, микрофон должен быть размещен так, чтобы хорошо принимать интересующие вас звуки. Типичные варианты размещения - в центре помещения, рядом с камерой, рядом с местом, где могут происходить интересующие вас события. Нельзя располагать микрофон рядом с источником шума, например, вентилятором или машинным оборудованием, поскольку шум может перекрыть тихие или далекие звуки.
- Там, где происходят представляющие интерес события
- В камере
- В центре помещения
Акустическая среда - звукопоглощающие свойства стен, потолка и пола, сложная форма помещений (например, длинные коридоры) - создает эффекты реверберации и эха, которые могут существенно снижать качество звука в определенных местах. Например, голос будет звучать совершенно по-разному в сильно заглушенном помещении (зал для совещаний с акустической отделкой), в церкви и в ванной комнате, отделанной кафельной плиткой. В акустически сложной обстановке размещение микрофона может стать решающим фактором.
Имеют значение и установка оборудования, и его конфигурация (например, настройка уровня звука), а также интеграция аудиооборудования с системой видеонаблюдения. Рекомендации по конкретной ситуации можно получить у компаний, специализирующихся на установке и интеграции систем.
Рекомендации для аудиоаналитики иногда отличаются от рекомендаций для звукозаписи общего характера. Обязательно изучите пользовательскую документацию, чтобы знать о необходимых требованиях.
Подготовка аудиоданных
После приема звука информацию подготавливают в следующему шагу обработки. Разные виды подготовки могут выполняться параллельно или поодиночке.
- Преобразование
- Аналитика на периферии в режиме реального времени
- Обработка и кодирование
Преобразование. Аудиоданные абстрагируются и преобразуются, например. в визуальную информацию диаграммы звукового спектра. Этот процесс необратим: восстановить исходный звук из диаграммы спектра невозможно.
Аналитика на периферии в режиме реального времени.
При обработке звука на периферии системы можно использовать классификатор звуков. Результатом его работы являются данные, описывающие характеристики звука. Восстановить исходный звук по этим метаданным невозможно.
Детектор звуков позволяет распознавать характерные структуры, уровни громкости и частоты и выдает информацию о состоянии. В этом случае исходный звук также невозможно восстановить.Обработка и кодирование. В ситуациях, когда требуется использовать исходные аудиоданные (без преобразования и анализа), они обычно подвергаются определенной обработке и кодированию в соответствии с моделью применения. Модель применения может предусматривать сохранение аудиоданных на периферии системы, передачу аудиопотока на внешний клиент (сервер или облако) для дополнительной обработки или во внешнее хранилище.
Топология анализа
Местоположение средств аналитики в системе важно по целому ряду причин. В частности, с точки зрения конфиденциальности и соблюдения нормативных требований в отношении персональных данных важно, где именно программное обеспечение анализирует аудиоданные. Существуют ситуации, когда аудиоданные нельзя пересылать по сети и критически важно, чтобы принимаемые (но не сохраняемые) аудиоданные анализировались локально. Если обработка требует значительных вычислительных ресурсов, которые на периферии системы недоступны, может потребоваться передача цифровых аудиоданных в облачную среду или на сервер.
Аналитика на периферии. Если средства аналитики работают на периферии системы (в камере), цифровые аудиоданные не покидают камеру. В случае приема звука без записи по сети передается только результат аналитической обработки - метаданные или сигналы управления.
Аналитика на сервере. При обработке на сервере цифровой аудиосигнал выходит за пределы камеры. В камере (на периферии системы) может выполняться предварительная обработка, абстрагирующая или деперсонализирующая его до метаданных. Сервер обычно представляет собой часть закрытой системы (контролируемой владельцем системы), что позволяет решить вопросы конфиденциальности передаваемых аудиоданных. В то же время необходимо обеспечить соблюдение применимых правил и нормативных требований.
Облачная аналитика. Цифровые аудиоданные также могут передаваться на сервер в облачной среде. Как и в случае аналитики на сервере, аудиоинформация может подвергаться предварительному преобразованию в метаданные в камере. Облачные системы нередко децентрализованы, поэтому здесь еще важнее учитывать вопросы конфиденциальности и следить за соблюдением нормативных требований.
- Локальное хранение данных
- Облако
- Сервер
- Хранение данных
Варианты применения и примеры
Многие видеокамеры имеют готовый к применению встроенный аудиоканал. Существует множество вариантов применения, в которых ответственное и профессиональное использование принимаемого звука может существенно повысить эффективность решения и дать целый ряд преимуществ. Например, звук может стать решающим доказательством при расследовании происшествия или позволить обнаружить в реальном времени события, требующие немедленного реагирования охраны или персонала медучреждения. Само наличие аудионаблюдения может иметь отпугивающий эффект и предотвращать преступления.
- Взаимодействие
- Запись
- Анализ
- Визуализация
- Прослушивание
Обнаружение инцидентов с помощью аудиоаналитики
Приложения для аудиоаналитики обрабатывают принятый звуковой сигнал, находя и извлекая определенную информацию. Они применяются, например, для обнаружения таких событий, как стрельба, бьющееся стекло или агрессивное поведение. Например, такое приложение может по результатам обработки звукового сигнала ответить на вопрос: “Было ли разбито стекло?“. При обнаружении события система обычно автоматически уведомляет персонал визуальным сигналом или включением тревоги. Это обеспечивает своевременное уведомление и оперативное реагирование на происшествия.
Ориентирование камеры
Еще один пример применения аудиоаналитики - ориентирование PTZ-камеры. Здесь объединяются возможности аудио- и видеонаблюдения: система определяет, откуда пришел звук, и автоматически поворачивает камеру на источник.
- PTZ-камера, контролирующая банкомат.
- Микрофон камеры регистрирует внезапный громкий звук, и камера мгновенно поворачивается в направлении инцидента.
- Оператор получает сигнал тревоги и подтверждает инцидент.
Визуализация звука на видео
Принятый звук можно визуализировать на мониторе в виде диаграммы звукового спектра. При превышении установленного порога на диаграмме отображается уведомление о тревоге.
Такая визуализация звука может быть полезна в ситуациях, когда необходимо одновременно следить за звуками из множества источников, например, из нескольких палат в больнице. В то время как слушать сразу множество источников (звуков из разных палат) может быть затруднительно, наблюдать на экране на сестринском посту множество визуализаций гораздо проще. Если также есть видео из палат, визуализацию звука можно наложить на видеоизображение.

Прослушивание и реагирование
Возможно, самый простой и интуитивно понятный вариант применения – это аудионаблюдение с прямым вмешательством оператора для лучшего понимания обстановки. Например, оператор может вызвать охрану для выяснения ситуации, услышав подозрительный разговор. Или же оператор в больнице или доме престарелых может услышать, что пациенту плохо, и вызвать медсестру. Аудионаблюдение также позволяет, например, определить, откуда раздался подозрительный звук, и направить на источник звука PTZ-камеру.
Такие варианты применения предусматривают наличие одного или нескольких операторов, прослушивающих аудиосигнал из диспетчерской или через приложение на мобильном устройстве. Человек воспринимает звуки и анализирует, какие из них существенны для данного объекта или ситуации. В сочетании с видеонаблюдением аудионаблюдение добавляет еще один канал информации для принятия решений. Иногда звук может быть единственным каналом информации – например, если источник находится вне поле зрения камеры или при сложных условиях освещения.
Прослушивание и свидетельство
Аудионаблюдение также можно использовать как основу для личного свидетельства об услышанных событиях. Этот вариант использования отличается от варианта прослушивание и реагирование тем, что его цель – не принятие решений, но эти два варианта могут сосуществовать. Например, оператор, услышавший звуки разгорающегося спора и изобличающий злоумышленников разговор, может не только направить на место охрану, но и впоследствии выступить как свидетель происшедшего.
Запись и хранение
В определенных ситуациях запись и хранение аудиоданных может быть отличным источником дополнительных свидетельств. Например, на записи могут быть зафиксированы разговоры злоумышленников или звуки стрельбы. Запись звука может показать, кто что говорил, сколько выстрелов было сделано и дать другую представляющую интерес для расследования информацию.
При записи звука в контексте расследований следует позаботиться о том, чтобы сохранять исходные данные, не обрабатывая их (в отличие от других контекстов, когда это может быть необходимо или полезно). В записях для целей расследования любая обработка может рассматриваться как подделка доказательств. Разборчивость речи можно улучшить с помощью специальных алгоритмов выделения голоса; это может повысить ценность записи с точки зрения расследования. Но такие алгоритмы следует применять уже потом, на копии записанного материала. Сохраняя запись в максимально необработанном виде, вы расширяете возможности ее последующего использования.
Больше возможностей для вашей системы видеонаблюдения
Системы видеонаблюдения нередко содержат датчики различных типов. Разумеется, в их число входит светочувствительная матрица видеокамеры, регистрирующей визуальную составляющую обстановки. Однако широко применяются и невизуальные датчики – например, радарные и инфракрасные детекторы движения. В некоторых ситуациях видеонаблюдение неуместно, и тогда невизуальные датчики используются самостоятельно. Однако чаще невизуальные датчики применяются как дополнение к видеокамерам для получения других видов информации.
Использование в системе видеонаблюдения приемников звука (микрофонов) значительно расширяет возможности системы в самых разных вариантах применения. Добавление поддержки звука в систему видеонаблюдения открывает возможности для работы в мультисенсорном режиме – с помощью аналитических приложений или с участием оператора.
Простейший пример – вариант “прослушивание и реагирование“, когда благодаря звуковому каналу оператор получает существенно лучшее представление о происходящем на объекте. Обнаружить агрессивное поведение по одному лишь видеоизображению может быть трудно, а со звуком это сделать значительно легче.
Другой типичный пример – использование видеоаналитики, например, видеодетектора движения. Если видеоаналитическое приложение работает в сложных условиях, например, при низкой освещенности, дополнительный анализ звука позволяет существенно повысить надежность обнаружения.
Наблюдение и обнаружение
Звук содержит несколько видом информации, которую можно использовать для наблюдения и аудиоаналитики. Существуют различные методы обработки и характеризации, применяемые для извлечения и очистки этой информации для облегчения ее дальнейшего использования и взаимодействия с окружающими системами.
Характеристики звука
Характеристики звука, в том числе громкость и высота, могут нести важную в контексте видеонаблюдения информацию. Сколько длился звук, двигался ли его источник, был ли источник расположен близко или далеко – вся эта информация добавляет детали, когда мы анализируем обстановку. Аппаратные и программные средства аудиомониторинга разрабатываются так, чтобы работать с этой же информацией, “слушая“ различные характеристики звука, от громкости до изменения интенсивности спектральных составляющих во времени.
Пространственная информация. Это информация об окружающих нас физических объектах – их расположении, направлениях и расстояниях. Пространственную информацию можно использовать для фокусирования аудионаблюдения в различных направлениях для улучшения качества записи. Она также может использоваться аналитическими средствами для определения, с какого направления пришел звук или как далеко расположен его источник.
Временная информация. Временная информация важна как для оценки динамики (изменения со временем), так и в абсолютном измерении (когда произошло то или иное событие?), и часто сопоставляется с данными других датчиков, например, с видео. Временная информация играет важную роль при анализе поведения, позволяя определить, когда случилось и сколько длилось то или иное событие.
Спектральная информация. Спектральная информация описывает частотный состав звука - его тон или, для более сложных звуков, составляющие его тона. Используемые в аудионаблюдении микрофоны имеют плоскую частотную характеристику, чтобы одинаково эффективно принимать все частотные составляющие звука в слышимом диапазоне (20 Гц – 20 кГц). Этим они отличаются от человеческого уха, которое лучше воспринимает частоты, свойственные человеческой речи, чем другие .
Информация об амплитуде. Это информация о громкости (интенсивности) звука. Информация об амплитуде дополняет спектральную информацию и вместе с ней дает представление о структуре принимаемого звука.
Обработка сигнала
В аудионаблюдении обработка сигнала обычно производится для улучшения передачи, повышения эффективности хранения или субъективного качества, для выделения или обнаружения интересующих составляющих. Для обработки применяются программные алгоритмы, изменяющие и анализирующие аудиосигнал различными способами.
Преобразование сигнала
Алгоритмы можно применять для изменения сигналов в определенных целях, например:
для улучшения слышимости сигнала путем автоматического выравнивания уровня;
для изменения спектрального состава сигнала с помощью эквалайзера;
для ограничения уровня сигнала путем удаления определенных частот или амплитуд. Можно уменьшать объем данных путем сжатия или обеспечивать конфиденциальность путем скремблирования.
Анализ сигналов
Приложения аудиоаналитики работают с принятыми (но не записываемыми) аудиоданными, анализируя характеристики звука и получая информацию, выраженную не в форме звукового сигнала. Такие приложения фактически преобразуют аудиоданные в более пригодные для принятия решений активы в другом формате. Существуют, например, аналитические приложения для обнаружения агрессивного поведения, стрельбы, звука бьющегося стекла или автосигнализации.
При использовании алгоритмов машинного обучения их можно обучить прогнозированию на больших объемах данных, не прибегая к явному программированию. Например, можно представить себе алгоритм для распознавания звука закрывающейся двери, обученный на тысячах примеров таких звуков.
Свойства человеческого слуха
Человеческий слух – один из самых совершенных инструментов для обнаружения и анализа звука. Человеческое ухо и мозг способны обнаруживать и интерпретировать речь даже в очень шумных условиях, когда большинство алгоритмов отказывают.
С помощью слуха мы способны получать пространственную информацию об обстановке, определяя, откуда пришел звук и движется ли его источник. Имея два уха, мы можем определить, пришел ли звук слева, справа или с какого-то другого направления. Наши уши и голова устроены так, что мы также можем определить, идет ли звук сверху или снизу, спереди или сзади. Применяет “многоступенчатую фильтрацию“, наш мозг анализирует различия между сигналами от обоих ушей, мгновенно улавливая задержки микросекундного масштаба для обнаружения событий. Мы располагаем отличным аппаратом для анализа аудиосигналов, особенно в отношении человеческого голоса, но также и в отношении угроз, с которыми человечеству приходилось сталкиваться в прошлом.
При подходящих обстоятельствах (хорошее качество звука, стереофонический звук, относительно небольшие задержки) человек-оператор может быть мощным “аналитическим прибором“, дополняющим аппаратные и программные средства обнаружения. Используя систему аудионаблюдения всего с двумя микрофонами, оператор может получать пространственную информацию об обстановке – а также определять, откуда пришел звук и движется ли его источник.
Отказ от ответственности
Этот документ и его содержимое предоставлен компанией Axis, и все права на сам документ и связанные с ним права интеллектуальной собственности (включая, но не ограничиваясь перечисленным, товарные знаки, логотипы и другие приведенные знаки) защищены законом. Все права, титулы и интересы в отношении данного документа или связанных с ним прав интеллектуальной собственности остаются и будут оставаться за компанией Axis Communications AB.
Примите во внимание, что данный документ представлен на условиях “как есть“ без каких либо гарантий, исключительно в информационных целях. Информация, приведенная в этом документе, не представляет собой юридических рекомендаций и не должна рассматриваться как таковые. Этот документ не должен и не может порождать никаких юридических обязательств со стороны компании Axis Communications AB и/или любых ее дочерних компаний. Обязательства Axis Communications AB и/или любых ее дочерних компаний в отношении любых продуктов Axis устанавливаются исключительно положениями и условиями соглашения между Axis и стороной, приобретшей такие продукты непосредственно у Axis.
В ЦЕЛЯХ ИСКЛЮЧЕНИЯ СОМНЕНИЙ ВСЕ РИСКИ, СВЯЗАННЫЕ С ИСПОЛЬЗОВАНИЕМ, РЕЗУЛЬТАТАМИ ИСПОЛЬЗОВАНИЯ И ЭФФЕКТИВНОСТЬЮ ДАННОГО ДОКУМЕНТА, ЛЕЖАТ НА ПОЛЬЗОВАТЕЛЕ ДОКУМЕНТА. КОМПАНИЯ AXIS ОТВЕРГАЕТ И ИСКЛЮЧАЕТ, В МАКСИМАЛЬНОЙ СТЕПЕНИ, ДОПУСТИМОЙ ПО ЗАКОНУ, ЛЮБЫЕ ГАРАНТИИ, В ТОМ ЧИСЛЕ ДЕЙСТВУЮЩИЕ В СИЛУ ЗАКОНА, ЯВНЫЕ И ПОДРАЗУМЕВАЕМЫЕ, ВКЛЮЧАЯ, НО НЕ ОГРАНИЧИВАЯСЬ ПЕРЕЧИСЛЕННЫМ, ПОДРАЗУМЕВАЕМЫЕ ГАРАНТИИ ТОВАРНОЙ ПРИГОДНОСТИ, ПРИМЕНЕНИЯ С ОПРЕДЕЛЕННЫМИ ЦЕЛЯМИ, ИМУЩЕСТВЕННЫХ ПРАВ И ИХ НЕНАРУШЕНИЯ, ОТВЕТСТВЕННОСТИ В ОТНОШЕНИИ ПРОДУКТА, А ТАКЖЕ ВСЕ ПРОЧИЕ ГАРАНТИИ, ВЫТЕКАЮЩИЕ ИЗ ЛЮБЫХ ПРЕДЛОЖЕНИЙ, СПЕЦИФИКАЦИЙ И ПРИМЕРОВ В ДАННОМ ДОКУМЕНТЕ.
Терминология качества звука
Цифровой звук
Цифровой звук - это представление аналогового аудиосигнала (часто полученного из акустического сигнала с помощью микрофона) в цифровой форме. В цифровом звуке форма звуковой волны обычно представляется в виде последовательности цифровых отсчетов. Точность такого представления зависит от числа значимых цифр, с которым работает кодер сигнала. Например, в записи звука на CD-диске отсчеты следуют с частотой 44100 в секунду и имеют разрядность 16 бит.
Шум:
Шум - это нежелательный (и зачастую неизбежный) звук, определяющий нижнюю границу рабочего диапазона громкости. Шумы образуются на всех этапах обработки звука, от записываемого источника (например, вентилятор в комнате) до микрофона (например, собственный шум, вибрации, ветер), проводов (например, помехи, наводки) и приемного устройства ( собственные шумы, шум оцифровки). Все вместе они образуют т.н. уровень собственных шумов.
Шумы обычно характеризуются диапазоном показателя сигнал/шум - от определенного уровня (часто самого громкого звука, с которым может работать система) до уровня собственных шумов.
В видео его эквивалентом являются видеошумы, выглядящие как случайный, обычно статический, рисунок пикселей, “снег“. Они ограничивают возможность видеть детали в темных частях изображения (подобно тому, как звуковой шум ограничивает возможность слышать тихие звуки).
Геометрические искажения:
Все нежелательные изменения сигнала снижают его исходную “истинность“; это явление называется искажениями (шум, о котором говорилось выше, обычно не относят к искажениям). Искажения снижают субъективное качество (хотя некоторые искажения могут звучать “приятно“) и скрывают объективную информацию, содержащуюся в звуке, затрудняют восприятие, особенно при анализе содержания, и снижают пригодность для аналитической обработки.
Для количественной оценки искажений обычно применяют два показателя - суммарный коэффициент гармоник и интермодуляционные искажения).
Аналогом искажений в видео являются артефакты - хроматические искажения, виньетирование, размытие и т.д.; все, что “портит“ вид изображения и ограничивает возможность рассмотреть детали.
Частота дискретизации и частотная характеристика:
В цифровой системе звук представляется в виде отсчетов, следующих с определенной частотой. Эта т.н. частота дискретизации обычно составляет от 8000 до 48000 раз в секунду (герц). Как следует из теории сигналов (теоремы Найквиста), для адекватной передачи звука частота дискретизации должна быть не меньше удвоенной максимальной частоты аналогового сигнала, которую необходимо или желательно уметь воспроизводить.
Обычный человек слышит частоты в диапазоне от 20 Гц до примерно 15-20 кГц в зависимости от возраста и других факторов. Можно сказать, что низкие частоты, в районе сотен герц, часто образуют “основу“ звука (например, формант речи), в то время как высокие частоты (несколько килогерц и более) содержат “детали“.
Диапазон звуковых частот можно сравнить с разрешением и частотой кадров в видео; Чем они меньше, тем меньше детализированной информации вы получаете.
Битовая глубина:
При формировании каждого отсчета цифрового сигнала мгновенное значение аналогового сигнала преобразуется в цифровую форму. В цифровом мире не существует бесконечностей, поэтому уровень детализации ограничен заданной разрядностью (числом бит) отсчетов. Каждый бит (значение 0 или 1, высокий или низкий уровень логического сигнала и т.д.) соответствует множителю 2. Соответственно имеющийся диапазон амплитуд (например , заданное электрическое напряжение или уровень звукового давления) дробится на двоичные доли. Два бита соответствуют четырем долям, три бита - восьми и т.д. Упрощенно говоря, сигнал амплитудой 1 вольт, дискретизованный с разрядностью 3 бита, будет представлен в виде ступенек с шагом 1/8 вольта.
Для сохранения достаточного качества звука, по крайней мере на слух, обычно достаточно 16 бит (65536 ступеней). Такая разрядность используется в записях на CD. Для аналитики и более требовательных приложений используется разрядность 24 бит.
Аналогом разрядности в видео является контраст, диапазон яркости или цветности, который может воспроизвести конкретный пиксель.