Wide dynamic range
Resumen
Las escenas que contienen áreas muy oscuras y muy iluminadas representan todo un desafío para una cámara. Algunos ejemplos habituales de este tipo de escenas con Wide Dynamic Range (WDR) en el terreno de la seguridad son las puertas de entradas, garajes y túneles, que presentan un gran contraste entre la luz del exterior y la oscuridad del interior. Las escenas exteriores con luz solar directa y sombras también resultan problemáticas.
Para que las cámaras puedan reproducir mejor todo el contenido de una escena se han desarrollado varios métodos. No existe una técnica perfecta para todas las escenas y situaciones, cada método tiene sus peros, que en algunos casos pueden incluir la aparición de algunas anomalías visuales, conocidas como artefactos.
Axis ofrece diferentes soluciones WDR, entre ellas dos soluciones de nivel forense que representan un salto adelante revolucionario en la calidad de imagen de las escenas difíciles con alto contraste. Su capacidad de hacer visibles los detalles de las zonas oscuras de una escena sin sobreexponer las partes iluminadas y el excepcional valor forense de sus imágenes las convierte en unas soluciones sin rival en el mercado.
Las soluciones WDR de Axis incluyen Forensic WDR, WDR - Forensic Capture, WDR - Dynamic Capture y WDR - Dynamic Contrast. La mayoría de las cámaras Axis utilizan Forensic WDR, un método basado en la doble exposición. Al desactivar esa opción, las cámaras pasan automáticamente al modo WDR (contraste dinámico).
Algunas cámaras Axis utilizan combinaciones no especificadas de estos métodos para ampliar el rango dinámico. En estas cámaras, la solución WDR está adaptada a cada cámara concreta y aparece “WDR” en las hojas de datos y otros documentos de información sobre el producto.
Normalmente, la capacidad de rango dinámico de una cámara se expresa en dB, pero el nivel de WDR real resulta difícil de medir y también depende de otros factores, como la complejidad de la escena, la cantidad de movimiento y la capacidad de procesamiento de imágenes de la cámara.
Durante el desarrollo de las cámaras, Axis prioriza la facilidad de uso en el ámbito forense y la calidad de imagen por encima de la medición y la indicación de un alto valor en dB. Debido a esta priorización, una cámara Axis con un rango dinámico determinado podría obtener mejores resultados que otra cámara con un valor de dB más alto.
Introducción
Tradicionalmente las cámaras han tenido dificultades con las escenas con un wide dynamic range, es decir, con una importante variación en los niveles de luz. Este documento técnico expone las claves tecnológicas que explican las limitaciones del rango dinámico de una cámara, describe los métodos generales disponibles para lograr un buen rendimiento WDR y presenta las soluciones WDR de Axis para obtener vídeo con el máximo valor forense y facilidad de uso.
Escenas con Wide Dynamic Range
El dynamic range hace referencia a la diferencia en los niveles de luz entre las zonas más oscuras y las más iluminadas de una escena o una imagen. Así, una escena con amplio rango dinámico contiene simultáneamente áreas tanto muy luminosas como muy oscuras. Ejemplos habituales en el terreno de la vigilancia:
Puertas de entrada con luz diurna en el exterior y entornos oscuros en el interior.
Garajes o túneles, con luz diurna en el exterior y bajos niveles de luz en el interior.
Escenas de exterior, con luz solar directa y sombras.
Edificios de oficinas o centros comerciales con mucha luz reflejada desde las ventanas.
A continuación, presentamos un ejemplo de una escena con un amplio rango dinámico, capturada con una cámara de vigilancia que no cuenta con la tecnología necesaria para procesar escenas WDR.

En función del tiempo de exposición empleado, la cámara puede hacer visible la entrada y el exterior iluminados o bien el interior oscuro del garaje. Una cámara sin capacidad WDR no puede capturar todo el contenido de la escena en una sola imagen.
En las imágenes de la parte inferior se insertan fragmentos de la imagen de exposición corta en la imagen de exposición larga, y viceversa. Es evidente que la cámara, al carecer de capacidad WDR, no consiguió capturar objetos importantes de la escena.

Para poder capturar el contenido de toda la escena, hace falta una cámara de vigilancia con tecnología WDR. Esta cámara es capaz de capturar ambos extremos en una sola imagen y mostrar claramente los detalles de la entrada iluminada y las sombras oscuras del interior del garaje. Sin capacidad WDR, la cámara solo puede generar una imagen válida en la zona oscura o brillante de la escena, mientras la otra zona queda subexpuesta o sobreexpuesta.
Limitaciones físicas del dynamic range de una cámara
Los principales motivos de las limitaciones en el dynamic range de una cámara tienen que ver con la forma de capturar la luz en el sensor de la cámara, con el procesamiento de las imágenes y también con las características de la luz. Expresado en términos más prácticos, el dynamic range depende del tamaño de píxel, el tiempo de exposición, el ruido y la profundidad de bits.
Tamaño de píxel y tiempo de exposición
La luz está formada por una serie de haces de energía llamados fotones. Cuando aumenta la intensidad de la luz de una escena, significa que la cámara recibirá un mayor número de fotones. Sin embargo, una cámara, o más concretamente su sensor de imagen, solo puede detectar un número limitado de fotones por cada intervalo de exposición.
El sensor de imagen está formado por millones de puntos fotosensibles, llamados píxeles, capaces de convertir los fotones capturados en electrones. Cuando la cámara forma una imagen, se mide el recuento de electrones de cada píxel, lo que aporta información sobre los niveles de luz en las diferentes partes de la escena capturada.
Cada píxel tiene un tamaño determinado y alcanza un punto de saturación a partir de un determinado número de electrones. Las cámaras modernas tratan de maximizar el número de píxeles, pero por motivos económicos el tamaño total del sensor es reducido, lo que en la práctica limita el tamaño de los píxeles.
En una escena con wide dynamic range, un tiempo de exposición largo saturará los píxeles en las partes más iluminadas de la imagen. Al reducir el tiempo de exposición y capturando los fotones en un período de tiempo inferior, puede evitarse la sobresaturación de fotones en las partes más iluminadas. Sin embargo, con un tiempo de exposición inferior seguramente se capturarán pocos fotones en las zonas más oscuras. A causa de las características de las partículas de la luz, y al fenómeno conocido como ruido de disparo de fotones, en estas zonas de la imagen el ruido será muy visible. El tiempo de exposición correcto de un píxel debe maximizar la relación señal-ruido (SNR), por lo que será más corto para los píxeles situados en las zonas más iluminadas de la imagen que para los píxeles de las regiones más oscuras.
Ruido y profundidad de bits
Aplicado a los píxeles, el dynamic range se define como la señal máxima dividida por el umbral mínimo de ruido. El umbral mínimo de ruido determina la intensidad de señal más baja que puede apreciarse por encima de la intensidad de todas las fuentes de ruido sumadas. Parte del ruido tiene su origen en las imperfecciones del conversor analógico-digital que cuenta los electrones y genera una lectura de píxeles. Otro tipo de ruido es el ruido de disparo de fotones, imposible de evitar incluso utilizando los mejores equipos. Todos los tipos de ruido se traducen en valores de píxel que no reflejan las intensidades auténticas de la escena real.
La profundidad de bits describe el número de bits utilizados para capturar la información en un píxel y determina el número de niveles de luz que pueden detectarse. Las cámaras de seguridad normalmente tienen una profundidad de bits de 10 bits. Con una profundidad de bits superior en teoría aumentan los niveles de luz que pueden detectarse, aunque en realidad la calidad de imagen solo aumentará si los píxeles del sensor son lo bastante grandes y si el ruido es lo bastante bajo. Si los datos del sensor presentan ruido, de poco sirve aumentar el número de bits.
Visualización de la imagen
En relación con la profundidad de bits, es importante tener en cuenta que un monitor típico en el que un profesional de la seguridad visualizará el vídeo tiene una profundidad de bits de solo 8 bits por cada canal de color. Esto significa que el algoritmo para trasladar los 10 bits del sensor a los 8 bits del monitor tiene un papel clave a la hora de obtener un nivel de WDR correcto.
Métodos generales para aumentar el dynamic range de una cámara
Se han desarrollado distintos métodos para sortear las limitaciones del rango dinámico de una cámara y lograr una buena calidad de imagen WDR. Estos métodos en ocasiones se combinan para obtener unos mejores resultados. No hay un método único ideal para todas las aplicaciones, ya que cada método tiene asociadas diferentes anomalías visuales, denominadas artefactos. Los defectos apenas visibles en una aplicación pueden resultar fatales en otra. Consulte el capítulo 7 para ver una descripción de los artefactos más habituales.
Uso de exposiciones dobles o múltiples
La utilización de un algoritmo de fusión permite combinar varias imágenes capturadas con diferentes tiempos de exposición en una sola imagen. Se trata del método más habitual para aumentar el dynamic range. Sin embargo, a causa de la captura secuencial, este método introduce artefactos asociados al movimiento de la escena. Por lo general, el movimiento rápido puede resultar problemático, dado que las dos exposiciones no se pueden combinar debido a que los objetos no se encuentran en la misma posición entre ambas capturas.
La doble exposición requiere dos tiempos de exposición: uno muy corto y otro largo. Dado que el tiempo corto de exposición no se puede sincronizar con todos los tipos de iluminación artificial moderna (LED), el parpadeo de zona brillante de la imagen puede resultar muy visible.
Los defectos más comunes causados por la doble exposición incluyen:
Parpadeo
Distorsión por movimiento e imágenes fantasma
Ruido en las zonas oscuras de la escena
Ruido inesperado en las zonas grises medias de la escena.
Uso de píxeles de doble o múltiple sensibilidad
Con este método, la cámara utiliza un sensor de imagen que contiene dos o más tipos de píxeles, con diferentes sensibilidades de luz. De este modo, una única exposición permite obtener dos imágenes, una más oscura y otra más clara, para cada conjunto de píxeles. La imagen final se crea en tiempo real combinando estas imágenes mediante un algoritmo de fusión y mapeo de tonos. Normalmente existen restricciones aplicables a las diferencias entre las sensibilidades de los píxeles contiguos, como una relación de sensibilidad fija, restricciones que limitan el dynamic range que puede obtenerse con este método. Gracias a la exposición simultánea se evitan los artefactos relacionados con el movimiento y el parpadeo, pero se introducen en cambio otros tipos de artefactos. Por ejemplo, la pérdida de resolución asociada a este método (ya que se utilizan menos píxeles para formar la imagen) puede crear patrones de moaré y efectos de escalera en la imagen. Asimismo, el procesamiento necesario para combinar los dos conjuntos de píxeles puede resultar complicado y, en algunos casos, provocar otros problemas. Artefactos más habituales:
Patrón de Moiré y efecto escalera
Ruido
Borrosidad
Uso de mejoras en el contraste
Este método digital emplea una imagen subexpuesta y aumenta de forma digital el nivel de brillo en las zonas más oscuras. En realidad, este método no amplía el dynamic range capturado, pero mejora las posibilidades de detección en la imagen final, especialmente en áreas que sin este procesamiento quedarían sobreexpuestas. Se trata de un método muy útil para escenas con un dynamic range limitado y mucho movimiento. Los principales artefactos que puede introducir son los siguientes:
Ruido inesperado en las zonas más oscuras
Pocos niveles de grises en algunas áreas
Colores poco naturales
Uso de mejoras locales en el contraste
Tradicionalmente, las cámaras han aplicado métodos globales para ajustar la curva tonal, lo que significa que utilizan la misma transformación para todos los píxeles de la imagen. También es posible utilizar un método local, ajustando la curva de tono de forma diferente en función de las áreas del sensor. De este modo no se amplía realmente el dynamic range capturado, pero la modulación del contraste mejora las posibilidades de visualización y ofrece una visión más limpia en una pantalla con un dynamic range bajo. Los artefactos más habituales dependen de la intensidad de aplicación del método y pueden incluir:
Ghosting (Efecto fantasma)
Cartooning (Efecto dibujo)
Pérdida de contraste
Colores excesivos
Imágenes WDR en cámaras Axis
Axis ofrece diferentes soluciones para obtener imágenes WDR, soluciones que combinan algunos de los métodos generales presentados en el capítulo anterior con las últimas técnicas y procedimientos de procesamiento de imagen, con el fin de reducir los artefactos.
Posibilidades de la tecnología WDR según Axis
Desde Axis utilizamos una serie de parámetros clave para evaluar nuestras soluciones WDR. A la hora de determinar cuál es la solución más adecuada para cada aplicación de vigilancia, cada uno de estos parámetros puede tener un peso diferente en función de las circunstancias de cada caso. La evaluación de los parámetros se basa en el uso real y en valoraciones subjetivas.
| Parámetro | Significado |
| Movimiento | ¿Hasta qué punto se evitan artefactos relacionados con el movimiento y el parpadeo? |
| Alcance | El dynamic range efectivo. Expresado en dB. |
| Aspecto | ¿Con qué calidad se reproduce la imagen en una escena difícil? |
El parámetro del movimiento describe la capacidad de una solución para capturar una escena con movimiento sin introducir artefactos asociados a la técnica de muestreo. El tratamiento del parpadeo es un factor importante en este terreno, junto con la posibilidad de evitar los artefactos combinados.
El parámetro del alcance define la diferencia máxima de brillo que puede existir entre la parte más iluminada y la parte más oscura de la imagen, sin perder usabilidad de la imagen a efectos de vigilancia.
El parámetro del aspecto refleja la capacidad de la solución para reproducir condiciones de iluminación difíciles y, al mismo tiempo, obtener una imagen de calidad suficiente para el monitor del personal de seguridad. El objetivo no es reproducir la escena con la máxima fidelidad, ya que se podrían perder detalles importantes para el espectador.
Soluciones WDR de Axis
El dynamic range de una cámara se expresa normalmente por su valor en dB, un valor asociado al parámetro del alcance descrito en el apartado anterior. Sin embargo, para garantizar una buena usabilidad y el máximo nivel de detalle en las escenas de vigilancia más habituales, las soluciones WDR de Axis priorizan los parámetros del movimiento y el aspecto por encima del alcance. Gracias a esta priorización, las cámaras Axis pueden obtener unas imágenes con mejor dynamic range de lo que indican sus valores en dB. Teniendo en cuenta la reducción de los artefactos y la mejor usabilidad, una cámara Axis con un valor de dB inferior podría ser perfectamente mejor que una cámara de otro fabricante con un valor de dB superior. Consulte el capítulo 6 para obtener más información acerca de los valores de dB.
A continuación se presentan las soluciones WDR de Axis.
La tecnología Forensic WDR es un método que combina una exposición doble y la introducción de mejoras locales en el contraste. y permite obtener imágenes optimizadas para su utilización con fines forenses. Gracias a la utilización de algoritmos de procesamiento de imagen de última generación, esta tecnología es capaz de reducir de forma eficaz el ruido visible y los artefactos. Forensic WDR también es adecuado para escenas con movimiento y cámaras de ultra alta resolución.
WDR - Forensic Capture es un método que combina una exposición doble y la introducción de mejoras locales en el contraste y permite obtener imágenes optimizadas para su utilización con fines forenses.
WDR - Dynamic Capture utiliza un método de doble exposición para combinar imágenes con diferentes tiempos de exposición.
WDR - Dynamic Contrast utiliza un método de mejora del contraste con un dynamic range limitado, pero con muy pocos artefactos. Al utilizar únicamente una exposición, esta solución resulta útil en escenas con mucho movimiento.
Algunas cámaras Axis utilizan combinaciones no especificadas de estos métodos para ampliar el rango dinámico. En estas cámaras, la solución WDR está adaptada a cada cámara concreta y aparece “WDR” en los documentos de información sobre el producto.
Las soluciones WDR de AXIS se suministras preconfiguradas, pero puede optar por activar o desactivar la doble exposición. Algunos adquieren una cámara con Forensic WDR, desactivan la doble exposición porque consideran excesivo el movimiento en la escena y, al final, se ven obligados a usar únicamente la mejora de contraste local. Algunos sensores y sistemas en chip (SoC) no pueden gestionar la alta resolución combinada con la doble exposición debido a limitaciones de rendimiento. Estas cámaras se limitan a utilizar únicamente la mejora del contraste local.
En algunas cámaras, la velocidad de fotogramas podía aumentar (a veces hasta duplicarse) al desactivar la doble exposición.
La tabla siguiente clasifica las soluciones WDR de Axis en función de diferentes aspectos vinculados al rendimiento.
| Solución WDR | Movimiento ¿Hasta qué punto se evitan artefactos relacionados con el movimiento y el parpadeo? | Alcance ¿En qué medida es capaz la cámara de gestionar la diferencia entre las zonas más oscuras y las más brillantes de una escena realista? (también conocido como valor dB) | Aspecto ¿Con qué calidad se reproduce la imagen en una escena difícil? |
| Forensic WDR | +++ | +++ | +++++ |
| WDR - Forensic Capture | ++ | +++ | +++ |
| WDR - Dynamic Capture | + | + | ++ |
| WDR - Dynamic Contrast | +++++ | - | - |
A juzgar por la puntuación, la solución WDR con un mejor rendimiento es Forensic WDR, ya que es mejor que la solución WDR - Forensic Capture tanto en el parámetro del movimiento como en el del aspecto. Sin embargo, todas estas soluciones de nivel forense representan un salto adelante revolucionario en la calidad de imagen de las escenas complejas. Su capacidad de hacer visibles los detalles de las zonas oscuras de una escena sin sobreexponer las partes iluminadas y el excepcional valor forense de sus imágenes las convierte en unas soluciones sin rival en el mercado.
Teniendo en cuenta que la finalidad de las soluciones forenses es obtener la mejor usabilidad con fines de análisis de la imagen, las sombras se representan con una iluminación mejorada y los detalles presentan una calidad superior, lo que se traduce en una imagen que transmite una impresión muy diferente de lo que estamos acostumbrados a ver, por ejemplo, en las transmisiones de vídeo. Con una cámara Forensic WDR, el dynamic range de la escena se comprime considerablemente, pero sin perder detalles. Esta característica optimiza el vídeo para su visualización y reduce la fatiga ocular, pensando especialmente en centros de seguridad cuyos profesionales pasan todo el día revisando vídeo en directo y grabado.
La figura siguiente compara una escena capturada con dos cámaras diferentes: una cámara sin tecnología WDR a la izquierda y una cámara Axis con Forensic WDR a la derecha. Con la tecnología Forensic WDR, se obtienen unos detalles nítidos y visibles tanto del interior iluminado con luz de fondo como del exterior.

Capacidad de dynamic range especificada en dB
La capacidad de dynamic range de una cámara suele expresarse en un valor en dB, un valor asociado al parámetro del alcance descrito en el capítulo 5.
El valor en dB expresa la relación entre la claridad del objeto más brillante y la claridad del objeto más tenue que una cámara puede capturar. Si la relación es de 1000:1, el valor en dB es de 60 dB, cifra obtenida a partir del logaritmo de la relación (en este caso 3) multiplicado por 20.
El nivel más tenue detectable puede definirse como el umbral mínimo de ruido del píxel del sensor, ya que cualquier señal inferior a este nivel queda tapada por el ruido. Con esta definición, un buen sensor de imagen normalmente puede alcanzar un dynamic range de unos 70 dB. Usando técnicas de WDR podemos incrementar el dynamic range efectivo, o el alcance, sin alterar el valor de dB de la cámara.
Sin embargo, ni el valor en dB ni el alcance expresan totalmente el dynamic range total que puede obtener una cámara. La calidad de la imagen WDR también depende del método WDR empleado, de la presencia de artefactos visibles y de la calidad del procesamiento de la imagen. Algunos de estos factores están asociados a los parámetros del aspecto y el movimiento, descritos en el capítulo 5.
La imagen de la derecha se ha obtenido con una cámara con un valor de dB teórico inferior al de la cámara de la imagen de la izquierda. En esta escena con wide dynamic range, la cámara con el valor de dB inferior ha obtenido una imagen claramente mejor a efectos de videovigilancia, por sorprendente que parezca. Evidentemente, la cámara con el valor de dB inferior presentaba otras prestaciones, como un mejor procesamiento de la imagen, que se traducen en una capacidad de WDR superior.

Artefactos en imágenes WDR
Este capítulo describe algunos de los artefactos visuales más habituales y sus causas.
Distorsión por movimiento: La distorsión por movimiento puede producirse cuando la imagen grabada cambia de un fotograma a otro, a causa de un movimiento rápido en la escena o simplemente por un tiempo de exposición demasiado largo. En las cámaras WDR que emplean exposiciones múltiples, se producen distintos niveles de desenfoque por movimiento en diferentes partes de la imagen, dependiendo de su nivel de brillo.

Efecto fantasma: Cuando se utilizan varias exposiciones para crear una sola imagen, es posible que un objeto en movimiento se capture en diferentes puntos. Esto puede provocar un efecto tipo fantasma alrededor de objetos o personas en movimiento.

Defectos causados por parpadeo: Los defectos debidos al parpadeo de la luz pueden aparecer en todo tipo de cámaras. Teniendo en cuenta que una iluminación constante es la situación más habitual, las fuentes de luz moduladas, como la iluminación fluorescente o LED, representan un problema. En función del tipo de cámara, los artefactos introducidos pueden tener la forma de franjas o pulsaciones visibles. En las cámaras WDR que utilizan exposiciones múltiples, el efecto suele ser más pronunciado en la exposición corta, lo que puede ocasionar que el parpadeo resulte más visible en la imagen, dado que puede producirse una transición brusca entre las áreas tomadas con diferentes tiempos de exposición.

Ruido inesperado: Al combinar dos o más imágenes para formar una nueva con un rango dinámico mayor, la nueva imagen no tendrá las mismas características de ruido que una imagen con un rango dinámico realmente amplio. Una de las concesiones que debe aceptarse es que la imagen combinada tendrá más ruido que una imagen ideal. Este ruido no se distribuye de manera uniforme en todos los niveles de brillo, sino que es más intenso en las zonas donde se han combinado dos imágenes. Si los filtros de ruido de las cámaras no pueden compensar este efecto, el resultado puede ser un ruido inesperado en zonas que se suponen libres de ruido.

Caricaturización y artificialidad: Las escenas con un rango dinámico muy alto pueden resultar difíciles de visualizar en un monitor estándar. Aunque los sofisticados procesos de tratamiento de imágenes hagan todo lo posible por conservar el color y el contraste, en ocasiones puede que no sea suficiente para reproducir las imágenes de forma natural. El resultado pueden ser colores extraños o, simplemente, una experiencia poco natural.

Franjas moradas: El efecto de franjas moradas, o a veces azules, se produce cuando los bordes nítidos y de alto contraste de la imagen adquieren un tinte púrpura debido a la aberración cromática del objetivo. La aberración cromática se produce cuando las diferentes longitudes de onda de la luz no se refractan por igual en el objetivo y, por lo tanto, aparecen ligeramente desplazadas o desenfocadas en el sensor. Este efecto puede resultar más pronunciado cerca del borde del sensor. Las cámaras WDR pueden ser más sensibles a la aberración cromática que otras porque conservan mejor el color y el contraste. Mientras que una cámara sin WDR puede saturar o sobreexponer las áreas más cercanas a fuentes de luz brillante, una cámara WDR, en cambio, suele conservar la información de color, lo que en este caso puede hacer que las debilidades del sistema óptico resulten más visibles.

Destellos y neblina de objetivo: Cuando la luz penetra en el sistema de un objetivo óptico, parte de la luz no se captura correctamente, sino que se dispersa por el sistema del objetivo. Parte de esta luz será capturada por los deflectores internos, diseñados para reducir el rebote de la luz, pero una parte también llegará hasta el sensor de imagen y, si no llega en el punto correcto, provocará diferentes tipos de artefactos. El artefacto más habitual es el destello en el objetivo, visible en la mayoría de las cámaras situadas frente a una fuente de luz intensa, como el sol. Otro efecto, conocido como niebla, reduce el contraste y la saturación del color en zonas más amplias de la imagen. Ambos efectos resultan especialmente problemáticos si hay fuentes de luz intensas en la imagen, escenas con un amplio rango dinámico, cristales sucios o polvo en el sistema del objetivo. Instalar una cubierta protectora contra la intemperie en la cámara podría reducir tanto los destellos como la niebla. El rendimiento de una cámara WDR, es decir, la capacidad de capturar y reproducir escenas con un rango dinámico muy amplio, continuará estando limitado por la luz dispersa presente en el sistema óptico.
