Plage dynamique étendue (WDR)
Avant-propos
Les scènes qui contiennent à la fois des zones très sombres et très brillantes sont délicates à traiter pour une caméra. En termes de vidéoprotection, les exemples typiques de scènes à plage dynamique étendue (ou WDR pour Wide Dynamic Range) sont notamment les portes d’accès, les parkings couverts et les tunnels, où il existe un fort contraste entre la lumière extérieure et l’intérieur plus sombre. Les scènes extérieures avec lumière directe du soleil et ombres posent également problème.
Plusieurs méthodes ont été mises au point pour que les caméras puissent mieux recréer le contenu de l’ensemble de la scène. Néanmoins, aucune technique unique n’est optimale pour tous les types de scènes et de situations. Chaque méthode présente ses inconvénients, notamment par l’introduction de diverses anomalies visuelles, dénommées artefacts.
Axis propose plusieurs solutions WDR, notamment deux solutions médico-légales qui révolutionnent l'imagerie des scènes difficiles à contraste élevé. Leur capacité à révéler les détails dans les parties sombres d’une scène, sans surexposition des parties éclairées, est sans équivalent. Les images ainsi traitées offrent ainsi une valeur forensique exceptionnelle.
Les solutions WDR d'Axis comprennent Forensic WDR, WDR-Forensic Capture, WDR-Dynamic Capture, et WDR-Dynamic Contrast. La plupart des caméras Axis utilisent la technologie Forensic WDR, qui repose sur une double exposition. Lorsque cette fonction est désactivée, les caméras passent automatiquement en mode WDR-Dynamic Contrast.
Certaines caméras Axis font appel à des combinaisons non spécifiées de ces différentes méthodes pour étendre la plage dynamique. La solution WDR est personnalisée à chacune d’entre elles et intitulée simplement « WDR » dans les fiches techniques et autres supports d’information produit.
La plage dynamique d'une caméra s'exprime généralement en dB, mais la performance WDR effective est difficile à estimer et dépend aussi d'autres facteurs tels que la complexité de la scène, la quantité de mouvements dans la scène, et les capacités de traitement d'image de la caméra.
Lorsqu'elle développe ses caméras, Axis privilégie la facilité d'utilisation à des fins médico-légales et la qualité d’image plutôt que la mesure et la mise en avant d’une valeur dB élevée. Compte tenu de cette priorisation, une caméra Axis avec une plage dynamique spécifiée pourrait très bien surpasser une caméra concurrente dont la valeur dB est plus élevée.
Introduction
Les caméras ont généralement des difficultés avec les scènes dont la plage dynamique est étendue, c’est-à-dire celles dont les niveaux de luminosité présentent de fortes variations. Ce livre blanc explique la technologie qui sous-tend les limitations de plage dynamique d'une caméra, décrit les méthodes générales disponibles pour obtenir de bonnes performances WDR, et présente les solutions WDR d'Axis pour aboutir à des vidéos dont la valeur médico-légale et l'exploitabilité sont optimales.
Scènes à plage dynamique étendue
La plage dynamique correspond à la différence entre les niveaux de luminosité de la zone la plus sombre et de la zone la plus brillante d’une scène ou d’une image. Une scène associée à une plage dynamique étendue contient donc en même temps des zones très lumineuses et des zones très sombres. En voici quelques exemples typiques en vidéosurveillance.
Portes d’entrée avec un extérieur très lumineux et un intérieur plus sombre
Parkings couverts ou tunnels, lumineux à l’extérieur et peu éclairés à l’intérieur
Scènes extérieures avec lumière directe du soleil et ombres.
Immeubles de bureau ou centres commerciaux où les baies vitrées réfléchissent une grande quantité de lumière.
Les images ci-dessous représentent une scène à plage dynamique étendue, capturée par une caméra de surveillance sans la technologie requise pour gérer des scènes WDR.

Selon le temps d’exposition choisi, la caméra peut rendre visible soit l’entrée bien éclairée et l’extérieur lumineux, soit l’intérieur obscur du parking. Une caméra sans fonction WDR ne peut pas capturer l'ensemble du contenu de la scène en une seule image.
Dans les clichés ci-dessous, l’image à temps d’exposition long comporte des incrustations de l’image à temps d’exposition court et inversement. Il apparaît que la caméra sans fonction WDR a perdu des objets importants de la scène.

Pour pouvoir capturer l’ensemble du contenu de la scène, une caméra de surveillance WDR s’impose. Elle peut, dans une seule image, capturer les deux extrêmes, autrement dit révéler clairement des détails à la fois dans l’entrée bien éclairée et dans les ombres sombres à l’intérieur du parking couvert. Sans la fonction WDR, la caméra ne peut produire une image exploitable que dans la partie sombre ou lumineuse de la scène, l'autre partie étant alors sous-exposée ou surexposée.
Limitations physiques à la plage dynamique d’une caméra
Les principales raisons de la plage dynamique limitée d’une caméra sont liées à l’arrivée de la lumière dans le capteur d’image, au traitement des images, mais aussi à la nature de la lumière elle-même. En termes plus concrets, la plage dynamique dépend de la taille de pixel, du temps d’exposition, du bruit et de la profondeur de bits.
Taille de pixel et temps d’exposition
La lumière est composée de particules d’énergie appelées photons. Lorsque l’intensité lumineuse d’une scène augmente, le nombre de photons qui pénètrent dans la caméra augmente également. Cependant, une caméra, ou plutôt son capteur d’image, ne peut détecter qu’un nombre limité de photons par intervalle d’exposition.
Le capteur d’image est constitué de millions de points photosensibles, dénommés pixels, capables de convertir en électrons les photons qui les frappent. Lorsque la caméra forme une image, le nombre d’électrons est compté pour chaque pixel, révélant ainsi des informations sur les niveaux de luminosité des différentes zones de la scène capturée.
Chaque pixel a une dimension fixe et ne peut contenir qu’un nombre fixe d’électrons avant d’arriver à saturation. Dans une caméra moderne, on cherche à maximiser le nombre de pixels, tout en préservant les dimensions totales du capteur pour des raisons de coûts, ce qui aboutit à une limitation de la taille des pixels.
Dans une scène à plage dynamique étendue, un temps d’exposition long va saturer les pixels correspondant aux zones les plus lumineuses de l’image. En réduisant le temps d’exposition, donc en recueillant les photons sur une période plus courte, on peut éviter la saturation par les photons dans les zones les plus lumineuses. Revers de la médaille : un temps d’exposition plus court se traduit par un très petit nombre de photons capturés pour les zones les plus obscures. En raison de la nature particulaire de la lumière et d’un phénomène physique nommé bruit de grenaille photonique, ces zones de l’image seront visiblement grainées. Pour un pixel, le temps d’exposition correct est celui qui maximise le rapport signal sur bruit (S/B). Par conséquent, il est plus court pour les pixels correspondant aux zones lumineuses de l’image que pour ceux correspondant aux régions plus sombres.
Bruit et profondeur de bits
Au niveau du pixel, la plage dynamique est définie comme le signal maximal divisé par le bruit de fond. Le bruit de fond détermine la plus faible intensité de signal utile discernable dans l’intensité totale de toutes les sources de bruit. Une partie du bruit provient d’imperfections du convertisseur analogique-numérique, qui compte les électrons et génère un résultat par pixel. Un autre type de bruit est le bruit de grenaille photonique, impossible à annuler même avec un matériel parfait. Tout ce bruit aboutit à des valeurs par pixel qui ne traduisent pas les intensités vraies de la scène.
La profondeur de bits représente le nombre de bits utilisés pour capturer les informations dans un seul pixel. Il détermine en quelque sorte l’échelle des luminosités détectables. Les caméras de sécurité possèdent en général une profondeur de 10 bits. Théoriquement, une profondeur de bits supérieure augmente le nombre de niveaux de luminosité détectables. Mais en réalité, elle augmentera la qualité d’image uniquement si les pixels du capteur sont suffisamment gros et le bruit suffisamment faible. Si les données du capteur sont bruitées, il n’y a pas grand intérêt à accroître la profondeur de bits.
Affichage de l’image
À propos de la profondeur de bits, il convient d’observer qu’un moniteur standard, comme celui qu’utilise l’agent de sécurité pour visionner la vidéo de surveillance, possède une profondeur de seulement 8 bits par canal de couleur. Autrement dit, l’algorithme qui traduit les 10 bits du capteur en 8 bits pour le moniteur est crucial pour obtenir de bonnes performances WDR.
Méthodes générales d’élargissement de la plage dynamique d’une caméra
Plusieurs méthodes ont été mises au point pour contourner les limitations de plage dynamique d'une caméra, et aboutir à une imagerie WDR de qualité. Pour optimiser les résultats, ces méthodes sont parfois combinées. Aucune méthode unique n’est optimale pour toutes les applications. En effet, chaque méthode introduit diverses anomalies visuelles, dénommées artefacts. Des artefacts invisibles dans une application peuvent se révéler extrêmement gênants dans une autre. Le chapitre 7 donne la description d’artefacts fréquents.
Temps d’exposition multiples
À l’aide d’un algorithme de fusionnement, plusieurs images capturées à des temps d’exposition différents sont combinées pour former une même image. C’est là la méthode la plus courante pour élargir la plage dynamique. Cependant, comme la capture est séquentielle, cette méthode introduit des artefacts dus aux mouvements dans la scène. En général, les mouvements rapides peuvent poser problème car les deux expositions ne peuvent pas être fusionnées, les objets ne se trouvant pas dans la même position entre les deux prises de vue.
La double exposition nécessite deux temps d'exposition : l'un très court et l'autre long. Étant donné que le temps d'exposition court ne peut pas être synchronisé avec tous les types d'éclairage artificiel moderne (LED), le clignotement de la partie claire de l'image peut être très visible.
Parmi les artefacts courants causés par la double exposition, on peut citer :
Clignotement
Flou cinétique et effet fantôme
Bruit dans les zones sombres de la scène
Un bruit inattendu dans les zones de gris moyen de la scène
Pixels de différentes sensibilités
Dans cette méthode, la caméra possède un capteur d’image qui comporte au moins deux types de pixels, dont les sensibilités à la lumière diffèrent. De ce fait, une seule exposition peut en fait créer deux images, une plus sombre et une plus lumineuse, selon la série de pixels. L'image finale est créée en temps réel en combinant ces images à l'aide d'un algorithme de fusion et d'une courbe des gammas. Il existe généralement des restrictions sur l’écart de sensibilité réalisable entre pixels adjacents (par exemple rapport de sensibilité fixe), ce qui limite la plage dynamique possible par cette méthode. Avec une seule exposition, les artefacts liés au mouvement et au clignotement sont évités, mais d’autres types d’artefacts peuvent apparaître. Par exemple, la résolution plus faible inhérente à cette méthode (l’image est formée par un nombre inférieur de pixels) peut créer des effets de moiré et de crénelage sur l’image. Par ailleurs, le traitement pour combiner les deux séries de pixels peut être compliqué à mettre en œuvre, voire provoquer dans certains cas d’autres problèmes. Artefacts typiques :
Effets de moiré et crénelage
Bruit
Flou
Amélioration du contraste
Il s’agit d’une méthode numérique qui éclaircit les zones les plus sombres d’une image sous-exposée. La méthode n’élargit pas véritablement la plage dynamique capturée, mais améliore les possibilités de détection dans l’image finale, en particulier dans les zones qui auraient été surexposées sinon. Elle est très utile pour les scènes à plage dynamique limitée où les objets sont très mobiles. Voici les artefacts les plus courants :
Bruit contre-intuitif dans les zones plus sombres
Peu de niveaux de gris dans certaines zones
Couleurs irréalistes
Amélioration locale du contraste
Généralement, les caméras conventionnelles recourent à des méthodes globales pour ajuster la courbe de tons : ainsi, tous les pixels de l’image sont soumis à la même transformation. Il est néanmoins possible d’utiliser une méthode locale, qui ajuste la courbe de tons en fonction des zones du capteur. Cette méthode n’élargit pas véritablement la plage dynamique capturée, mais constitue un puissant outil de visualisation grâce à la modération du contraste, qui donne une image plus réaliste sur un écran à faible plage dynamique. Les artefacts typiques dépendent de l’intensité d’emploi de la méthode :
Images fantômes
Effet dessin animé
Manque de contraste
Couleurs excessives
Imagerie WDR dans les caméras Axis
Axis propose plusieurs solutions pour l’imagerie WDR, qui combinent certaines des méthodes générales présentées au chapitre précédent avec un traitement d’images de pointe et des procédures visant à réduire les artefacts.
Performance WDR selon Axis
Chez Axis, nous avons retenu quelques critères fondamentaux pour évaluer nos solutions WDR. Pour déterminer la solution qui convient à une situation de surveillance particulière, ces critères doivent être pondérés différemment en fonction des circonstances. L’évaluation de ces critères repose sur un usage réel et un jugement subjectif.
| Critère | Explication |
| Mouvement | Les artefacts de mouvement et clignotement sont-ils bien évités ? |
| Amplitude | Plage dynamique pratique. Liée à la valeur en dB. |
| Apparence | L’image d’une scène difficile est-elle bien reproduite ? |
La note du critère Mouvement se rapporte à la capacité de la solution à capturer une scène comportant du mouvement, sans introduire d’artefacts liés à la technique d’échantillonnage. Dans ce critère, le traitement du clignotement est un élément important, l’autre étant d’éviter de fusionner les artefacts.
La note du critère Amplitude correspond à l’écart admissible de luminosité entre la zone la plus éclairée et la zone la plus sombre de l’image, qui doit en plus rester exploitable à des fins de surveillance.
La note du critère Apparence représente la capacité de la solution à reproduire les conditions de luminosité défavorables, tout en restituant une image visualisable par l’équipe de sécurité sur un moniteur de contrôle. Ici, l’objectif n’est pas de reproduire la scène le plus fidèlement possible, car cela pourrait masquer des détails pour l’observateur.
Solutions WDR Axis
La plage dynamique d’une caméra s’exprime en général par une valeur en dB, liée au critère Amplitude défini au paragraphe précédent. Pour fournir des scènes de surveillance exploitables et détaillées, les solutions WDR Axis accordent la priorité aux critères Mouvement et Apparence, devant le critère Amplitude. Ce choix signifie que les caméras Axis peuvent restituer une plage dynamique plus large que ne le laissent supposer leurs valeurs en dB. En produisant des images plus facilement exploitables et comportant moins d’artefacts, une caméra Axis caractérisée par une valeur en dB plus faible peut très bien surpasser une caméra concurrente d’une valeur en dB supérieure. Pour en savoir plus sur les valeurs en dB, reportez-vous au chapitre 6.
Les solutions WDR Axis sont recensées ci-dessous.
Forensic WDR combine la double exposition et une méthode d’amélioration locale du contraste. Cette fonction produit des images optimisées pour un usage à des fins d’enquête. Exploitant des algorithmes de traitement d’image de dernière génération, cette technologie réduit efficacement le bruit visible et les artefacts. Forensic WDR convient également pour les scènes à mouvements et dans les caméras à ultra-haute résolution.
WDR Forensic Capture combine la double exposition et une méthode d’amélioration locale du contraste. Cette fonction produit des images optimisées pour un usage à des fins d’enquête.
WDR - dynamic capture applique une méthode de double exposition, qui fusionne les images capturées à des temps d’exposition différents.
WDR - dynamic contrast utilise une méthode d’amélioration du contraste. La plage dynamique est relativement étroite, mais l’image contient très peu d’artefacts. Comme les images sont prises avec un temps d’exposition fixe, cette solution est à privilégier dans les scènes comportant beaucoup d’objets mobiles.
Certaines caméras Axis font appel à des combinaisons non spécifiées de ces différentes méthodes pour étendre la plage dynamique. La solution WDR est personnalisée à chacune d’entre elles et intitulée simplement « WDR » dans les documents d’information produit.
Les solutions WDR d'AXIS sont prédéfinies, mais vous pouvez choisir d'activer ou de désactiver la double exposition. Certains achètent une caméra équipée de la technologie Forensic WDR, désactivent la double exposition en raison des nombreux mouvements dans la scène, et sont alors forcés d'utiliser exclusivement l'amélioration du contraste local. Certains capteurs et systèmes sur puce (SoC) ne peuvent pas prendre en charge la haute résolution associée à la double exposition pour des raisons de performances. Ces caméras ne peuvent utiliser que l'amélioration du contraste local.
Sur certaines caméras, la fréquence d'image peut être augmentée (parfois même doublée) lorsque la double exposition est désactivée.
Le Tableau ci-dessous présente les notes des solutions WDR Axis en fonction des critères de performance retenus.
| Solution WDR | Mouvement Les artefacts de mouvement et clignotement sont-ils bien évités ? | Amplitude Dans quelle mesure la caméra est-elle capable de gérer la différence entre les zones les plus sombres et les plus lumineuses d'une scène réaliste ? (également appelée « valeur dB ») | Apparence L’image d’une scène difficile est-elle bien reproduite ? |
| Forensic WDR | +++ | +++ | +++++ |
| WDR - Forensic Capture | ++ | +++ | +++ |
| WDR - dynamic capture | + | + | ++ |
| WDR - dynamic contrast | +++++ | - | - |
D’après le classement, la solution WDR la plus performante globalement est Forensic WDR. Elle améliore à la fois le critère Mouvement et le critère Apparence par rapport à la solution WDR-Forensic Capture. Néanmoins, ces deux solutions forensiques représentent une évolution radicale dans l’imagerie des scènes complexes. Leur capacité à révéler les détails dans les parties sombres d’une scène, sans surexposition des parties éclairées, est sans équivalent. Les images ainsi traitées offrent ainsi une valeur forensique exceptionnelle.
Comme le but des solutions forensiques consiste à restituer des images facilement exploitables à des fins d’enquête, toutes les ombres sont éclaircies et tous les détails affinés. Il en résulte une image à l’apparence très différente de celles dont nous avons l’habitude, à la télévision par exemple. Avec une caméra Forensic WDR, la plage dynamique de la scène est comprimée en une plage dynamique beaucoup plus étroite, sans perte de détails. Cette méthode optimise la vidéo pour qu’elle soit observable sans fatigue oculaire, par exemple par les agents d’un centre de sécurité qui visionnent la vidéo en direct et enregistrée.
La Figure ci-dessous compare une scène capturée avec deux caméras différentes : à gauche une caméra sans fonctionnalité WDR, et à droite une caméra Axis dotée de Forensic WDR. Avec la fonction Forensic WDR, les détails sont nets et visibles à la fois à l’intérieur en contre-jour et à l’extérieur.

Plage dynamique spécifiée en dB
La plage dynamique d’une caméra s’exprime normalement sous forme d’une valeur en dB, liée au critère Amplitude présenté au chapitre 5.
Cette valeur en dB représente le rapport entre la luminance de l’objet le plus lumineux et la luminance de l’objet le moins lumineux que la caméra peut capturer. Si ce rapport vaut 1000:1, la valeur en dB correspond à 60 dB, c’est-à-dire le logarithme décimal de ce rapport (ici 3) multiplié par 20.
Le niveau le moins éclairé détectable peut se définir comme le bruit de fond du pixel du capteur, du fait qu’un signal inférieur à ce niveau est noyé dans le bruit. Avec cette définition, un bon capteur d’image peut atteindre normalement une plage dynamique d’environ 70 dB. Avec les techniques WDR, il est possible d’élargir la plage dynamique pratique, ou l’amplitude, sans toutefois modifier sur la valeur réelle en décibels de la caméra.
Toutefois, ni la valeur en dB, ni le critère Amplitude n’exprime pleinement en pratique la plage dynamique d’une caméra. La qualité d’une image WDR dépend également de la méthode WDR employée, de la présence d’artefacts visibles et de la qualité du traitement d’images. Certains de ces facteurs sont pris en compte dans les critères Apparence et Mouvement définis au chapitre 5.
L’image de droite ci-dessous a été prise avec une caméra dont la valeur en dB est plus faible que pour l’image de gauche. Dans cette scène à plage dynamique étendue, la caméra dont la valeur en dB est la plus faible produit clairement une image plus adaptée à la vidéosurveillance, contrairement à ce qu’on pourrait croire. La caméra de valeur en dB plus faible embarque à l’évidence d’autres fonctionnalités (par exemple traitement d’image plus abouti) qui améliorent sa performance WDR.

Artefacts en imagerie WDR
Ce chapitre présente certains des artefacts visuels les plus courants et leur origine.
Flou de mouvement : Un flou de mouvement peut se produire lorsque l'image enregistrée change pendant une même prise, en raison de mouvements rapides dans la scène ou parce que le temps d'exposition est simplement trop long. Dans les caméras WDR qui utilisent des expositions multiples, différents degrés de flou de mouvement apparaissent dans différentes parties de l'image, selon la luminosité de cette dernière.

Images fantômes : Lorsqu'une même image est créée à partir de plusieurs temps d'exposition, un objet en mouvement peut être capturé dans plusieurs positions. Il peut en résulter un effet de type « fantôme » autour des objets ou personnes en mouvement.

Artefacts causés par le scintillement : Des artefacts provoqués par la lumière scintillante peuvent apparaître dans tous les types de caméras. Puisqu’un éclairage constant est normalement supposé, les sources de lumière modulées comme un éclairage fluorescent ou LED posent un défi. Selon le type de caméra, les artefacts introduits peuvent prendre la forme de bandes ou d’impulsions visibles. Dans les caméras WDR utilisant des expositions multiples, l’effet est généralement le plus marqué lors de l'exposition de courte durée, ce qui peut rendre le scintillement particulièrement visible dans l’image car il peut y avoir une transition nette entre des zones capturées avec des temps d’exposition différents.

Bruit contre-intuitif : Lorsque vous combinez deux images ou plus pour en former une nouvelle dotée d'une plage dynamique plus étendue, la nouvelle image ne présentera pas les mêmes caractéristiques de bruit qu'une image disposant d'une plage dynamique vraiment grande. Un des compromis à accepter est que l'image combinée sera plus bruyante qu'une image idéale. Ce bruit n'est pas réparti de manière uniforme sur tous les niveaux de luminosité, mais il est plus prononcé aux endroits où deux images ont été fusionnées. Si les filtres anti-bruit des caméras ne parviennent pas à compenser cet effet, des bruits inattendus peuvent apparaître dans des zones qui devraient normalement être exemptes de bruit.

Caricature et artificialité : Les scènes présentant une plage dynamique très étendue pourraient être difficiles à afficher sur un moniteur standard. Même si un traitement d'image sophistiqué s'efforce de préserver au mieux les couleurs et les contrastes, cela ne suffit pas toujours pour un rendu naturel des images. Il peut en résulter des couleurs étranges ou, simplement, une impression générale d'artificialité.

Franges violettes : Les franges violettes, ou parfois bleues, sont un phénomène par lequel les contours nets et très contrastés de l'image peuvent prendre une teinte violette en raison d'une abération chromatique de l'objectif. Une abération chromatique se produit lorsque des longueurs d'onde lumineuses différentes sont réfractées de manière illégale dans l'objectif et sont ainsi légèrement déplacées ou floutées sur le capteur. Cet effet peut être plus marqué près du bord du capteur. Les caméras WDR peuvent être plus sensibles à l'abération chromatique que les autres caméras car elles préservent mieux les couleurs et contrastes. Alors qu'une caméra sans WDR peut saturer ou surexposer les zones les plus proches des sources de lumière vive, une caméra WDR parvient souvent à préserver les informations chromatiques, ce qui, dans ce cas, peut rendre plus visibles les faiblesses du système optique.

Reflets d'objectif et diffusion atmosphérique : Lorsque la lumière pénètre dans un système d'objectif optique, une partie de la lumière n'est pas recueillie correctement mais est diffuse dans le système d'objectif. Une partie de cette lumière est absorbée par des déflecteurs internes prévus pour réduire les réflexions lumineuses, mais le reste atteint le capteur d’image au mauvais endroit, provoquant de ce fait différents types d’artefacts. L’artefact le plus courant est la lumière parasite visible dans la plupart des caméras qui font face à une source lumineuse intense comme le soleil. Quant à l’effet de brume, il réduit le contraste et la saturation des couleurs sur de plus grandes surfaces de l’image. Ces deux effets sont particulièrement gênants lorsque l'image compte des sources lumineuses intenses, dans les scènes à plage dynamique étendue, lorsque la vitre avant est sale, ou si l'intérieur du système d'objectif est poussiéreux. L'installation d'une casquette de protection sur la caméra pourrait réduire à la fois les reflets et la diffusion atmosphérique. Les performances d'une caméra WDR, c'est-à-dire sa capacité à capturer et à restituer des scènes présentant une plage dynamique très élevée, resteront limitées par la lumière diffuse présente dans le système optique.
