Wide dynamic range

ottobre, 2022

Sommario

Per una telecamera, le scene che contengono simultaneamente aree molto chiare e molto scure sono problematiche. Esempi tipici di scene ad ampio intervallo dinamico (Wide Dynamic Range, o WDR) sono le porte d'ingresso, le gallerie o i parcheggi sotterranei, dove si ha un notevole contrasto fra la luce esterna e gli interni più scuri. Sono altrettanto problematiche le scene all'aperto con luce solare diretta e ombre molto scure.

Sono stati sviluppati diversi metodi affinché le telecamere siano in grado di ricreare meglio l'intera scena. Nessuna tecnica è ottimale per tutte le scene o le situazioni e ogni metodo ha i suoi svantaggi, tra cui la comparsa di varie anomalie visive dette artefatti.

Axis offre diverse soluzioni con tecnologia WDR, di cui due per uso forense, che rivoluzionano notevolmente la rappresentazione visiva di scene difficili. La loro capacità di rendere visibili i dettagli nelle parti scure di una scena, senza sovraesporre le parti chiare, è ineguagliabile e offre immagini di straordinario valore forense.

Soluzioni WDR Axis:

  • Forensic WDR è la combinazione tra la doppia esposizione e un metodo di aumento del contrasto locale. Fornisce immagini ottimizzate per la massima utilizzabilità forense. Utilizzando algoritmi di elaborazione dell'immagine di ultima generazione, questa tecnologia riduce efficacemente il rumore e gli artefatti visibili. Forensic WDR è adatta anche alle scene con movimento e su telecamere a risoluzione ultra elevata.

  • WDR - Forensic Capture è la combinazione tra la doppia esposizione e un metodo di aumento del contrasto locale. Fornisce un'immagine ottimizzata per la massima utilizzabilità forense.

  • WDR - Dynamic Capture utilizza un metodo a doppia esposizione per unire immagini con tempi di esposizione diversi. L'intervallo dinamico è limitato dagli artefatti, dovuti per esempio al movimento e allo sfarfallio.

  • WDR - Dynamic Contrast sfrutta un metodo di aumento del contrasto, con un intervallo dinamico moderatamente limitato, ma con pochissimi artefatti. Poiché utilizza una sola esposizione, questa soluzione funziona bene nelle scene con molto movimento.

Alcune telecamere Axis utilizzano combinazioni non specificate di vari metodi per ampliare l'intervallo dinamico. Su queste telecamere, la soluzione WDR è adattata a ogni modello specifico ed è definita “WDR” sulle schede tecniche e in altre informazioni sul prodotto.

La capacità di intervallo dinamico della telecamera viene normalmente espressa con un valore in dB. Tuttavia, le prestazioni WDR effettive sono difficili da misurare e dipendono anche da altri fattori, come la complessità della scena, la quantità di movimento e le funzionalità di elaborazione dell'immagine della telecamera.

Axis dà priorità all'utilizzabilità forense e alla qualità d'immagine piuttosto che a un alto valore in dB. Pertanto, una telecamera Axis con un certo intervallo dinamico può benissimo superare una telecamera della concorrenza con un valore in dB superiore.

Introduzione

Tradizionalmente, le telecamere hanno problemi con le scene ad ampio intervallo dinamico, che presentano variazioni notevoli dei livelli di luce. Il presente documento descrive le cause tecniche che limitano l'intervallo dinamico di una telecamera, i metodi generali disponibili per ottenere buone prestazioni WDR e le soluzioni WDR Axis per un video che massimizzi il valore e l'utilizzabilità forense.

Scene ad ampio intervallo dinamico

L'intervallo dinamico indica la differenza tra i livelli di luce delle aree più chiare e più scure di una scena o di un'immagine. Una scena ad ampio intervallo dinamico, dunque, contiene simultaneamente aree molto chiare e molto scure. Esempi tipici nella sorveglianza:

  • Porte d'ingresso con luce diurna all'esterno e ambiente più scuro all'interno.

  • Parcheggi sotterranei o gallerie, con luce diurna all'esterno e scarsa illuminazione all'interno.

  • Aree all'aperto con luce solare diretta e ombre scure.

  • Palazzine di uffici o centri commerciali con luci riflesse da finestre/vetrine.

Il seguente è un esempio di scena ad ampio intervallo dinamico ripresa con una telecamera di sorveglianza senza funzionalità WDR.

Tipica scena di sorveglianza ad ampio intervallo dinamico – parcheggio sotterraneo con ingresso. Le due immagini sono state acquisite utilizzando tempi di esposizione diversi, minore per l'immagine a sinistra e maggiore per quella a destra.

A seconda del tempo di esposizione utilizzato, la telecamera può rendere visibile solo l'ingresso e l'esterno (più luminosi) o l'interno del garage (più scuro). Una telecamera senza WDR non è in grado di acquisire correttamente tutte le aree della scena in una sola immagine.

Nelle seguenti figure, nell'immagine acquisita con un tempo di esposizione breve sono stati inseriti dettagli dell'immagine con tempo di esposizione lungo, e viceversa. È evidente che una telecamera senza WDR non riesce a cogliere particolari importanti.

La stessa scena illustrata sopra. L'immagine a sinistra mostra i dettagli persi con un tempo di esposizione breve. L'immagine a destra mostra i dettagli persi con un tempo di esposizione lungo.

Per poter cogliere tutti i dettagli della scena, occorre una telecamera di sorveglianza dotata di WDR. In una sola immagine, la telecamera riesce ad acquisire entrambi gli estremi, ovvero mostra chiaramente i dettagli sia dell'ingresso illuminato che delle ombre scure all'interno del parcheggio. Senza funzionalità WDR, per contro, l'intervallo dinamico è limitato da diversi fattori.

Limitazioni fisiche dell'intervallo dinamico di una telecamera

I motivi principali per cui l'intervallo dinamico di una telecamera è limitato dipendono dalla quantità di luce acquisita dal sensore, dai metodi di elaborazione delle immagini e dalla natura della luce stessa. In termini più pratici, l'intervallo dinamico dipende dalle dimensioni dei pixel, dal tempo di esposizione, dal rumore e dalla profondità di bit.

Dimensione dei pixel e tempo di esposizione

La luce è composta da fasci discreti di energia, detti fotoni. Se l'intensità luminosa di una scena aumenta, la telecamera è colpita da un maggior numero di fotoni. Tuttavia, una telecamera (o meglio il suo sensore d'immagine) è in grado di rilevare solo un numero limitato di fotoni per intervallo di esposizione.

Il sensore d'immagine è composto da milioni di punti fotosensibili, detti pixel, che convertono i fotoni in elettroni. Mentre la telecamera forma un'immagine, si misura il numero di elettroni per ogni pixel, fornendo informazioni sui livelli luminosi nelle varie parti della scena acquisita.

Ogni pixel ha dimensioni prestabilite e può contenere solo un determinato numero di elettroni prima di saturarsi. Su una moderna telecamera, l'ideale sarebbe aumentare al massimo il numero di pixel. Tuttavia, per motivi di costo, le dimensioni totali del sensore devono essere contenute, quindi sono limitate anche le dimensioni dei pixel.

In una scena ad ampio intervallo dinamico, un tempo di esposizione lungo saturerà i pixel nelle parti più chiare dell'immagine. Riducendo il tempo di esposizione e acquisendo fotoni per un periodo più breve, è possibile evitare l'eccesso di fotoni nelle parti più chiare. Tuttavia, con un tempo di esposizione più breve, solo pochissimi fotoni verranno acquisiti nelle aree più scure. A causa delle caratteristiche delle particelle di luce e di un fenomeno detto “photon shot noise“ (rumore granulare), queste aree dell'immagine risulteranno visibilmente disturbate. Il tempo corretto di esposizione per un pixel è quello in cui si ha il massimo rapporto segnale/rumore (SNR) e, pertanto, è minore per i pixel nelle parti più chiare dell'immagine rispetto a quelli delle aree più scure.

Rumore e profondità di bit

A livello di pixel, l'intervallo dinamico è il rapporto tra il segnale massimo e il rumore di fondo. Il rumore di fondo è l'intensità di segnale minima percepibile; si trova al di sopra della somma delle intensità di tutte le sorgenti di rumore. Parte del rumore è causata da imperfezioni del convertitore analogico-digitale, che conteggia gli elettroni e genera un valore per pixel. Un altro tipo di rumore è il “photon shot noise“ (rumore granulare), impossibile da evitare anche con apparecchiature perfette. Tutto il rumore origina valori dei pixel che non rispecchiano le intensità della scena effettiva.

La profondità di bit indica il numero di bit utilizzati per acquisire le informazioni in un pixel, determinando il possibile numero di livelli luminosi che possono essere rilevati. Normalmente, le telecamere di sicurezza hanno una profondità di 10 bit. In teoria, una profondità di bit maggiore aumenterebbe i livelli luminosi rilevabili. Nella realtà, però, la qualità d'immagine aumenta solo se i pixel del sensore sono abbastanza grandi e il rumore è sufficientemente basso. Se i dati del sensore contengono rumore, non si hanno benefici aumentando il numero di bit.

Visualizzazione dell'immagine

Riguardo la profondità di bit, è altrettanto importante ricordare che i monitor su cui gli operatori di sicurezza guardano i video di sorveglianza hanno una profondità di soli 8 bit per canale di colore. Questo significa che l'algoritmo di traduzione dai 10 bit del sensore agli 8 bit del monitor è fondamentale per avere buone prestazioni WDR.

Metodi generali di ampliamento dell'intervallo dinamico di una telecamera

Per aggirare i limiti di intervallo dinamico delle telecamere e avere immagini WDR, sono stati sviluppati diversi metodi, che talvolta vengono combinati per ottenere un miglior risultato. Da solo, nessun metodo è ottimale per tutte le applicazioni, poiché ognuno causa diverse anomalie visive dette artefatti. Gli artefatti non visibili in un'applicazione possono essere molto problematici in un'altra. Per la descrizione degli artefatti più frequenti, leggere il capitolo 7.

Uso di esposizioni doppie o multiple

Utilizzando un algoritmo di fusione, è possibile combinare più immagini acquisite con tempi di esposizione diversi e formarne una sola. Si tratta del metodo più comune per ampliare l'intervallo dinamico. Tuttavia, poiché l'acquisizione è sequenziale, questo metodo provoca artefatti dovuti al movimento nella scena. Normalmente, le sorgenti luminose intermittenti e i rapidi movimenti possono essere problematici, perché gli oggetti possono muoversi tra le varie acquisizioni. Anche l'elaborazione dell'immagine può causare rumore a bande. Dunque, gli artefatti includono:

  • Sfarfallio

  • Sfocatura da movimento e ghosting

  • Rumore

Uso di pixel a sensibilità doppia o multipla

Con questo metodo, la telecamera utilizza un sensore di immagine che contiene due o più tipi di pixel con sensibilità luminose diverse. Pertanto, una sola esposizione può essenzialmente creare due immagini (una più chiara e una più scura) per ogni serie di pixel. L'immagine WDR finale viene creata combinando queste immagini. Normalmente si applicano restrizioni alla differenza di sensibilità tra i pixel adiacenti (per esempio un rapporto fisso di sensibilità), limitando l'intervallo dinamico che può essere ottenuto con questo metodo. Grazie all'esposizione simultanea, si evitano gli artefatti legati al movimento e allo sfarfallio, ma al loro posto subentrano altri tipi di artefatti. Ad esempio, la risoluzione minore, dovuta al minor numero di pixel richiesti per formare l'immagine con questo metodo, può causare effetti moiré e a scalini nell'immagine. Inoltre, la combinazione delle due serie di pixel può risultare complicata e, in alcuni casi, provocare altri problemi. Artefatti tipici:

  • Effetti moiré e a scalini

  • Rumore

  • Discrepanze di colore

  • Sfocatura

Aumento del contrasto

Si tratta di un metodo digitale che consiste nell'utilizzare un'immagine sottoesposta e schiarire digitalmente le aree più scure. Questo metodo non amplia realmente l'intervallo dinamico acquisito, ma aumenta le possibilità di rilevamento nell'immagine finale, soprattutto in aree altrimenti sovraesposte. Tale metodo è molto utile per le scene con intervallo dinamico limitato e molto movimento. Fra gli artefatti più comuni:

  • Rumore a bande nelle aree più scure

  • Scarsità di livelli di grigio in alcune aree

  • Colori innaturali

Aumento del contrasto locale

Tradizionalmente, le telecamere utilizzano metodi globali per regolare la curva tonale; ovvero, si utilizza la stessa trasformata per tutti i pixel dell'immagine. È anche possibile utilizzare un metodo locale, regolando la curva tonale in modo diverso nelle varie aree del sensore. Questo metodo non amplia realmente l'intervallo dinamico acquisito, ma rappresenta un efficace strumento di visualizzazione, perché modera il contrasto e crea un aspetto migliore su uno schermo a basso intervallo dinamico. Gli artefatti più comuni dipendono dall'intensità di utilizzo di questo metodo e possono includere:

  • Ghosting

  • Cartooning

  • Mancanza di contrasto

  • Colori eccessivi

Immagini WDR nelle telecamere Axis

Axis offre diverse soluzioni per le immagini WDR, combinando alcuni metodi generali descritti al capitolo precedente con un'elaborazione dell'immagine e procedure all'avanguardia per ridurre gli artefatti.

Prestazioni WDR descritte da Axis

Axis segue alcuni criteri fondamentali per classificare le soluzioni WDR. Per determinare quale soluzione sia adatta a un caso di sorveglianza specifico, questi criteri devono essere valutati in modo diverso in base alle circostanze. La valutazione dei criteri si basa sull'uso reale e su un giudizio soggettivo.

Criteri utilizzati per determinare le prestazioni WDR.
CriterioSignificato
MovimentoCon che efficacia vengono evitati gli artefatti legati al movimento e allo sfarfallio?
PortataIntervallo dinamico pratico, espresso con il valore in dB.
AspettoCon che qualità viene riprodotta l'immagine in una scena difficile?

Il criterio Movimento esprime la capacità della soluzione di acquisire una scena in movimento senza introdurre artefatti dovuti alla tecnica di campionamento. Ai fini di questo criterio, il trattamento dello sfarfallio è un fattore importante; un altro è evitare gli artefatti dovuti alle fusioni.

Il criterio Portata esprime l'ampiezza della differenza tra la parte più chiara e quella più scura dell'immagine pur mantenendo l'utilizzabilità dell'immagine nella sorveglianza.

Il criterio Aspetto esprime la capacità della soluzione di riprodurre le condizioni di luminosità problematiche, producendo comunque un'immagine visionabile sui monitor del personale di sicurezza. L'obiettivo non è riprodurre la scena il più fedelmente possibile, perché verrebbero nascosti dettagli allo spettatore.

Soluzioni WDR Axis

L'intervallo dinamico di una telecamera viene solitamente specificato con un valore in dB, relativo al criterio Portata visto al capitolo precedente. Tuttavia, per garantire utilizzabilità e dettagli nelle comuni scene di sorveglianza, le soluzioni WDR Axis danno priorità ai criteri di movimento e aspetto anziché alla portata. Questa priorità significa che le telecamere Axis possono offrire un intervallo dinamico superiore a quello espresso semplicemente in dB. Considerando gli artefatti ridotti e la maggiore utilizzabilità, una telecamera Axis con un valore in dB inferiore può benissimo superare una telecamera con un valore in dB superiore prodotta da un'altra azienda. Per maggiori dettagli sui valori in dB, vedere il capitolo 6.

Di seguito vengono elencate le soluzioni Axis WDR.

  • Forensic WDR è la combinazione tra la doppia esposizione e un metodo di aumento del contrasto locale. Fornisce immagini ottimizzate per la massima utilizzabilità forense. Utilizzando algoritmi di elaborazione dell'immagine di ultima generazione, questa tecnologia riduce efficacemente il rumore e gli artefatti visibili. Forensic WDR è adatta anche alle scene con movimento e su telecamere a risoluzione ultra elevata.

  • WDR - Forensic Capture è la combinazione tra la doppia esposizione e un metodo di aumento del contrasto locale. Fornisce immagini ottimizzate per la massima utilizzabilità forense.

  • WDR - Dynamic Capture utilizza un metodo a doppia esposizione per unire immagini con tempi di esposizione diversi. L'intervallo dinamico è limitato dagli artefatti, dovuti per esempio al movimento e allo sfarfallio.

  • WDR - Dynamic Contrast sfrutta un metodo di aumento del contrasto, con un intervallo dinamico moderatamente limitato, ma con pochissimi artefatti. Poiché utilizza una sola esposizione, questa soluzione funziona bene nelle scene con molto movimento.

Alcune telecamere Axis utilizzano combinazioni non specificate di vari metodi per ampliare l'intervallo dinamico. Su queste telecamere, la soluzione WDR è adattata a ogni modello specifico ed è definita “WDR” nei documenti informativi sul prodotto.

La seguente tabella mostra la classificazione delle soluzioni WDR Axis secondo i criteri prestazionali.

Soluzioni WDR Axis classificate in base ai criteri di movimento, portata e aspetto.
Soluzione WDRMovimento

Con che efficacia vengono evitati gli artefatti legati al movimento e allo sfarfallio?

Portata

Intervallo dinamico pratico, espresso con il valore in dB.

Aspetto

Con che qualità viene riprodotta l'immagine in una scena difficile?

Forensic WDR+++++++++++
WDR - Forensic Capture++++++++
WDR - Dynamic Capture++++
WDR – Dynamic Contrast+++++--

Secondo la classificazione, la soluzione che generalmente garantisce migliori prestazioni è Forensic WDR, superiore nei criteri Movimento e Aspetto in confronto a WDR - Forensic Capture. Tuttavia, entrambe le soluzioni forensi offrono miglioramenti rivoluzionari nella rappresentazione di scene difficili. La loro capacità di rendere visibili i dettagli nelle parti scure di una scena, senza sovraesporre le parti chiare, è ineguagliabile e offre immagini di straordinario valore forense.

Poiché lo scopo di queste soluzioni è dare priorità all'utilizzabilità forense, tutte le ombre vengono schiarite e tutti i dettagli vengono enfatizzati, conferendo all'immagine un aspetto molto diverso da quello a cui siamo abituati (ad esempio in televisione). Con una telecamera Forensic WDR, l'intervallo dinamico della scena è compresso a un valore nettamente inferiore, senza perdere dettagli. Questo ottimizza il video per la visualizzazione, senza affaticare la vista di chi guarda le immagini in diretta e le registrazioni in una centrale di sicurezza.

La seguente figura confronta una scena acquisita con due telecamere diverse: una telecamera senza funzionalità WDR (a sinistra) e una telecamera Axis con Forensic WDR (a destra). Con Forensic WDR, i dettagli sono chiari e visibili sia nell'ambiente interno retroilluminato che all'esterno.

Scena interna con forte retroilluminazione. Confronto tra una telecamera senza funzionalità WDR (a sinistra) e una telecamera Axis con Forensic WDR (a destra).

Capacità di intervallo dinamico in dB

La capacità di intervallo dinamico di una telecamera viene normalmente specificata con un valore in dB, relativo al criterio Aspetto descritto al capitolo 5.

Il valore in dB misura il rapporto tra la radianza dell'oggetto più chiaro e quella dell'oggetto più scuro che la telecamera può acquisire. Se il rapporto è 1000:1, il valore in dB calcolato è pari a 60, ovvero il logaritmo del rapporto (in questo caso 3) moltiplicato per 20.

Il livello rilevabile minimo può essere definito come il rumore di fondo del pixel del sensore, poiché ogni segnale al di sotto di questo livello viene sovrastato dal rumore. Con questa definizione, un buon sensore di immagine può normalmente raggiungere un intervallo dinamico di circa 70 dB. Utilizzando le tecniche WDR è possibile, senza alterare il valore in dB effettivo della telecamera, aumentare l'intervallo dinamico pratico, o la portata.

Tuttavia, né il valore in dB né la portata esprimono la capacità massima di intervallo dinamico di una telecamera. La qualità di un'immagine WDR dipende anche dai metodi WDR utilizzati, dall'eventuale rimanenza di artefatti visibili e dalla qualità dell'elaborazione dell'immagine. Alcuni di questi fattori sono riassunti dai criteri Aspetto e Movimento descritti al capitolo 5.

L'immagine a destra è stata acquisita con una telecamera che ha un valore in dB inferiore a quella dell'immagine a sinistra. In questa scena ad ampio intervallo dinamico, la telecamera con il valore dB inferiore produce chiaramente un'immagine più adatta alla videosorveglianza, contrariamente a quanto ci si potrebbe aspettare. La telecamera con un valore in dB inferiore ha evidentemente altre caratteristiche, come una migliore elaborazione delle immagini, che aumentano la sua capacità WDR.

Interno retroilluminato ripreso da telecamere con valori in dB diversi. Contrariamente a quanto ci si potrebbe aspettare, l'immagine a destra è stata acquisita con una telecamera che ha un valore in dB inferiore a quella dell'immagine a sinistra.

Artefatti nelle immagini WDR

Questo capitolo descrive alcuni degli artefatti visivi più comuni e le loro cause.

  • Sfocatura da movimento
    La sfocatura da movimento può verificarsi quando l'immagine registrata cambia durante un singolo frame, o per un rapido movimento nella scena o perché il tempo di esposizione è semplicemente troppo lungo.

  • Ghosting
    Quando si utilizzano più esposizioni per creare un'immagine, un oggetto in movimento potrebbe essere acquisito in punti diversi. Questo fenomeno, già di per sé, può conferire un aspetto “fantasma“ all'immagine, che può diventare ancora più indistinta, perché la sfocatura da movimento sarà diversa per gli oggetti di luminosità diversa. Ad esempio, un oggetto in movimento apparirà più confuso nelle parti più scure che in quelle più chiare.

  • Artefatti causati dallo sfarfallio
    Gli artefatti causati da una luce intermittente possono comparire in tutti i tipi di telecamere. Poiché di solito si utilizza un'illuminazione costante, le sorgenti a luce modulata, come quelle fluorescenti, sono problematiche. A seconda del tipo di telecamera, potrebbero comparire artefatti come strisce o pulsazioni visibili.

  • Rumore a bande
    In un'immagine è spesso tollerabile una certa quantità di rumore distribuito casualmente. Nell'elaborazione digitale, tuttavia, le difficoltà tecniche nella lettura dei valori dei pixel possono causare la comparsa di linee di rumore visibile.

  • Cartooning e over sharpening
    Un'immagine WDR può essere talmente ricca di tonalità riprodotte e dettagli enfatizzati da essere difficilmente visualizzabile su un monitor standard. Di conseguenza, l'immagine visualizzata può avere uno stile innaturale e simile a un cartone animato.

  • Discrepanze di colore
    I metodi che non trattano tutti i pixel allo stesso modo possono causare artefatti nella riproduzione del colore, visualizzando ad esempio colori errati o troppi colori.

  • Purple fringing
    Il purple fringing, o blue fringing, è l'effetto che si manifesta con un alone sfocato di colore variabile vicino i bordi dell'immagine a causa dell'aberrazione cromatica dell'obiettivo. L'aberrazione cromatica si ha quando i diversi colori della luce non vengono rifratti equamente nell'obiettivo e risultano leggermente spostati o non a fuoco sul sensore. In genere, questo effetto è più marcato vicino all'estremità del sensore. Le telecamere con WDR sono più sensibili alle aberrazioni cromatiche rispetto a quelle senza WDR, perché le parti scure dell'immagine sono più soggette a mappatura tonale.

  • Riflessi e annebbiamenti sull'obiettivo
    Quando la luce penetra in un gruppo ottico, una parte non viene acquisita correttamente e viene dispersa o riflessa nel sistema. Parte di questa luce viene intercettata da schermi interni, che hanno la funzione di ridurre i riflessi, ma una parte raggiunge il sensore d'immagine in un punto indesiderato e causa vari tipi di artefatti. L'artefatto più comune è il cosiddetto “lens flare“, visibile nella maggior parte delle telecamere rivolte verso una sorgente luminosa forte come il sole. Un altro effetto, detto nebbia o “haze“, riduce il contrasto e la saturazione del colore nelle parti più grandi dell'immagine. Entrambi gli effetti sono particolarmente fastidiosi in presenza di sorgenti luminose forti nell'immagine, scene ad ampio intervallo dinamico, vetri sporchi o polvere nel gruppo ottico. Installando un parapioggia sulla telecamera, è possibile ridurre sia i riflessi che l'annebbiamento, ma le telecamere WDR ad ampia copertura saranno comunque limitate dalla luce dispersa nel gruppo ottico.