La compressione del segnale video

L’occhio umano è molto più sensibile alla luce che al colore, per questo motivo i codec di compressione (H264, ProRes, MPEG…) riducono la componente cromatica dell’immagine molto più di quella luminosa.

Ecco illustrato come funziona il sottocampionamento della crominanza:

Il sottocampionamento della crominanza

Ovviamente questo è un esempio estremo, è improbabile che un’immagine contenga 8 pixel adiacenti di colore così diverso, tuttavia è evidente come già un codec 4:2:2 sia in grado di mantenere molte più informazioni di un codec 4:2:0.

La profondità colore o bit depth, indicata in bit per canale, identifica il numero di colori che un codec è in grado di riprodurre. Dal momento che nel sistema binario utilizzato per la computazione digitale ogni bit può essere 0 o 1, il numero totale dei colori riproducibili da una determinata profondità colore è dato da 2 elevato alla somma dei bit relativi a ognuno dei tre canali RGB. Quindi:

I codec 8 bit possono produrre 224 colori, ossia 16 milioni di colori

I codec 10 bit possono produrre 230 colori, ossia 1 miliardo di colori

8 e 10 sono i bit per canale a disposizione del codec, 2 è il numero dei possibili valori di ogni bit, che come detto sono ristretti a 0 e 1, 24 e 30 sono rispettivamente la somma di 8+8+8 e 10+10+10, ossia la somma dei bit relativi a ognuno dei tre canali RGB.

Anche qui la differenza è enorme. 8 bit sono spesso insufficienti per riprodurre tutte le sfumature tonali acquisite dal sensore, lo si nota in particolare nei gradienti più ricchi, come nei cieli, che spesso presentano problemi di banding, ossia transizioni nette tra un colore e l’altro. Una profondità colore di 10 bit è  considerata più che sufficiente perché un video Log possa riprodurre la realtà in maniera fedele.

Nei file RAW la quantità d’informazioni è solitamente distribuita in progressione lineare proporzionalmente al livello di luminosità dell’immagine acquisita. Per questo motivo i file RAW richiedono profondità colore molto elevate (almeno 12 bit) per offrire una qualità d’immagine sufficiente nelle ombre.

Log vs RAW

Dal momento che sia nei file RAW che nei file video la maggior parte delle informazioni è riservata alle alteluci, in digitale si tende spesso a sovraesporre le immagini (o come si dice in gergo fotografico a esporre a destra, un’espressione legata alla rappresentazione grafica dell’esposimetro all’interno delle camere, che indica la sovraesposizione appunto sulla destra) prevedendo di effettuare un pull down, ossia di scurire le immagini in fase di color correction. Operando in questo modo è importante far attenzione al livello di sovraesposizione affinché mezzitoni e alteluci non si spostino eccessivamente verso l’alto; è quindi cruciale conoscere a fondo i limiti del sensore in uso.

Un’altra caratteristica della compressione video è il bitrate, che viene sempre indicato come bitrate al secondo (25 Mb/sec, 400 Mb/sec etc.) e identifica il numero di bit al secondo utilizzati dal codec. In relazione a uno stesso codec, un bitrate più alto produce immagini meno compresse e di migliore qualità rispetto a un bitrate più basso. Ovviamente, più alto è il bitrate e maggiori sono le dimensioni del file prodotto.

L’ultimo fattore fondamentale della compressione video è l’efficienza del codec. A parità di bitrate, profondità colore e sottocampionamento della crominanza, un codec più efficiente può produrre immagini decisamente migliori rispetto a un codec meno efficiente. I codec più utilizzati a livello professionale sono il ProRes della Apple e il DNxHD della AVID.

Alla luce di tutto quanto sopra è palese il motivo per cui nelle videocamere professionali non siano presenti codec con compressione superiore al 4:2:2 10 bit.

Un’ultima considerazione riguarda la risoluzione. Più è alta, più spazio in termini di pixel viene messo a disposizione del codec per piazzare sfumature colore. Per questo motivo può accadere che un file 4K a 8 bit produca file più ricchi in termini tonali rispetto a un 2K a 10 bit. Non di rado, ad esempio, le catch light appaiono più naturali nei file 4K 4:2:0 8 bit rispetto a come vengono riprodotte nei file FullHD 4:2:2 10 bit, dove spesso sono descritte da una manciata di pixel e non presentano transizioni morbide verso il colore dell’iride.