Qualità e colore video

Questo articolo è molto importante quindi cercate di seguirlo con attenzione: sono tutti i concetti che servono per entrare nel complesso mondo della risoluzione, dei compressori per l’editing e della dimensione del file video.
Prima di iniziare definiamo il significato di alcuni termini:
Codec: un dispositivo hardware o software che comprime/decomprime un flusso di dati.
Codifica (encode): è l’azione che permette di creare un video, utilizzando un codec (es. Mpeg1/2).
Decodifica (decode): è l’azione che permette di visualizzare (sul monitor ad esempio) il video precedentemente codificato.
Tutte le schede di cattura utilizzano una qualche forma di compressione del filmato, questo perché altrimenti il video assumerebbe dimensioni enormi, anche per un uso professionale. Nel caso volessimo acquisire un filmato PAL a 768*576 ci occorrerebbero non meno di 100gb per un paio d’ore. Ecco il motivo per cui sono stati intrapresi studi che permettessero un risparmio di risorse in fase di cattura e di elaborazione del filmato.
Sostanzialmente le strade percorse per ottenere questi risultati sono due: lo studio delle capacità percettive dell’occhio umano e la creazione di algoritmi di compressione che, con una perdita più o meno grande di informazione, producessero un video quanto più possibile simile (durante la visione), a quello originale. Il fenomeno della perdita di informazione è detto lossy (anche distruttivo, viceversa lossless significa non-distruttivo), esistono diversi codec di compressione, tutti cercano di ottenere un giusto equilibrio tra qualità e risparmio di risorse. E’ palese che se l’acquisizione viene fatta con un codec, che predilige, l’esasperato risparmio di spazio su disco rigido, avremo risultati assai modesti. Quindi, il procedimento corretto per ottenere un buon filmato finale è: acquisire con il minimo di compressione consentito dalla nostra scheda, utilizzando il codec che sia meno lossy rispetto agli altri, montare se necessario il filmato e poi codificarlo in un formato con un miglior rapporto qualità/risparmio di spazio su hard disk.
Contrariamente a quanto si pensa, le schede Home che acquisiscono in MPEG2, non sono quelle da cui si ottengono i migliori risultati per l’editing, questo perché il codec MPEG2 è un formato di compressione a perdita di informazione; anche nel caso di compressioni di qualità, il video mpeg rimane sostanzialmente diverso dal video non compresso. Questo accade perché il fine di questo standard è quello di creare un video che nasconda gli artefatti della compressione, sfruttando quelli che sono i limiti percettivi dell’occhio umano. Per far questo nel video mpeg2 sono stati approfonditi alcuni studi riguardanti: la DCT (Discrete Cosine Transform), ridondanza temporale, la predizione di movimento, ed altri metodi che, vista la loro complessità, non saranno nemmeno nominati. In parole povere nel codec mpeg2 vengono distinti dei fotogrammi principali di riferimento (I-Frame) che devono essere considerati come dei fotogrammi chiave, sono, in pratica, delle immagini statiche (compresse) a partire dalle quali vengono costruiti i fotogrammi successivi e antecedenti. In questo gruppo di fotogrammi (B-Frame e P-Frame) sono memorizzati solo le variazioni di quelle parti del video che non sono presenti nei frames di riferimento (I-Frame). Per concludere nel video mpeg2 i frames vengono presi in gruppi di immagini (GOP, Group of Picture) quindi, se il video è molto compresso e ci sono pochi I-Frame, la qualità del montaggio ne risulterà compromessa.
In definitiva, nel caso di video mpeg2, la qualità dipenderà dal modo in cui il video è stato creato, ovvero dalle qualità intrinseche del software o hardware che effettuerà la codifica e dalla compressione utilizzata (non solo il bitrate massimo). Schede che soddisfano queste caratteristiche con elevati livelli qualitativi, superano abbondantemente il milione e mezzo delle vecchie lire, quindi: le schede All in wonder (tutte) che acquisiscono in mpeg2, non si avvicinano NEMMENO LONTANAMENTE alla qualità DVD o TV digitale.
Le schede di cattura via software che permettono la cattura in mpeg2, ottengono risultati assai modesti, perché, non avendo a disposizione la potenza di calcolo necessaria per codificare video in mpeg2 realtime (ci vorrebbe una CPU da 2Ghz almeno), usano, in fase di codifica, delle approssimazioni matematiche che penalizzano il video, creando, gia in fase di cattura, degli evidenti artefatti.
il codec Motion JPEG era, fino a poco tempo fa, l’unico codec usato in ambito professionale. In pratica in questo codec, la compressione avviene unicamente a livello di ogni singolo fotogramma, utilizzando l’algoritmo Jpeg. Il flusso video può arrivare a valori molto elevati: compressione 1,3:1 e 15mbyte al secondo. Vi assicuro che nel caso acquisiate da sorgenti non digitali, andare oltre non avrebbe senso (per esempio, una scheda semiprofessionale come la DC30+ ha una compressione minima di 3:1). La compressione Motion JPEG, consente una notevole qualità in fase di cattura, ed è quasi sicuramente utilizzabile dalla vostra scheda di cattura (schede con cattura via software o quelle con cattura hardware Mjpeg).
Chiariamo quello che, alla luce di queste informazioni, dovrebbe risultare ovvio e cioè che: ad una minore compressione, corrisponde una maggiore qualità del video. Purtroppo questa maggiore qualità richiede maggiore spazio su disco rigido.
La compressione video da applicare in fase di cattura è vincolata da 3 fattori:
1) Sorgente: è ovvio che, se catturate video da un videoregistratore VHS, è inutile acquisire a 768×576 con 6MB/Sec, vedremo meglio dopo il perché. Molto dipenderà anche se il video da catturare sia progressivo o interlacciato.
2) Spazio su disco: se avete poco spazio su hard disk, ad esempio 10 GB, dovrete rinunciare ad acquisire alla massima qualità, questo perché (nell’esempio della DC10+) potrete acquisire meno di 30 minuti di video. Vorrei sottolineare a tal proposito, che nel caso di fonti di buona qualità è inutile utilizzare compressioni troppo basse, che vanno invece usate con video di bassa qualità. Nel caso della DC10/30 una compressione di 4:1 o 5:1 è praticamente indistinguibile da una di 3,5:1 se la fonte è di qualità medio-alta.
3)  Flusso video: occorre una buona velocità nello scrivere i dati su hard disk. Se non avete almeno un HD con UDMA, difficilmente otterrete risultati accettabili alla risoluzione massima. Bisogna valutare anche che il flusso di dati che vengono memorizzati sul disco rigido, sia costante, senza  oscillazioni verso il basso, causa principale della perdita di frame. Questo fenomeno è chiamato dropped frame, ovvero il salto di alcuni frames che vengono ”ignorati” e quindi non memorizzati. Personalmente consiglio un disco rigido ATA66 di almeno 30gb con rotazione di 7.200 rpm.
Due concetti chiave: luminanza e crominanza
Luminanza: in una sequenza video, è il segnale che contiene informazioni relative alla luminosità (bianco/nero).
Crominanza: in una sequenza video, è il segnale che contiene le informazioni relative al colore (red/green/blue).
Nell’ambiente televisivo si fa riferimento allo spazio colore/luminosità chiamato Yuv, dove Y rappresenta la luminanza (l’intensità luminosa), mentre U e V (chiamati anche R-Y e B-Y) sono i canali che trasportano i colori.
Il sistema visivo umano riconosce meglio le variazioni spaziali di luminanza rispetto a quelle di crominanza. È quindi conveniente vista la banda limitata di cui disponiamo trasportare la luminanza in un canale e negli altri due l’informazione colore a cui è stata sottratta la luminanza. Come si sarà notato, nella crominanza non c’è il colore verde, abbiamo infatti R-Y(red) e B-Y(blue), questo accade perché Il 70% del segnale di luminanza è composto dal verde (fisiologia dell’occhio), quindi è conveniente basare i segnali colore sugli altri 2 primari.
In ambiente tecnico i livelli di campionamento (YUV) sono rappresentati da 3 cifre: in cui la prima rappresenta la luminanza Y, il secondo il colore rosso (U) e il terzo il colore blue (V).
Ecco le combinazione più usate e il loro significato:
a)  combinazione 4:4:4 indica che non è impiegato nessun sottocampionamento. Ai quattro blocchi di luminanza (la prima cifra) corrispondono quattro R-Y e quattro B-Y. Nessuna perdita di informazione.
b)  combinazione 4:2:2 indica che a quattro campioni Y corrispondono due R-Y e due B-Y. Buon compromesso tra qualità e compressione. (usato in ambito professionale).
c)  combinazione 4:1:1 indica che a quattro campioni Y corrispondono uno R-Y e uno B-Y. Usato nelle registrazioni amatoriali DV e nelle trasmissioni televisive.
d) combinazione 4:2:0 indica che a quattro campioni Y corrispondono uno R-Y e uno B-Y presi però a righe video alterne. Qualità simile a quella 4:1:1 ma maggiormente usata nel video PAL per motivi di qualità massima ottenibile.
Come si vede la prima cifra, quella relativa alla luminanza, non viene mai sottocampionata, questo perché, come stato detto precedentemente, la perdita di dettaglio del colore è meno percepibile rispetto a quella derivante dalla definizione della luminosità.

Una risposta a “Qualità e colore video

I commenti sono chiusi.