compressione

Come funzionano gli Algoritmi di Compressione dati (ZIP. JPEG, MP3)

Siamo nel 1995. L’ingegnere tedesco Karlheinz Brandenburg comprime la canzone Tom’s Diner di Suzanne Vega in formato MP3.  È la prima canzone nella storia a diventare un file MP3. La canzone è stata scelta come traccia di prova di una canzone compressa, grazie alla semplicità del brano e alla voce cristallina della cantante statunitense. Il ritmo del brano ha aiutato nella codifica del file. La compressione dei dati serve a ridurre di dimensione un determinato file, occupando meno spazio nella memoria. In effetti, tutti noi sappiamo come comprimere un file. Però ti starai chiedendo come funzionano gli algoritmi di compressione dati, giusto? Bene, continua a leggere e scoprirai i meccanismi segreti dei più noti algoritmi di compressione, come i file ZIP, JPEG e MP3.

 

Cos’è la compressione dei dati

Detto in maniera semplice, per compressione dei dati si intende la riduzione delle informazioni non essenziali in un file. In tal modo il file si riduce di dimensione e perciò occuperà meno spazio nella memoria di un dispositivo. In generale, possiamo dividere gli algoritmi di compressione dati in due categorie: la compressione senza perdita dei dati e la compressione con perdita dei dati.

compressione Ah, la compressione! Un vero toccasana per le dimensioni dei file informatici. Ma come funziona? Grazie ai suoi superalgoritmi, riesce a eliminare tutte quelle informazioni ridondanti che non servono a nulla e che appesantiscono il file. E così, dopo questo miracoloso processo, si ottiene un nuovo file dall’aspetto snello e slanciato, con dimensioni ridotte e pronte per essere scaricate in un battibaleno. Ma non pensare che la compressione sia solo una questione di dimensioni, no no! La qualità è fondamentale, eccome se lo è! Ci sono due modi di comprimere i file: il primo, chiamato “lossless”, mantiene tutte le informazioni originali del file, senza perdere nemmeno una virgola. Il secondo, invece, il “lossy”, è un po’ più sbarazzino e taglia via tutto ciò che non è strettamente necessario, per ridurre le dimensioni del file senza perdere di vista la qualità.Iniziamo con il formato ZIP.

 

Il formato ZIP: come funziona

Il formato ZIP può essere considerato loseless, cioè il file non perde alcuna informazione durante il processo di compressione. Tuttavia, è consigliabile non comprimere e decomprimere ripetutamente un file o una cartella, o si rischia di perdere qualche informazione. Come funziona il formato ZIP? E la sua sigla per cosa sta?

compressione Secondo il creatore del formato, Phil Katz, la sigla ZIP sta per “Zona di interoperabilità di compressione“. Katz era un programmatore che voleva concepire un modo efficiente per archiviare e trasmettere grandi quantità di dati in un periodo storico in cui i modem erano ancora lenti. Stiamo parlando degli anni ‘80, dopotutto. I dati compressi vengono archiviati in un file Zip, che funge come una sorta di contenitore magico. Rimpicciolisce i file al suo interno e li riporta alle loro originali dimensioni quando bisogna estrarli. Durante il processo di compressione, i file non perdono informazioni. Il formato ZIP supporta anche la crittografia dei dati, consentendo agli utenti di proteggere i loro file con una password.

Entriamo di più nei dettagli tecnici. Immagina che devi mettere in una valigia una marea di vestiti. L’insieme dei vestiti pesa 100 chili, ma magicamente all’interno della valigia peseranno 10 chili. Ecco, la compressione dei dati zip funziona in maniera analoga. Invece dei vestiti, ci sono dei file da mettere in una cartella zip. Per farlo il software usa un algoritmo, cioè una serie di istruzioni, per comprimere i file e farli diventare piccini piccini. Ma come fa? Elimina le informazioni superflue. L’algoritmo di compressione infatti cerca di individuare se ci sono parti dei file che si ripetono o che comunque non sono importanti. Dunque le elimina durante il processo, oppure le sostituisce con informazioni più corte.

Immagina di avere un file con la scritta “AAAAAABBBBBBCCCCC“. L’algoritmo ZIP può capire che ci sono 6 lettere A, 6 lettere B e 5 lettere C, e invece di scrivere tutto così lungo, può scrivere “A6B6C5”. In questo modo il file diventa più piccolo, ma quando lo apri la scritta sarà comunque uguale.

Occhio che il formato ZIP non può compiere miracoli. Provare a comprimere file di per sé già compressi, come MP3 e JPEG, non servirà a molto. Se tu lavori con file video e immagini, dunque, potrebbe non essere la scelta migliore.

 

Il formato MP3: come funziona

In questo caso si tratta di una compressione dati lossy, ovvero si perdono informazioni. Il codec MP3 serve a ridurre le dimensioni dei file audio mantenendo una buona qualità del suono. Cosa accade al file audio durante il processo di compressione? Ad esempio da WAV a MP3?

compressione

Inizialmente il codec MP3 analizza il segnale audio in ingresso per identificare le varie frequenze presenti nel suono, cioè le varie note e suoni che si sentono nella canzone. Poi, suddivide l’ampiezza del suono in una serie di valori predefiniti, in modo da rappresentare il suono con meno informazioni e occupare meno spazio. Poi il formato MP3 cosa fa? Divide il suono in diverse bande di frequenza, cosicché il software possa rimuovere alcune informazioni ridondanti presenti nel suono, cioè che non fanno particolare differenza per l’udito umano. Il processo si conclude con l’impostazione di un bitrate: cioè la quantità di dati utilizzati per rappresentare il suono. Più alto è il bitrate, minore sarà la compressione dei dati. Viceversa, più basso è il bitrate, maggiore sarà la compressione, causando una perdita significativa della qualità audio.

In generale, un buon compromesso tra qualità del suono e dimensione del file è rappresentato da un bit rate di 192 Kps, che consente di ottenere brani di qualità molto simile al CD. Tuttavia, per percepire la differenza tra un brano MP3 a 192 Kps e un CD, è necessario utilizzare cuffie di ottima qualità o un impianto hi-fi. Se invece si desidera una qualità ancora migliore, è consigliabile optare per i file FLAC, un codec audio che utilizza una compressione dei dati lossless, ovvero senza perdita di qualità.

Detto ciò, il formato MP3 ha rivoluzionato per sempre l’industria musicale, permettendo di scaricare e condividere la musica in formato digitale tramite il web. La naturale conseguenza è la nascita di alcuni servizi, come Spotify o Apple Music. Per chi necessita di spazio libero nell’hard disk, il formato MP3 rimane la scelta più saggia.

 

Il formato JPEG: come funziona

Anche il formato JPEG prevede la perdita di alcune informazioni, in maniera simile al formato MP3. La differenza è che qui si tratta di immagini. Il formato JPEG è stato standardizzato nel 1992 ed è diventato uno dei formati di file immagine più popolari e diffusi al mondo. Cosa capita all’immagine quando viene compressa in JPEG?

Quando un’immagine viene compressa, il software elimina alcune informazioni non essenziali per l’occhio umano. La nostra percezione dell’immagine rimane quasi inalterata, in sostanza. Chiaro, più la compressione è massiccia, più sarà visibile all’occhio umano, notando sfocature e immagini pixellate. Poiché il formato JPEG è lossy, ciò implica che ogniqualvolta salvi un’immagine in formato JPEG, viene continuamente compressa, perdendo ulteriori dettagli. Durante il processo di compressione del formato JPEG, vengono eliminati alcuni pixel dall’immagine e poi durante la decompressione vengono ricostruiti in modo approssimativo rispetto all’originale. Gli algoritmi di compressione JPEG eliminano i pixel meno importanti o ridondanti come quelli con colori simili, in questo modo si riducono le informazioni dell’immagine e si diminuisce lo spazio necessario per archiviarla.

Se cerchi un formato loseless dell’immagine, bisogna optare per il PNG (portable network graphics). Peserà di più ma mantiene la qualità dell’immagine. Inoltre, il formato PNG supporta la trasparenza, il che significa che è possibile creare immagini con sfondi trasparenti che possono essere sovrapposte ad altri elementi senza la necessità di creare un bordo bianco intorno all’immagine.

In generale, il formato JPEG è consigliato per le immagini fotografiche e le immagini con una grande quantità di dettagli. Se sei un fotografo, sai cos’è il formato RAW. Purtroppo pesano e anche parecchio, per questo conviene convertile in formato JPEG. Le immagini vengono memorizzate in 8 bit. È innegabile che i file RAW offrano una qualità superiore grazie alla quantità di informazioni che contengono. La gamma dinamica è notevolmente ampia e il formato RAW consente di apportare correzioni più sostanziali. Tra l’altro, può rappresentare una vera e propria ancora di salvezza per correggere gli errori commessi durante lo scatto. La flessibilità di un file RAW è assoluta e non può essere comparata con quella di un file Jpeg. Il motivo è che un file RAW è come una tela bianca sulla quale è possibile applicare qualsiasi modifica o correzione ritenuta opportuna senza compromettere la qualità dell’immagine.

Insomma, tutto dipende dalle tue esigenze!

E questo è tutto per quanto riguarda gli algoritmi di compressione dati. La loro utilità è indiscutibile. Immagina un mondo digitale senza compressione dei dati… spiacevole, vero? Se ti è piaciuto questo articolo, lo staff di Inline Style ti invita a condividere il sapere tecnologico. Ci aiuti a crescere e a fare informazione. Grazie e alla prossima!

COMMENTI