Verlustbehaftet verlustfrei: lossyWAV

MP3 ist kein Allzweckformat

Das MP3-Format mag zwar für die meisten Fälle ausreichen, aber es ist wie auch JPEG oder MPEG ein reines Endanwenderformat, das sich nicht sonderlich gut zur Weiterverarbeitung eignet. Mit Weiterverarbeitung ist im Grunde alles gemeint, was den Klang hörbar verändert, wie z.B. das Anwenden eines Equalizers oder (wie in meinem Fall) die Anpassung für das Hören mit Kopfhörern.

Das Problem des Formats beruht in einem solchen Fall darauf, dass die Artefakte, die durch Maskierung verborgen werden, durch starke Veränderung des Materials “demaskiert” werden können und somit hörbar werden.

Dies ist ein signifikanter Nachteil gegenüber einem verlustfreien Format, wie es z.B. eine Audio-CD verwendet. Die Bezeichnung “CD-Qualität” ist bei Formaten wie MP3 also eher irreführend, da die Qualität nur unter Normalbedingungen (also ohne Nachbearbeitung) als der einer CD ebenbürtig wahrgenommen wird, es aber objektiv betrachtet nicht ist. Diese Formate sind extrem an das menschliche Gehör angepasst und können nur durch psychoakustische “Tricks” bei der erzielten Datenrate eine wahrgenommene CD-Qualität erreichen. Bei einer nachträglichen Veränderung des Materials wird dann diese Feinabstimmung auf das menschliche Gehör durcheinander gebracht und die versteckten (aber stets vorhandenen) Artefakte können hörbar werden.

Die Alternative

Zunächst lautet die Alternative zu diesem Problem verlustfreie Kompression. Diese hat den Vorteil, dass sie (wie der Name schon sagt) verlustfrei und daher identisch zum Original ist. Mit solchen Verfahren lassen sich allerdings nur recht hohe Datenraten erzielen, die im Schnitt die Datenrate im Vergleich zum Original halbieren, was bei CD-Audio-Material so um 700 kbps wäre. Eine wirkliche Alternative zu verlustbehafteten Formaten wie MP3 stellt das somit kaum dar, es sei denn, man hat genug Speicherplatz zur Verfügung.

Der Kompromiss als Lösung

Einen Kompromiss zwischen beiden Welten stellt nun ein noch recht junges Verfahren dar, das die Datenrate stark reduziert, aber keine Methoden der Psychoakustik einsetzt und somit auch eine Weiterverarbeitung ohne weiteres erlaubt. Das Verfahren nennt sich lossyWAV und besticht dadurch, dass es kein eigenes Format darstellt, sondern eher eine Art Vorbereiter ist, der das Audiomaterial so bearbeitet, dass es danach von einem verlustfreien Encoder (wie z.B. FLAC) deutlich besser komprimiert werden kann. Dabei lassen sich quasi ohne wahrnehmbaren Verlust Datenraten von unter 400 kbps erzielen. Ein weiterer Vorteil besteht darin, dass das Material ohne weiteren Verlust in andere verlustfreie Formate umgewandelt werden kann, da die Vorbereitung nur einmalig stattfindet. Somit ist das Verfahren auch zukunftssicher.

Wie das funktioniert

Eine verlustfrei komprimierte Audiodatei besteht aus einzelnen Samples mit einem festen Wertebereich. Bei einer Audio-CD haben die Samples eine Größe von 16 Bit, was 65536 (216) unterschiedliche Werte ermöglicht, die in diesem Fall von -32768 bis +32767 reichen. Sie beschreiben die Amplitude (den Ausschlag) des Samples. Durch eine Aneinanderreihung vieler einzelner Samples wird eine Kurve erzeugt, welche den Schallwellen entspricht. Die Samples werden dabei in hoher Geschwindigkeit abgespielt, bei einer Audio-CD mit 44.100 Samples pro Sekunde.

Jedes Sample wird intern in Form einer Folge von Bits gespeichert, wobei das erste Bit den größten Anteil am Gesamtwert der Bit-Folge hat. Beispiel anhand des Wertes 15, der sich mit 4 Bit (24-1=15) darstellen lässt:

1000 = 8
1100 = 12
1110 = 14
1111 = 15

Das heißt, der Anteil am Gesamtwert halbiert sich mit jedem weiteren Bit. Dieser Umstand wird bei lossyWAV ausgenutzt. Zunächst wird innerhalb eines Sample-Blocks der Bereich mit der geringsten Lautheit ermittelt. Dann wird die Genauigkeit der einzelnen Samples des Blocks so weit heruntergeschraubt (d.h. die letzten Bits zu 0 gesetzt), dass die entstehenden Veränderungen noch mindestens vom Bereich mit der geringsten Lautheit überdeckt werden und daher nicht hörbar sind. Da die Sample-Blöcke nur wenige Millisekunden lang sind, passt sich das Verfahren flexibel an das Material an und kann als variable Bit-Tiefen-Reduktion bezeichnet werden, mit der Zielsetzung, unhörbar zu sein. Verlustfreie Encoder wie FLAC oder WavPack erkennen nun, dass innerhalb der Sample-Blöcke konstante Anzahlen von Bits zu 0 gesetzt sind, und komprimieren das entsprechend effektiv, wodurch die Datenrate stark sinkt.

Allerdings funktioniert dieses Verfahren nicht mit allen verlustfreien Codecs. Monkey’s Audio (APE), und Apple Lossless (ALAC) sind hier zu nennen.

lossyWAV richtet sich primär an Leute, die sich auf der einen Seite die Möglichkeit offen halten möchten, mehr oder weniger starkes Post-Processing zu betreiben, ohne dabei Gefahr zu laufen, dass dadurch Kompressionsartefakte zum Vorschein kommen, aber auf der anderen Seite nicht den für ein verlustfreies Musikarchiv nötigen Speicherplatz bereitstellen können oder wollen.

One thought on “Verlustbehaftet verlustfrei: lossyWAV

  1. hm” bis aufs Bit reduziert.. interessant.. Ich habe noch das Compact Kassette Zeitalter erlebt.. Dolby und Chromdioxid BASF Autoreverse Band-Salat ..ein “Abenteuer”
    ..bin ich old-school ?

Leave a Reply

Your email address will not be published.

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>