Wie digitalisiere ich meine Hörspiel-Kassetten?

Autor: sleepy
Letzte inhaltliche Änderung: 28.04.2002


Diese Schritt-für-Schritt-Anleitung erklärt, wie man Hörspiel-Kassetten als WAV-Datei aufnimmt und wie diese WAV-Datei ins platzsparende MP3-Format konvertiert wird.

Die Screenshots innerhalb dieser Anleitung stammen aus den folgenden Programmen:
Natürlich ist die grundlegende Vorgehensweise beim Aufnehmen und Encoden immer gleich und damit ist diese Anleitung auch für nachfolgende Versionen der oben genannten Programme gültig.

Eine Bitte an alle Webmaster


Schon mehrmals habe ich Auszüge aus der folgenden Anleitung auf fremden Internetseiten gefunden. Ganze Kapitel wurden samt Bildern und dem Original-Wortlaut auf andere Internet-Seiten übernommen, ohne mich darüber zu informieren. Ebenso habe ich die Anleitung auch schon einmal in einem fremden Frame-Set wiedergefunden.
Ich finde es nicht gut, daß sich andere mit fremden Federn schmücken, und behaupten, sie selbst hätten diesen Text verfaßt!

Bitte seid fair und respektiert die Arbeit und die Zeit, die ich in diese Anleitung gesteckt habe.

Inhalt




Zuerst die Theorie... zum Inhalt

Frage: Was passiert eigentlich genau, wenn man irgendwelche analogen Audiosignale (also Musik oder Hörspiele) mit dem Computer aufnimmt (digitalisiert)?
Antwort: Eine ganze Menge. Aber nichts, was zu kompliziert zum Verstehen wäre!


Also, dann mal los zur Erklärung...

Zuerst mußt Du wissen, wie ein Hörspiel denn eigentlich "aussieht", wenn es aus dem Kassettendeck rauskommt. Am Line-out-Ausgang des Kassettendecks liegen beim Abspielen eines Hörspiels (und natürlich auch bei Musik) dauernd unterschiedliche elektrische Spannungen an, die man z.b. mit einem Oszilloskop (einem speziellen elektronischen Meßgerät) sichtbar machen kann.
Wenn man nun so ein Oszilloskop an die Ausgangsbuchsen des Kassettendecks anschließt, dann erhält man zu einem bestimmten Zeitpunkt beispielsweise folgendes Bild:

Analoges Audiosignal
Abb.1: Analoges Audiosignal


Es handelt sich dabei um ein analoges Signal. Das bedeutet, daß zu jedem Zeitpunkt zwischen dem maximalen und dem minimalen Spannungswert unendlich viele Zwischenwerte vorhanden sind.
Und jetzt wird auch schnell das erste Problem klar, das sich uns beim Digitalisieren in den Weg stellt: Zu absolut jedem Zeitpunkt gibt es im analogen Audiosignal einen ganz bestimmten Spannungswert. Das ist für einen Computer einfach zu viel!
Das zweite Problem ist, daß es im analogen Audiosignal unendlich viele Zwischenwerte gibt. Und auch das ist für einen Computer zu viel!

Mit anderen Worten: Beim Digitalisieren eines analogen Audiosignals (diesen Vorgang nennt man auch "Samplen") mußt Du dich tatsächlich mit einigen wenigen ausgesuchten Informationen des Original-Signals zufrieden geben!
Aber keine Angst. Das hört sich jetzt im ersten Moment so an, als würde die Qualität der Aufnahme darunter leiden. Tatsache ist aber, daß Dein Ohr überhaupt nicht in der Lage ist, das Fehlen der vielen analogen Zwischenwerte rauszuhören und bei geeigneter Wahl der Samplefrequenz (dieser Begriff wird gleich noch genau erklärt) ist der Unterschied zwischen digitalisiertem Signal und analogem Original-Signal vielleicht noch meßbar, keinesfalls aber hörbar!
Das glaubst Du nicht? Dann denke mal an die gute Tonqualität von Audio-CDs. Und die funktionieren haargenau nach dem selben Prinzip, das ich jetzt gleich erkläre.

Dann mal zum ersten Problem: Der Computer ist nicht in der Lage, wirklich jeden Spannungswert des analogen Audiosignals zu registrieren. Aber das muß er auch gar nicht. Es reicht, wenn das analoge Signal einfach nur regelmäßig in bestimmten Zeitintervallen gemessen wird. Dabei ist ganz klar, daß die Tonqualität um so besser ist, je kleiner die Zeitabstände zwischen den einzelnen Messungen sind.

Um Dir das zu verdeutlichen kannst Du ja mal folgendes kleine Spielchen machen, das kleine Kinder oft machen: Halte Dir die Ohren fest zu und öffne sie in regelmäßigen Abständen jeweils nur ganz kurz. Wenn Du auf diese Weise versuchst, einer Unterhaltung zuzuhören, dann erkennst Du ganz schnell, daß Du alles um so besser verstehst, je öfter Du die Ohren wieder aufmachst, d.h. je kleiner die Zeitabstände sind, nach denen Du die Ohren wieder öffnest.

Jetzt stellt sich nur noch die Frage, wie oft pro Sekunde das analoge Signal gemessen werden soll (in unserem Beispiel: Wie oft pro Sekunde die Ohren geöffnet werden sollen.). Oder mit anderen Worten: Wie hoch soll die Abtast- oder Samplefrequenz sein?

Dabei hilft Dir die Erkenntnis des amerikanischen Mathematikers Claude Elwood Shannon, der herausfand, daß die Samplefrequenz mindestens doppelt so hoch wie die höchste im analogen Signal vorkommende Frequenz sein muß, damit keine Verzerrungen im Klangbild entstehen.
(Übrigens: Im analogen Signal bedeutet eine hohe Frequenz einen hohen Ton und logischerweise ein niedrige Frequenz einen tiefen Ton.)

Aha, alles klar! Wenn Du annimmst, daß das menschliche Ohr Frequenzen bis 22kHz hören kann, dann bist Du also mit einer Samplefrequenz von 44kHz auf der sicheren Seite. Und genau diese 44kHz (ganz genau 44,1kHz) werden auch bei der handelsüblichen Audio-CD als Samplefrequenz verwendet. (Kleiner Hinweis: Eine Samplefrequenz von 44,1kHz bedeutet, daß das analoge Signal 44100 mal pro Sekunde abgetastet wird.)

Entstehung des PAM-Signals durch Abtastung
Abb.2: Entstehung des PAM-Signals durch Abtastung


Wenn Du Dir jetzt das durch die Abtastung entstandene sogenannte PAM-Signal (Puls-Amplituden-Modulation) in Abb. 3 betrachtest, dann siehst Du, daß man die Kurvenform des analogen Audiosignals noch deutlich erkennen kann, d.h. die ursprünglichen Informationen sind im Prinzip noch vorhanden.

Das entstandene PAM-Signal
Abb.3: Das entstandene PAM-Signal


Mit diesem Trick hast Du das erste Problem also gelöst: Statt zu jedem Zeitpunkt das Signal abzutasten reicht es völlig aus, das nur in regelmäßigen Abständen zu tun. Dadurch wird die Zahl der vom Computer abzuspeichernden Spannungswerte auf eine relativ überschaubare Anzahl begrenzt.

Dann mal weiter zum zweiten Problem: Jetzt geht es darum, die Spannungswerte, die Du gerade durch die zeitlich gesteuerten Messungen erhalten hast, auf der Festplatte des Computers abzuspeichern. Oder mit anderen Worten: Die Länge der roten Balken aus Abb. 3 muß ermittelt und abgespeichert werden. (Übrigens: Statt "roter Balken" kann man auch den Fachbegriff "Sample" verwenden!)

Ganz so einfach, wie sich das im ersten Moment anhört, ist es aber leider nicht. Denn was die Sache so kompliziert macht, ist die Tatsache, daß die einzelnen roten Balken jeweils unterschiedlich lang sind! Und zwar alle! Und das wäre, Du ahnst es vielleicht schon, einfach wieder zu viel für einen Computer. Die Sache muß also vereinfacht werden, und das macht man folgendermaßen: Man gibt sich sozusagen ein Raster mit einer ganz bestimmten Anzahl von Spannungsstufen (also Längen der roten Balken) vor, die man unterscheiden will. In Abb. 3 siehst Du, daß der Spannungsbereich schon in einzelne Spannungsstufen unterteilt ist, die von 0 bis 7 durchnummeriert sind, so daß Du also insgesamt 8 Spannungsstufen erhälst. Du unterscheidest jetzt also nicht mehr unendlich viele Spannungswerte, wie vorher, sondern nur noch 8 unterschiedliche Spannungsstufen. Das erleichtert die Sache sehr stark. (Übrigens: Das Unterteilen des gesamten Spannungsbereichs in einzelne Spannungsstufen nennt man "Quantisieren".)

Um jetzt endlich mit dem Abspeichern der einzelnen Samples zu beginnen, fehlt nur noch eine Kleinigkeit. Du weißt ja sicherlich, daß ein Computer mit Zahlen wie 2, 3, 4, 5, 6, usw. in dieser Form nichts anfangen kann, sondern daß so ein Prozessor nur mit 0 und 1 rechnet. Du mußt also Deine 8 Spannungsstufen zuerst noch in eine für den Computer verständliche Form bringen, die Spannungsstufen also Codieren.

Dazu weist Du am einfachsten jeder Spannungsstufe ein bestimmtes Codewort zu. Um 8 verschiedene Spannungsstufen zu unterscheiden, brauchst Du Codewörter, die mindestens 3 Bit lang sind. Wie die Zuweisung dieser 3-Bit-Codewörter zu den Spannungswerten aussehen könnte, das siehst Du in Abb. 4.

Die Codierung
Abb.4: Die Codierung


Alles, was jetzt noch zu tun ist, ist das sture Ablesen der Werte aus dem Diagramm. Beispiel: (siehe auch Abb.5)
  - Sample 1 endet in der Spannungsstufe 4 und wird daher als 3-Bit-Codewort 1 0 0 abgespeichert.
  - Sample 2 endet in der Spannungsstufe 5 und wird daher als 3-Bit-Codewort 1 0 1 abgespeichert.
  - Sample 3 endet in der Spannungsstufe 6 und wird daher als 3-Bit-Codewort 1 1 0 abgespeichert.
  - Sample 4 endet in der Spannungsstufe 7 und wird daher als 3-Bit-Codewort 1 1 1 abgespeichert.
und so weiter . . .

In Abb. 5 siehst Du die Wertetabelle, die Du erhälst, wenn Du alle Samples der ersten Halbwelle codierst.

Die Wertetabelle nach Quantisierung und Codierung
Abb.5: Die Wertetabelle nach Quantisierung und Codierung


Die erste Halbwelle des analogen Audiosignals in unserem Beispiel wird also nach dem Digitalisieren folgendermaßen auf der Festplatte abgespeichert:
1 0 0   1 0 1   1 1 0   1 1 1   1 1 1    1 1 1   1 1 1   1 1 1   1 1 0   1 0 1   1 0 0

(Übrigens: Dieses Signal, das Du jetzt durch Quantisierung und Codierung erhalten hast, nennt man auch PCM-Signal (Puls-Code-Modulation)).

  Also nochmal kurz:

Ein analoges Audiosignal stellt eine so große Datenmenge dar, daß es vom Computer in dieser Form nicht bearbeitet werden kann. Das analoge Signal muß zuerst digitalisiert werden. Dazu wandelt man das analoge Signal zuerst in ein PAM-Signal (Puls-Amplituden-Modulation) um, indem man das analoge Signal jeweils in regelmäßigen Zeitabständen abtastet. Dieses PAM-Signal besteht aus vielen sogenannten Samples, die anschließend durch Quantisierung bestimmten vorgegebenen Spannungsstufen zugeteilt und durch Codierung in eine für den Computer verträgliche Form umgewandelt werden. Das resultierende Signal nennt man dann PCM-Signal (Puls-Code-Modulation).

Das Digitalisieren besteht also aus folgenden einzelnen Vorgängen:
  • Abtasten des analogen Signals
  • Quantisierung
  • Codierung

Das ist eigentlich schon alles, was man über die Theorie des Digitalisierens wissen sollte.

Wenn ein digitales Audiosignal jetzt wieder abgespielt werden soll, dann passiert im Prinzip alles genau umgekehrt:
Von der Festplatte wird beispielsweise ein 3-Bit-Codewort gelesen, aus der festgelegten Code-Tabelle wird ausgelesen, welcher Spannungswert diesem Codewort entspricht und anschließend wird dieser Spannungswert an den Audio-Ausgang der Soundkarte angelegt, von wo er über den Verstärker und die Lautsprecher wieder in Dein Ohr gelangt. Alles ganz einfach, oder?


Und nun zum Abschluß des theoretischen Teils noch ein paar interessante Zahlen:

In dem obigen Beispiel beschränken wir uns auf ein 3-Bit-Codewort (also 8 Spannungsstufen), weil es zum Erklären und Verstehen ziemlich einfach und übersichtlich ist.

In der Realität werden natürlich ganz andere Werte verwendet. Ich will Dir das am Beispiel der Audio-CD einmal zeigen:
Eine Audio-CD benutzt eine Samplerate von 44,1 kHz und 16-Bit-Codewörter zur Codierung. Statt 8 Spannungsstufen, wie wir sie in unserem Beispiel mit 3-Bit-Codewörtern haben (2 hoch 3 = 8), stehen bei 16-Bit-Codewörtern 65536 Spannungsstufen zur Verfügung (2 hoch 16 = 65536)! Du kannst Dir sicher vorstellen, daß das Klangbild der Audio-CD dadurch wesentlich besser ist, als das in unserem Beispiel.

Aber nun mal weiter: Wie Du weißt, bedeutet eine Samplerate von 44,1 kHz, daß das analoge Audiosignal 44100 mal pro Sekunde abgetastet wird. Die 44100 Samples, die man dadurch erhält, werden bei der Audio-CD anschließend mit 16-Bit-Codewörtern codiert.
Mit anderen Worten: Pro Sekunde werden 88200 Bytes an Daten benötigt (16 Bit = 2 Bytes, also: 44100 × 2 Bytes = 88200 Bytes). Und das pro Stereo-Kanal! Insgesamt sind es also 176400 Bytes für jede Sekunde CD-Klang!

Umgerechnet bedeutet das, daß für eine Minute Stereo-CD-Musik 10.584.000 Bytes, also ca. 10 Megabytes, benötigt werden.
Und genau so viel Speicherplatz (ca. 10 Megabytes pro Minute) brauchst Du auch auf Deiner Festplatte, um jetzt endlich Deine Hörspiel-Kassetten zu digitalisieren. Wie das genau gemacht wird, das erfährst Du sofort, wenn Du diese Anleitung weiter durchliest...


(Kleiner Hinweis: Am Ende dieser Anleitung findest Du ein kleines Lexikon, in dem die wichtigsten Fachbegriffe ausführlich erklärt werden.)


Was brauche ich zum Digitalisieren meiner Hörspiel-Kassetten? zum Inhalt


Audio-Überspielkabel
Abb.6: Audio-Überspielkabel


Klinkenstecker Cinchstecker
Abb.7: Klinkenstecker Abb.8: Cinchstecker


1. Schritt: PC und Kassettenrecorder verbinden zum Inhalt

An der Rückseite des Kassettenrecorders findest Du normalerweise 4 Cinch-Buchsen, die mit "LINE IN (RECORD)" und "LINE OUT (PLAYBACK)" beschriftet sind. Die Stecker, die dort stecken, ziehst Du jetzt raus. Merke Dir aber, welches Kabel an welchem Anschluß war, damit Du später alles wieder richtig anschließen kannst.
Dort wo "LINE OUT (PLAYBACK)" steht steckst Du nun die Cinch-Stecker unseres Audio-Kabels ein.
Die Anschlüsse "LINE IN (RECORD)" läßt Du am besten frei! Sonst kann es durch die Verbindung mit dem Verstärker und dem Antennenanschluß des Tuners zu einer Masseschleife kommen, was sich durch ein starkes Brummen in der Aufnahme bemerkbar macht, und das willst Du ja wohl nicht!

Die andere Seite des Audio-Überspielkabels, also den Klinkenstecker, steckst Du in den "LINE IN"-Eingang Deiner Soundkarte. Wenn Du Dir nicht sicher bist, welcher Anschluß das ist, schau unbedingt in der Betriebsanleitung der Karte nach, denn bei falschem Anschluß kann es zu Defekten an Deiner Hardware kommen!
Um evtl. Neben- bzw. Störgeräusche ganz sicher zu vermeiden solltest Du unbedingt das Mikrofon (falls vorhanden) von der Soundkarte trennen. Das macht auch dann Sinn, wenn in der Lautstärkeregelung von Windows (siehe Schritt 4) das Mikrofon nicht als Aufnahmequelle angewählt ist, denn selbst dann kann es noch sein, daß alle Geräusche, die Du während der Aufnahme machst, zusammen mit dem Hörspiel aufgenommen werden. Eben typisch Microsoft...

  Also nochmal kurz:
  • Alle Kabel am Kassettenrecorder abziehen.
  • Das Audio-Überspielkabel an den Anschluß "LINE OUT (PLAYBACK)" des Kassettenrecorders anschließen.
  • Die andere Seite des Audio-Überspielkabels an "LINE IN" der Soundkarte anschließen.
  • Ein evtl. angeschlossenes Mikrofon von der Soundkarte trennen.

Noch ein Hinweis: Unbedingt die "LINE IN"-Buchse der Soundkarte verwenden und nicht etwa den Mikrofon-Anschluß !!!
Der Mikrofon-Anschluß ist wirklich nur für Mikrofone zu gebrauchen! Da diese Anschlüsse mit ganz anderen Pegeln arbeiten als LINE-Anschlüsse kommt es leicht zu hoffnungslos übersteuerten oder sehr dumpf klingenden Aufnahmen.

Und hier noch ein paar Dinge, die Du außerdem beachten solltest:

2. Schritt: Vorbereitungen am Kassettenrecorder zum Inhalt

Vor Beginn der Aufnahme ist es sinnvoll, die Tonköpfe des Kassettenrecorders zu reinigen. Dazu verwendest Du am besten eine Naßreinigungs-Kassette, die für max. 20,- DM erhältlich ist. Die Entmagnetisierung des Tonkopfes mit einer speziellen Kassette kann ebenfalls eine Verbesserung der Tonqualität bringen.
Die Tonkopf-Reinigung muß aber nicht vor jeder Aufnahme gemacht werden, sondern nur, wenn die Tonqualität merklich abnimmt.

Eine Naßreinigungskassette (siehe Abb.9) besteht aus einem Gewebeband, das mit einer Tonkopfreinigungsflüssigkeit (wird mitgeliefert) angefeuchtet wird. Dieses feuchte Gewebeband reinigt dann mechanisch den Tonkopf von Staub und vom Abrieb der Kassettenbänder. Ein Durchlauf dieser Naßreinigungskassette dauert max. 1 Minute.

Naßreinigungskassette
Abb.9: Naßreinigungskassette


Eine Entmagnetisierungskassette (siehe Abb.10) enthält ein kleine elektronische Schaltung, die mit einer eigenen Batterie betrieben wird. Diese Schaltung neutralisiert die sog. Vormagnetisierung, die sich durch das ständige Vorbeilaufen des Kassettenbandes am Tonkopf bildet. Diese Vormagnetisierung bewirkt, daß der Tonkopf die magnetischen Informationen auf den Kassetten (also die Audio-Informationen) nicht mehr in vollem Umfang registrieren kann. Daher ist eine Vormagnetisierung des Tonkopfes nicht erwünscht und kann durch so eine Entmagnetisierungskassette beseitigt werden. Der Entmagnetisierungsvorgang dauert je nach Modell zwischen 2 und max. 10 Sekunden. Trotz des geringen Zeitaufwandes sollte die Entmagnetisierungskassette nicht allzu oft eingesetzt werden!

Entmagnetisierungskassette
Abb.10: Entmagnetisierungskassette


Ganz wichtig ist es, die Kassette einmal komplett vor- und zurückzuspulen. Denn wenn eine Kassette länger rumliegt und nicht angehört wird, dann "verklebt" das Band und kann unter Umständen nicht gleichmäßig abgespielt werden, was sich bei der Aufnahme durch furchtbares Jaulen bemerkbar macht.

  Also nochmal kurz:
  • Tonkopf reinigen (falls notwendig).
  • Kassette einmal komplett vor- und zurückspulen.

(Anmerkung: Probiere unbedingt mal aus, ob sich das Hörspiel nicht vielleicht besser anhört, wenn Du die "DOLBY NOISE REDUCTION" am Kassettenrecorder ausschaltest. Ich persönlich finde DOLBY bei Musikaufnahmen ganz in Ordnung, bei Sprachaufnahmen (also bei Hörspielen) schalte ich es jedoch grundsätzlich aus.)


3. Schritt: Vorbereitungen am PC zum Inhalt

Damit es nicht zu irgendwelchem Aussetzern oder Störungen kommt, solltest Du während der Aufnahme nicht mit Deinem Computer weiterarbeiten. Schließe am besten alle Programme (außer dem Aufnahme-Programm natürlich!). Vor allem solltest Du den Bildschirmschoner abschalten!

Außerdem kann es nicht schaden, die Festplatte, auf die später bei der Aufnahme die temporäre Datei geschrieben wird, vor der Aufnahme zu defragmentieren. Bei einer Audio-Aufnahme fällt eine sehr große Datenmenge an, die nicht schnell genug auf der Festplatte abgelegt werden kann, wenn erst noch eine ausreichend große, freie Stelle gesucht und mit dem Schreibkopf angefahren werden muß. Beim Defragmentieren erhält man einen großen, freien und vor allem zusammenhängenden Bereich, in dem dann die Audio-Daten problemlos und ohne Aussetzer abgespeichert werden können.

  Also nochmal kurz:
  • Alle Anwendungen schließen.
  • Bildschirmschoner abschalten.
  • ggf. die Festplatte für die temporäre Datei defragmentieren.


4. Schritt: Aufnahme des Hörspiels zum Inhalt

Hinweis: Die nachfolgend erklärten Aufnahmevorbereitungen solltest Du auf jeden Fall, also unabhängig von der verwendeten Aufnahme-Software durchführen.

Als erstes solltest Du die Lautstärkeregelung von Windows aufrufen. Das geht entweder durch einen Klick auf das Lautsprecher-Symbol im SysTray (Abb. 11) oder durch folgenden Startmenü-Eintrag: "Start/Programme/Zubehör/Unterhaltungsmedien/Lautstärkeregelung"

Symbole in der SysTray
Abb.11: Symbole in der SysTray


Dort wählst Du im Menü "Optionen" den Menüpunkt "Eigenschaften".

Eigenschaften der Lautstärkeregelung
Abb.12: Eigenschaften der Lautstärkeregelung


Markiere bei "Lautstärke regeln für" den Punkt "Aufnahme" und achte darauf, daß unten vor "Line-In" ein Häkchen ist. Ist dies der Fall, dann kannst Du auf "OK" klicken.
Nun solltest Du am besten nur den "Line-In"-Regler wählen. Mit diesem Regler kannst Du die Lautstärke des des ankommenden Audio-Signals einstellen. (In Abb.13 siehst Du die Einstellung, die bei mir optimal ist.)

Aufnahmeregler der Lautstärkeregelung
Abb.13: Aufnahmeregler der Lautstärkeregelung


Laß ruhig das Fenster mit der Lautstärkeregelung offen, damit Du eventuell schnell noch nachregeln kannst.


Soviel zur Aufnahme des Hörspiels.


5. Schritt: Encoden des Hörspiels (Umwandeln ins MP3-Format) zum Inhalt

Was Du vor dem Encoden wissen solltest:



6. Schritt: ID3-Tag bearbeiten (Titelinfo) zum Inhalt

Als letzten Schritt solltest Du unbedingt den ID3-Tag der MP3-Datei so gut wie es geht ausfüllen. Wenn Du viele MP3-Dateien mit wenig aussagekräftigen Dateinamen auf Deiner Festplatte hast, und dann versuchst, eine bestimmte Aufnahme zu finden, dann wirst Du ganz schnell die Informationen des ID3-Tags schätzen lernen.
Langer Rede kurzer Sinn: Nimm Dir die Zeit, den ID3-Tag sorgfältig auszufüllen.

Der ID3-Tag bietet die Möglichkeit, weitere Informationen zur MP3-Datei in dieser Datei abzuspeichern. Man unterscheidet dabei folgende Standards:
  Es ist ratsam, auf jeden Fall den ID3v1-Tag auszufüllen, da er von vielen Hard- und Software-Playern angezeigt wird. Beim ID3v2-Tag ist dies (noch) nicht der Fall. Es ist auch möglich, eine MP3-Datei mit beiden (ID3v1 und ID3v2) Tags auszustatten!

Zum Eingeben der ID3-Tag-Infos gibt es jede Menge Free- und Shareware-Programme. Ich zeige hier, wie man diese Aufgabe mit "WimAmp" löst, da ich davon ausgehe, daß wohl jeder dieses bekannte und weit verbreitete Freeware-Programm kennt.

Lade einfach die MP3-Datei in den WinAmp-Player. Drücke jetzt die Tastenkombination ALT-3 oder wähle aus dem Kontextmenü, das Du mit einem Rechtsklick mit der Maus aufrufen kannst, den Menüpunkt "Titelinfo" aus. Dann sollte folgendes Fenster erscheinen:

ID3-Tag-Editor von WinAmp
Abb.39: ID3-Tag-Editor von WinAmp


Im Bild siehst Du ein Beispiel, wie der ID3-Tag ausgefüllt werden kann. Folgende Informationen solltest Du auf jeden Fall angeben:


Die richtige Wahl der Datenrate und der Samplefrequenz zum Inhalt

Dieses Kapitel wurde von Ivanhoe verfaßt und enthält einige interessante Informationen zur richtigen Wahl von Datenrate und Samplefrequenz.

Der Schlüssel, um MP3 zu verstehen, ist die Datenrate. Dieser Wert ist bei CBR-Codierung konstant und dieser Wert ALLEIN bestimmt die Größe der Datei (Behalte das mal im Hinterkopf bei der Rechnung gleich).
Am besten erkläre ich es wohl mit einem kleinen Beispiel: Stell Dir vor, Du hast eine Datei mit 64kBit/44kHz und eine Datei mit 64kBit/22kHz.

Im ersten Fall (64kBit/44kHz) bedeutet dies:
Die Aufgabe von MP3 besteht nun darin, diese 44100 Bytes in 8192 Bytes zu pressen. Oder anders gesagt MPEG muß bei 64kBit/44kHz mehr als 5 Original-Bytes in 1 MPEG-Byte umrechnen.
Dieser Faktor von 5,3 : 1 (also Samplingfrequenz zu Bitrate) ist gut dazu geeignet, die Qualität zu bestimmen.

Im zweiten Fall (64kBit/22kHz) sieht es so aus, daß wiederum zwei Größen fest vorgegeben sind:
In diesem Fall muß MPEG also nur halb so viele Daten in ein MPEG-Byte pressen (im Vergleich zum 64kBit/44kHz). Während vorhin aus 5 Original-Bytes 1 MPEG-Byte wurde, ist es jetzt so, daß "nur" 2-3 Original-Bytes zu einem MPEG-Byte zusammengefaßt werden. Das Verhältnis ist also wesentlich günstiger für MPEG und es kann "besser" codiert werden, also mehr Details bleiben erhalten.
Der Faktor ist hier übrigens 2,7 : 1.

(Anmerkung: Im Beispiel gehe ich von 8Bit aus! Normal ist zwar 16Bit, aber 8 ist schöner zu rechnen !!!)

So, ich hoffe das war nicht zu kompliziert bis jetzt. Ich fasse es mal in wenigen Worten zusammen:
Aber Vorsicht! Ich habe die ganze Zeit von Qualität gesprochen. Da ist aber die Qualität der Codierung gemeint, NICHT die Klangqualität!!!

Im Normalfall ist die Klangqualität besser, je höher die Samplerate ist. Bei MP3 kommt aber noch ein Faktor dazu, nämlich die Qualität der Codierung.

Durch die Wahl der "richtigen" Samplefrequenz kann man also das Endergebnis verbessern. Das heißt aber nicht automatisch, daß die höhere Samplefrequenz die "richtige" ist.

Wenn man zum Beispiel Musik mp3't, dann sollte man auf die höhere Samplefrequenz zurückgreifen, denn bei Musik gibt es viele Stellen, die im Bereich zwischen 11kHz-22kHz liegen. Diese Töne kann man nur aufnehmen, wenn die Samplefrequenz doppelt so hoch ist, also 44kHz. Ein Song ohne diese hohen Töne klingt nicht mehr so gut (Kofferradio-Effekt). Mit einer Samplefrequenz von 22kHz würde man also brutal alle Töne oberhalb von 11kHz abschneiden.

Bei einem gesprochenen Text (z.B. Audiobook oder Hörspiel) sieht es dagegen schon anders aus.
Die menschliche Stimme reicht eben frequenzmäßig nicht so hoch hinauf, und man kann hier getrost auf den Frequenzbereich von 11-22kHz verzichten. Wenn also in diesem Bereich sowieso keine Töne vorkommen, kann man ihn auch bei der Codierung außen vor lassen. Dadurch erreicht man eine bessere Klangqualität. Also wenn keine hohen Töne über 11kHz vorkommen, dann sollte man auf jeden Fall die Samplefrequenz runtersetzen. Die reduzierte Frequenz bietet nämlich mehr Platz für die bessere Codierung von Details.

Noch einmal kurz: Wenn Du ein Hörspiel oder ein Audiobook codierst, bei dem im Frequenzbereich zwischen 11 und 22kHz sowieso fast nichts passiert, dann ist das Endergebnis mit 64kBit/22kHz hörbar besser als mit 64kBit/44kHz. Und das kommt daher, weil Du den ganzen zur Verfügung stehenden Platz von 64kBit pro Sekunde ausschließlich zur Codierung der Frequenzen bis 11kHz verwendest und den Frequenzbereich von 11 bis 22kHz gar nicht beachtest (was aber nicht weiter schlimm ist, da bei menschlicher Sprache in diesem Frequenzbereich sowieso nichts passiert).

Auf den ersten Blick scheint 64kBit/44kHz das bessere Format zu sein, aber die Wirklichkeit sieht anders aus, wie Du ja jetzt weißt.

Wenn also keine hohen Töne vorkommen, dann kann 64kBit/22kHz von der Klangqualität u.U. genau so gut sein, wie 128kBit/44kHz !!!
Andererseits wird 64kBit/44kHz NIE so gut sein, wie 128kBit/44kHz !!!

Diese ganze Betrachtung zeigt Dir jetzt deutlich:


Lexikon der Fachbegriffe zum Inhalt

In diesem Kapitel findest Du die genaue Erklärung der wichtigsten Fachbegriffe aus dieser Anleitung.
Natürlich gibt es weitaus mehr Begriffe, die mit der digitalen Verarbeitung analoger Signale zu tun haben, aber hier findest Du nur die allerwichtigsten und gebräuchlichsten Ausdrücke. Und selbst das sind schon eine ganze Menge...

Abtastfrequenz fA
engl.: sampling frequency; Frequenz, mit der bei einem analogen Signal die Abtastung erfolgt, also die jeweiligen Augenblickswerte (Momentanwerte) ermittelt werden. Der Kehrwert der Abtastfrequenz ist die Abtastperiode.
Beispiel: Eine Abtastfrequenz von 8 kHz (= 8000 Hz) bedeutet einen Abstand von 1/8000s = 125µs für die Abtastwerte. Das ist gleichbedeutend mit der Aussage, daß die Abtastung 8000 mal pro Sekunde erfolgt.
Abtastperiode TA
engl.: sampling periode; Es gilt auch die Bezeichnung Abtastintervall. Zeitabstände, nach denen bei einem analogen Signal die Abtastung erfolgt, also die jeweiligen Augenblickswerte (Momentanwerte) ermittelt werden. Der Kehrwert der Abtastperiode ist die Abtastfrequenz.
Abtasttheorem
Bedingung für die Wahl der Abtastfrequenz, um eine störungsfreie Rückwandlung der Abtastwerte in das analoge Signal zu ermöglichen. Maßgebend ist die größte im abzutastenden analogen Signal enthaltene Frequenz fmax .
Es gilt: fA >= 2 × fmax
Für die Abtastperiode folgt daraus: TA <= Tmax / 2
Innerhalb der Periode für die größte Frequenz im abzutastenden Signal müssen also mindestens zwei Abtastungen liegen, bedingt durch die konstante Abtastperiode liegen diese im Bereich der positiven und negativen Halbwelle.
Abtastung
engl.: sampling; Feststellung der Augenblickswerte (Momentanwerte) bei einem analogen Signal in regelmäßigen zeitlichen Abständen.
Abtastwert
engl.: sample; In regelmäßigen zeitlichen Abständen festgestellter Augenblickswert (Momentanwert) bei einem analogen Signal.
A/D-Wandler (Analog/Digital-Wandler)
Technische Funktionseinheit, welche ein analoges Eingangssignal in ein digitales Ausgangssignal wandelt.
A/D-Wandlung (Analog/Digital-Wandlung)
engl.: analog-to-digital conversion; Umsetzung eines analogen Signals in ein digitales Signal. Die Umkehrung der A/D-Wandlung ist die D/A-Wandlung.
Aliasing
Überlappungsfehler. Störeffekt im Frequenzbereich eines abgetasteten Signals, wenn bei der Abtastung das Abtasttheorem nicht erfüllt wurde, also Unterabtastung vorliegt. Dies bedeutet zu wenig Abtastungen im Zeitbereich, so daß sich die Amplituden-Frequenzgänge überlappen, weshalb nach der Tiefpaßfilterung im Basisband auch Anteile des oberen Bandes enthalten sind.
Amplitude
Maximalwert einer sinusförmigen Zeitfunktion. Dabei kann es sich um positive oder negative Werte handeln. Es ist auch üblich, den Begriff Amplitude ebenfalls bei nicht-sinusförmigen Zeitfunktionen zu verwenden.
analog
Wert- und zeitkontinuierliche Verläufe physikalischer Größen. Innerhalb eines definierten Bereiches kann somit jeder Wert auftreten, es ist dadurch Vielwertigkeit gegeben. Der zum Begriff "analog" gegensätzliche Begriff ist "digital".
Augenblickswert
Es gilt auch die Bezeichnung Momentanwert. Wert einer physikalischen Größe (z.B. Spannung) zu einem definierten Zeitpunkt.
Bit
engl.: binary digit; Binärzeichen. Impuls zur Darstellung einer logischen Null oder Eins als Elementarentscheidung. Als Einheit wird die Bezeichnung "Bit" verwendet.
Bitrate
engl.: bit rate; Es gelten auch die Bezeichnungen Bitstrom, Bitfrequenz oder Datenrate (data rate). Übertragungsgeschwindigkeit bei der Übertragung digitaler Signale als Anzahl der pro Sekunde seriell übertragenen Bit. Die Angabe erfolgt in bit/s, kbit/s, Mbit/s oder Gbit/s.
Byte
Datenwort, das aus 8 aufeinander folgenden Bit besteht.
CD
engl.: compact disc; Platte für die optische Speicherung digitaler Signale.
Code
Zuordnungsvorschrift für Zeichen zwischen unterschiedlichen Zeichenvorräten.
Coder
Technische Funktionseinheit zur Durchführung einer Codierung. Das nicht codierte (uncodierte) Signal wird dabei der Einheit zugeführt, gemäß dem vorgegebenen Code verarbeitet und danach als codiertes Signal am Ausgang zur Verfügung gestellt.
Codierung
engl.: coding; Die Durchführung der Maßnahme wird als codieren bezeichnet. Codierung bedeutet allgemein die Zuordnung zwischen Zeichen aus definierten Vorratsmengen. Die Festlegungen für diese Zuordnung (Zuordnungsvorschrift) - in vielen Fällen handelt es sich um eine Berechnungsformel (Algorithmus) - werden als Code bezeichnet. Beim digitalen Rundfunk und bei Datendiensten werden im Rahmen einer Codierung digitalen oder analogen Signalen Bitfolgen zugeordnet, also eine jeweils festgelegte Zahl von Binärzeichen (Bit). Bei der Wandlung analoger in digitale Signale betrifft die Codierung die Zuordnung von Bitfolgen zu den zeit- und wertequantisierten Anteilen des analogen Signals.
Constant Bitrate (CBR)
-› siehe Konstante Bitrate
Datenrate
-› siehe Bitrate
D/A-Wandler (Digital/Analog-Wandler)
Technische Funktionseinheit, welche ein digitales Eingangssignal in ein analoges Ausgangssignal wandelt.
D/A-Wandlung /Digital/Analog-Wandlung)
engl.: digital-to-analog conversion; Umsetzung eines digitalen Signals in ein analoges Signal. Die Umkehrung der D/A-Wandlung ist die A/D-Wandlung.
Decoder
Technische Funktionseinheit, die eine Codierung rückgängig macht, also ein codiertes Signal in ein uncodiertes Signal wandelt. Für die Decodierung muß allerdings der für die Codierung verwendete Code genutzt werden, weil sonst die einwandfreie Funktion nicht gegeben ist. Das Gegenteil des Decoders ist der Coder.
Decodierung
Die Decodierung ist das Gegenteil der Codierung. Durch die Decodierung wird die im Rahmen der Codierung verwendete Zuordnung von Bitfolgen wieder rückgängig gemacht. Für die einwandfreie Funktion der Decodierung muß jedoch die Zuordnungsvorschrift bzw. der Algorithmus bekannt sein.
digital
Wert- und zeitdiskrete Verläufe physikalischer Größen (z.B. Spannung). Im Regelfall werden darunter zweiwertige Signale verstanden, die in einem festen Zeittakt auftreten. Es ist dabei gegenüber der Vielwertigkeit analoger Signale nur noch eine Zweiwertigkeit gegeben. Der zum Begriff "digital" gegensätzliche Begriff ist "analog".
Encoder
-› siehe Coder
Frequenz
engl.: frequency; Anzahl der Schwingungen pro Sekunde. Die Einheit der Frequenz ist Hertz (Hz).
ID3-Tag
Der ID3-Tag bietet die Möglichkeit, weitere Informationen zur MP3-Datei in dieser Datei abzuspeichern. Man unterscheidet dabei folgende Standards:
Impuls
Steilflankiges Einzelsignal kurzer Dauer.
Konstante Bitrate (CBR)
engl.: constant bitrate; Bei Codierung einer MP3-Datei mit konstanter Bitrate wird die gewählte Bitrate für die gesamte Datei beibehalten. An "schwierigen" Abschnitten in der Quelldatei (z.b. Abschnitte mit relativ weiter Trennung der Stereokanäle) kann diese Methode zu geringfügigen Verlusten bei der Audioqualität führen. Bei "einfachen" Passagen (z.B. längere Stille oder Passagen mit relativ naher Trennung der Stereokanäle) bleiben dagegen einige Bits ungenutzt.
Durch die gleichbleibende Bitrate können MP3-Player (Hard- und Software-Player) sehr einfach und genau die Gesamtlänge der MP3-Datei berechnen und selbst beim bzw. nach dem schnellen Vor- oder Rücklauf bleibt die Zeitanzeige genau. Außerdem können keine störenden Knackgeräusche beim Bitratenwechsel innerhalb der Datei auftreten.
Das Gegenteil der konstanten Bitrate ist die variable Bitrate.
Momentanwert
-› siehe Augenblickswert
MPEG (Motion Pictures Experts Group)
Expertengruppe für Bewegtbildübertragung. Internationales Gremium, welches verschiedene als MPEG bezeichnete Standards für das Datenreduktionsverfahren zur Übertragung von Bewegtbildern erarbeitet hat.
Oversampling
-› siehe Überabtastung
Puls-Amplituden-Modulation (PAM)
Umwandlung eines analogen Signals durch regelmäßig wiederholte Abtastung. Das resultierende Signal nennt man PAM-Signal.
Puls-Code-Modulation (PCM)
Zuordnung von Codewörtern definierter Länge zu quantisierten Impulsen. Dieser Vorgang ist durch entsprechende Demodulation umkehrbar. Puls-Code-Modulation ist der letzte Verfahrensschritt bei der Analog-Digital-Wandlung von Signalen. Durch die Abtastung ergibt sich zuerst ein puls-amplituden-moduliertes Signal (PAM-Signal). Dann erfolgt eine Wertequantisierung der Pulse. Für jeden Quantisierungsbereich wird danach ein Codewort festgelegt.
Quantisierung
engl.: quantising; Einteilung in Intervalle. Die Quantisierung kann für den Zeitbereich (Zeitquantisierung) und/oder den Wertebereich (Wertequantisierung) eines Signals erfolgen. Sind die Intervalle konstant, dann liegt lineare Quantisierung vor. Werden Stufungen unterschiedlicher Größe gewählt, dann ist nichtlineare Quantisierung gegeben.
Sample
Probe. Anteile von Signalverläufen, im Grenzfall handelt es sich dabei um einzelne Abtastwerte.
Samplefrequenz
-› siehe Abtastfrequenz
Sampling
Probeentnahme. Planmäßige Erstellung von Anteilen gegebener Signalverläufe.
Samplerate
engl.: sampling rate; -› siehe Abtastperiode
Soundkarte
Steckkarte für den Rechner, die das Einlesen und Verarbeiten digitaler Audiosignale ermöglicht.
Subsampling
-› siehe Unterabtastung
Überabtastung
engl.: oversampling; Abtastung eines analogen Signals mit einer Abtastfrequenz fA , die größer als zur Erfüllung des Abtasttheorems (fA >= 2 × fmax) mindestens erforderlich ist.
Unterabtastung
engl.: subsampling; Abtastung eines analogen Signals mit einer Abtastfrequenz fA , die kleiner als zur Erfüllung des Abtasttheorems (fA >= 2 × fmax) mindestens erforderlich ist. Durch Unterabstastung tritt Aliasing als Störeffekt auf.
Variable Bitrate (VBR)
Die MP3-Codierung mit variabler Bitrate basiert auf einem intelligenten Verfahren, das automatisch erkennt, ob zur Verschlüsselung einzelner Passagen mehr oder weniger Bits pro Sekunde unbedingt benötigt werden. Erkennt der Encoder eine "schwierige" Passage in der Quelldatei (z.B. eine Passage mit relativ weiter Trennung der Stereokanäle), dann wird zur besseren Codierung dieser Passage automatisch eine höhere Bitrate gewählt. Erkennt der Encoder dagegen eine "einfache" Passage innerhalb der Quelldatei (z.B. längere Stille oder relativ nahe Trennung der Stereokanäle), so wird automatisch eine geringere Bitrate verwendet, um dadurch unnötige Bits einzusparen.
Eine MP3-Datei mit VBR-Codierung enthält also mehrere Teile mit verschiedenen Bitraten. Das führt dazu, daß MP3-Player (Hard- und Software-Player) oftmals nicht in der Lage sind, die korrekte Gesamtlänge der Datei anzugeben und auch beim schnellen Vor- und Rücklauf kann es zu Problemen kommen. Außerdem können beim Abspielen an den Stellen des Bitratenwechsels innerhalb der Datei Knackgeräusche auftreten.
Das Gegenteil der variablen Bitrate ist die konstante Bitrate.
Verbindung
engl.: connection; Zusammenschaltung der für die Übermittlung von Informationen zwischen zwei oder mehr Punkten erforderlichen Übertragungswege, Vermittlungseinrichtungen und anderen Funktionseinheiten.

Noch ein paar Anmerkungen... zum Inhalt



Nochmal die Bitte an alle Webmaster zum Inhalt


Schon mehrmals habe ich Auszüge aus der folgenden Anleitung auf fremden Internetseiten gefunden. Ganze Kapitel wurden samt Bildern und dem Original-Wortlaut auf andere Internet-Seiten übernommen, ohne mich darüber zu informieren. Ebenso habe ich die Anleitung auch schon einmal in einem fremden Frame-Set wiedergefunden.
Ich finde es nicht gut, daß sich andere mit fremden Federn schmücken, und behaupten, sie selbst hätten diesen Text verfaßt!

Bitte seid fair und respektiert die Arbeit und die Zeit, die ich in diese Anleitung gesteckt habe.

© sleepy, k-town 04/2002 zum Inhalt