Der Vocoder

Inspiriert vom schon etwas länger zurückliegenden Musiktipp „Mr. Roboto“ kommt heute mal wieder ein Blog über ein musikalisches Effektgerät. Der Vocoder (ein Kunstwort aus Voice Encoder) war ursprünglich gar nicht für die Musik bestimmt, sondern für kodierte Sprachübertragung und Reduktion der für die Übertragung nötigen Bandbreite. Die damit verfremdeten Stimmen lassen sich aber wunderbar als Effekt nutzen. Spätestens seit Kraftwerk hat der Vocoder breiten Einzug in die Popmusik gehalten.

 Wie funktioniert er nun? Das ist schwer zu erklären, ohne ein wenig Grundwissen über Frequenzen und Filter vorauszusetzen. Der Vocoder hat zwei Eingänge, einen für das Trägersignal und einen für das Modulatorsignal (meistens, aber nicht zwangsläufig Sprache). Vereinfacht gesagt wird dem Träger das Modulatorsignal „aufgeprägt“. Nimmt man beispielsweise eine Orgel als Träger, dann lässt man sozusagen die Orgel sprechen. Technisch besteht der Vocoder aus Analyse- und Synthesesektion. In der Analysesektion wird das Modulatorsignal mit einer Filterbank in Frequenzbänder aufgeteilt, gleichmäßig von Bässen bis zu den Höhen. Nach jedem Filter kommt ein sogenannter Envelope Follower, der ein Steuersignal erzeugt, das einfach den momentanen Lautstärkepegel in diesem Frequenzband widerspiegelt. In der Synthesesektion wird nun das Trägersignal genauso wie der Modulator in verschiedene Tonhöhenbereiche aufgeteilt. Die Ausgangslautstärke jedes Bereiches wird dabei durch das Steuersignal der Analysesektion geregelt. Sind im Modulator beispielsweise keine Bässe enthalten, werden somit auch die Bassanteile des Trägers herausgefiltert. Jede zeitliche Änderung der Frequenzanteile des Modulators bewirkt die gleiche Änderung im Trägersignal.

Damit man mit Sprache verständliche Ergebnisse bekommt, müssen einige Voraussetzungen erfüllt sein. Man braucht genügend Frequenzbänder, üblicherweise im Bereich von 10-20, damit nicht zuviele Details des Modulators verloren gehen. Das Trägersignal sollte einen gleichmäßigen Lautstärkepegel haben und einen breiten Frequenzbereich abdecken, denn im Träger nicht enthaltene Frequenzen werden auch im Endergebnis nicht vorkommen.
Wie klingt das ganze denn nun? Ich habe zwei Beispiele erstellt mit einem zur Webseite passenden Sprachsample: Modulator

  1. Der erste Träger ist ein knarrender, einzelner Ton. Damit erzeugt man eine typische Roboterstimme Carrier 1. Und das Ergebnis: Vocoded 1
  2. Als zweites habe ich wechselnde Akkorde mit einem etwas sanfteren Klang als Trägersignal gewählt. Damit bekommt man ein harmonischeres Ergebnis, das sich dann auch gut in eine Melodie einbetten lässt oder als Ersatz für mehrstimmigen Gesang dienen kann Carrier 2. Das Ergebnis: Vocoded 2

Beide Varianten kommen in Styx‘ Mr. Roboto gleich am Anfang vor. Der Vocoder ist aber natürlich nicht auf Spracheffekte beschränkt. Durch die Kombination aus Träger und Modulator sind unzählige Varianten denkbar. Interessant klingt beispielsweise auch, eine Schlagzeugspur als Modulator zu verwenden.
Übrigens ist der Vococer genaugenommen nicht als Sprachsynthesizer zu bezeichnen, da er nur Signale verfremdet, Sprache aber nicht selbst erzeugt. Ein Sprachsynthesizer hat meist eine Sammlung gesampelter Konsonanten und Vokale in allen Variationen und setzt daraus Wörter und Sätze zusammen. Will man das als Effekt in der Musik einsetzen, ist häufig schlechtere Qualität von Vorteil. Eine Simulation eines sehr alten Gerätes, das eigentlich eher zum Lernen für Kinder gedacht war, findet man hier:
http://www.speaknspell.co.uk/speaknspell.html
Kraftwerkfans werden es sofort erkennen.

9 thoughts on “Der Vocoder

  1. Na das ist ja mal ein interessanter Beitrag! – Ich hab mir solche Effektgeräte bisher ja immer etwas einfacher vorgestellt: Nämlich nur die Filterbank, wobei dann allerdings die „Lautstärke“ (und ein wenig auch die Bandbreite) von jedem Filter einzeln einstellbar ist. Die einzelnen Signale dann wieder durch einen Summierverstärker geschickt und fertig. War aber wohl zuuu einfach gedacht…
    Gibt’s auch irgendwo Schaltpläne für so’n Gerät, die unter einer Public Domain oder sonstigen „Open-something“-Lizenz stehen?

  2. @Hans: Das, was Du meinst, nennt man landlaeufig „Graphischer Equalizer“ (bzw., wenn auch die Bandbreite einstellbar ist, „Parametrischer Equalizer“) und das ist in der Tat ein viel einfacheres Geraet 🙂

    Es gibt inzwischen so viele digitale Vocoder als Plugins, dass eigentlich niemand mehr einen analogen einsetzt 🙂

    (Mein erster war aber ein analoger – der MAM VF-11)

  3. Sollte eigentlich kein Problem sein, Schaltpläne zu finden. Einfach in der Suchmaschine Deines Vertrauens „vocoder schematic“ eingeben, dann kommt schon einiges.
    Da ich keinen analogen Vocoder besitze, habe ich die Beispiele mit einem Freeware-Plugin gemacht.

  4. @Pragmatiker: Wenn ich da so drüber nachdenke, ergibt die Erklärung einen Sinn, wobei sich mir der Zweck von Equalizern zumindest bei der heimischen Stereoanlage nie erschlossen hat. – Soll zur Anpassung des Klangbildes an die räumlichen Gegebenheiten dienen… Wahrscheinlich bin ich dafür nicht Audiophil genug.
    Andrerseits dachte ich dabei aber auch an Filterbänke, mit jeweils etwa 100 Hz (nicht kHz!) Bandbreite pro Filter, die im Extremfall auch als Bandsperre arbeiten. Das würde für den Audiobereich, wenn man bis 20kHz geht, bedeuten, dass man es mit 200 Filtern zu tun hat, die alle einzeln einstellbar sind. Würde bei „parametrischen Filtern“ mit je einem Regler für obere und untere Grenzfrequenz sowie einem „Lautstärkeregler“ also ein Schaltpult mit 600 Drehknöpfen ergeben…

    @Arne: Ja, das stimmt natürlich, aber ich dachte mir, das vielleicht schon jemand einen guten Link kennt.

    Noch allgemein zur Unterscheidung Analog vs. Digital. Wenn ich Euch richtig verstehe, dann meint Ihr mit „analog“ einen Vocoder in Form eines Gerätes, das man beispielsweise am Mischpult anschliessen kann, während ein „digitaler Vocoder“ ein Programm ist, das einen Sounddatenstrom im PC bearbeitet. Oder seh ich das falsch?
    Ich seh die Unterscheidung da etwas anders: da kann ein digitaler Vocoder durchaus auch als Schaltung vorliegen, die dann aber weniger aus passiven Bauteilen und OpAmps besteht als vielmehr aus DSPs, um es mal mit Elektronikerbegriffen auszudrücken.

  5. @Hans: Ein Equalizer kann zur Anpassung an einen Raum benutzt werden, hauptsaechlich zur Unterdrueckung von stehenden Wellen durch Resonanzen im Raum. Dann setzt man normalerweise die Centerfrequenz eines Bandes auf diese Resonanz, stellt den Filter sehr schmal (hoher Q-Faktor), und dreht ihn dann weit runter. Dann wird das Musiksignal bei der entsprechenden Frequenz viel leiser wiedergegeben, dann allerdings von der Raumresonanz wieder verstaerkt, das Ergebnis ist dann eben eine halbwegs lineare Wiedergabe.

    Allerdings beseitigt man unerwuenschte Raumeffekte eher mit baulichen Massnahmen, EQ sollte nur ein Notbehelf sein. Und andere Effekte wie z.B. Hall kann man sowieso nicht durch Signalbearbeitung ausgleichen.

    Uebrigens sind die Filterbaender sowohl in graphischen EQs als auch in Vocodern meist nicht linear angeordnet, sondern logarithmisch. Also nicht 100 Hz, 200 Hz, 300 Hz, 400 Hz usw. sondern 100 Hz, 200 Hz, 400 Hz, 800 Hz. etc. – das entspricht u.a. eher dem Funktionieren des Ohres, das bei hoeheren Frequenzen eine niedrigere Aufloesung hat.

    Es gibt auch digitale Vocoder, die man ans (analoge) Mischpult (es gibt auch digitale :)) anschliessen kann. Die haben dann eben D/A und A/D-Wandler drin 🙂 Aber ein Vocoder ist ein recht einfaches Geraet und wenn man das analog braucht, kann man fuer 200 Euro einen vollanalogen, guten Vocoder kaufen. Also der Umweg ueber digital lohnt sich dann eigentlich nicht, da ein Vocoder recht viel Rechenleistung braucht.

    So, jetzt reicht’s aber 😉

  6. Da der Vocoder 1936 für militärische Zwecke (um Bandbreite bei der Übertragung von Sprache zu sparen) erfunden wurde, kann er nicht so komplex sein. Könnte man erfahren mit welchem Plugin Du die Effekte gemacht hast?

  7. @Bernd: Er wurde eher zur Verschluessung von Sprache genutzt, naemlich indem die Frequenzbaender nach einem bestimmten Schema vertauscht wurden. Dadurch wurde die Sprache (da die Formanten nun komplett durcheinander waren) unverstaendlich, und erst nach derselben Vertauschung auf der Empfaengerseite wieder verstaendlich.

  8. @Pragmatiker: Danke für die Infos bezüglich Raumklang. Derartige Probleme hatte ich bisher noch nicht; – jetzt weis ich auch, warum ich da nicht mitreden kann. 🙂
    Ach ja, und die logarithmische Funktionsweise des Ohrs… – vergess ich auch immer wieder mal :-/

    Was den Vocoder selbst angeht, so hab ich auf Arne’s Antwort gestern mal ’ne Suchmaschiene gefragt, und bin dabei u.a. auf eine Serviceseite der Firma Korg gestossen, die dort Serviceunterlagen von alten Geräten zur Verfügung stellt. Da hab ich mir mal die Unterlagen des Korg VC 10 von 1978 herunter geladen. Sehr interessantes Gerät weil gleich mit eingebautem Synthesizer. Aber wahrscheinlich eher schwierig nachzubauen…
    Da ist es wohl wirklich billiger, ein fertiges Gerät zu kaufen, wenn man eines braucht. Und ja, dass ein voll in Software realisierter Vocoder ziemlich viel Rechenpower braucht, ist klar. Ist ja schliesslich angewandte numerische Mathematik, die hinter der Umsetzung der digitalen Filter steckt, aus denen so ein Programm im Kern besteht.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre mehr darüber, wie deine Kommentardaten verarbeitet werden.