Horst-Peter Hesse
Ekmelische Musik — Prinzipien ihrer Harmonik und deren neurophysiologische Basis

Die freie Musik

Salzburg ist bekannt als die Stadt, in der Wolfgang Amadeus Mozart geboren wurde. Daher ist es natürlich, dass die Erschließung und Pflege seines Werkes hier einen hohen Rang einnehmen. Weit weniger geläufig ist die Tatsache, dass Salzburg auch die Stadt ist, in der im Jahre 1922 die Internationale Gesellschaft für Neue Musik gegründet wurde, die zur Förderung des zeitgenössischen Musikschaffens jährlich Musikfeste in verschiedenen europäischen Städten veranstaltet.

Auf dem ersten Musikfest, das 1923 in Salzburg stattfand, wurde unter anderem Alois Hábas Viertelton-Streichquartett op. 12 uraufgeführt. Das mit großem Beifall aufgeführte Werk wurde vorgetragen durch das Frankfurter Amar-Quartett, in dem kein Geringerer als der Komponist Paul Hindemith die Bratsche spielte. Hába hatte, ebenso wie Béla Bartók, Vierteltöne und andere von unserem geläufigen Zwölf-Halbtöne-System abweichende Tonstufen in der osteuropäischen Volksmusik beobachtet, und war dadurch angeregt worden, sie in seiner Musik kompositorisch zu verarbeiten.

Es war zwar schon zu Beginn unseres Jahrhunderts in weiten Kreisen bekannt, dass in der Musik des Orients ebenso wie in der Volksmusik im Südosten Europas bestimmte Intervalle, die von der gleichstufig temperierten Stimmung abweichen, von alters her gebräuchlich sind. Auch hatte es seit Mitte des vorigen Jahrhunderts verschiedene Studien zur Reinstimmung der Terzen und vereinzelte Ansätze zur Wiedereinführung der griechischen Enharmonik mit ihren Vierteltonintervallen gegeben. Aber erst um die Wende zum 20. Jahrhundert wurde in verschiedenen Musikzentren der Gedanke diskutiert, die Grenzen des traditionellen Tonsystems zu sprengen und Tonstufen zu verwenden, die von der gleichmäßig logarithmischen Zwölfteilung der Oktave abweichen, um dadurch die Ausdrucksfähigkeit der Musik zu bereichern.

Unter den Komponisten schälten sich von Anfang an zwei Richtungen heraus: Neben denen, die die bestehende Musik verfeinern und weiterentwickeln wollten, gab es andere, die bereit waren, radikal mit der Musiktradition zu brechen. Mit folgenden Sätzen beginnen die "Thesen der freien Musik" des St. Petersburger Kunst- und Musiktheoretikers Nikolaj Kulbin:

Die Musik der Natur — das Licht, der Donner, das Sausen des Windes, das Plätschern des Wassers, der Gesang der Vögel — ist in der Auswahl der Töne frei. Die Nachtigall singt nicht nur nach Noten der jetzigen Musik, sondern nach allen, die ihr angenehm sind. ... Der Künstler der freien Musik wird wie die Nachtigall von den Tönen und Halbtönen nicht beschränkt. Er benutzt auch die Viertel- und Achteltöne und die Musik mit freier Auswahl der Töne. 1

Diese Thesen wurden von Kandinsky im Almanach "Der blaue Reiter" abgedruckt. Sie legen Zeugnis ab von der damals unter Künstlern vielerorts gärenden Sehnsucht, alle Fesseln der Tradition abzuschütteln und — nachdem die Alleinherrschaft der Funktionsharmonik und der Taktrhythmik gebrochen waren — auch die Tonhöhenorganisation aus überkommenen Begrenzungen zu befreien und in neue Klangwelten vorzustoßen.

Die Ästhetik der Freiheit, die in der Musik proklamiert wurde, hat unser Jahrhundert zu einem Zeitalter des extremen Individualismus gemacht, in dem es — im Gegensatz zu früheren Jahrhunderten — nur schwer möglich ist, einheitliche Entwicklungslinien aufzuspüren. Das gilt auch für die kompositorischen Experimente im Bereich der feinstufig organisierten Musik und deren Entfaltung, die bei den einzelnen Komponisten extrem unterschiedlich verlief. Ein Hauptprinzip in Hábas Schaffen ist die Distanzteilung, die Entwicklung von Leitern mit immer engeren Stufen, die gleichmäßig temperiert sein müssen, um die freie Transponierbarkeit zu gewährleisten. In seiner "Neuen Harmonielehre" aus dem Jahre 1927 verwendet er Zwölfteltöne (17 Cent) als kleinste Intervalle der melodischen Struktur. 2

Hába listet in seiner Harmonielehre auch eine Fülle von vertikalen Tonkombinationen auf, ohne aber Regeln für die Fortschreitung von Akkord zu Akkord zu geben. In seinem musikalischen Denken knüpft er nämlich an die von Schönberg vertretene Meinung an, dass es keine "harmoniefremden" Töne gäbe, wie es in der traditionellen Musiktheorie gelehrt wurde, sondern dass man jeden Ton mit jedem anderen verbinden könne, und zwar horizontal wie vertikal. Für den Komponisten solle nicht nur in der Melodik sondern auch in der Harmonik absolute schöpferische Freiheit herrschen. Hier stehen bei ihm sämtliche Mikrotonstufen gleichberechtigt neben den traditionellen zwölf Halbtönen. Aus dieser Freiheit der Tonhöhenordnung folgt für Hába ein einheitliches Gesetz für diese beiden musikalischen Dimensionen:

Das Prinzip der Leiter« — so schreibt er in der Harmonielehre — »ist das Fundament aller melodischen und harmonischen Bildungen. Es gibt kein separates konstruktives Gesetz für die Melodiebildung (die Leiter) und ein anderes konstruktives Gesetz für die Harmoniebildung (Terzen-, Quarten- oder andere Systeme), sondern die Leiter (gleichviel ob Dur, Moll, chromatische oder bichromatische u.a.) ist das gemeinsame Gesetz für Melodie- und Harmoniebildung.

Während Hábas Weg in die Mikrotonalität über eine Verkleinerung der melodischen Schritte — also über eine Distanzminimierung in der horizontalen Dimension — führte, wählten andere den Einstieg über die musikalische Vertikale, die Harmonik. Der Gedanke, dass unser Tonsystem nicht nur die Melodik sondern auch die Harmonik in Grenzen gezwungen haben könnte, innerhalb derer das Differenzierungsvermögen unseres Gehörs für simultane Klangverbindungen nicht ausgeschöpft wird, war der Auslöser dafür, dass im Jahre 1972 das Institut für Musikalische Grundlagenforschung am Mozarteum in Salzburg gegründet wurde. Hier wurden seitdem die unermesslich zahlreichen Möglichkeiten, Intervalle der verschiedensten Größe zu Akkorden zu kombinieren, in methodisch geplanten Serien ausgeführt, von geschulten Musikern gehörsmäßig beurteilt und kompositorisch auf die Probe gestellt.

Bei der Übereinanderschichtung von Intervallen sind zwar theoretisch beliebige Kombinationen möglich, aber einige heben sich durch eine spezifische Klangqualität heraus. Das gilt — wie seit der Antike bekannt ist — für alle Intervalle, deren Frequenzverhältnisse durch kleine ganze Zahlen ausgedrückt werden können. Erklingen Töne gleichzeitig, so genießen bestimmte Kombinationen auf Grund der Qualität des Zusammenklanges in der menschlichen Wahrnehmung eine Sonderstellung. Sie bilden prägnante, geschlossene Gestalten im Sinne der Gestalttheorie und sind gegenüber allen anderen dadurch ausgezeichnet, dass man sie mit hoher Präzision erkennen und einstimmen kann.

Die Art der Tonverwandtschaft lässt sich aus den Frequenzproportionen ablesen, die das Intervall bestimmen. Unter allen Intervallen bildet die Oktave den engsten Zusammenhang. Ihre Frequenzproportion 2:1 enthält die Primzahl 2. Die beiden Töne des Intervalls verschmelzen zu einer Einheit, die als ein einziger Ton aufgefasst werden kann. Wir nennen den Grad des Verbundenseins die Geschlossenheit des Intervalls. Mit dem Anwachsen der Proportionszahlen nimmt die Geschlossenheit ab. Das am nächstbesten verschmelzende Intervall ist die Quinte, ihre Proportion 3:2 enthält die Primzahl 3. Der nächste Verwandtschaftsgrad wird durch die große Terz repräsentiert. Deren Proportion lautet 5:4, sie enthält also als neue Primzahl die 5. Auf Grund der unterschiedlichen Primzahlen bergen die Proportionen ein Problem, das ebenfalls bereits in der Antike bekannt war. Schichtet man rein gestimmte Quinten übereinander, so trifft die zwölfte Quinte nicht mit der siebten übereinander aufgebauten Oktave zusammen. Der Quintenturm überschreitet die Oktaven um das sogenannte pythagoreische Komma. Das gleiche gilt in ähnlicher Weise für die auf Grund von Terzverwandtschaft gebildeten Intervalle. Drei reine große Terzen – übereinander aufgebaut – unterschreiten die Oktave um einen Viertelton.

Unser heutiges, das sogenannte gleichstufig temperierte Tonsystem umfasst bekanntlich zwölf gleichgroße Stufen innerhalb der Oktave. Es steht in enger Beziehung zur Entwicklung der Tasteninstrumente. Bei seiner Konstituierung waren drei Ziele zu berücksichtigen: Erstens, dass die auf den Tasteninstrumenten spielbaren Intervalle den genannten Proportionen möglichst nahe kommen, zweitens, dass man auf diesen Instrumenten trotz deren fester Stimmung frei transponieren konnte, und drittens dass die mit den zwölf Tonstufen zu bildenden Intervalle sich übereinander schichten lassen, ohne dass Kommata entstehen. In diesem System kann aber nur eine geringe Auswahl aus den vom Gehör zu unterscheidenden Intervallen realisiert werden. Es sind dies diejenigen Intervalle, deren Frequenzverhältnisse durch die Zahlen 1, 2, 3 und 5 oder Produkte aus diesen Zahlen gebildet werden, oder – genauer gesagt – Intervalle, die diesen Proportionen nahe kommen.

Die Reihe der naturgegebenen Intervalle beschränkt sich jedoch nicht auf Oktaven, Quinten und Terzen sondern setzt sich in den höheren Partialtönen, die jeden Grundton begleiten können, fort. Man kann sie auf Saiteninstrumenten als Flageolett-Töne hörbar machen. Wie aber klingen Akkorde aus Intervallen, deren Frequenzverhältnisse durch höhere Primzahlen wie 7, 11, 13 und so weiter bestimmt sind? Können vielleicht außerhalb der Grenzen unseres Tonsystems neue Akkorde mit eigenständiger Qualität entdeckt werden? Zwei Gründungsmitglieder des Instituts für musikalische Grundlagenforschung, die Salzburger Komponisten Franz Richter Herf und Rolf Maedel, entdeckten unter den unermesslich zahlreichen Möglichkeiten, Intervalle zu Akkorden zu kombinieren, eine durch besondere Eigenschaften ausgezeichnete Konstellation: Immer dann, wenn die Proportionszahlen der beteiligten Töne eine Arithmetische Folge bilden, entstehen statisch-homogene Zusammenklänge, deren Klangcharakter ein breites Spektrum von leuchtender Transparenz bis zum Trüben, zum Unruhigen oder zu spröder Rauhigkeit umfasst.

Arithmetische Folgen werden gebildet, indem zu einem Anfangsglied (a) wiederholt die gleiche Differenz (d) hinzuaddiert wird. Wir nennen dies Folge d auf a und schreiben abgekürzt d || a. Setzen wir a = 1 und d = 1, entsteht die einfachste Folge 1 || 1, also 1:2:3:4:5…. Es ist evident, dass die Partialfrequenzreihe bei schwingenden Saiten oder Luftsäulen nach diesem Prinzip aufgebaut ist. Bei mehrdimensionalen Schwingungssystemen — beispielsweise bei Stäben oder Glocken — gibt es andere Partialfrequenzreihen, die zwar komplizierter, aber in vielen Fällen ebenfalls regelmäßig sind. Ein Akkord kann durch einen Ausschnitt aus einer derartigen Reihe gebildet werden. Mit solchen, der Natur des Glockenklanges abgelauschten Strukturen können zahlreiche neue, wohlklingende Akkorde gebildet und in musikalischen Kompositionen verarbeitet werden.

Während Hába "das Prinzip der Leiter" zum Fundament der melodischen und harmonikalen Strukturen erklärte, konstruierte Richter Herf die Leitern jeweils so, dass sie die Bildung bestimmter intendierter Akkorde erlauben. Zur Kennzeichnung dieser neuen Musik nahmen die beiden Salzburger einen Begriff aus der griechischen Musiktheorie auf. Sie bezeichneten die außerhalb des traditionellen 12-Stufen-Systems liegenden Tonhöhen als ekmelisch und Kompositionen, in denen die neugewonnenen klanglichen Möglichkeiten musikalisch umgesetzt werden, dementsprechend als Ekmelische Musik. Diese Musik wird in einem 72-stufig temperierten System notiert, aus dem jede Komposition eine spezifische Auswahl von Tönen verwendet, die untereinander durch Frequenzproportionen in Beziehung stehen.

Gestalttheorie

Eine Gruppe von Tönen wird wie gesagt unter bestimmten Bedingungen als zusammengehörige Einheit aufgefasst. Das gilt in weiterem Sinne nicht nur für simultan erklingende Töne, für Intervalle und Akkorde, sondern für Melodien gleichermaßen; man nimmt sie als prägnante Gebilde wahr, als geschlossene und zugleich strukturierte Einheiten, die durch eine spezifische Klangqualität ausgezeichnet sind. Solche Tonverbindungen haben Eigenschaften, die an den einzelnen Tönen nicht in Erscheinung treten. Die neuen Eigenschaften entstehen aber nicht durch Mischung der beteiligten Toneigenschaften, denn die Einzeltöne behalten ihre Identität; sie gehen nicht – wie gemischte Farben – in dem Verschmelzungsprodukt auf sondern können bei aufmerksamem Hinhören als Elemente des Ganzen herausgehört werden. Darüber hinaus aber ist durch die Zusammenfügung der Töne etwas Neues entstanden, eine Tongestalt, die durch eigene Merkmale charakterisiert ist.

Der Philosoph Christian Freiherr von Ehrenfels hatte Ende des 19. Jahrhunderts den Blick auf die seit der Antike bekannte These "Das Ganze ist mehr als die Summe seiner Teile" gelenkt. 3 Intervalle, Akkorde, Motive und Melodien lassen sich innerhalb des Tonsystems transponieren, wobei jeder Ton durch einen anderen ersetzt wird, ohne dass das Ganze seinen spezifischen Charakter verliert. Für diejenigen Eigenschaften, die trotz Transposition unverändert erhalten bleiben, prägte Ehrenfels den Begriff Gestaltqualitäten. Natürlich war die Existenz von Gestalten seit jeher bekannt, aber die Frage, wie es im Prozess der Wahrnehmung zur Entstehung von Gestalten kommt, wurde nach dem Anstoß, den Ehrenfels gegeben hatte, neu durchdacht. Während man bis dahin davon ausging, dass Zusammenhänge zwischen Einzelempfindungen durch bewusste psychische Aktivität erzeugt würden, trat nun die kühne These in die Diskussion, dass Gestalten nicht sekundäre Produkte sind, die das Subjekt mehr oder weniger willentlich aus den einzelnen Wahrnehmungselementen zusammensetzt, sondern dass in sich geschlossene Ganzheiten im Erlebnis primär gegeben sind. Dies wurde als "spontane gestalthafte Organisation" bezeichnet.

Natürlich haben sich an dieser Behauptung lebhafte wissenschaftliche Kontroversen entzündet, obgleich die Alltagserfahrung diese Aussage stützt: Wir sehen um uns herum Dinge und Ereignisse und nicht etwa ein Raster von verschiedenen Farbtönen in unterschiedlicher Helligkeit. Lausche ich dem Spiel auf einem Musikinstrument, so höre ich kein Spektrum von Sinustönen sondern eine Melodie in einer bestimmten Klangfarbe. Die Klangfarbe erkennt man, auch wenn man die konstituierenden Teiltöne nicht identifizieren kann. Man kann Rhythmen erfassen und im Gedächtnis behalten, ohne die einzelnen Notenwerte zu wissen, Melodien entsprechend, ohne über Einzeltöne bzw. Intervalle Rechenschaft ablegen zu können. Aus den Gestalten kann man nachträglich – bei analytischer Einstellung – Elemente ausgliedern, auf Grund derer rationale Aussagen über das Gehörte erleichtert werden oder das Gehörte aufgeschrieben werden kann.

Dass wir dies so erleben, wurde zwar von niemandem bezweifelt, wohl aber gab es unterschiedliche Antworten auf die Fragen, ob ein physiologischer oder ein psychischer Ordnungsprozess der bewussten Wahrnehmung vorangegangen sei und ob bzw. in welchem Umfange die gestaltbildenden Tendenzen angeboren oder von Traditionen und Lernprozessen abhängig sind oder gar durch Lenkung der Aufmerksamkeit willentlich beeinflusst werden können. Ist beispielsweise das Grundtonempfinden bei Melodien oder Zusammenklängen naturgegeben oder durch Gewöhnung entstanden, liegen die Kriterien für die Qualität der Intervalle in der klingenden Materie oder in Struktur und Arbeitsweise des Nervensystems, oder spielen hier Konventionen eine entscheidende Rolle? Eine Antwort auf die Frage, ob die beobachteten Wechselwirkungen bereits auf der physischen oder erst auf der psychischen Ebene stattfinden, ist insofern von großer Bedeutung, als Wechselwirkungen, die schon im physischen Bereich stattfinden, der Willensentscheidung entzogen sind und daher als anthropologische Konstanten gelten können.

Zur Frequenzanalyse im Innenohr

Die Vorgänge im Innenohr und in den von dort zur Großhirnrinde führenden Nervenbahnen sind derart kompliziert, dass deren Deutung noch immer Hypothesen erfordert, die über die Lücken zwischen gesicherten Fakten hinweg vermitteln. Die hypothetischen Erklärungsmodelle lassen sich auf zwei unterschiedliche Prinzipien zurückführen, in denen die Vertreter zweier divergierender Forschungsrichtungen die Lösung von grundlegenden Problemen des Hörens vermuten. Das erste Prinzip liegt der sogenannten Ortstheorie des Hörens zugrunde, die — ausgehend von der Helmholtzschen Resonanztheorie 4

vor allem durch die bahnbrechenden Forschungen des Nobelpreisträgers Georg von Békésy weiterentwickelt wurde. 5 Wir wissen heute, dass im menschlichen Innenohr eine Frequenzanalyse stattfindet, als deren Ergebnis die Schallwellen — je nach ihrer Frequenz — an unterschiedlichen Orten der Cochlea Nervenimpulse auslösen, und dass komplexe Schallwellen durch eine ihren Frequenzkomponenten entsprechende, örtlich aufgefächerte Erregungsverteilung repräsentiert werden. Diese im Innenohr beginnende sogenannte Tonotopie läßt sich im gesamten auditorischen System bis in die Hirnrinde verfolgen. Die Verarbeitung der Nervenimpulse in den höheren Zentren der Hörbahn entzieht sich jedoch dem Zugriff der Forschung noch immer weitgehend. Daher versuchte man, so viele Hörphänomene wie möglich durch peripherienahe Prozesse zu erklären.

Viele Beobachtungen können allerdings bis heute nicht in befriedigendem Umfange erklärt werden. Das gilt insbesondere für eine Reihe von Wechselwirkungen, die bei gleichzeitig erklingenden Tönen auftreten. Die ungeklärten bzw. bisher kontrovers beantworteten Fragen beginnen jedoch schon bei der Wahrnehmung des Einzeltones. Die Tonhöhenwahrnehmung ist nicht etwa bei sinusförmigen Schallwellen besonders präzise, im Gegenteil: Die Genauigkeit, mit der die Tonhöhe bestimmt werden kann, steigt mit der Anzahl der harmonischen Komponenten einer Schallwelle (bis zu einem Grenzwert), obgleich die Beurteilung durch die Obertöne doch eigentlich erschwert werden müsste, da diese eine Reihe sich kontinuierlich verengender Intervalle über dem Grundton bilden. Eine einheitliche Tonhöhe kann sogar dann gehört werden, wenn die Grundfrequenz im Schwingungsvorgang objektiv gar nicht vorhanden ist. Diese Tonhöhenempfindung, der keine Grundfrequenz im Schallspektrum gegenübersteht, wurde von ihrem Entdecker, dem Holländer Schouten, Residuum genannt. 6 Er fand, dass die höheren Harmonischen nicht einzeln aufgefass werden können, sondern dass sie kollektiv wirksam werden mit einer Tonhöhe, die derjenigen des Grundtons entspricht. Das würde bedeuten, dass die Residualtonwahrnehmung auf Reizung von Orten in der Cochlea beruht, deren Erregung durch sinusförmigen Schall sonst die Wahrnehmung hoher Töne bewirkt.

Zur Erklärung dieses Phänomens lieferte Ernst Terhardt ein Modell auf der Basis der Ortstheorie, das wegen seiner Evidenz sehr schnell Eingang in das Schrifttum fand: 7 Wenn ein Ton erstens nicht durch einen einzigen Ort in der Cochlea repräsentiert wird sondern — wegen seiner Zusammensetzung aus Partialtönen — durch die von verschiedenen Orten ausgehenden Nervenimpulse, und wenn diese Orte zweitens — wegen des regelmäßigen Aufbaus der Partialtonreihe — in festen Distanzverhältnissen zueinander stehen, dann könnte die Tonhöhenerkennung als ein erlernter Mustererkennungsprozess erklärt werden, der auch bei unvollständigem Muster (z.B. bei fehlendem Grundton) aus der Konstellation der übrigen Teiltöne die Tonhöhe erkennt, so wie auch unvollständige optische Zeichen erkannt werden. Terhardt nennt die Tonhöhenempfindung in diesem Falle Virtuelle Tonhöhe.

Auch die musikalisch fundamentale Unterscheidung von Konsonanz und Dissonanz hat Terhardt sehr gründlich beleuchtet. 8 Sein Konzept schließt eng an die Helmholtzsche Theorie an, wo es heißt:

Wenn zwei musikalische Klänge nebeneinander erklingen, ergeben sich im allgemeinen Störungen ihres Zusammenklingens durch die Schwebungen, welche ihre Partialtöne miteinander hervorbringen, so daß [...] der Zusammenklang rauh wird. 9

Es mußte aber ein weiterer Faktor berücksichtigt werden. Schon Stumpf hatte beobachtet, daß die als optimal empfundene Intonation eines Intervalles davon abhängt, ob es simultan oder sukzessiv dargeboten wird. Bei simultaner Darbietung mehrerer Schallschwingungen beeinflussen die einzelnen Komponenten sich offenbar gegenseitig in der Weise, dass die frequenzspezifischen Erregungsmaxima sich gegenüber ihrer Lage bei Einzeldarbietung auseinanderschieben.

Tritt also zu einem Grundton dessen Oktave hinzu, so spreizt sich der Abstand zwischen den beiden Erregungsmaxima, der – nach der Ortstheorie – als Tondistanz, als Intervall bewuss wird. Durch die Erfahrung mit stimmhaften Sprachlauten, deren erste sechs harmonische Komponenten einen über zweieinhalb Oktaven ausgebreiteten Durdreiklang bilden, erlange das Gehör — so Terhardts Hypothese — eine Kenntnis von Tonhöhendistanzen, die sich als Normwerte einprägen. Erklingen nun beispielsweise Grundton und Oktave nicht gleichzeitig sondern nacheinander, so verringere sich der Abstand der Erregungsmaxima gegenüber der für die Oktave vorgespeicherten Norm; das Gehör verlange daher eine Erhöhung des Oktavtones. Aus dieser Sicht könne die Sonderstellung, die die einfachen Zahlenverhältnisse seit Jahrtausenden genießen, nicht mehr aufrechterhalten werden.

Terhardt modifizierte die traditionelle Theorie nun dahingehend, dass er für die Bestimmung der Intervallgrößen nicht die Verhältnisse kleiner ganzer Zahlen gelten ließ, sondern diese durch Tonhöhendistanzen ersetzte, da die beim Zusammenklingen erfolgende Spreizung der Intervalle berücksichtigt werden müsse. In diesem Zusammenhang stellte er folgende Thesen auf: 10

  • [...], dass bei der musikalischen Wahrnehmung keineswegs die einfachen Frequenzverhältnisse als solche maßgebend sind, sondern vielmehr die Tonhöhendistanzen.
  • [...], dass die Tonhöhendistanzen zwischen den ersten sechs bis acht Harmonischen durch fortgesetzte Analyse von einzelnen komplexen Tönen verschiedener Grundfrequenzen vom Gehör erlernt werden.
  • [...], dass es eine feste, theoretisch ideale Intonation der Intervalle nicht gibt.

Die Aussagen haben weitgehende Folgen, und deshalb wurde am Institut für musikalische Grundlagenforschung experimentell überprüft, ob sie für die Intonation von Akkorden von Bedeutung sind. 11 Der Autor benutzte sechsstimmige Akkorde, deren Proportionszahlen arithmetische Folgen bilden. Die Struktur weicht deutlich von dem bei den ersten sechs bis acht Harmonischen gegebenen Aufbau ab, kann also nicht durch Lernprozesse vertraut geworden sein. Diese Akkorde wurden in gleichstufig temperierter und in proportionaler, den Frequenzverhältnissen entsprechender Intonation hergestellt, um die beiden Versionen miteinander zu vergleichen.

Vertrauter Akkord
Proportion234568
Fremdartiger Akkordas¹ges²
Proportion5811141720

Alle benachbarten Tönen sind mindestens um eine Terz voneinander entfernt, so dass sie keine stärkeren unmittelbaren Schwebungen erzeugen. Es treten aber etliche Partialtöne in eng benachbarter Lage auf, so dass der entstehende Klangeindruck sowohl in temperierter als auch in proportionaler Stimmung in hohem Grade gestört sein müsste. In temperierter Stimmung klingt der Akkord tatsächlich verschwommen, unscharf, trüb; er ist mit einer verwackelten Photographie zu vergleichen. Wird die Stimmung dagegen so justiert, dass sie den Proportionen exakt entspricht, so wirkt der "fremdartige" Akkord klar und scharf gezeichnet; er bietet jetzt — trotz Kollision etlicher Partialtöne — den Eindruck von Geschlossenheit bei klaren Konturen. Dieser Gegensatz lässt sich in entsprechender Weise mit vielen anderen Akkordpaaren bestätigen. Bei Zusammenklängen gelten also nach unseren Untersuchungen tatsächlich die einfachen Proportionen. Die Klangqualität kann durch das Terhardtsche Modell auf der Basis der Ortstheorie nicht hinreichend erklärt werden. Es müssen daher andere Ursachen zur Erklärung der Phänomene herangezogen werden.

Die Mikrorhythmen-Theorie

Vertreter der zweiten oben erwähnten Forschungsrichtung sehen die Ursache mancher schwer erklärbaren Tatsachen auf dem Gebiet des Hörens darin, dass das Nervensystem neben dem örtlichen Code — also dem Ort der gereizten Nervenzelle — auch die zeitliche Struktur der Nervenimpulsfolgen als Informationsträger benutzt. Dieser Gedanke knüpft an eine Reihe von Hypothesen an, die zur Zeit ihrer Entstehung noch nicht durch neurophysiologische Erkenntnisse gestützt werden konnten. Die Grundidee geht auf Leonhardt Euler zurück. 12 In seiner Epoche war die Wellennatur des Schalles erkannt worden, und man führte die Tonempfindung auf periodische Anstöße des Trommelfells zurück, deren Aufeinanderfolge in bestimmter Weise zeitlich geordnet ist. Dann — so folgerte Euler — müßte die mikrozeitliche Gliederung dieser Reihe von Stößen für den Organismus von Bedeutung sein.

Ein Objekt gefällt uns, heißt es im II. Kapitel des Tentamen, in welchem wir eine ihm innewohnende Ordnung wahrnehmen. Placent itaque ea, in quibus ordinem, qui inest, percipimus. 13
Je leichter die Ordnung zu erfassen ist, desto vollkommener gilt es uns, und erfüllt uns deshalb mit innerer Freude. Quo facilius ordinem, qui in re proposita inest, percipimus, eosimpliciorem ac perfectionem eum existimamus idioque gaudio et laetitiaquadam afficimur. 14

Euler stellte die Luftpulse durch Reihen von Punkten dar, deren Abstände der Periodendauer der jeweiligen Schwingung entsprechen. Bei gleichzeitig erklingenden Tönen fügen sich die Punktreihen, die die einzelnen Schallwellen repräsentieren, zu übergeordneten Gruppen zusammen, die — in Abhängigkeit vom Frequenzverhältnis — eine kleinere oder größere Zahl von Punkten umfassen und in bestimmter Weise gegliedert sind. Ist das Frequenzverhältnis p:q, so passen in p Perioden der einen Reihe genau q Perioden der anderen. Die Ordnung in dem entstehenden Muster ist nicht von den absoluten Frequenzen sondern allein von den Proportionszahlen abhängig. Daraus ergibt sich für Euler die Transponierbarkeit der Intervalle. Die Ordnung wird um so komplexer und damit schwerer zu erfassen, je größer die am Ausdruck des Frequenzverhältnisses beteiligten Primzahlen sind.

Oktave2o o o o o o o o o
1o o o o o
Duodezime3o o o o o o o o o o o o o
1o o o o o
Quinte3o o o o o o o o o o o o o
2o o o o o o o o o

Kurz vor der Wende zum 20. Jahrhundert nahm der Philosoph Theodor Lipps diese Gedanken wieder auf und bemühte sich — gegen den Widerstand Stumpfs — sie mit dessen Begriff "Verschmelzung" in Einklang zu bringen. 15 Lipps verlegte in seiner Mikrorhythmen-Theorie die Eulerschen Punktmuster in die Ebene der Nervenaktivität. Er hielt es für möglich, dass die durch Töne ausgelösten Nervenimpulsketten in den zentralen Bahnen des Hörnervensystems den Rhythmus physikalischer Schwingungen widerspiegeln.

Nun überträgt sich freilich der Rhythmus der physikalischen Schwingungen in den physiologischen Organen in eine andere Sprache. [...] Aber die Möglichkeit besteht, [...] dass der Rhythmus dieser psychischen Vorgänge dem Rhythmus der physikalischen Schwingungen analog bleibt, so weit zum mindesten, dass das Verhältnis der psychischen Rhythmen mit dem Verhältnis der physikalischen in Vergleich gestellt werden kann. 16

Sind die zwei Tönen zugeordneten Schwingungszahlen p und q, so werden sich auch die Perioden der durch die Schallschwingungen erzeugten nervlichen Teilvorgänge entsprechend verhalten und p Teilvorgänge des einen das gleiche Zeitintervall z ausfüllen wie q Teilvorgängen des anderen. Demnach ist die gesamte neurale Aktivität bei konsonanten Mehrklängen mikrorhythmisch gegliedert, und es wird verständlich, dass konsonante Zusammenklänge in der Wahrnehmung als geschlossene Einheiten aufgefasst werden.

Konsonanz besteht, sofern nach Ablauf von z immer wieder dieselben zeitlichen Zusammenordnungen eintreten. [...] Jede von mir innerlich vollzogene Weise der Zusammenordnung der Teilvorgänge erleichtert den Vollzug der folgenden gleichen Weise der Zusammenordnung. 17

Kritiker der Mikrorhythmen-Theorie argumentierten mit dem Einwand, dass wir gerade bei den tiefsten Tönen, wo wir den Schwingungsrhythmus noch wahrnehmen können, die konsonanten Intervalle keineswegs angenehmer finden als die dissonanten. Lipps' Antwort lautete: Die psychische Zusammenordnung ist um so vollkommener, je rascher sie erfolgt, d.h. je kürzer z ist. Bei den tiefsten Tönen aber ist z um ein Vielfaches länger als in den höheren Lagen, und mit der Länge des Zeitintervalls z nimmt die bindende Kraft ab.

Auch im Falle leicht verstimmter Konsonanzen, wie sie bei der temperierten Stimmung vorliegen, kann dieses Bild gelten und das sogenannte Zurechthören erklären. Sind z.B. zwei Frequenzen p = 100 Hz und q = 201 Hz, die Periodendauern also Tp = 10 ms und Tq = 4,9751 ms, so ist zwar das Zeitintervall, das bis zum exakten Zusammentreffen der beiden Wellenzüge vergeht, sehr lang. Zugleich aber hat sich der Unterschied zwischen den einzelnen Teilperioden vermindert; eine Periode von 10 ms ist annähernd gleichlang wie 2 mal 4,9751 ms. Auch dann, wenn die Periodendauern zweier Impulssequenzen nur annähernd übereinstimmen, könnte dies innerhalb gewisser Grenzen wie völlige übereinstimmung aufgefasst werden, so wie im optischen etwa ein annähernd kreisförmiges oder quadratisches Gebilde wie die regelmäßige Form wirken kann, sofern die Annäherung genügend groß ist.

Ergebnisse der neueren Hörforschung

Die Mikrorhythmen-Theorie geht davon aus, dass die Periodizität des Schalls in der Nervenaktion erhalten bleibt. Der Verfasser hatte im Rahmen einer kritischen Analyse der klassischen Hörtheorien eine Reihe von Tonhöhenwahrnehmungen zusammengestellt, die allein auf der Auswertung von periodischen Gliederungen der Schallsignale, nicht aber durch die Ortstheorie erklärt werden können und dafür sprechen, dass Zeitintervalle im Nervenimpulsmuster bei der Tonhöhenerkennung eine wichtige Rolle spielen müssen. 18 Dies wurde zunächst grundsätzlich bestritten. Seit Mitte des 20. Jahrhunderts aber hat die neurophysiologische Forschung nach und nach immer mehr Beweise dafür gefunden, dass die Zeitstruktur des Schalls in Gestalt reizsynchroner Nervenimpulse im unteren Teil des Hörnervensystems tatsächlich erhalten bleibt. 19

Die als Folge des Schallsignals sich hin und her bewegenden Stereozilien der Sinneszellen führen nur bei Displazierung in einer Richtung zu Depolarisation und Freisetzung von Transmittern. [...] Die Häufigkeit der Phasen entspricht naturgemäß der Frequenz des Schallsignals. [...] Die Entladungsraten spiegeln daher das Zeitmuster des Schallsignals wider. Dieser Mechanismus funktioniert bis etwa 5 kHz. Die Periodizitätsanalyse wird von kochleären Implantaten genutzt, welche [...] in der Lage sind, trotz Reizung an nur einem Ort einen gewissen Frequenzumfang zu übertragen. 20

Damit sind die lange geleugneten Voraussetzungen für die Lipps'sche Mikrorhythmen-Theorie gegeben, und die gehörpsychologischen Befunde sprechen dafür, dass die in diesem zeitlichen Muster verschlüsselte Information in derjenigen Weise oder ähnlich ausgewertet wird, wie Lipps es postuliert hatte.

Offensichtlich werden Zeitintervalle im Nervensystem mit großer Präzision übertragen. Der Richtungseindruck beim Hören wird — neben der Auswertung von Intensitätsunterschieden, die zwischen beiden Ohren entstehen — auf Grund der äußerst geringen Zeitdifferenz gewonnen, mit der die Schallwellen die beiden Ohren erreichen. Die Laufzeitdifferenzen betragen nur Bruchteile von Millisekunden; bei der eben erkennbaren Abweichung von der Medianebene beträgt die Zeitdifferenz um 30 Mikrosekunden. 20 Diese kann nur erfasst und ausgewertet werden, wenn die zeitliche Struktur des Schalls in den von beiden Ohren kommenden Nervenbahnen zumindest bis zu den Bahnkreuzungen im Hirnstamm sehr genau repräsentiert ist.

Analyse und Synthese

"Kallisteia": Gertraud Steinkogler-Wurzinger – Sopran und fünf Harfen, Großes Studio des Mozarteums, Salzburg, 11.3.1994

Mehrere Forscher verbanden in ihren Hörtheorien Prinzipien der Ortstheorie und der Zeitreihenanalyse miteinander. 21 Nach den neuen Theorien, die zur Tonhöhenbestimmung auch die Auswertung der Zeitintervalle im Muster der Nervenimpulse einbeziehen, erfolgt die Schallanalyse in folgenden Schritten: Das Frequenzgemisch der gleichzeitig an den Ohren eintreffenden Schallvorgänge wird im Innenohr in einzelne Frequenzanteile aufgegliedert, und es werden an frequenzspezifischen Orten Nervenimpulse ausgelöst. Nach der Analyse des gesamten Schallfeldes müssen auf einer höher gelegenen Ebene des Hörnervensystems die Schallanteile gruppiert und verschiedenen Schallquellen zugeordnet werden. Bei Schall mit harmonischem Spektrum, beispielsweise den Vokalen der Sprache, sind die Frequenzen der einzelnen Partialschwingungen ganzzahlige Vielfache der Grundfrequenz. Sie lösen im Innenohr jeweils Ketten von Nervenimpulse aus. Wenn die Impulsketten aller erregten Nervenfasern aufeinander bezogen werden, so heben sich diejenigen aus der Gesamtheit heraus, bei denen die Impulse nach regelmäßigen Zeitintervallen gleichzeitig eintreffen. Das ist bei den Nervenfasern der Fall, die von Partialschwingungen eines harmonischen Spektrums erregt wurden, da deren Impulse — wie schon Euler und Lipps gezeigt haben — im Rhythmus der Grundfrequenz zusammentreffen müssen. Diese Konstellation ermöglicht eine Zusammenfassung der von der gleichen Schallquelle stammenden Schallkomponenten.

Die geschilderte biologisch notwendige Leistung des Hörnervensystems bildet gleichzeitig die Grundlage für die in der Musik genutzte Möglichkeit zur Bildung von Zusammenklängen, die als klangliche Einheiten wahrgenommen werden. Deren Perzeption als geschlossene Klanggestalten beruht also auf naturgegebenen Prinzipien des Nervensystems. Zusammenklänge der ekmelischen Musik, deren Bestandteile der Ordnung arithmetischer Folgen gehorchen, bilden die innere Ordnung von natürlichen Einzelklängen nach, und ihre Wahrnehmung und Bewertung als Konsonanzen hat nichts mit willkürlichen Setzungen und Lernvorgängen zu tun. Allerdings herrscht bei der Verbindung dieser Akkorde nicht mehr beliebige Freiheit sondern es gelten bestimmte Regeln, insbesondere die Tendenz, die unmittelbar nächstgelegenen stabilen Klänge aufkürzestem Wege zu erreichen. 22 In jedem Falle erfordert Musik, die Tonhöhen-Feinstufen auf die gezeigte Art verwendet, eine höhere Sensibilität, ein feineres Hinhören, sowohl vom Interpreten als auch vom Publikum. Denn in gleichem Maße, wie die Tonhöhen feiner abgestuft werden, steigen auch die Nuancen des musikalischen Ausdrucks.

Horst-Peter Hesse
  1. Nikolaj Kulbin: Die freie Musik. In: Klaus Lankheit (Hrsg.): Almanach “Der Blaue Reiter”, 1912. Dokumentierte Neuausgabe. München , S. 125–131.
  2. Alois Hába: Neue Harmonielehre des diatonischen, chromatischen, Viertel-, Drittel-, Sechstel- und Zwölftel-Tonsystems. 1927, Leipzig, Nachdruck München. Filmkunst-Musikverlag, .
  3. Christian Freiherr von Ehrenfels: Über "Gestaltqualitäten". In: Vierteljahresschrift für wissenschaftliche Philosophie. Nr. 14, , S. 249–292.
  4. Hermann von Helmholtz: Die Lehre von den Tonempfindungen als physiologische Grundlage für die Theorie der Musik. Nr. 61913, Braunschweig .
  5. Georg von Békésy: Experiments in hearing. New York .
  6. J. F. Schouten: The residue, a new component in subjective sound analysis. In: Proc. Nederlandsche Akademie van Wetenschappen. Nr. 45, , S. 256–365.
  7. Ernst Terhardt: Zur Tonhöhenwahrnehmung von Klängen. In: Acustica. Nr. 26, , S. 173–186.
  8. Ernst Terhardt: Ein psychoakustisch begründetes Konzept der musikalischen Konsonanz. In: Acustica. Nr. 36, , , S. 121–137.
  9. Hermann von Helmholtz: Die Lehre von den Tonempfindungen als physiologische Grundlage für die Theorie der Musik. Nr. 61913, Braunschweig , S. 320.
  10. Ernst Terhardt: Ein psychoakustisch begründetes Konzept der musikalischen Konsonanz. In: Acustica. Nr. 36, , , S. 129,132,135.
  11. Horst-Peter Hesse: Zum Konsonanzempfinden bei vielstimmigen Akkorden. In: I. Fuchs (Hrsg.): Internationaler Musikwissenschaftlicher Kongreß zum Mozartjahr 1991. Bericht. Tutzing , S. 669–675.
  12. Leonhardt Euler: Tentamen novae theoriae musicae. St. Petersburg .
  13. Leonhardt Euler: Tentamen novae theoriae musicae. St. Petersburg , Kapitel II, S. 12.
  14. Leonhardt Euler: Tentamen novae theoriae musicae. St. Petersburg , Kapitel II, S. 13.
  15. Theodor Lipps: Tonverwandtschaft und Tonverschmelzung. In: Zeitschrift für Psychologie und Physiologie der Sinnesorgane. Nr. 19, , S. 1–40.
  16. Theodor Lipps: Tonverwandtschaft und Tonverschmelzung. In: Zeitschrift für Psychologie und Physiologie der Sinnesorgane. Nr. 19, , S. 29.
  17. Theodor Lipps: Tonverwandtschaft und Tonverschmelzung. In: Zeitschrift für Psychologie und Physiologie der Sinnesorgane. Nr. 19, , S. 32.
  18. Horst-Peter Hesse: Die Wahrnehmung von Tonhöhe und Klangfarbe als Problem der Hörtheorie. Köln .
    • I. Tasaki: Nerve impulses in individual auditory nerve fibers of Guinea pig. In: Journ. Neurophysiol. Nr. 17, , S. 97–122.
    • E. F. Evans: Central mechanisms relevant to the neural analysis of simple and complex sounds. In: O.-J. Grüsser und R. Klinke (Hrsg.): Zeichenerkennung durch biologische und technische Systeme. Berlin u.a. , S. 328–343.
    • --: Pitch and cochlear nerve fibre temporal discharge patterns. In: R. Klinke und R. Hartmann (Hrsg.): Hearing – Physiological bases and psychophysics. Berlin u.a. , S. 140–146.
    • G. Langner: Evidence for neuronal periodicity detection in the auditory system of the Guinea fowl: Implications for pitch analysis in the time domain. In: Experimental Brain Research. Nr. 52, , S. 333–355.
  19. abH.-P. Zenner: Hören – Physiologie, Biochemie, Zell- und Neurobiologie. Stuttgart, New York , S. 27 f..
    • J. C. R. Licklider: A duplex theory of pitch perception. In: Experientia. Nr. 7, , S. 128–134.
    • Horst-Peter Hesse: Die Wahrnehmung von Tonhöhe und Klangfarbe als Problem der Hörtheorie. Köln .
    • H.-P. Zenner: Hören – Physiologie, Biochemie, Zell- und Neurobiologie. Stuttgart, New York .
  20. Johannes Kotschy: Auf dem Weg zur Mikroharmonik. In: Kai Bachmann und Wolfgang Thies (Hrsg.): Musikwissenschaft – Musikpraxis. Festschrift für Horst-Peter Hesse zum 65. Geburtstag (= Wort und Musik. Bd. 43). Müller-Speiser, Anif/Salzburg , S. 85–96.