Die Universalien der Musikwahrnehmung sind die Elemente der Musikwahrnehmung und -verarbeitung, die als angeboren, das heißt kulturunabhängig betrachtet werden.
Vielfach begegnet uns die Ansicht, Musik sei eine universale Sprache. Dies impliziert die Annahme, dass Musik universale Merkmale besitzt, also Merkmale, die nahezu allen musikalischen Systemen auf der Welt gemeinsam sind, und dass es universale mentale Strukturen für die Verarbeitung von Musik gibt. Von einem universalen Merkmal spricht man, wenn das Merkmal nicht gelernt wird, sondern spontan erscheint, latent in allen normalen Personen vorhanden ist, angeboren ist (Dissanayake, 2001). Hinsichtlich der Unterscheidung angeborener oder universaler Prozesse von erworbenen ist die Überlegung hilfreich, dass Prozesse, die schon bei der Geburt funktionieren, sehr wahrscheinlich angeboren und damit unabhängig von Erfahrungen sind. Infolgedessen könnte man aus Vergleichen von Säuglingen und Erwachsenen oder von Personen aus verschiedenen Musikkulturen schließen, dass der Prozess vermutlich angeboren ist, wenn diese die gleichen Funktionsweisen zeigen, und dass bei Unterschieden zwischen den Populationen der Prozess durch Enkulturation erworben sein könnte. Aus dieser Perspektive ist Musik keine universale Sprache, sondern die Universalien der Musikwahrnehmung und -verarbeitung umschreiben vielmehr die Grenzen, innerhalb deren die Merkmale der Musik zwischen verschiedenen Kulturen variieren.
Dem Bereich, in dem Musik wahrgenommen werden kann, sind Grenzen durch die Hörfläche des Menschen gesetzt. Wir können Frequenzen zwischen 20 Hz und 20 kHz wahrnehmen. Im Wesentlichen beschränkt sich aber der für Musik verwendete Frequenzbereich auf Frequenzen zwischen 40 Hz und 10 kHz. Unser Gehör ist an der oberen und unteren Grenze des wahrnehmbaren Frequenzbereichs am unempfindlichsten und im Bereich zwischen 1000 und 5000 Hz, wo sich für das Sprachverstehen wichtige Frequenzbereiche befinden, am empfindlichsten.
Die Tonhöhenwahrnehmung und die Auflösung der Frequenzen im Hörbereich ist eng verbunden mit der Physiologie des Innenohres und des auditorischen Gehirns. Das Innenohr führt eine Frequenzanalyse des gehörten Signals durch, indem es unterschiedliche Frequenzen entlang der Haarzellenreihe im Cortischen Organ der Cochlea (Hörschnecke) herausfiltert. Dort befinden sich die Synapsen (Anschlussstellen) von Nervenzellen, die die Signale für die jeweiligen Frequenzen zur Verarbeitung an das Gehirn weiterleiten.
Die wahrgenommene Tonhöhe (Tonheit) hängt hierbei von dem Ort in der Haarzellenreihe ab, an dem Nervenzellen angeregt werden. Zwischen der Position maximaler Erregung in der Haarzellenreihe (gemessen in Millimetern vom Ende der Cochlea) und der wahrgenommenen Tonhöhe ergibt sich ein linearer Zusammenhang.
Diese Beziehung zwischen Tonhöhe und Frequenz gilt allerdings nur für "reine" Töne (Sinustöne), die nur im Labor erzeugt werden können. In der normalen akustischen Praxis bestehen musikalische Töne aber, genau wie stimmhafte Sprachlaute, aus einer Vielzahl von Frequenzen: einer Grundfrequenz und ganzzahligen Vielfachen davon (Harmonische, Obertöne). Trotzdem löst diese Vielzahl von Frequenzen die Wahrnehmung nur einer einzigen Tonhöhe aus. Diese ist mit der Tonhöhe der Grundfrequenz identisch, was Hermann von Helmholtz vermuten ließ, dass die Grundfrequenz die Tonhöhe bestimmt. Das hat im 20. Jahrhundert der Psychophysiker Schouten widerlegt. Er konnte nachweisen, dass schon wenige innerhalb der Obertonreihe benachbarte Obertöne dieselbe Tonhöhe auslösen wie die Grundfrequenz allein (Phänomen der "Fehlenden Grundfrequenz", Residualklang).
Die Erklärung dieses Phänomens findet sich in der zentralnervösen Verarbeitung. Überlagerungen von Nervenimpulsen von Obertönen ergeben ein Impulsmuster, das die Grundfrequenz des Tones abbildet. Diese Periodizitätsinformation wird nach gegenwärtigem Kenntnisstand wahrscheinlich von Neuronen im auditorischen Mittelhirn (colliculus inferior) herausgefiltert, die individuell auf jeweils eine bestimmte Periodizität (und damit auf eine Grundtonhöhe) abgestimmt sind.
Die erreichbare Frequenz- und Tonhöhenauflösung hängt mit der Packungsdichte von Nervenzellanschlüssen in der Haarzellenreihe zusammen und mit der Möglichkeit des Gehirns, die Signale "Nervenzellen-genau" zu verarbeiten.
Aufgrund der erreichbaren Frequenzauflösung sind der Art und Weise, wie das Gehirn Tonhöhen kategorisiert, genauer, in wie viele Töne man die Oktave unterteilt, Grenzen gesetzt. Allerdings gibt es keinen direkten Zusammenhang zwischen dem Unterscheidungsvermögen und der Kategorisierung der Tonhöhen in Tonleitern - diese Kategorien sind viel gröber und werden, meist in Ausrichtung an konsonanten Intervallen, gelernt.
Die Physiologie und Verarbeitungsschritte des menschlichen Innenohres haben Auswirkungen auf die Wahrnehmung von Musikstücken. Ein wesentlicher Effekt des Innennohres ist der sogenannte Maskierungseffekt: Werden einzelne Töne in einem Frequenzbereich vorgespielt, wo diese intensitätsmäßig überwiegen, so werden aufgrund der Mechanik des Innenohres nicht nur die Nervenzellen angeregt, die für diese Töne zuständig sind, sondern in erheblichem Maße noch Nervenzellen in der Umgebung. Da die wahrgenommene Lautstärke aber von der Gesamt-Erregung der Nervenzellen im Innenohr abhängt, führt dies dazu, dass eine Melodiestimme lauter wahrgenommen wird, als sie physikalisch gesehen ist.
Musikanteile, die keinen Einzelton-Charakter haben (Begleitung in Akkorden, Rhythmusinstrumente) regen von ihrem Spektrum her eher einen breiten Frequenzbereich an, so dass hier kaum zusätzliche Nervenzellen aufgrund des Maskierungseffekts angeregt werden. Eine Anhebung der wahrgenommenen Lautstärke findet kaum statt.
Dies trägt dazu bei, dass eine Melodiestimme innerhalb der Begleitung gut wahrgenommen werden kann, selbst wenn ihr Schallpegel nicht wesentlich größer ist als der der Begleitinstrumente.
Die Nervenzellen des Innenohres haben die Eigenschaft, dass ihre Erregung bei Dauerbelastung abnimmt. Nach kurzer Zeit der Ruhe regenerieren sie sich und geben bei erneuter Anregung besonders starke Signale ab.
Dieser Effekt führt zu einer Betonung des Rhythmus bei Musikstücken. Instrumente, die den Rhythmus tragen, erklingen oft nur für kurze Zeit und erklingen oft in Frequenzbereichen, in denen andere Musikstimmen gerade nicht präsent sind (z.B. tiefer Bassbereich bei einer großen Trommel, relativ hochfrequenter Bereich bei Becken, aber auch: rhythmische Begleitung einer oder mehrere Oktaven unter oder über der Melodiestimme).
In diesen Frequenzbereichen herrscht zwischen den Rhythmusschlägen relative Ruhe, so dass sich die für diese Frequenzen zuständigen Nervenzellen erholen können. Bei einem Rhythmusschlag erzeugen diese Nervenzellen dann ganz besonders starke Signale.
Dies trägt dazu bei, dass Rhythmusinstrumente sehr gut wahrgenommen werden können, selbst wenn ihr Schallpegel nicht wesentlich größer ist als der der anderen Instrumente.
Die Wahl von Tonleitern ist verknüpft mit der Wahrnehmung von Amplituden- oder Frequenzschwankungen
Die verwendeten Töne einer Tonleiter sollen beim Zusammenklingen angenehm klingen. Dies gilt nicht nur, wenn Mehrstimmigkeit als musikalisches Ausdrucksmittel verwendet wird, sondern auch bei einstimmiger Musik. Denn in halliger Umgebung erklingen aufeinander folgende Töne für kurze Zeit gleichzeitig: Der Nachhall des vorausgegangenen Tons ist noch nicht abgeklungen, wenn der nächste Ton erklingt.
Sollen Töne beim Zusammenklingen angenehm klingen, dürfen hierbei keine starken und schnellen Amplituden- und Frequenzschwankungen hervorgerufen werden. Dies beeinflusst die Wahl einer Tonleiterin erheblichem Maße:
Dies hat die Konsequenz, dass Tonleitern bevorzugt werden, bei denen Töne im Verhältnis kleiner ganzer Zahlen zueinander stehen, oder die dem zumindest nahe kommen. Denn dann entstehen beim Zusammenklingen eher angenehme Klänge.
Die Wahrnehmung diskreter Tonhöhen ist wahrscheinlich universell. Schon Kinder scheinen prädisponiert zu sein, diskrete Tonhöhen zu singen. Diese kategoriale Tonhöhenwahrnehmung existiert in allen Kulturen - dadurch kann die musikalische Botschaft trotz Schwierigkeiten wie einer lauten Umgebung oder einer schlechten Intonation verstanden werden (Dowling & Harwood, 1986). Kategorienbildung hat den Zweck, die zu verarbeitende Datenmenge zu reduzieren, und verhindert auf diese Weise eine Überlastung beim Musikhören und -ausführen. Die konkreten Kategorien selbst sind aber erlernt und damit von Kultur zu Kultur verschieden.
Der Zweikomponententheorie von Révész (1913) zufolge existiert neben der Dimension Tonhöhe als weitere Dimension das Chroma oder die Tonigkeit und in diesem Zusammenhang die Oktavidentität, die ebenfalls oft als Universalie betrachtet wird. Als Chroma bezeichnet man den zyklisch wiederkehrenden Toncharakter von Tönen im Oktavabstand. Dies wird beispielsweise darin deutlich, dass verschiedene Varianten einer Melodie als äquivalent empfunden werden, wenn man die gesamte Melodie oder auch nur einzelne Töne der Melodie um eine Oktave versetzt und die Kontur erhalten bleibt. Ohne Oktavidentität hätte jeder Ton im gesamten Hörbereich einen eigenen Toncharakter, was eine enorme Komplexität bedeutet hätte. Aber durch die Oktavidentität muß unser Gehirn lediglich so viele Töne identifizieren, wie innerhalb einer Oktave vorkommen. Die Einteilung in Oktaven ordnet und strukturiert daher. Alle hoch entwickelten Musik-Kulturen geben Tönen im Oktavabstand denselben Namen. Oktavidentität wird auch von Affen wahrgenommen, und neuere Ergebnisse der Gehirnforschung zeigen, daß Säugetiere eine Oktavkartierung haben, und zwar im auditorischen Thalamus, also zwischen Hirnstamm und Großhirn (Braun und Chaloupka, 2005).
In den meisten Kulturen kommen neben der Oktave auch Quinte und Quarte vor. Anscheinend neigt das Gehirn eher zu diesen Kategorien, denn Kombinationen von Tönen, deren Frequenzverhältnisse durch kleine ganze Zahlen gegeben sind, erzeugen im Gegensatz zu solchen mit komplizierteren Frequenzverhältnissen zusätzliche periodische Muster in Nervensignalen (z.B. hat die Oktave ein Frequenzverhältnis von 1 : 2, die Quinte von 2 : 3, die Quarte von 3 : 4, dagegen der Tritonus von 32 : 45). Dies legen auch Experimente nahe, in denen Kinder und Erwachsene Tonfolgen besser behalten konnten, deren Töne in kleinzahligen Frequenzverhältnissen standen, also beispielsweise besser Tonfolgen mit Quinte und Quarte als mit dem Tritonus (Trehub, 2000).
Aus der Oktavidentität ergibt sich die logarithmische Skala, bei der die Frequenz mit steigender Tonhöhe immer schneller anwächst: Da sich Oktavtöne durch Frequenzverdopplung ergeben (z.B. sind 440 Hz, 880 Hz und 1760 Hz Oktaven), liegen die Frequenzen von Tönen derselben Kategorie immer weiter auseinander, je mehr die Tonhöhe ansteigt. Damit steht die Tonhöhe in logarithmischer Beziehung zur Frequenz. Die dadurch entstehende psychophysische Skala ist universal (Justus & Bharucha, 2002). Man kann es auch als universal betrachten, dass es aufbauend auf dieser Skala Tonhöhenkategorien, Tonleitern und Tonhierarchien gibt - diese sind aber in ihrer konkreten Ausprägung kulturell beeinflusst.
Tonleitern haben in allen Kulturen eine relativ geringe Anzahl von Stufen, sie bestehen fast überall aus 5 bis 7 Tönen pro Oktave. Dies passt gut dazu, dass die Kurzzeitgedächtnisgrenze für Kategorien bei etwa 7 liegt (Miller, 1956). Die Anzahl der Stufen, in welche die Oktave unterteilt wird, ist außerdem davon abhängig, wie differenziert man Töne kategorisieren kann.
Es gibt auch kaum äquidistante Skalen, d.h., bei Tonleitern sind die Intervalle zwischen benachbarten Tonstufen fast nie gleich groß, z.B. gibt es in der diatonischen Tonleiter Ganztöne und Halbtöne. Auf diese Weise können tonale Bezüge hergestellt werden, die Töne stehen in unterschiedlichen Beziehungen zum Grundton und der Hörer kann sich zu jedem Zeitpunkt vorstellen, wo sich die Musik in Bezug auf das tonale Zentrum der Musik befindet. Dadurch kann eine Wahrnehmung von Spannung und Auflösung entstehen, was die musikalischen Ausdrucks- und Erlebnismöglichkeiten steigert (Sloboda, 1985).
Durch diese unterschiedlichen Beziehungen zum Grundton bilden sich Tonhierarchien, die sich auch in fast jeder Kultur finden, d.h., die Töne der Tonleiter haben verschiedene Funktionen, sie treten unterschiedlich häufig und an verschiedenen Positionen in einer Melodie auf. Die spezifischen Tonhierarchien variieren aber zwischen den Kulturen (Justus & Bharucha, 2002). Es scheint eine universale Verarbeitungsprädisposition für Skalen mit ungleichen Tonabständen zu geben – solche Skalen sind leichter zu enkodieren und zu behalten als Skalen mit gleichen Abständen. Dies zeigt sich schon bei Kleinkindern: Trehub (2000) präsentierte Kindern drei Skalen - die Durtonleiter, eine neue Skala mit ungleichen Abständen und eine äquidistante Skala - und untersuchte, ob sie erkennen können, wenn ein Ton der Tonleiter um drei oder vier Halbtöne verschoben wurde. Für die Kinder waren vermutlich alle drei Skalen unbekannt, sie zeigten aber eine signifikant bessere Leistung bei den beiden Skalen mit ungleichen Abständen als bei der gleichschrittigen Skala.
Eine weitere Universalie in der Tonhöhen- und Melodiewahrnehmung hängt mit der melodischen Kontur zusammen. Der Hörer neigt dazu, eher globale, die Beziehung zwischen Tönen betreffende Informationen zu verarbeiten als präzise, absolute Reize wie spezifische Tonhöhen oder Intervalle (Trehub, 2000): Nach dem Hören einer unbekannten Melodie wird gewöhnlich kaum mehr als ihre Kontur im Gedächtnis behalten, also Richtungsänderungen der Tonhöhe. Des Weiteren werden unterschiedliche Tonfolgen mit gleicher Kontur als verwandt empfunden. Schon im Kleinkindalter hat die melodische Kontur eine große Bedeutung bei der Repräsentation von Melodien, was auf eine Universalie hindeutet. Experimente von Trehub (2000) zeigen, dass Kleinkinder eine Melodie, die transponiert wurde (Intervalle bleiben gleich) als identisch mit der Originalmelodie behandeln. Selbst wenn sich die Intervalle ändern, aber die Kontur erhalten bleibt, wird die Melodie als bekannt und nicht als neu behandelt. Wird aber auch nur ein Ton so verschoben, dass sich die Kontur ändert, sehen Kinder und Erwachsene die Melodie als unbekannt an.
Ebenfalls universal ist der Einsatz auditiver Gruppierungsstrategien. Die Organisation von Tönen zu Wahrnehmungseinheiten steigert die Ökonomie und Leistungsfähigkeit in der Verarbeitung der Musik, die durch die Kurzzeitgedächtniskapazität beschränkt ist. Gruppiert und strukturiert wird nach bestimmten Gestaltprinzipien, aber es ist fraglich, ob auch sie universal sind. Da die musikalische Wahrnehmung auch von gelernten Kategorien und Schemata geprägt ist, sind immer auch andere Hörweisen möglich (Motte-Haber, 1996).
Die Gruppierung von Ereignissen zu Wahrnehmungseinheiten, um Information zu reduzieren, gehört auch zu den Universalien der Rhythmuswahrnehmung. Dies zeigt sich beispielsweise darin, dass wir eine Folge von Schlägen meist zu Gruppen von zwei oder drei Schlägen von unterschiedlichem Gewicht zusammenfassen (Fricke, 1997). In diesem Zusammenhang versuchen wir außerdem immer einen regelmäßigen Puls zu finden, um den herum wir die anderen Ereignisse organisieren können - wir suchen für eine ökonomische Verarbeitung immer aktiv nach Regelmäßigkeiten. Bestätigung findet dies unter anderem in Experimenten von Drake und Bertrand (2001), bei denen die Synchronisierung bei über 90 % lag, wenn Personen zur Musik den Takt klopfen sollten, und die zeigen, dass bereits Säuglinge ihre Saugrate an die Rate einer auditiven Sequenz anpassen können.
Rhythmus ist immer in verschiedenen Ebenen organisiert: Über den angesprochenen regelmäßigen Puls sind rhythmische Muster gelegt – der Puls wird unterteilt durch asymmetrisch angeordnete Klänge. Die Details der rhythmischen Organisation unterscheiden sich jedoch von Kultur zu Kultur. Einer der einfachsten Rhythmen ist der Daktylus (ein langes Intervall, gefolgt von zwei kurzen); in anderen Kulturen wie im südlichen Afrika oder in Indien findet man komplexere Rhythmen - hier kann die Anzahl der Schläge innerhalb des Pulses groß und ungerade sein, z.B. sind in Indien 7 bis 17 Schläge üblich.
Durch die Asymmetrie der rhythmischen Muster wird ein Ortsempfinden innerhalb des Beats geschaffen, es entstehen Betonungen, die auch wesentlich für die Musik fast aller Kulturen sind. Diese Bezugspunkte bilden die Grundlage für ein Empfinden von Bewegung und Ruhe und geben außerdem Hinweise für die Koordination der verschiedenen Teile in polyphoner Musik (Sloboda, 1985).