Die Erfindung bezieht sich auf ein Verfahren zur binauralen Wiedergabe
akustischer Signale über ein binaurales Wiedergabesystem, insbesondere einen
Kopfhörer.
Hintergrund der Erfindung
In einer realen Hörsituation werden Schallquellen von einem Hörer
mit übereinstimmenden visuellen und auditiven Sinneseindrücken wahrgenommen.
Eine solche Hörsituation ist in
1 schematisch dargestellt. Dieses bedeutet, daß
der Hörer, der vor sich zwei sprechende Personen, welche zwei Schallquellen
bilden, sieht, diese auch vor sich und zwar links und rechts frontal vor sich hört.
Wenn der Hörer nun die Blickrichtung und hierdurch seine Kopfausrichtung verändert,
wodurch der Hörer seinen Kopf einem der Sprecher zuwendet, bleiben beide Sprecher
ortsfest. Der Hörer hört dann die sprechende Person, welcher er sich zugewandt
hat, direkt von vorn und die anderen sprechende Person von der Seite. Dieses gilt
also sowohl für den visuellen als auch für den auditiven Eindruck. Erst
diese Wahrnehmung einer auch bei Kopfdrehung sich in der Lage nicht verändernden
Schallquelle ermöglicht dem Hörer eine realistische Wahrnehmung und Ortung.
Die beschriebenen Merkmale charakterisieren eine natürliche Hörsituation.
Hiervon zu unterscheiden ist die Situation der Wiedergabe von akustischen
Signalen oder Schallsignalen für einen Hörer über einen Kopfhörer.
Es sei angenommen, daß Stimmen von zwei eine jeweilige Schallquelle bildenden
Sprechern über ein Mikrophon aufgenommen und über den Kopfhörer dem
Hörer zu Gehör gebracht werden. Bei einer solchen einfachen Mikrophonaufnahme
ist es für den Hörer bei der Wiedergabe über den Kopfhörer nicht
möglich, die Position der Sprecher/Schallquellen zu lokalisieren. Es findet
in diesem Fall immer eine Wahrnehmung des Gehörten ausschließlich innerhalb
des Kopfes des Hörer statt, eine sogenannte Im-Kopf-Lokalisation (IKL) tritt
auf.
Wenn die einfache Mikrophonaufnahme nun durch eine Kunstkopfmessung
ersetzt wird, bei der eine Richtungswahrnehmung mittels Aufnahmen bei unterschiedlichen
Drehstellungen des Kunstkopfes abgebildet wird, erfolgt eine Teilnachbildung der
natürlichen Hörsituation. Allerdings passiert nun bei der Wiedergabe über
den Kopfhörer im Vergleich zur natürlichen Hörsituation etwas sehr
unnatürliches. Wenn der Hörer seinen Kopf dreht, dreht sich auch der auf
dem Kopf angeordnete Kopfhörer mit, und es ändern sich die für die
Schallquellen/Sprecher wahrgenommenen Orte, wie dieses in 2
schematisch dargestellt ist. Gemäß 2 wird
das Hörereignis aus Sicht des Hörers nach rechts verschoben wahrgenommen,
obwohl keine der Schallquellen/Sprecher seinen ursprünglichen Ort verlassen
hat. Es entsteht eine Wahrnehmung, die es in der natürlichen Hörsituation
bei ortsfesten Schallquellen nicht gibt. Deshalb wird diese Art der Wahrnehmung
vom Gehirn als nur innerhalb des Kopfes möglich eingestuft. Lediglich ein gewisser
räumlicher Eindruck des Schalleinfalls wird mit Hilfe des Kunstkopfes nachgebildet.
Eine völlige Im-Kopf-Lokalisation tritt auf, wenn der Schall auf den Kunstkopf
von vorn, oben oder hinten auftritt, also in der medianen Ebene, wenn sich das Hörereignis
in gleicher Entfernung zu den beiden bei der Kunstkopfmessung am Kunstkopf verwendeten
Mikrophonen befindet. Eine Fehllokalisation tritt jedoch in jedem Fall bei beliebigen
Kopfdrehungen des Hörers mit dem Kopfhörer auf, da sich nach seiner Wahrnehmung
die Schallquellen mitbewegen.
Derartige Tonaufnahmen mit Hilfe einer Kunstkopfmessung werden als
binaurale Tonaufnahmen bezeichnet, bei denen es sich um Aufnahmen von Schallsignalen
mit Hilfe von am Kunstkopf angeordneten Mikrophonen handelt. Bei der Wiedergabe
derartiger Schallsignale entsteht, wie oben beschrieben, unter bestimmten Voraussetzungen
ein natürlicher Höreindruck mit der Fähigkeit zur Lokalisation der
Schallquellen. Bei der einfachsten binauralen Aufnahmemethode werden zwei Mikrophone
benötigt, die seitwärts voneinander weg zeigen und einen Abstand von etwa
20cm zueinander aufweisen. Dieser Abstand und die Plazierung stellen angenähert
die Position der Ohrkanäle eines durchschnittlichen Menschen dar. Üblicherweise
werden Mikrophone mit Kugelcharakteristik genutzt, die im Gehörgang des Kunstkopfes
eingesetzt sind. Auf diese Art wird die kopfbezogene Übertragungsfunktion (KBÜF
oder HRTF – „Head Related Transfer Function") nachgebildet. Eine so
ermittelte Übertragungsfunktion wird als binaurale Übertragungsfunktion
bezeichnet. Aus mathematischer Sicht handelt es sich bei der Übertragungsfunktion
um eine Darstellung in der Frequenzdomäne, die mit Hilfe einer sogenannten
Fourier-Transformation in eine äquivalente Impulsantwort in der Zeitdomäne
umgewandelt werden kann. Auch eine umgekehrte Transformation ist möglich.
Die binaurale Übertragungsfunktion wird mit Hilfe der Kunstkopfmessung
für eine bestimmte räumliche Anordnung von Kunstkopf und Schallquellen
gemessen. Bei der binauralen Wiedergabe von akustischen Signalen werden die abgegebenen
akustischen Signale gebildet, indem die mittels Kunstkopfmessung ermittelte binaurale
Übertragungsfunktion mit akustischen Grundsignalen mathematisch gefaltet wird.
Auf diese Weise wird die akustische Wiedergabe von dem Träger des Kopfhörers
als „räumlich" erfahren.
In 2 sind die beiden wirksamen HRTFs
mit eingetragen.
Es wurde bereits vorgeschlagen, die binaurale Wiedergabe von Schallsignalen
über einen Kopfhörer zu nutzen, um einen Besucher, der sich durch ein
Museum oder eine Ausstellung bewegt, in Abhängigkeit vom Standort des Besuchers
innerhalb der Ausstellung Informationen zu den Ausstellungsgegenständen so
wiederzugeben, daß die Wiedergabe von dem Besucher „räumlich" erfahren
wird (vgl. Zimmermann et al.: LISTEN: Contextualized Presentation for Audio- or
Commented Environments, Vortrag ABIS-Workshop, LLWA 2003 Karlsruhe). Der vom Besucher
getragene Kopfhörer ist mit einer Meßeinrichtung versehen, mit der der
Standort des Besuchers innerhalb der Ausstellung fortlaufend ermittelt werden kann.
Darüber hinaus ist die Meßeinrichtung ausgestaltet, eine momentane Drehstellung
des Kopfhörers zu erfassen. In Abhängigkeit von dem ermittelten Standort
und der momentanen Drehstellung des Kopfhörers werden über die Schallsignalquellen
der Kopfhörer akustische Signale binaural wiedergegeben. Mit Hilfe der Ortslokalisation
und der Information über die momentane Drehstellung des Kopfhörers kann
ermittelt werden, welche Ausstellungsgegenstände sich augenblicklich im Blickfeld
des Besuchers befinden. Dementsprechend können dann zugehörige Informationen
mit Hilfe der binauralen Wiedergabe übermittelt werden. Hierbei erfolgt eine
mathematische Faltung einer binauralen Übertragungsfunktion mit akustischen
Grundsignalen, so daß für den Besucher der Eindruck im Ausstellungsraum
angeordneter Schallquellen entsteht.
In dem Dokument DE 44 33 719
A1 werden Kunstköpfe bei der Ermittlung einer Übertragungsfunktion
verwendet.
Das Dokument DE 103 45 190
A1 beschreibt ein Verfahren und eine Anordnung zur Raumrichtungskonstanten
Ortung von Hörereignissen mittels Kopfhörern.
Das Dokument Zotkin et al.: HRFT Personalization using anthropomeric
measurements, 2003 Workshop an Applications of Signal Processing to Audio and Acoustics,
October 19–22, 2003, S. 157–160 beschreibt Probleme, welche bei der
Ermittlung von Übertragungsfunktionen auftreten können.
In dem Dokument C. Moldrzyk: Ein neuartiger Kunstkopf zur Verifikation
einer akustischen Entwurfsmethodik für Architekten, Vortrag auf der 22. Tonmeistertagung,
25.11.2002 ist ein neuartiger Kunstkopf zur Verifikation einer akustischen Entwurfsmethodik
für Architekten offenbart, bei dem sich der Kopf im Halsbereich gegenüber
dem Torso dreht.
Zusammenfassung der Erfindung
Aufgabe der Erfindung ist es, ein verbessertes Verfahren zum binauralen
Wiedergeben von akustischen Signalen über ein binaurales Wiedergabesystem,
insbesondere einen Kopfhörer, zu schaffen, bei dem der binaurale Wiedergabeeffekt,
nämlich die räumliche Klangerfahrung, verbessert ist.
Diese Aufgabe wird erfindungsgemäß durch ein Verfahren nach
dem unabhängigen Anspruch 1 gelöst.
Es ist ein Verfahren zum binauralen Wiedergeben von akustischen Signalen
über ein binaurales Wiedergabesystem, insbesondere einen Kopfhörer, geschaffen,
bei dem eine momentane Drehstellung des Wiedergabesystems mit Hilfe einer Drehstellungsmeßeinrichtung
ermittelt wird und über das Wiedergabesystem akustische Signale abgegeben werden,
bei deren Bildung in Echtzeit eine mathematische Faltung eines akustischen Grundsignals
und einer der ermittelten momentanen Drehstellung zugehörigen binauralen Übertragungsfunktion
ausgeführt wird, wobei als die zugehörige binaurale Übertragungsfunktion
eine unter Verwendung von winkelabhängigen Meßergebnissen einer Kunstkopfmessung
an einem über einer Torsonachbildung in verschiedene Winkelstellungen gedrehten
Kunstkopf ermittelte Übertragungsfunktion verwendet wird und wobei bei der
Bildung der abgegebenen akustischen Signale mittels einer weiteren mathematischen
Faltung eine Kompensation einer inversen Wiedergabesystemübertragungsfunktion
für einen Schallübertragungsweg von einem Trommelfell über einen
Ohrkanal bis zu einer akustischen Signalquelle des Wiedergabesystems ausgeführt
wird.
Die Erfinder haben im Laufe langwieriger Untersuchungen und nach Ausführung
einer Vielzahl von experimentellen Untersuchungen überraschend festgestellt,
daß die binaurale Wiedergabe von akustischen Signalen verbessert wird, wenn
bei der Ermittlung der binauralen Übertragungsfunktion im Rahmen der Kunstkopfmessung
diese an einem Kunstkopf ermittelt wird, der über einer Torsonachbildung gedreht
wird. Weiterhin wird eine in optimierter Weise an die natürliche Hörsituation
angepaßte binaurale Wiedergabe ermöglicht. Bei bekannten Verfahren wird
demgegenüber lediglich ein Kunstkopf in verschiedenen Drehstellungen verwendet.
Ein wesentlicher Vorteil beim Vergleich mit realen Abhörsituationen
ist die Annäherung an physiologische Ausgangsbewegungen des Probanden. So sitzen
Proband wie der Kunstkopf bei der Messung im Stuhl, die mögliche Kopfdrehung
ist (bei physiologisch durch die Sitzstellung weitestgehend fixierter Schulter)
im möglichen Auslenkungswinkel angenähert und translatorische Bewegungen
sind durch die Sitzposition quasi ausgeschlossen.
Eine optimale Nachbildung einer realen Hörsituation wird bei
einer vorteilhaften Weiterbildung der Erfindung dadurch erreicht, daß als die
ermittelte Übertragungsfunktion eine binaurale und mittels der Kunstkopfmessung
in einer Realraumsituation ermittelte Übertragungsfunktion verwendet wird.
Eine weitere vorteilhafte Ausführungsform der Erfindung besteht
darin, daß als die ermittelte Übertragungsfunktion eine simulierte binaurale
Übertragungsfunktion verwendet wird, die mit Hilfe einer anderen mathematischen
Faltung einer simulierten monauralen Übertragungsfunktion für einen Modellraum
und einer mittels der Kunstkopfmessung ermittelten Außenohrübertragungsfunktion
gebildet ist. Bei dieser Ausführungsform wird in einer bevorzugten Ausgestaltung
ein Computermodell des Wiedergaberaumes erstellt. Beispielsweise wird mittels eines
RayTracingverfahrens, welches als solches bekannt ist und hier deshalb keiner weiteren
Erläuterung bedarf, die monaurale Übertragungsfunktion am Wiedergabeort
errechnet.
Hierbei werden der Direktschall und Reflexionen mit Ankunftspegel,
Laufzeit und Einfallsrichtung gespeichert. Solche Berechnungen können derzeitig
selbst auf modernsten Computern noch Stunden dauern. Die monaurale Übertragungsfunktion
wird nun mit sogenannten kopfbezogenen Übertragungsfunktionen (HRTF –
„Head Related Transmission Function") gefaltet, die in einem reflexionsarmen
Raum mittels Kunstkopf mit Torsonachbildung in hoher Winkelauflösung gemessen
werden. Die Auswahl der HRTFs geschieht in Echtzeit mittels einer modernen Drehstellungsmeßeinrichtung
(„head tracker"). Das Ergebnis wird in Echtzeit mit einem Testsignal gefaltet
und kann über die Kopfhörer mit der Wiedergabe im realen Raum verglichen
werden.
Eine verbesserte Nachbildung einer realen Hörsituation wird bei
einer zweckmäßigen Fortbildung der Erfindung dadurch erreicht, daß
als die zugehörige Übertragungsfunktion eine unter Verwendung der winkelabhängigen
Meßsignale der Kunstkopfmessung ermittelte Übertragungsfunktion verwendet
wird, bei der die winkelabhängigen Meßsignale in Winkelabständen
von höchstens zwei Grad, bevorzugt von höchstens einem Grad eingehen.
In einer Ausführungsform werden bevorzugt winkelabhängige
HRTFs der Kunstkopfmessung verwendet, wobei die winkelabhängigen HRTFs in hochauflösenden
Winkelabständen von höchstens zwei Grad, bevorzugt von höchstens
einem Grad eingehen.
Beschreibung bevorzugter Ausführungsbeispiele der Erfindung
Die Erfindung wird im folgenden anhand von Ausführungsbeispielen
unter Bezugnahme auf Figuren einer Zeichnung näher erläutert. Hierbei
zeigen:
1 eine schematische Darstellung einer natürlichen
Hörsituation mit zwei Schallquellen;
2 eine schematische Darstellung einer Hörsituation,
bei der eine Person einen Kopfhörer aufgesetzt hat;
3 eine schematische Darstellung einer Anordnung mit
zwei Schallquellen und einem Kunstkopf, welcher drehbar auf einer Torsonachbildung
angeordnet ist;
4A bis 4D grafische Darstellungen
von Differenzwerten für Übertragungsmaße für eine Drehung des
gesamten, fest mit der Torsonachbildung bei 0° verbundenen Kunstkopf gegenüber
der Drehung des Kunstkopf über der Torsonachbildung für Drehungen um –10°,
–20°, –30° und –40°; und
5 eine schematische Darstellung einer Person mit Kopfhörer
zur Erläuterung eines Verfahrens zum binauralen Wiedergeben von akustischen
Signalen über ein binaurales Wiedergabesystem, nämlich den Kopfhörer.
3 zeigt eine schematische Darstellung einer Anordnung
mit zwei Schallquellen 30, 31 und einem Kunstkopf 33,
welcher drehbar auf einer Torsonachbildung 34 angeordnet ist, für
eine Kunstkopfmessung, bei der eine binaurale Übertragungsfunktion jeweils
für unterschiedliche Drehstellungen des Kunstkopfes 33 über der
Torsonachbildung 34 gemessen wird. Die Messung der binauralen Übertragungsfunktion
erfolgt für Drehstellungen des Kunstkopfes 33, die in Abständen
von weniger als zwei Grad, bevorzugt in Abständen von weniger als einem Grad
eingestellt werden.
Mit der Anordnung nach 3 wurden binaurale
Übertragungsfunktionen gemessen.
4A bis 4D zeigen eine
grafische Darstellung von Differenzwerten für Übertragungsmaße für
eine Drehung des gesamten, fest mit der Torsonachbildung 34 bei 0°
verbundenen Kunstkopf 33 gegenüber der Drehung des Kunstkopf
33 über der Torsonachbildung 34 um –10°, –20°,
–30° und –40°. Hierdurch wird die Bedeutung der Führung
des drehbar über der Torsonachbildung 34 angeordneten Kunstkopfes
33 herausgestellt. Die dargestellten Differenzwerte zeigen die Wichtigkeit
der Torsonachbildung 34. Als anschauliche Erklärung können diese
Meßergebnisse herangezogen werden, welche die Differenzwerte
der Übertragungsmaße für die Drehung in 10° Schritten von –10°
bis –40° zeigen (linkes Ohr – Kurve A; rechtes Ohr – Kurve
B). Es wurden in dem für eine HRTF relevanten Frequenzbereich von größer
1 kHz Abweichungen von bis zu 25 dB festgestellt. Zudem treten aufgrund von Reflexionen
an den Schultern der Torsonachbildung 34 je nach Rotationswinkel Laufzeitunterschiede
auf, die in der binauralen Wiedergabe eine in der Horizontalebene weiter verbesserte
Lokalisation erwarten lassen.
Vorteile der Messung mit der Torsonachbildung 34 liegen a)
in der Lokalisation und b) bei der Klangfarbe. Beide sind nicht völlig unabhängig
voneinander und auch nicht von der Propriozeption.
Es wurde festgestellt, daß bei der Ermittlung der binauralen
Übertragungsfunktionen in Ergänzung zu der Berücksichtigung einer
hohen Winkelauflösung eine weitere Verbesserung erreicht werden kann, wenn
der Einfluß des Weges zwischen Kopfhörermembran und Trommelfell der Person
mit dem Kopfhörer berücksichtigt wird. Hierbei hat sich die Berücksichtigung
der inversen Kopfhörerübertragungsfunktion zur Kompensation dieser Strecke
Kopfhörermembran/Trommelfell als nicht ausreichend im klanglichen Vergleich
zur realen Schallquelle herausgestellt, solange die inverse Kopfhörerübertragungsfunktion
nur von der Kopfhörermembran bis zum Mikrofon im Abschluß eines geblockten
Ohrkanals gemessen wird. Der sich ergebende Unterschied ist auf den richtungsunabhängigen
Einfluß des Ohrkanals und (wesentlich weniger) auf eine veränderte Trommelfellimpedanz
zurückzuführen.
Die Erfindung sieht nun in einer Ausführung vor, die Diskrepanz
im Klang zwischen realer Schallquelle und binauraler Wiedergabe mittels einer individuell
erstellten Entzerrungskurve auszugleichen. Die Unterschiede im Frequenzgang der
Frontalrichtung wurden von sehr hörerfahrenen und mit Filterdesign vertrauten
Personen bis zum Bereich von 0.2 dB und Güteunterschieden von 0.3 als gleich
empfunden, so daß scheinbar eine allgemeingültige Entzerrung aufgrund
einer möglichst guten gehörmäßigen Annäherung zwischen
realer und virtueller Schallquelle möglich ist. Es wird eine empirisch gefundene
inverse Kopfhörerübertragungsfunktion verwendet, die mittels eines A/B-Vergleiches
mit dem natürlichen Hören gewonnen wird.
5 zeigt eine schematische Darstellung einer Person
50 mit Kopfhörer 51 zur Erläuterung eines Verfahrens
zum binauralen Wiedergeben von akustischen Signalen über ein binaurales Wiedergabesystem,
nämlich den Kopfhörer 51. In 5 ist
eine Schar von binauralen Übertragungsfunktionen 52 gezeigt, die mit
Hilfe der in 3 gezeigten Anordnung für verschiedene
Winkelstellungen des Kunstkopfes 33 über der Torsonachbildung
34 gemessen wurden. Je nach aktueller Kopf-/Kopfhörer(dreh)stellung,
d.h. aktueller Winkelstellung, wird aus der Schar von binauralen Übertragungsfunktionen
52 das richtige Paar für die beiden Kopfkörerlautsprecher ausgewählt
und mit dem wiederzugebenden akustischen Signal in Echtzeit gefaltet. Dadurch bleiben
die Schallquellen auch bei Kopf-/Kopfhörerdrehung positionsfest und werden
eindeutig lokalisiert. Die Winkelstellung des Kopfes/Kopfhörers wird mittels
einer Drehmeßeinrichtung („head tracker") fortlaufend ermittelt.
Die in der vorstehenden Beschreibung, den Ansprüchen und der
Zeichnung offenbarten Merkmale der Erfindung können sowohl einzeln als auch
in beliebiger Kombination für die Verwirklichung der Erfindung in ihren verschiedenen
Ausführungsformen von Bedeutung sein.