Medidas objetivas de localización de un evento sonoro para sistemas de teleconferencia

  1. Blanco Martín, Elena
Dirixida por:
  1. Francisco Javier Casajús Quirós Director

Universidade de defensa: Universidad Politécnica de Madrid

Fecha de defensa: 13 de xullo de 2009

Tribunal:
  1. Ramón García Gómez Presidente/a
  2. Luis Alfonso Hernández Gómez Secretario/a
  3. Lino Pedro García Morales Vogal
  4. Soledad Torres Guijarro Vogal
  5. José Javier López Monfort Vogal

Tipo: Tese

Resumo

RESUMEN El objetivo de esta Tesis Doctoral es el desarrollo de una herramienta que permita medir, de forma objetiva, sobre el sonido recibido en los oídos (señal biaural) la sensación subjetiva de ubicación en el espacio del evento sonoro que genera dicha señal. Es importante diferenciar entre la posición de las fuentes sonoras, ubicación física real, y la posición del evento sonoro que representan dichas fuentes, ubicación subjetiva. Esta herramienta se aplicará al caso de sistemas de teleconferencia, sistemas que intentan reproducir virtualmente la información sonora y visual que procede de otra sala, representándola en una pantalla con altavoces. El sistema de reproducción de audio que se va a estudiar está basado en el concepto de ventana acústica virtual. La ventana acústica virtual es un sistema de comunicaciones que recrea el Principio de Huygens. Lo que se pretende es hacer que entre dos salas (emisora y receptora, que pueden estar a cientos de kilómetros) aparezca una ventana virtual entre ellas de forma que la sensación subjetiva sea que están comunicadas por una ventana física en una de las paredes. Para ello se capta el frente de onda sonora que llega a la pared donde se sitúa la ventana en la sala emisora y se reproduce en la pared de la ventana acústica virtual en la sala receptora. Así pues, a diferencia de otros sistemas de reproducción multicanal, como el estéreo o los sistemas surround, donde la “espacialidad” de las fuentes de sonido sólo se reproduce correctamente en una zona limitada de la sala (llamada “sweet spot”); la ventana acústica virtual permite reconstruir el campo sonoro que se introduciría por la ventana virtual dejando que se propague por la sala el sonido que viene de la sala emisora como si hubiera una apertura física real. Por lo tanto las aplicaciones basadas en el concepto de ventana acústica virtual proporcionan mejoras evidentes sobre un conjunto de atributos a menudo relacionados con el concepto de calidad espacial: localización, profundidad y extensión. Concretamente uno de esos atributos subjetivos, la localización del evento sonoro reproducido, es el que se investiga en esta Tesis, poniendo de manifiesto las limitaciones de la ventana acústica virtual a la hora de reproducir la información de localización del sonido. El concepto de ventana acústica virtual está basado en el uso de un array de micrófonos capaz de capturar el frente de onda en una pared de la sala emisora, más un array de altavoces encargado de reconstruir dicho frente de onda en otra pared de la sala de recepción. En el caso hipotético de que el número de transductores fuera infinito y la pared posterior totalmente absorbente, la reproducción del campo sonoro sería perfecta. Cómo dicho número está limitado, la reproducción es imperfecta y lo que se busca es valorar como influye la distorsión introducida en la calidad del sonido reproducido, y en concreto sobre los parámetros de localización subjetiva. Se ha dividido el estudio de la localización en los dos planos principales: el plano horizontal y el plano medio. Es en el plano horizontal donde se desarrollan más investigaciones, ya que el sistema auditivo humano está desarrollado principalmente para ubicar los “peligros” en este plano, de ahí la ubicación de dos sensores (oídos) localizados Tesis Doctoral: Medidas objetivas de localización de un evento sonoro para sistemas de teleconferencia en diferentes puntos de este plano. En lo que respecta al plano medio, existen escasos estudios, ya que la localización en este plano no parte de dos señales sino de una (señal monoaural) y además la resolución subjetiva de localización del sistema auditivo humano es peor. A continuación se presenta la Tesis Doctoral titulada “Medidas objetivas de localización de un evento sonoro para sistemas de teleconferencia”. Dicha Tesis está estructurada en una serie de capítulos que se presentan a continuación. En el primer capítulo, de introducción, se ofrece una justificación de la Tesis y su ámbito de aplicación, además de una enumeración de los objetivos previstos. En el segundo capítulo se presenta una visión general del marco teórico, así como del estado del arte sobre los aspectos que fundamentan la localización espacial de eventos sonoros. Estos son los tópicos en los que se centra el trabajo de investigación de esta Tesis. En los dos siguientes capítulos, se presentan el desarrollo y los medios materiales con los que se ha contado para la realización de la Tesis Doctoral, así como los resultados obtenidos. Basándose en el estudio de los modelos psicoacústicos que analizan el sistema de audición, se ha desarrollado un Localizador de Eventos Sonoros y se ha aplicado a escenarios acústicos simulados y a escenarios acústicos reales, analizando las diferencias y la fiabilidad de la simulación. Hay que destacar que la temática con la que se relaciona este trabajo tiene carácter multidisciplinar, debido a que abarca temas generales de procesado de señal, de acústica y electroacústica y de psicoacústica. Por este motivo resulta extremadamente difícil estudiar y exponer de forma completa el marco teórico y estado del arte sobre la investigación de la Tesis Doctoral, por lo que se ha preferido exponer solamente los temas clave que aplican a la localización espacial en el plano horizontal y en el plano medio. Como existe una clara diferencia entre los mecanismos que utiliza el sistema auditivo en el plano horizontal y en el plano medio para determinar la dirección del sonido, el tercer capítulo se dedica al proceso de localización en el plano horizontal y el cuarto capítulo al proceso de localización en el plano medio. En el capítulo quinto se refieren las conclusiones y aportaciones destacables de la investigación y las líneas propuestas de trabajo para investigaciones futuras. El último capítulo está dedicado a la bibliografía y a las publicaciones ya realizadas. Para terminar, como producto final de esta Tesis, queda una herramienta práctica que se puede utilizar para estudiar, mejorar y desarrollar sistemas de reproducción de audio en los que se quiera analizar y valorar la localización de los eventos sonoros reproducidos. Tesis Doctoral: Medidas objetivas de localización de un evento sonoro para sistemas de teleconferencia ABSTRACT The aim of this Doctoral Thesis is to implement a tool for evaluating the direction of sound events (on the horizontal plane and on the median plane), named LSE (Localization of Sound Events). LSE mimics the auditory system that a person uses for localizing sound. LSE algorithm is able to localize sound event on the horizontal plane using the binaural signal and on the median plane using the monaural signal. Moreover, LSE can simulate some acoustic configurations such as the virtual acoustic opening. Mainly, LSE is a Matlab application developed for simulating a virtual acoustic opening configuration, which is used for teleconference. The virtual acoustic opening is implemented by using the principles of Wave Field Synthesis. The quality of reproduced sound event is very important in multichannel systems. The subjective quality of the sound reproduced by a virtual acoustic opening must be evaluated. Performing tests using listeners have a high cost. Therefore, there is an increasing need to formulate objective measurements that model the human auditory perception. Such measurements should combine the best of both approaches: the relevance of listening tests and the efficiency as well as repeatability of the objective measurements. Such auditory perception or psychoacoustic models are becoming an important tool for audio quality evaluations. The direction of the sound perceived by a listener is an important cue when a multichannel audio system is evaluated. Accurate localization of the sound sources depends on many cues that are related to the nature of the sound, the anthropometry and hearing characteristics of the listener, the voluntary or involuntary motion of source or of listener, and the physical environment in which the listener is immersed. While some of these cues are valuables for accurate localization, others, such as echoes and reverberation, are often detrimental. In a virtual acoustic opening application there are two acoustic spaces connected by a multichannel audio communication system. Inside the emitting room, the sound source position is variable and there is a microphone array that receives the sound field. This field is synthesized according to Huygens Principle into the receiving room by a loudspeaker array (WFS technique). Both arrays have the same number of transducers placed at the same position. Into the receiving room, the listener can be located at any place. The system tries to replicate the sound as if there was a physical opening in the wall between the two rooms. Listener will localize a sound event reproduced by the loudspeaker array. The direction of the sound perceived must be the same as if sound comes through a window made in the wall. It is important to differentiate between the position from the sound sources, real physical location, and the position of the sound event that reproduces such sources, subjective localization. Other systems of multichannel reproduction, as the stereo or surround systems, can only reproduced a correct sound image in a limited zone of the room, called “sweet spot”. Tesis Doctoral: Medidas objetivas de localización de un evento sonoro para sistemas de teleconferencia Therefore the applications based on the concept of virtual acoustic opening provide clear improvements on a set of attributes often related to the concept of space quality: location, depth and extension. Specifically, one of those subjective attributes, the location of sound event, is the one that is investigated in this Thesis. Moreover the limitations of the virtual acoustic opening for reproducing the localization cues are presented. The localization has been divided into two subjects: the horizontal plane and the median plane. On horizontal plane there are many investigations based on the binaural signal from the ears. On median plane few studies has been made, since the location in this plane only analyzes one signal (monaural signal). Next the Doctoral Thesis titled “Objective measurements of sound event localization event for teleconference systems” is presented. This Thesis is organized in the following chapters. In the first chapter, Introduction, the reason of the Thesis and its appliance scope are presented. In addition, the aims are enumerated. In the second chapter, general view of theoretical subjects, as well as recent researches on spatial localization of sound events, are studied. In third and fourth chapters, the own research and results are presented. Moreover, the methods and systems of measurements are described. “Localization of Sound Event” has been developed in based to psychoacoustics models of auditory system. This tool has been applied to virtual acoustic scenes and to real acoustics scenes for testing the accurate of the models and simulations. This Thesis has a multidisciplinary scope: psychoacoustics, electro-acoustical and processing signal aspects. Each subject could be deeply studied, but only the key factors on spatial localization are put forward. Third chapter is dedicated to localization on horizontal plane and fourth chapter to localization on median plane. In the fifth chapter, the main conclusions and contributions are presented, moreover the futures works. Last chapter is dedicated to the referred bibliography and to the publications made by the author.