viernes, 3 de diciembre de 2010

HOLOFONIA

 

El sonido holofónico, u holofonía es una técnica de espacialización sonora.
La holofonía equivale en la grabación de audio lo que la holografía en la imagen. Para lograr la percepción del oyente respecto a la posición de la fuente de sonido, se graban las secuencias de cada oído independientemente empleando una cabeza de dummy equipada con dos micrófonos omnidireccionales situados a la altura de cada oreja. Luego ambas grabaciones se recombinan usando un algoritmo llamado Cetera. El resultado se emite por un único canal. Se supone que esta técnica imita a la forma que nuestro cerebro sigue para procesar el sonido, es decir a la escucha binaural

Técnica de la holofonía

El efecto con cabezas de maniquí que tratan de simular las condiciones auditivas de una cabeza humana, usando para ello unos órganos auditivos artificiales, en los que se colocan los micrófonos, donde deberían estar los oídos. De esta forma el sonido se graba de una manera aproximada a como llegaría a los oídos de una persona.


Funcionamiento de la cabeza artificial.

    Una cabeza artificial capta el sonido de manera similar a como lo hace una cabeza humana, dependiendo del grado de realismo de esta. La cabeza supone un obstáculo para las ondas sonoras en el margen de frecuencias medias altas. En el lado más alejado de la cabeza con respecto a la fuente sonora, el oído se encuentra en una sombra acústica: la cabeza bloquea las altas frecuencias. A la inversa, en el lado de la cabeza orientada hacia el sonido, existe un aumento en el nivel de presión sonora, al margen de frecuencias medias a altas.

    Los pliegues del pabellón de la oreja (oído externo) también afectan a la respuesta en frecuencia, reflejando los sonidos dentro del canal auditivo. Estas reflexiones se combinan con el sonido directo, originando cancelaciones de fase a ciertas frecuencias.

    Cada oído capta un espectro diferente de amplitud y de fase, debido a que uno de ellos está en sombra por la cabeza y ambos están separados. Estas diferencias interaurales varían de acuerdo con el nivel de presión sonora y la angulación del sonido incidente respecto de la cabeza.

    Una vez que las señales sonoras entran a cada oído, los micrófonos se encargan de hacer la transducción de la energía acústica, a mecánico y luego a energía eléctrica.
Cuando las señales de los micrófonos de la cabeza artificial se reproducen sobre los audífonos, se escuchan las mismas diferencias interaurales que captó la cabeza artificial. Esto crea la ilusión de imágenes sonoras localizadas donde estaban las fuentes originales.

    La fidelidad que alcance la técnica binaural para reproducir el campo acústico dentro del oído externo del auditor estará primeramente determinado por el grado de realismo que posea la cabeza artificial que se utilizará para grabar la señal sonora. Por ejemplo, una cabeza artificial sin orejas no captará la información que estas entregan al proceso de localización desde los 2000 Hz en adelante, por cuanto se espera que sea capaz de reproducir la localización sólo en el plano horizontal y en la distancia, hasta unos 1000 Hz. La localización en el plano medio utilizando este tipo de cabeza no podrá ser reproducida debido a la ausencia de los patrones espectrales producidos por la oreja.

    Se puede sustituir la propia cabeza por la cabeza artificial situando dos micrófonos de condensador miniatura cercanos al tímpano para grabar en los oídos. Cuanto mayor sea la semejanza entre la cabeza y los oídos artificiales con la cabeza y los oídos humanos, mejor será la creación de imágenes sonoras reproducidas. Por tanto, si se graba en binaural con la propia cabeza, se puede experimentar una creación de imágenes sonoras más precisas que si se graba con una cabeza artificial. Esta grabación tendrá una respuesta no plana debido a la difracción de la cabeza.

    Otro sustituto de la cabeza artificial es una esfera del tamaño de una cabeza con micrófonos montados a nivel en la posición de los oídos. Este sistema llamado Kugelflachenmikrofon, lo desarrolló Gonter Theile para mejorar la creación de imágenes sonoras sobre altavoces.

La Grabación Binaural

    La grabación binaural (dos oídos) se inicia mediante una cabeza artificial (dummy head). Los micrófonos ubicados dentro de la cabeza artificial en cada oído captan el sonido que llega a cada uno de ellos. Una vez grabadas estas señales sonoras, al reproducir la grabación en los audífonos, el auditor escucha los sonidos que originalmente estaban presentes en la cabeza artificial.



Obtención de señales binaurales mediante una cabeza artificial.

La grabación binaural funciona según los siguientes antecedentes:

    Cuando se escucha una fuente de sonido natural en cualquier dirección, la entrada a nuestros oídos está justamente formada por dos señales uni–direccionales cuyo sonido presiona los tímpanos. Si se consiguiera recrear las mismas presiones en los tímpanos del que escucha como si hubiera ocurrido “en directo”, se podrá reproducir la experiencia original de audición, que incluye la información direccional y la reverberación.

    La grabación binaural con reproducción sobre audífono es el método más espacialmente exacto de los conocidos y del ambiente alrededor de toda la cabeza delante, detrás, encima, debajo, etc. Al auditor se le puede engañar y hacer creer que está escuchando un auténtico instrumento que suena en la sala de audición.
    En cuanto a los inconvenientes: la cabeza artificial es restrictiva- limita su uso a las grabaciones de conciertos en directo; no es mono – compatible, y es relativamente cara.

Ejemplos de Simuladores Existentes:

Simuladores Ajustados a Norma:


Simulador de cabeza y torso Bruel & Kjare 4128.

Ventajas.

• Provee difracciones acústicas similares a las encontradas alrededor de un torso y cabeza de un humano promedio.
• Útil para todo tipo de mediciones acústicas aéreas.
• Compatibilidad con la reproducción estereofónica convencional.

Desventajas.

• No simula conducción por vibraciones, tales como vía ósea.
• Para otro tipo de aplicación requiere estudio adicional.

Cabezas sin Torsos:



Cabeza artificial Newman KU100.

Ventajas.
• Provee difracciones acústicas similares a las encontradas alrededor de una cabeza de un humano promedio.
• Útil para todo tipo de mediciones acústicas aéreas.
• Compatibilidad con la reproducción estereofónica convencional.

Desventajas.
• No simula conducción por vibraciones, tales como vía ósea.
• Para otro tipo de aplicación requiere estudio adicional.
• El torso afecta el nivel de presión en el oído en un incremento de 3 dB bajo los 2 Khz a 0° acimut aproximadamente.

Esferas de diámetro relacionado a la cabeza

Ventajas.
• Mayor simplicidad en su construcción, por ende el mas bajo costo.
• Precisión en la reproducción en las diferencias interaurales de tiempo.
• Compatibilidad con la reproducción estereofónica convencional.

Desventajas.
• No simula conducción por vibraciones, tales como vía ósea.
• Para otro tipo de aplicación requiere estudio adicional.
• Reproducción de diferencias interaurales de intensidad hasta 1000 Hz.
• No permite reproducir la percepción de elevación de la fuente.


Se presentarán a continuación algunos modelos de cabeza artificial hechos hasta el momento: KEMAR (Knowles Manikin for Acoustical Research)

 Kemar

Simulador de oído de Zwislocki

    En el maniquí KEMAR (fig. 2.22 a y b), la simulación de la oreja equipara la respuesta acústica con un pabellón, un canal auditivo, y un tímpano que iguala el oído medio en dimensiones, impedancia acústica, y modos. Las dimensiones de torso y cabeza son basadas en los datos antropométricos publicados, pero la aurícula se basa en datos obtenidos para este desarrollo. Se adaptaron el canal auditivo y tímpano desde acoplador tipo oído echo por Zwislocki (Fig. 2.23). El acoplador de Zwislocki tiene una cavidad de pared dura cilíndrica central con diámetro (7.5 mm) cercano a un canal auditivo de un adulto humano medio. Cuatro ramas laterales R1 a R4, localizados cerca del micrófono, esquematizan la variación de la impedancia acústica con la frecuencia que se ha observado en oídos. Cada rama lateral consiste en una red acústica en serie con masa, resistencia y compliancia. La longitud del canal auditivo del KEMAR de la entrada a la terminación del micrófono (tímpano) de ½-pulgada es 2,15 cm. La presión sonora de la entrada del oído se descubrió ser relativamente insensible a la impedancia superficial o de la piel de la cabeza. Las mediciones validantes muestran que el maniquí, designado como KEMAR, es como un humano medio en respuesta acústica en campo libre. Cabe destacar que esta publicación dio paso a la creación de la norma ANSI S3.36 – 1985, que detalla las especificaciones para la construcción de un maniquí para mediciones acústicas aéreas simuladas in-situ, que es, en parte, la base para nuestro prototipo [1-2-7].

También se han usado Cabezas Tipo Natural sin los torsos para mediciones acústicas. Bauer (1966) construyó una cabeza y torso reproducible. Este maniquí tiene un espesor de 1/8 de pulgada de "piel” Plastisol recubierto en un cráneo de fibra de vidrio de poliéster, pabellón auditivo artificial, canales auditivos y tímpanos (con micrófonos de 1 pulgada en la posición del tímpano).

Cabeza Aachen modelo HMS II: cabeza artificial con micrófonos de medida; el procesador de grabación ecualiza las señales de la cabeza para obtener respuesta plana en un campo libre frontal; la unidad reproductora contiene ecualizadores de campo libre para usar con audífonos Lambda Profesional Stax SR: existe también para grabación una unidad con cápsulas Schoeps, dos salidas XLR y EQ conectable para campo libre frontal o campo independiente de la dirección.

Simulador de cabeza y torso 4128 Bruel & Kjaer: Usa dos micrófonos 4006 B y K. Bajo solicitud especial.

Cabezas Biofónicas Mr. Aural y Lady Aural, de Coles: montadas con piel suave de imitación y densidad interna.

Holófono H1 de Holophone Systems: realizada como reproducción exacta de una cabeza humana, con membranas acústicas diseñadas especialmente y un procesador de señal; contiene una pantalla para el viento; sólo disponible para alquiler.

KU 81i y KU 100 de Neumann: Cabeza artificial de sistema binaural que incluye cabeza artificial “ Fritz II” simplificada con micrófonos internos, energía CA o pilas, y cables; compatible con estéreo; ecualización acústica interna para respuesta de campo difusa plana; canal de auditorio acortado a 9 mm. (la longitud mas corta imprescindible para los efectos direccionales)

Conjunto MKE 2002 Sennheiser: par de micrófonos de condensador omnidireccional miniatura montados en un conjunto de cabeza, a encajar en los oídos del sujeto o en una cabeza artificial simplificada: se incluye una cabeza artificial sin canales de oído; no lleva ecualización para difracción de la cabeza.

Ecualización De La Cabeza Artificial

    Una cabeza artificial (o una cabeza humana) no posee una respuesta de frecuencia plana debido a la difracción de la cabeza. La difracción de la cabeza y el pabellón auditivo crean una respuesta de frecuencia muy desigual. La resonancia que produce la concha del pabellón de la oreja se perturba con la mayoría de los audífonos. Si se ecualiza la señal del audífono para restaurar la resonancia de la concha, se oirán imágenes sonoras fuera de la cabeza. Por tanto, la reproducción binaural sobre audífonos o altavoces suena tonalmente coloreada a menos que se use una ecualización a la medida. Algunas cabezas artificiales disponen de una ecualización incorporada que compensa el efecto de la cabeza.

¿Cuál sería la mejor ecualización para que una cabeza artificial consiga el sonido tonal de un micrófono convencional de respuesta plana? Se han propuesto varios esquemas de ecualización alguno de estos son:

• Ecualización de campo difuso. Esta compensa la respuesta media de la cabeza a los sonidos que llegan de todas las direcciones (tal como la reverberación en una sala de conciertos).
• Ecualización frontal de campo libre. Esta compensa la respuesta de la cabeza con respecto a una fuente sonora directamente enfrente, en condiciones anecoicas.
• Ecualización de campo libre, 10° de promedio. Esta compensa la respuesta de la cabeza a una fuente sonora en condiciones anecoicas con un valor medio de ± 10° con respecto al centro.
• Ecualización de campo libre con una fuente a ± 30°. Esta compensa la respuesta de la cabeza a una fuente sonora alejada a 30° del centro, en condiciones anecoicas. Esta es una localización típica para altavoz estéreo.

    Para proporcionar una respuesta plana desde el micrófono al oyente, la ecualización de la cabeza artificial debería ser la inversa de la respuesta de frecuencia del audífono. Por ejemplo, si se ecualiza la cabeza con una cierta atenuación a 3 Khz para tener una respuesta plana de captación, los audífonos deberían producir un realce equivalente de imagen a 3 Khz. [22]

Síntesis Binaural.

    Las señales binaurales no sólo pueden ser obtenidas mediante una cabeza artificial. Es posible transformar señales no binaurales a señales binaurales mediante un proceso denominado síntesis binaural. Este proceso, que algunos denominan Auralización es realizado en un computador, el cual contiene una base de datos de FTRC de sujetos humanos para un gran número de direcciones de incidencia, la señal no binaural es sometida a la acción de estos filtros para transformarla a binaural, el resultado de este proceso es actualmente conocido como Sonido 3D en los sistemas multimedios. [27]

La síntesis binaural también puede ser usada para compatibilizar las señales provenientes de micrófonos discretos a una señal binaural principal obtenida mediante una cabeza artificial, durante grabaciones de música orquestal.

Funcionamiento

    Cuando se escucha a través de audífonos, el oído derecho sólo oye la señal derecha, y el izquierdo solo la señal izquierda. Pero cuando se escucha a través de altavoces, hay una intermodulación acústica (crosstalk) alrededor de la cabeza (como se ve en la figura 2.24). El oído derecho oye la señal no sólo del altavoz derecho, sino también la señal del altavoz izquierdo que viaja alrededor de la cabeza. [22]

Intermodulación acústica interaural de la audición en estéreo

    El convertidor transaural cancela la señal del altavoz izquierdo que llega al oído derecho y también la señal del altavoz derecho que llega al oído izquierdo. Esto es, cancela la intermodulación acústica entre cada altavoz y el oído opuesto, de forma que el oído izquierdo sólo escucha el altavoz izquierdo, y el oído derecho al altavoz derecho. Es como si se llevara puesto unos audífonos sin la incomodidad de su uso físico. La supresión de la intermodulación se puede aplicar antes o después de la grabación.

    La figura muestra un diagrama de bloques simplificado de un supresor de intermodulación. Una señal retardada y ecualizada se introduce en el canal opuesto y se suma con polaridad contraria. Esta intermodulación electrónica cancela la intermodulación acústica que se produce durante la escucha con altavoz.
Supresor de intermodulación


    La ecualización anti – intermodulación es la diferencia en respuesta de frecuencia en los dos oídos debida a la difracción de la cabeza. El retardo es la diferencia de tiempo de llegada entre los oídos. La ecualización (EQ) y el retardo depende del ángulo de alejamiento del centro de los altavoces que generalmente es de 30º. [22]

    La figura muestra cómo trabaja la supresión de intermodulación. Supongamos que queremos que sólo aparezca la señal del canal izquierdo en el oído izquierdo. Esto es, queremos cancelar el sonido del altavoz izquierdo que llega al oído derecho.
• La señal directa del altavoz izquierdo hacia el oído izquierdo.

• R es la señal difractada por la cabeza (ecualizada, retardada) del altavoz izquierdo hacia el oído derecho.
• -R es la señal de cancelación de intermodulación. Es una versión ecualizada, retardada e invertida de la señal L.

    Las señales R y -R se añaden en contrafase (se cancelan) en el oído derecho; por lo que sólo la señal L se oye en el oído izquierdo. Obsérvese que la propia señal de cancelación es de cabeza difractada con respecto al oído opuesto, y también es necesario cancelarla. [22]

Diagrama de planta de la cancelación de la intermodulación