4.1 Prise de son stéréophonique
4.1.1 Historique de la stéréophonie
Le terme grec stereos veut dire solide. Ainsi la stéréophonie vise à recréer une illusion de corps sonore dans l’espace, comme la stéréophotographie tente de rendre compte de la profondeur sur des images.
On retrouve les premières expériences de stéréographie avec des gravures à partir de 1850, l’arrivée de la photographie remplacera le travail du dessinateur. Ces images en trois dimensions sont très populaires, elles procurent un voyage, un peu de rêve à qui les regarde. Le cinéma n’existe pas, et la radio non plus. Jusqu’à la fin de la seconde guerre mondiale on trouvera des appareils pour visionner ces images en relief dans de très nombreux foyers, depuis les téléviseurs ont chassé ces machines dans les greniers.
En 1877, Thomas Edison aux États-Unis et Charles Cros en France inventent les premiers dispositifs permettant la capture de sons et leur ré-écoute, respectivement le phonographe et le paléographe. Un pavillon capte le son et le dirige vers une membrane équipée d’une aiguille qui grave en profondeur sur un cylindre. À la ré-écoute, le relief du sillon met en mouvement le diaphragme et le pavillon amplifie le son produit. Malheureusement le nombre d’utilisation des rouleaux est limité et la fabrication de ceux-ci requière que les musiciens jouent pour chaque unité produite. En 1887, Emile Berliner met au point la gravure et la reproduction mécanique des disques plats pour gramophones.

D’autre part l’invention du microphone à charbon par David Edward Hughes en 1877 permet de transmettre la voix à distance, cette trouvaille permettra l’invention du téléphone puis de la radiodiffusion grâce aux émetteurs de télégraphie sans fils. Au mois d’août 1881 dans le cadre de l’Exposition Internationale de l’électricité à Paris, Clément Ader réalise le théâtrophone : il dispose au bord le la scène de l’Opéra de Paris dix micros à charbon. Au palais de l’Industrie le public écoute au moyen de récepteurs téléphoniques le son des différentes paires de microphones. L’écoute binaurale est née, l’auditeur peut suivre les déplacements des comédiens au casque.
En 1898, David Lodge dépose le principe du haut-parleur à bobine mobile. En 1894 la modulation électrique est appliquée à la reproduction des disques, mais le premier enregistrement dit électrique ne viendra pas avant Alfred Cortot en 1925. L’enregistrement magnétique est inventé par Vladimir Poulsen en 1898, mais ne sera pas appliqué avant 1944, les rubans papiers enduits de poudre magnétique (trop fragiles) et les fils d’acier (peu pratiques) sont remplacés par le film polyester.
En 1925 les premiers concerts sont retransmis par la radio suisse on n’utilisent qu’un seul microphone faute de savoir mélanger plusieurs modulations, cet unique micro sert également au speaker. Le cinéma devient sonore en 1926 et ce sera grâce à cela que les recherche en stéréophonie s’accéléreront.
En 1927 est réalisé le premier enregistrement avec une tête artificielle, le mannequin Oscar développé par Barlett Jones à Chicago. Le principe du micro électrostatique est développé par l’américain Edward Wente en 1927. Georg Neumann est le premier à le produire en série dès 1928 : le CMV3. On développe aussi des microphones électrodynamiques : bobine mobile et ruban (1931). Et on travail sur la directivité.
Le potentiomètre apparaît, on peut mélanger plusieurs signaux électriques provenant de différents micros et faire des effets de panoramiques. La bande magnétique ouvre de nombreuses possibilité en studio pour l’enregistrement et pour la création de nouvelles musiques qui se servent de ce support comme d’un instrument. Stefan Kudelski développe le magnétophone Nagra pour le reportage en extérieur.
L’apparition du cinéma parlant et son essors dans les années 1928-29 motive les travaux de stéréophonie. On souhaiterait que le son puisse suivre les déplacement des comédiens à l’écran pour plus de réalisme.
Au début des années 30 Harvey Fletcher pour les laboratoires Bell (États-Unis) conçoit un système pour recréer le front d’onde : il dispose un rideau de microphones (plus de dix) sur scène. La diffusion se fait sur un rideau de haut-parleur, chaque signal provenant d’un micro servant à moduler un haut-parleur. Ce système a l’avantage de ne pas privilégier de place pour l’auditeur, mais économiquement ce système n’est pas possible, il faut trop de matériel pour réaliser la diffusion, on évolue vers trois canaux et finalement deux canaux pour la diffusion.
À la même époque Alen Blumlein pour EMI (Angleterre) se rend compte de l’impossibilité pratique de recréer le front d’onde et se concentre sur la restitution dans une situation d’écoute stéréophonique, c’est à dire pour un auditeur placé au sommet d’un triangle équilatéral formé par les enceintes et lui-même. Il découvre que l’impression de spatialisation peut être donnée par une différence d’intensité entre les deux signaux. Il met au point des techniques de prise de son avec des micros coïncidents : XY, MS et stéréosonic.
En 1940, de Boer approfondit la prise de son par tête artificielle en décrivant l’impression de localisation en fonction de la différence d’intensité et du temps d’arrivée des signaux.
Vers la fin des années 50, les stations de radio européennes développement des couples de microphones espacé de 15 à 30 cm et des angles variables entre les micros. On remarque ce certaines conformations ont tendance à privilégier soit le son direct, soit le son réverbéré. Ces différences sont souvent liées aux salles utilisées par les ingénieurs pour leur essais, certaines salles étant plus réverbérantes que d’autres.
1952 le cinéma commence à diffuser sur plus de deux haut parleur : procédé Cinérama à 6 canaux. 1959 la radio diffuse en stéréo, 1978 première diffusion stéréophonique de programmes télévisés au Japon, en Europe il faudra attendre 1984.
L’installation massive de systèmes multicanaux récemment chez les particuliers pousse à développer d’autres techniques de stéréophonie sur plus de deux haut-parleurs : surround 5.1, quadriphonie,...
4.1.2 Les fondamentaux
La stéréophonie pour des raisons pratiques s’est développée sur deux haut-parleurs. La première idée de recréer le front d’onde en entier sur l’avant ou tout autour de l’auditeur a été abandonnée pour des raisons de support.
La recherche s’est orientée vers la stéréophonie à deux canaux. Les maisons de disques et les radios ont développé des techniques. La plus part faisait appelle à un microphone par haut-parleur. Les essais empiriques ont permis de développer une théorie.
4.1.2.1 Théorie
La stéréophonie a été développée pour être diffusée sur une paire de haut-parleurs en non par un casque. L’intermodulation entre les canaux gauche et droit est importante.
Comme pour la perception binaurale les paramètres qui permettent la perception latérale et en profondeur sont la différence de temps d’arrivée et la différence d’intensité.
Des expériences ont été menées pour connaître précisément la localisation perçue en fonction de la différence de temps d’arrivée et la différence d’intensité. Voir les courbes ci-contre tirées de la publication de Wittek et Theile, présentées à la 112ème convention de l’AES.
De ces courbes découle toute l’approche moderne de la stéréophonie. Le travail fondamental a été entrepris par Michael Williams avec l’aide de Gert Simonsen, thésard danois qui a effectué les relevés de localisation.
Les deux familles de courbes ci-contre présente le décalage de la source virtuelle (phantom source) en fonction de la différence de niveau et de la différence de temps. La raison pour laquelle il y a plusieurs courbes est que différents sons ont été utilisés pour ces expériences et le résultat varie en fonction de la nature de ces sons.
Pour la suite de l’exposé on se placera dans le cas où la distance en le microphones qui constituent le couple stéréophonique est négligeable par rapport à la distance du couple aux sources sonores. On se place pour la même raison dans le cas des ondes planes ce qui simplifie la théorie.
La théorie servant de guide, une écoute critique permet de valider le choix de configuration.


4.1.2.2 Différence d’intensité
Comme on se place dans le cas des ondes planes, les sources sont lointaines. La différence de niveau liée à la différence de distance parcourue est minime.
La différence de niveau est due à la directivité des capsules et de leur orientation.
Plus la différence d’intensité est importante et plus la source virtuelle s’écarte du centre vers le côté le plus fort.
4.1.2.3 Différence de temps
Ici c’est le temps de propagation de l’onde plane qui donne l’information de localisation.
Plus la différence de temps augmente et plus la source virtuelle s’écarte du centre vers le côté où l’onde arrive en premier.

4.1.2.4 Différence de temps et d’intensité
On constate que pour des couples qui font intervenir une diférence de niveau et une différence de niveau, les effets sont cumulé dès lors que les informations de niveau et de temps sont concordantes.
4.1.3 Les couples stéréophoniques
Sur les bases précédentes on peut développer différentes configurations de couples. Certaines sont basées sur des différences de niveau uniquement. D’autres sur des différences de temps uniquement. Et finalement une troisième catégorie utilise les différences de temps et d’intensité.
4.1.3.1 Stéréophonie d’intensité
4.1.3.1.1 Couple coïncident
On appelle couple coïncident, un couple microphonique qui utilise les propriétés des différences d’intensité uniquement. A ce moment les deux capsules sont placées très proches l’une de l’autre pour minimiser la distance entre elles.
L’avantage de ces types de couples est qu’ils sont compatibles avec la monophonie. En effet, s’il y a une différence de temps entres les deux microphones, le mélange de leur signaux en monophonie entraîne des filtres en peigne assez désagréables.
D’autre part certains supports de diffusion donnent de mauvais résultats à partir de stéréophonie de temps. Un encodage qui ne restitue pas les différences de temps va anéantir l’impression d’espace. Dans ces cas il faut utiliser la stéréophonie d’intensité.
Une autre utilisation possible est que ce type de couple limite la réverbération perçue par l’auditeur. D’ailleurs ces techniques ont été développées par les Anglais qui enregistraient leurs essais dans le Royal Albert Hall qui est très réverbérant.
4.1.3.1.2 Couple XY
Configuration classique : Deux microphones de directivité cardioïde sont placés l’un au dessus de l’autre. L’un pointant à quatre-vingt dix degrés de l’autre.



L’angle utile de prise de son est très large : environ 180°. A la restitution les sources placées à 90° et au-delà seront restituées sur un haut-parleur. Ceci peut entraîner un tassement des sources virtuelles.
Il n’y a pas beaucoup de distorsion angulaire, ni d’effet de "trou au centre".
Il est possible de varier à partir du couple XY classique en changeant la polarité des microphones et l’angle que les microphones forment. En jouant sur ce paramètres on peut faire varier l’angle utile de prise de son.
4.1.2.1.3 Couple MS
Configuration classique : Deux microphones l’un de directivité bipolaire ("S"), l’autre de directivité cardioïde ("M") sont placés l’un au dessus de l’autre. Le microphone cardioïde pointe vers l’avant. Les lobes du microphone bidirectionnel pointent vers la gauche (lobe positif) et la droite.

Il faut passer par une étape de matriçage pour pouvoir écouter normalement ces enregistrements.

Ce matriçage peut être effectué après l’enregistrement pour faire varier le rapport entre le signal monophonique frontal et le signal latéral. Plus le signal latéral est fort et plus l’angle de prise de son utile est important.
Après matriçage le couple est équivalent à un couple XY avec des microphones de directivité cardioïde un peu biscornue.
On peut remplacer le microphone cardioïde par un autre type de microphone (omnidirectionnel, hyper ou hypocardioïde).
Ce type de conformation est particulièrement utile pour l’audio-visuel ou pour des installations qu’il n’est pas possible de modifier facilement.
4.1.3.1.4 Couple Blumlein
Configuration classique : Deux microphones bidirectionnels sont placés l’un au dessus de l’autre, les corps des microphones dans le même axe. Les lobes forment une croix vu dans l’axe des corps.

L’avant est le secteur entre le lobe positif de chaque microphone. Le son capté à l’arrière est aussi bon, mais les sources paraissent inversées latéralement.
Les lobes de chaque secteur latéral sont hors-phases. Le qualité du son est très désagréable. On évitera d’utiliser cette conformation dans des lieux très réverbérants.
Cette conformation est très utilisée pour le théâtre radiophonique où il est important que les comédiens puissent se voir en disant leur texte. On place alors des comédiens à l’avant et à l’arrière du couple.


4.1.3.2 Stéréophonie de temps
4.1.3.2.1 Couple AB
Un couple AB est un couple qui n’utilise que la différence de temps. Classiquement il est réalisé avec des microphones omnidirectionnels. On peut aussi utiliser des microphones plus directifs.
Il n’y a pas à proprement parler d’angle de prise de son. Les sons qui sont dans un champ en forme de trompe devant les microphones sont latéralisés. Mais en règle générale la localisation des sources est assez mauvaise.
4.1.3.2.2 Couple AB - petit
Pour une courte distance entre les microphones. Sur les courbes ci-après on a un écart de 40 cm.
Pour un faible écart la réverbération perçu est exagérée, ceci peut être utile si le son de la pièce est trop sec et qu’il faut une prise de son assez floue.


4.1.3.2.3 Couple AB - large
Pour une grande distance entre les microphones. Sur les courbes ci-après on a un écart de 100 cm.
La spatialisation est très limitée et les sources sautent d’un côté à l’autre.


Par expérience, j’ai utilisé un couple avec 3 mètres d’écart entre les deux microphones pour donner l’impression qu’il y avait moins de réverbération. J’explique ceci par le fait que si les sons sont décorrélés entre les deux canaux, on perd totalement la localisation et certains sons diffus deviennent moins perceptibles.
4.1.3.3 Stéréophonie d’intensité et de temps
4.1.3.3.1 Couple mixte
Un couple mixte va utiliser deux microphones avec un écart entre les deux capsules et un angle entre eux. Il convient de bien faire la différence entre cet angle "physique" et l’angle "utile" de prise de son.
On peut librement faire varier les angles physiques et les distances entre les microphones ainsi que leur directivité.
Michael Williams à tracé des abaques qui relient toutes ces variables. Par exemple voici l’abaque concernant les couples de microphones cardioïdes.

4.1.3.3.2 Couple ORTF
Le plus connus des couples, en France en tous cas, mais qui est très utilisé internationnalement.
Deux microphones cardioïdes sont placés de sorte à former un angle de 110° et la capsules sont espacées de 17 cm.



L’angle utile de prise de son est de l’ordre de 70° à 90° selon les auteurs. Il y a peu de distorsion angulaire et le résultat sonore est souvent très bon. On a une bonne impression de profondeur et la latéralisation est bonne. Il peut y avoir une légère impression de "trou" au centre de l’image sonore.
Cette conformation peut servir de base pour un enregistrement, il suffit ensuite de tester en s’écartant de ce canon de la prise de son pour trouver une valeur d’angle et de distance entre les microphones adéquats.
Par expérience des angles trop grands ou trop étroits comme des distances trop grandes ou trop petites ne donnent que très rarement des résultats satisfaisants. Pour essayer d’en savoir plus j’ai commencé une étude du sujet en ne faisant aucune approximation. Le temps me manque pour terminer.
4.1.3.3.3 Couple usuel pour ma pratique
En testant à partir de la conformation, j’ai trouvé qu’avec un angle de 90° et une distance de 19,5 cm les résultats étaient très bons et que l’impression au casque était elle aussi très satisfaisante.



4.1.3.3.4 Manipulations de la stéréophonie
Il est possible de faire subir quelques traitements aux signaux. Nous regarderont principalement la rotation de l’angle du couple.
Si après avoir réaliser l’enregistrement il est nécessaire de légèrement retoucher le centrage du couple, on peut intervenir de deux façons.
- Décalage temporel électronique - On introduit sur un des deux canaux une ligne de retard. L’angle de prise de son va tourner vers l’autre canal.
- Décalage de niveau - On baisse le niveau d’un des deux canaux. L’angle de prise de son va tourner vers l’autre canal. Inversement si on monte le niveau d’un des deux canaux, l’angle de prise de son va tourner vers ce même canal.
Il existe une troisième façon de faire, mais qui ne peut être réalisé qu’à la prise de son :
- Décalage temporel géométrique - On recule un des deux microphones dans l’axe de celui-ci. L’angle de prise de son tourne vers l’autre microphone.

Ces techniques ne sont pas forcément utile dans les conditions normales de prise de son, mais elles sont très importantes pour les prises de son multicanales basées sur la stéréophonie.
4.1.3.3.5 Remarques
Etant donné que les informations qui créent l’impression d’espace sont très ténues, il est importante d’avoir une qualité optimale sur toute la chaîne audio. En particulier, le choix des microphones, des préamplificateurs et de la numérisation est absolument critique. Il n’est pas rare qu’un système stéréophonique haut de gamme soit aussi cher qu’un système de prise de son de proximité monodirigée.
Les rotations de phases de l’électronique sont à minimiser. En effet, la présence de rotations de phases va détériorer les transitoires qui sont très riches en fréquences et qui sont très importantes pour la localisation. On évitera donc les systèmes intégrant des transformateurs.
La distorsion est elle aussi à minimiser pour des raisons de qualité sonore et de précision de la localisation.
Les prises de sons stéréophoniques sont souvent assez distantes des sources. Il faut donc améliorer autant que possible le rapport signal bruit.
Au delà du matériel, il est important de choisir l’endroit, ou de s’y adapter car ses qualités sonores vont être captées par la prise de son. Le choix de la position du couple microphonique et la disposition des sources dans l’espace est critique. Il faut rendre les sources avec le plus de clarté possible. Il faut donner à entendre l’acoustique du lieu d’enregistrement sans qu’elle ne nuise à la précision du son des sources. Le travail de prise de son stéréophonique demande de la patience et beaucoup d’écoute.
Après de nombreuses tentatives, je constate que certaines sources ne sont pas enregistrable en stéréophonie. En particulier les enceintes (amplificateur de guitare, clavier, chant, etc...) ne donnent pas de résultat satisfaisant. On a l’impression d’un mur de son en non d’une source placée dans l’espace. Mélangé à des instruments acoustiques l’effet est désagréable, tout l’espace est perturbé. Dans ces conditions on préférera faire un prise de son de proximité monodirigée.