+
Information

Codec / vocodeur audio GSM

Codec / vocodeur audio GSM

Une variété de formes différentes de codec audio ou de vocodeur sont disponibles pour une utilisation générale et le système GSM prend en charge un certain nombre de codecs audio spécifiques. Ceux-ci incluent les codecs RPE-LPC, demi-débit et AMR. Les performances de chaque codec vocal sont différentes et ils peuvent être utilisés dans des conditions différentes, bien que le codec AMR soit désormais le plus largement utilisé. Le nouveau codec AMR large bande (AMR-WB) est également introduit dans de nombreux domaines, y compris le GSM

La technologie des codecs vocaux a progressé à des degrés considérables ces dernières années en raison de la puissance de traitement croissante disponible. Cela signifie que les codecs vocaux utilisés dans le système GSM ont été considérablement améliorés depuis l'introduction des premiers téléphones GSM.

Notions de base sur le vocodeur / codec

Les vocodeurs ou codecs vocaux sont utilisés dans de nombreux domaines des communications vocales. De toute évidence, l'accent est mis ici sur les codecs audio ou vocodeurs GSM, mais les mêmes principes s'appliquent à toute forme de codec.

Si la parole était numérisée de manière linéaire, elle exigerait un débit de données élevé qui occuperait une très large bande passante. Comme la bande passante est normalement limitée dans tout système de communication, il est nécessaire de compresser les données pour les envoyer via le canal disponible. Une fois à travers le canal, il peut ensuite être étendu pour régénérer l'audio d'une manière aussi proche que possible de l'original.

Pour répondre aux exigences du système de codec, la parole doit être capturée à une fréquence d'échantillonnage et une résolution suffisamment élevées pour permettre une reproduction claire du son d'origine. Il doit ensuite être compressé de manière à maintenir la fidélité de l'audio sur un canal de transmission sans fil à débit binaire limité et sujet aux erreurs.

Les codecs audio ou vocodeurs peuvent utiliser une variété de techniques, mais de nombreux codecs audio modernes utilisent une technique connue sous le nom de prédiction linéaire. À bien des égards, cela peut être comparé à une modélisation mathématique du tractus vocal humain. Pour y parvenir, l'enveloppe spectrale du signal est estimée à l'aide d'une technique de filtrage. Même lorsque des signaux contenant de nombreux signaux non liés aux harmoniques sont utilisés, il est possible que les codecs vocaux donnent des niveaux de compression très élevés.

Différentes méthodologies de codec sont utilisées pour les codecs GSM:

  • CELP: Le codec CELP ou Code Excited Linear Prediction est un algorithme de vocodeur qui a été proposé à l'origine en 1985 et qui a apporté une amélioration significative par rapport aux autres codecs vocaux de l'époque. Le principe de base du codec CELP a été développé et utilisé comme base d'autres codecs vocaux, notamment ACELP, RCELP, VSELP, etc. En tant que telle, la méthodologie du codec CELP est désormais l'algorithme de codage vocal le plus largement utilisé. En conséquence, CELP est maintenant utilisé comme terme générique pour une classe particulière de vocodeurs ou codecs vocaux et non un codec particulier.

    Le principe principal du codec CELP est qu'il utilise un principe appelé «analyse par synthèse». Dans ce processus, le codage est effectué en optimisant de manière perceptible le signal décodé dans un système en boucle fermée. Une façon d'y parvenir est de comparer une variété de flux binaires générés et de choisir celui qui produit le meilleur signal sonore.

  • Codec ACELP: Le codec ACELP ou Algebraic Code Excited Linear Prediction. Le codec ACELP ou algorithme de vocodeur est un développement du modèle CELP. Cependant, les livres de codes de codecs ACELP ont une structure algébrique spécifique comme indiqué par le nom.
  • Codec VSELP: Le codec VSELP ou Vector Sum Excitation Linear Prediction. L'un des principaux inconvénients du codec VSELP est sa capacité limitée à coder des sons non vocaux. Cela signifie qu'il fonctionne mal en présence de bruit. En conséquence, ce codec vocal n'est plus aussi largement utilisé, d'autres codecs vocaux plus récents étant préférés et offrant des performances bien supérieures.

Codecs / vocodeurs audio GSM

Une variété de codecs / vocodeurs audio GSM sont pris en charge. Ceux-ci ont été introduits à des moments différents et ont des niveaux de performance différents. Bien que certains des premiers codecs audio ne soient pas aussi largement utilisés ces jours-ci, ils sont toujours décrits ici car ils font partie du système GSM.


Codecs audio GSM
Nom du codecDébit binaire
(kbit / s)
Technologie de compression
Taux plein13RTE-LPC
EFR12.2ACELP
Demi tarif5.6VSELP
AMR12.2 - 4.75ACELP
AMR-WB23.85 - 6.60ACELP

Codec GSM plein débit / RPE-LPC

Le RPE-LPC ou Regular Pulse Excited - Linear Predictive Coder. Cette forme de codec vocal a été le premier codec vocal utilisé avec le GSM et il a été choisi après des tests pour le comparer avec d'autres schémas de codec de l'époque. Le codec vocal est basé sur l'excitation à impulsions régulières LPC avec prédiction à long terme. Le schéma de base est lié à deux codecs vocaux précédents, à savoir: RELP, Residual Excited Linear Prediction et au MPE-LPC, Multi Pulse Excited LPC. Les avantages de RELP sont la complexité relativement faible résultant de l'utilisation du codage en bande de base, mais ses performances sont limitées par le bruit tonal produit par le système. Le MPE-LPC est plus complexe mais offre un meilleur niveau de performance. Le codec RPE-LPC offrait un compromis entre les deux, équilibrant performances et complexité pour la technologie de l'époque.

Malgré les efforts entrepris pour fournir des performances optimales, au fur et à mesure que la technologie évoluait, le codec RPE-LPC était considéré comme offrant un faible niveau de qualité vocale. Au fur et à mesure que d'autres codecs audio à plein débit sont devenus disponibles, ils ont été incorporés au système.

GSM EFR - Codec plein débit amélioré

Plus tard, un autre vocodeur appelé le vocodeur Enhanced Full Rate (EFR) a été ajouté en réponse à la mauvaise qualité perçue par les utilisateurs du codec RPE-LPC original. Ce nouveau codec a donné une bien meilleure qualité sonore et a été adopté par GSM. En utilisant la technologie de compression ACELP, il a permis une amélioration significative de la qualité par rapport à l'encodeur LPC-RPE d'origine. Cela est devenu possible à mesure que la puissance de traitement disponible augmentait dans les téléphones mobiles en raison de niveaux de puissance de traitement plus élevés combinés à leur consommation de courant plus faible.

Codec GSM Half Rate

La norme GSM permet la division d'un seul canal vocal à plein débit en deux sous-canaux qui peuvent maintenir des appels séparés. Ce faisant, les opérateurs de réseau peuvent doubler le nombre d'appels vocaux pouvant être traités par le réseau avec très peu d'investissement supplémentaire.

Pour permettre l'utilisation de cette fonction, un codec demi-débit doit être utilisé. Le codec à demi-débit a été introduit dans les premières années du GSM, mais a donné une qualité vocale bien inférieure par rapport aux autres codecs vocaux. Cependant, cela offrait des avantages lorsque la demande était élevée et que la capacité du réseau était limitée.

Le codec GSM Half Rate utilise un algorithme de codec VSELP. Il code les données autour de trames de 20 ms portant chacune 112 bits pour donner un débit de 5,6 kbps. Cela comprend un débit de données de 100 bps pour un indicateur de mode qui détaille si le système pense que les trames contiennent des données vocales ou non. Cela permet au codec vocal de fonctionner de manière à offrir la qualité optimale.

Le système de codec Half Rate a été introduit dans les années 1990, mais étant donné la mauvaise qualité perçue, il n'a pas été largement utilisé.

Codec GSM AMR

Le codec AMR, Adaptive Multi-Rate est désormais le codec GSM le plus utilisé. Le codec AMR a été adopté par le 3GPP en octobre 1988 et il est utilisé à la fois pour les appels vocaux GSM et UMTS / WCDMA à commutation de circuits.

Le codec AMR offre une variété d'options pour l'un des huit débits binaires différents, comme décrit dans le tableau ci-dessous. Les débits binaires sont basés sur des trames d'une longueur de 20 millisecondes et contenant 160 échantillons. Le codec AMR utilise une variété de techniques différentes pour fournir la compression des données. Le codec ACELP est utilisé comme base du codec vocal global, mais d'autres techniques sont utilisées en plus de cela. Une transmission discontinue est utilisée de telle sorte qu'en l'absence d'activité vocale, la transmission est coupée. De plus, la détection d'activité vocale (VAD) est utilisée pour indiquer qu'il n'y a que du bruit de fond et aucune parole. De plus, pour indiquer à l'utilisateur que la connexion est toujours présente, un générateur de bruit de confort (CNG) est utilisé pour fournir du bruit de fond, même lorsqu'aucune donnée vocale n'est transmise. Ceci est ajouté localement au niveau du récepteur.

L'utilisation du codec AMR nécessite également qu'une adaptation de liaison optimisée soit utilisée de sorte que le débit de données optimal soit sélectionné pour répondre aux exigences des conditions actuelles du canal radio, y compris son rapport signal sur bruit et sa capacité. Ceci est réalisé en réduisant le codage source et en augmentant le codage de canal. Bien qu'il y ait une réduction de la clarté de la voix, la connexion réseau est plus robuste et la liaison est maintenue sans interruption. Des niveaux d'amélioration compris entre 4 et 6 dB peuvent être observés. Cependant, les opérateurs de réseau peuvent donner la priorité à chaque station en termes de qualité ou de capacité.

Le codec AMR a un total de huit débits: huit sont disponibles à plein débit (FR), tandis que six sont disponibles à demi-débit (HR). Cela donne un total de quatorze modes différents.


Débits de données du codec AMR
ModeDébit binaire
(kbit / s)
Plein tarif (FR) /
Demi-tarif (HR)
AMR 12.212.2FR
AMR 10.210.2FR
AMR 7,957.95FR / HR
AMR 7.407.40FR / HR
AMR 6.706.70FR / HR
AMR 5,905.90FR / HR
AMR 5.155.15FR / HR
AMR 4.754.75FR / HR

Codec AMR-WB

Le codec AMR-WB, également connu sous sa désignation ITU de G.722.2, est basé sur le codec AMR très populaire à plusieurs débits adaptatifs. AMR-WB utilise également une base ACELP pour son fonctionnement, mais il a été développé et AMR-WB offre une qualité vocale améliorée en raison de la largeur de bande vocale plus large qu'il code. AMR-WB a une bande passante allant de 50 à 7000 Hz, ce qui est nettement plus large que les bandes passantes de 300 à 3400 Hz utilisées par les téléphones standards. Cependant, cela se fait au prix d'un traitement supplémentaire, mais avec les progrès de la technologie des circuits intégrés ces dernières années, cela est parfaitement acceptable.

Le codec AMR-WB contient un certain nombre de domaines fonctionnels: il comprend principalement un ensemble de modes de codec de voix et de canal à débit fixe. Il comprend également d'autres fonctions de codec, notamment: un détecteur d'activité vocale (VAD); Fonctionnalité de transmission discontinue (DTX) pour GSM; et la fonctionnalité de débit contrôlé à la source (SCR) pour les applications UMTS. Une autre fonctionnalité comprend la signalisation dans la bande pour la transmission en mode codec et l'adaptation de liaison pour la commande de la sélection de mode.

Le codec AMR-WB a une fréquence d'échantillonnage de 16 kHz et le codage est effectué par blocs de 20 ms. Deux bandes de fréquences sont utilisées: 50-6400 Hz et 6400-7000 Hz. Ceux-ci sont codés séparément pour réduire la complexité du codec. Cette division sert également à focaliser l'allocation de bits dans la plage de fréquences subjectivement la plus importante.

La bande de fréquence inférieure utilise un algorithme de codec ACELP, bien qu'un certain nombre de fonctionnalités supplémentaires aient été incluses pour améliorer la qualité subjective de l'audio. L'analyse de prédiction linéaire est effectuée une fois par trame de 20 ms. De plus, les livres de codes d'excitation fixes et adaptatifs sont recherchés toutes les 5 ms pour des valeurs de paramètres de codec optimales.

La bande de fréquence plus élevée ajoute certaines caractéristiques naturelles et de personnalité à la voix. L'audio est reconstruit en utilisant les paramètres de la bande inférieure ainsi qu'en utilisant une excitation aléatoire. Comme le niveau de puissance dans cette bande est inférieur à celui de la bande inférieure, le gain est ajusté par rapport à la bande inférieure, mais en fonction des informations de voisement. Le contenu du signal de la bande supérieure est reconstruit en utilisant un filtre prédictif linéaire qui génère des informations à partir du filtre de bande inférieure.


Codec AMR-WB
Débit binaire
(kbit / s)
Remarques
6.60Il s'agit du tarif le plus bas pour AMR-WB. Il est utilisé pour les connexions à commutation de circuits pour GSM et UMTS et est destiné à être utilisé uniquement temporairement dans des conditions de canal radio sévères ou lors de la congestion du réseau.
8.85Cela donne une qualité améliorée par rapport au débit de 6,6 kbps, mais encore une fois, son utilisation n'est recommandée que pour une utilisation en période de congestion ou lors de conditions de canal radio sévères.
12.65Il s'agit du débit binaire principal utilisé pour les réseaux GSM et UMTS à commutation de circuits, offrant des performances supérieures au codec AMR d'origine.
14.25Un débit binaire plus élevé est utilisé pour donner une voix plus claire et est particulièrement utile lorsque les niveaux de bruit ambiant sont élevés.
15.85Un débit binaire plus élevé est utilisé pour donner une voix plus claire et est particulièrement utile lorsque les niveaux de bruit ambiant sont élevés.
18.25Un débit binaire plus élevé est utilisé pour donner une voix plus claire et est particulièrement utile lorsque les niveaux de bruit ambiant sont élevés.
19.85Un débit binaire plus élevé est utilisé pour donner une voix plus claire et est particulièrement utile lorsque les niveaux de bruit ambiant sont élevés.
23.05Non suggéré pour les canaux GSM à plein débit.
23.85Non recommandé pour les canaux GSM à plein débit et offre une qualité vocale similaire à celle du G.722 à 64 kbps.

Tous les téléphones équipés d'AMR-WB ne pourront pas accéder à tous les débits de données - les différentes fonctions du téléphone peuvent ne pas exiger que toutes soient actives, par exemple. En conséquence, il est nécessaire d'informer le réseau des tarifs disponibles et de simplifier ainsi la négociation entre le combiné et le réseau. Pour ce faire, trois configurations AMR-WB différentes sont disponibles:

  • Configuration A: 6,6, 8,85 et 12,65 kbit / s
  • Configuration B: 6,6, 8,85, 12,65 et 15,85 kbit / s
  • Configuration C: 6,6, 8,85, 12,65 et 23,85 kbit / s

On constate que seuls les modes 23,85, 15,85, 12,65, 8,85 et 6,60 kbit / s sont utilisés. Sur la base de tests d'écoute, il a été considéré que ces cinq modes étaient suffisants pour un service de téléphonie vocale de haute qualité. Les autres débits de données ont été conservés et peuvent être utilisés à d'autres fins, notamment la messagerie multimédia, le streaming audio, etc.

Bien que ceux-ci aient été décrits comme des codecs GSM, ils sont également utilisés dans un certain nombre d'autres domaines - certains sont utilisés avec la voix à commutation de circuits utilisée dans l'UMTS. Les performances du codec se sont améliorées depuis l'introduction des premiers codecs GSM: la qualité vocale ainsi que la bande passante requise ont tous été améliorés.

Sujets sur la connectivité sans fil et filaire:
Bases des communications mobiles2G GSM3G UMTS4G LTE5GWiFiIEEE 802.15.4Téléphones sans fil DECTNFC- Communication en champ procheFondamentaux du réseauQu'est-ce que CloudEthernetDonnées sérieUSBSigFoxLoRaVoIPSDNNFVSD-WAN
Revenir à Connectivité sans fil et filaire


Voir la vidéo: GSM Speech Coding, Authentication and Security (Janvier 2021).