Summary: | El presente trabajo de tesis describe el estudio e implementación en hardware (DSP) de un codificador de voz basado en el estandar CELP FS1016 para canales de banda angosta. En primer lugar, se realiza un breve estudio del marco teórico en el que se basan los codificadores de voz, luego se describen las técnicas de procesamiento de voz más importantes que conforman el presente trabajo, en especial las referidas al estandar FS1016, se describen también los detalles de la implementación en el DSP, y finalmente se presentan las pruebas de calidad respectivas. En base al estudio y correcto conocimiento de todos los bloques constituyentes del esquema CELP FS1016, se proponen mejoras y optimizaciones tanto en el ámbito algorítmico, como en el ámbito del procesador DSP. Con ello se pretende obtener una mayor calidad de voz decodificada (sintética), sin comprometer seriamente la tasa de compresión del sistema ni el tiempo de ejecución del algoritmo, de tal forma que pueda ser empleado en sistemas de transmisión digital de datos de banda angosta. En el presente trabajo se usaron varias técnicas que pertenecen al esquema de codificación de voz basado en la Predicción Lineal con Excitación de Código (Code Excited Linear Prediction) como son: Cuantización Escalar de los Coeficientes LPC usando la técnica LSP (Line Spectral Frequency), Interpolación de los LSP, Análisis por Síntesis basado en la minimización del error ponderado perceptualmente (Perceptual Weighting Error), Excitación basada en un Codebook Estocástico (Excitación Vectorial) mas un Codebook Adaptivo (Pitch), Post-Filtro con control automático de ganancia, etc. La implementación en hardware constituye un aporte importante del presente trabajo. El codificador es implementado sobre la tarjeta de desarrollo DSK TMS320C6711 de Texas Instruments, lo cual permitirá su fácil incorporación a sistemas de comunicaciones banda angosta, a través de interfaces como RS232, RS485, etc. Finalmente se evalúa la calidad de la voz sintética del codificador tanto sin inserción como con inserción de errores (BER variable) en la señal codificada. === This thesis document describes the study and hardware implementation (DSP) of a CELP-based voice coder intended for narrow-band channels. Firstly, a brief study of the theoretical framework for voice coders is presented; then follows a description of the relevant voice processing techniques used in this work, mainly those that comprise the FS1016 standard; also, details of the implementation on DSP are described; and finally, the respective quality tests are shown. Based on the study and correct understanding of all the blocks that constitute the CELP FS1016 model, many improvements and optimizations regarding both algorithmic and processor-related issues are proposed. It is expected to obtain a better decoded voice quality without seriously compromise neither the compression system rate nor the algorithm execution time so that it can be used in narrow band digital transmission systems. This work used many techniques that come from the CELP (Code Excited Linear Prediction) approach, such as: Scalar quantization of linear prediction coefficients using LSP, Interpolation of LSP, analysis-by-synthesis based on the minimization of the perceptual weighting error, Stochastic Codebook excitation, Adaptive Codebook (Pitch), post-filter with automatic gain control and others. Hardware implementation constitutes an important contribution in this work. The coder was implemented on the Texas Instruments DSK TMS320C6711 board. The coder implementation on hardware will enable it to be easily incorporated into a narrow band communication system through data interfaces such as RS232, RS485, etc. Finally, the synthetic voice quality is tested through subjective tests, first without error insertion and then with a variable BER insertion.
|