El título se traduce como Síntesis de Voz de Español del centro de México usando Modelos Ocultos de Markov. Fue un trabajo que se presentó en el 13th Annual International Conference on Information Technology & Computer Science organizado por Atiner. Llevado a cabo el día 15 al 19 de mayo de 2016.
El artículo revisa una parte del trabajo de tesis doctoral en el que se está trabajando. Relata como se llevó a cabo en la facultad, la adaptación a español mexicano del sistema de síntesis de voz HTS, propuesto originalmente por el Dr Tokuda y su equipo.
Fue producto de dos meses de trabajo, afortunadamente, tuvo buena recepción en el congreso. Se comparte autoría con el Dr Abel Herrera y con el MI Fernando Del Río, del Laboratorio de Tecnologías del Lenguaje de la Facultad de Ingeniería de la UNAM.
El Abstract del artículo es el siguiente:
The current century has proved being relevant in the design of new speech synthesizers. The incorporation of Hidden Markov Models HMM has changed the paradigm in the design of concatenative speech synthesizers. Such systems are called HMM text to speech synthesis (HTS). This paper describes a version adapted to central Mexico Spanish. A MOS test shows an intelligibility score of 3.4 and 3.1 of naturalness
Adjuntamos el artículo a ésta sección del blog como hemos venido haciendo con trabajos académicos anteriores. Descargar el texto en el vínculo abajo:
[…] speaker followed by a synthesized version of the same phrase using MFCC as speech parameterization (Franco, et. Al. 2016). The results were above the average in both intelligibility and naturalness (3.44 and 3.07 […]