Se você já testou alguma solução de mercado para a sintetização de áudio a partir de texto (text to speech) então você provavelmente já se deparou com alguma palavra que soou errado, isso ocorre porque as solução de fala para texto (TTS) são treinadas considerando o português comum que encontramos no dicionário.
No entanto é muito comum encontrarmos siglas, termos específicos ou até mesmo a utilização de palavras estrangeiras dentro de uma empresa nas nossas respostas. Como podemos adaptar nosso sistema cognitivo para que possa suportar tais especializações?
Um método seria escrever a palavra errada em nossas respostas para que então ela fosse vocalizada corretamente nos sistemas que utilizam áudio, mas essa abordagem nos tira a flexibilidade de poder treinar um mesmo corpus e permitir a utilização tanto por texto quanto por voz.
Nesse tutorial vamos apresentar como customizar o Watson Text to Speech de modo que ele fale as suas palavras corretamente em português.
"Um dos diferenciais do serviço Text to Speech da IBM é a possibilidade de customizar como essas palavras são expressas (em português)."
- Autor: Renato Leal
- Medium: medium.com/@renatoleal
- Linkedin: https://www.linkedin.com/in/renatodossantosleal/
Obs: você pode baixar o arquivo html daqui e abrir no chrome, com ele você poderá visualizar corretamente todos os outputs conseguidos e também ouvir como ficava o speech antes e depois