Recursos Criados Sobre Síntese da Fala
Modelo de Prosódia para o Português Europeu Ferramenta de Etiquetagem de F0 nos parâmetros do modelo de Fujisaki Base de dados de fala FEUP-IPB Base de
Dados Curada de Parâmetros de Fala Patológica Para mais esclarecimentos ou consulta dos recursos contactar: Última Atualização: 17/05/2022 ·
Modelo de Prosódia para o Português Europeu o Trata-se de um modelo que faz a predição dos parâmetros prosódicos durações temporais e frequência fundamental de um texto escrito, com a finalidade de ser sintetizado por um conversor texto-fala. o O modelo está dividido em dois sub-modelos: § Um modelo de predição das durações segmentais, baseado em redes neuronais. (.pdf - 351 Kb). O modelo determina as durações dos segmentos de fonema com que devem ser sintetizados, tendo como entrada apenas o texto escrito. · Ouvir resultados o Fala original (locutor profissional) § Frase 1 (t2_p2.mp3 - 84 Kb) § Frase 2 (t1_p16.mp3 - 104 Kb) o Fala com durações segmentais impostas com o modelo § Frase 1 (t2_p2_d44.mp3
- 84 Kb) § Frase 2 (t1_p16_d44.mp3
- 104 Kb) § Um modelo de predição das curvas da frequência fundamental (F0) (.pdf - 222 Kb). Este modelo determina os parâmetros associados aos comandos de acento (.pdf - 214 Kb) e aos comandos de frase (.pdf - 230 Kb) que são as entradas de um modelo fisiológico de Fujisaki para geração de curvas de F0. Os parâmetros dos comandos da acento e de frase são determinados com redes neuronais (uma para cada parâmetro), tendo como entrada apenas o texto e as durações dos segmentos (determinadas pelo modelo de durações anterior). · Ouvir resultados (Modelo de Durações + Modelo de F0) o Fala com F0 imposta pelo modelo § Frase 1 (re14_t2_p2.mp3
- 84 Kb) § Frase 2 (re14_t1_p16.mp3
- 104 Kb) § Apresentação dos Resultados de forma visual: Para mais detalhes consultar "A Prosody Model to TTS Systems" (.pdf - 3.9 Mb). Modelo fisiológico de Fujisaki para geração de curvas de F0: Em que:
· Etiquetagem de F0 nos
parâmetros do modelo de Fujisaki Ferramenta
desenvolvida
Conjunto de regras que convertem o texto escrito numa sequência de fonemas. |