Base de Dados para Sintetizador de Fala em Português Europeu, FEUP/IPB-BD

 

"Este trabalho foi produzido, parte no âmbito da preparação de doutoramento de João Paulo Teixeira e parte no Projecto ANTIGONA (programa IC-PME)"

Publicado em: "Phonetic Events from the Labeling the European Portuguese Database for Speech Synthesis, FEUP/IPB-DB" (.pdf - 132 Kb). Teixeira, J. P., Freitas, D., Braga, D., Barros, M. J. e Latsch, V., em actas do EUROSPEECH’01, Aalborg. Pages 1707-1710. Poster (.pdf - 401 Kb).

Apresenta-se a demonstração de uma faixa (com duração de cerca de 110 segundos) da Base de Dados de Fala Etiquetada para Português FEUP/IPB-DB.

Cada faixa (num total geral de cerca de 100 minutos de material gravado), foi cuidadosamente examinada e foram editadas colocadas etiquetas identificativas dos segmentos usando o software Speech Filing System (SFS) da UCL. Três níveis de etiquetas identificam marcas de fonemas, palavra e frase. A sílaba tónica também se encontra identificada com uma marca antes do primeiro fonema desta sílaba. As anotações de cada nível encontram-se num ficheiro de texto com a indicação do instante de tempo de ocorrência de cada elemento. As etiquetas ao nível do fonema são baseadas no código SAMPA  estendido com outros códigos presentes na tabela. As etiquetas identificativas dos segmentos ao nível da palavra e da frase encontram-se descritas nas linhas finais da tabela.

Etiqueta

Significado

p, b, t, d, k, g

Segmentos pós-oclusão das consoantes oclusivas em código SAMPA

!

Segmento de oclusão das consoantes oclusivas

f, v, s, z, S, Z

Fricativas em código SAMPA

m, n, J

Consoantes nasais em código SAMPA

L, l, R, r

Consoantes líquidas em código SAMPA

l*

l em posição final de sílaba (l velar)

i, e, E, a, 6, O, o, u, @

Vogais em código SAMPA

i~,e~,6~,o~,u~,w~,j~

Vogais nasais em código SAMPA

w, j

Semi-vogais em código SAMPA

X

Silêncio

XX

Aspiração

"

Início de sílaba tónica

 

Nível de Palavra

i

Início de palavra

f

Fim de palavra

 

Nível de Frase

i

Início de frase

.

Fim de frase

, ! () - ; : ... "

Todas as marcas de pontuação que surgem no texto

 

  • Além destas etiquetas foi posteriormente, para efeitos de estudo prosódico, realizada uma  marcação prosódica ao nível da frequência fundamental (F0),  identificando os comandos de frase e de acento de acordo com o modelo de Fujisaki.

 

Exemplo para uma faixa:

 

 

Trabalho realizado por:

João Paulo Teixeira e Daniela Braga com a Coordenação de Diamantino Freitas

 

Deixa-se uma menção de agradecimento à RDP, ao locutor Diamantino José Guedes e ao Projecto ANTÍGONA.

  <>
Se desejar fazer qualquer comentário ou sugestão, por favor, contacte joaopt@ipb.pt.

 

Última Actualização: 22/4/2006