PRO-GMÁTICA: uma base de dados prosódica pragmaticamente orientada em Português Europeu Artigo de Conferência uri icon

resumo

  • Neste trabalho apresenta-se uma base de dados de fala espontânea com etiquetagem linguística, prosódica e pragmática em Português Europeu (PE). Esta informação pode ser encontrada num ficheiro de texto que é associado ao sinal de fala, sendo por isso possível analisar simultaneamente as várias dimensões em questão. O objectivo deste trabalho consiste em criar um corpus de fala etiquetado em que seja possível correlacionar a dimensão acústica e prosódica do sinal com o seu significado linguístico e pragmático, sobretudo tendo em atenção as dimensões emocionais e estilísticas do discurso. Constituem motivações subjacentes a este trabalho a necessidade de controlar a manipular a naturalidade da fala sintética, a necessidade de implementar emoção e atitude nos actuais sistemas síntese e reconhecimento de fala e a inexistência de corpora de fala espontânea linguística e prosodicamente etiquetada e que contemple as dimensões emocional e comunicativa. Neste artigo, faz-se uma breve introdução ao assunto em questão e apresenta-se o estado-da-arte das bases de dados em PE. Em seguida, descreve-se o processo da recolha da PRO-GMÁTICA e os critérios subjacentes à sua estruturação. Posteriormente, refere-se o tratamento e análise dos dados recolhidos, o que consiste basicamente no elenco e descrição dos níveis de etiquetagem considerados e na extracção dos parâmetros acústicos segundo o modelo Fujisaki. Finalmente, apresentam-se as conclusões e trabalhos futuros. Desta forma, pretendemos, num futuro próximo, vir a dotar os sistemas de síntese da fala e de diálogo homem-máquina em PE de uma dimensão mais pragmática.

data de publicação

  • janeiro 1, 2005