[tcc] O processo de produção e reconhecimento de fala

O processo de fala representa um papel de grande importância na comunicação entre seres humanos. Esse processo pode ser representado claramente por um ciclo, ciclo este que pode ser resumidamente descrito da seguinte forma: o processo de fala começa nos pensamentos do emissor da mensagem, onde a informação a ser transmitida é formulada. A partir dessa mensagem, o processo de fonação (movimentos musculares para produção de sons) se inicia para permitir a geração dos sons que serão ouvidos, e potencialmente entendidos, por outras pessoas.

Um ouvinte recebe essas ondas sonoras através do seu sistema auditivo. Essas ondas são convertidas em sinais neurológicos de forma com que o cérebro possa fazer o entendimento da mensagem recebida.

O processo completo de geração de fala até o seu entendimento final pode ser entendido com mais detalhes, conforme descrito anteriormente por [1], observando-se a figura abaixo:

Figura 1. Produção e reconhecimento de fala

Inicialmente temos o processo de geração da fala: a etapa de formulação da mensagem consiste na elaboração da ideia que será expressada, após isso o sistema de expressão linguística é acionado para converter a ideia gerada num conjunto de palavras e fonemas que será transmitido posteriormente. Com as palavras e fonemas já definidos, o mapeamento neuromuscular se inicia para que o trato vocal possa trabalhar corretamente e emitir os sons relativos à mensagem original.

Após essas etapas concluídas temos o processo de entendimento da fala por parte do ouvinte: o processo de entendimento funciona de forma similar, porém inversa. As ondas sonoras emitidas pelo locutor chegam até o aparelho auditivo do ouvinte onde farão o estímulo da cóclea, desse estímulo a transdução neural vai permitir uma conversão das informações contidas nas ondas sonoras em sinais neurais que serão usados nos processos subsequentes. Com os sinais convertidos, o sistema de expressão linguística e a compreensão da mensagem são atingidos e o ouvinte entende a mensagem emitida pelo locutor. Porém, segundo [2], atualmente ainda não é claro como os dois processos que ocorrem após a transdução neural funcionam exatamente.

No campo computacional, há processos equivalentes para cada uma das etapas do processo de produção e entendimento da fala humana. O processo computacional para o reconhecimento de fala pode ser visto na figura abaixo, conforme também descrito por [3]:

Figura 2. Reconhecimento computacional de fala

Nele é possível notar que para cada uma das quatro etapas do processo humano existe uma contraparte no processo de reconhecimento computacional.

Nota importante: este texto ainda está sujeito a uma ampla revisão, ou seja, é uma versão beta. =)

Referências
[1] HUANG, Xuedong; ACERO, Alex; HON, Hsiao-Wuen. Spoken Language Processing (…), Prentice Hall, 2001, páginas 19 e 20
[2] HUANG, Xuedong; ACERO, Alex; HON, Hsiao-Wuen. Spoken Language Processing (…), Prentice Hall, 2001, página 20
[3] HUANG, Xuedong; ACERO, Alex; HON, Hsiao-Wuen. Spoken Language Processing (…), Prentice Hall, 2001, página 20

Nota: Os textos publicados com a identificação [tcc] no título são textos relativos aos assuntos que estou pesquisando para o meu TCC. Como eu estou na etapa de pesquisa e formulação das ideias, nem tudo o que for apresentado aqui deve ser encarado como verdade absoluta, além de estar sujeito a erros, como qualquer outro trabalho. Utilize seu senso crítico ao ler estes textos e, se você desejar, deixe seus comentários no formulário abaixo. :D

2 comentários »

  1. Fábio R. de Miranda disse,

    31/05/2009 @ 20:05

    oi, Klaus

    Sou eu de novo. Bom texto, legal que a idéia de usar o blog como tubo de ensaio para as coisas do TCC esteja indo em frente.

    Só uma sugestão: achei o jeito com que você indicou as referências um pouco diferente, apesar de a rigor estar certo (indicando especificamente de qual página saiu cada informação). No caso deste texto, como [1], [2] e [3] se tratam da mesma obra, acho que você poderia colocar tudo como referência [1], páginas 19 e 20.

    É bom tomar este cuidado de separar detalhadamente cada página (ou mesmo parágrafo) ao referenciar uma informação quando o teor da mesma for muito notável, controverso ou polêmico, até mesmo para não atrair o ônus sobre provar a informação para você. Mas normalmente a gente faz uma referência mais easygoing, assumindo que o leitor pode procurar um pouco na obra referenciada se quiser mesmo correr atrás.

    Boa sorte!

    []s

  2. Klaus Paiva disse,

    02/06/2009 @ 20:49

    Oi Miranda,
    novamente muito obrigado pelas dicas! Fico muito agradecido pela leitura dos textos ainda nessa versão “beta” dos mesmos. :D

    Conforme você sugeriu, no artigo que estamos escrevendo vou agrupar essas referências similares para gerar um resultado melhor organizado!

    Obrigado novamente.

Deixe seu comentário

* campos obrigatórios