<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Klaus Paiva &#187; Reconhecimento de fala</title>
	<atom:link href="http://blog.klaus.pro.br/tags/reconhecimento-de-fala/feed" rel="self" type="application/rss+xml" />
	<link>http://blog.klaus.pro.br</link>
	<description>Idéias e desventuras de Klaus Paiva</description>
	<lastBuildDate>Wed, 08 Sep 2010 19:15:55 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.0.1</generator>
		<item>
		<title>[tcc] O processo de produção e reconhecimento de fala</title>
		<link>http://blog.klaus.pro.br/2009/ler/tcc-o-processo-de-producao-e-reconhecimento-de-fala/index.html</link>
		<comments>http://blog.klaus.pro.br/2009/ler/tcc-o-processo-de-producao-e-reconhecimento-de-fala/index.html#comments</comments>
		<pubDate>Sun, 31 May 2009 14:07:08 +0000</pubDate>
		<dc:creator>Klaus Paiva</dc:creator>
				<category><![CDATA[Textos]]></category>
		<category><![CDATA[Reconhecimento de fala]]></category>
		<category><![CDATA[TCC]]></category>
		<category><![CDATA[Voz]]></category>

		<guid isPermaLink="false">http://blog.klaus.pro.br/?p=277</guid>
		<description><![CDATA[O processo de fala representa um papel de grande importância na comunicação entre seres humanos. Esse processo pode ser representado claramente por um ciclo, ciclo este que pode ser resumidamente descrito da seguinte forma: o processo de fala começa nos pensamentos do emissor da mensagem, onde a informação a ser transmitida é formulada. A partir [...]]]></description>
			<content:encoded><![CDATA[<p>O processo de fala representa um papel de grande importância na comunicação entre seres humanos. Esse processo pode ser representado claramente por um ciclo, ciclo este que pode ser resumidamente descrito da seguinte forma: o processo de fala começa nos pensamentos do emissor da mensagem, onde a informação a ser transmitida é formulada. A partir dessa mensagem, o processo de fonação (movimentos musculares para produção de sons) se inicia para permitir a geração dos sons que serão ouvidos, e potencialmente entendidos, por outras pessoas.</p>
<p>Um ouvinte recebe essas ondas sonoras através do seu sistema auditivo. Essas ondas são convertidas em sinais neurológicos de forma com que o cérebro possa fazer o entendimento da mensagem recebida.</p>
<p>O processo completo de geração de fala até o seu entendimento final pode ser entendido com mais detalhes, conforme descrito anteriormente por <a id="back2ref1" href="#ref1">[1]</a>, observando-se a figura abaixo:</p>
<dl class="images">
<dt><a class="thickbox" title="Figura 1. Produção e reconhecimento de fala" href="http://blog.klaus.pro.br/wp-content/uploads/2009/05/processo-voz-humana.jpg"><img src="http://blog.klaus.pro.br/wp-content/uploads/2009/05/processo-voz-humana-thumb.jpg" alt="" /></a></dt>
<dd>Figura 1. Produção e reconhecimento de fala</dd>
</dl>
<p>Inicialmente temos o processo de geração da fala: a etapa de <strong>formulação da mensagem</strong> consiste na elaboração da ideia que será expressada, após isso o <strong>sistema de expressão linguística</strong> é acionado para converter a ideia gerada num conjunto de palavras e fonemas que será transmitido posteriormente. Com as palavras e fonemas já definidos, o <strong>mapeamento neuromuscular</strong> se inicia para que o <strong>trato vocal</strong> possa trabalhar corretamente e emitir os sons relativos à mensagem original.</p>
<p>Após essas etapas concluídas temos o processo de entendimento da fala por parte do ouvinte: o processo de entendimento funciona de forma similar, porém inversa. As ondas sonoras emitidas pelo locutor chegam até o aparelho auditivo do ouvinte onde farão o <strong>estímulo da cóclea</strong>, desse estímulo a <strong>transdução neural</strong> vai permitir uma conversão das informações contidas nas ondas sonoras em sinais neurais que serão usados nos processos subsequentes. Com os sinais convertidos, o <strong>sistema de expressão linguística</strong> e a <strong>compreensão da mensagem</strong> são atingidos e o ouvinte entende a mensagem emitida pelo locutor. Porém, segundo <a id="back2ref2" href="#ref2">[2]</a>, atualmente ainda não é claro como os dois processos que ocorrem após a transdução neural funcionam exatamente.</p>
<p>No campo computacional, há processos equivalentes para cada uma das etapas do processo de produção e entendimento da fala humana. O processo computacional para o reconhecimento de fala pode ser visto na figura abaixo, conforme também descrito por <a id="back2ref3" href="#ref3">[3]</a>:</p>
<dl class="images">
<dt><a class="thickbox" title="Figura 2. Reconhecimento computacional de fala" href="http://blog.klaus.pro.br/wp-content/uploads/2009/05/processo-reconhecimento-voz.jpg"><img src="http://blog.klaus.pro.br/wp-content/uploads/2009/05/processo-reconhecimento-voz-thumb.jpg" alt="" /></a></dt>
<dd>Figura 2. Reconhecimento computacional de fala</dd>
</dl>
<p>Nele é possível notar que para cada uma das quatro etapas do processo humano existe uma contraparte no processo de reconhecimento computacional.</p>
<p>Nota importante: este texto ainda está <strong>sujeito a uma ampla revisão</strong>, ou seja, é uma versão <em><strong>beta</strong></em>. =)</p>
<dl class="references">
<dt>Referências</dt>
<dd id="ref1"><a href="#back2ref1" title="Voltar ao contexto desta referência">[1]</a> HUANG, Xuedong; ACERO, Alex; HON, Hsiao-Wuen. Spoken Language Processing (&#8230;), Prentice Hall, 2001, páginas 19 e 20</dd>
<dd id="ref2"><a href="#back2ref2" title="Voltar ao contexto desta referência">[2]</a> HUANG, Xuedong; ACERO, Alex; HON, Hsiao-Wuen. Spoken Language Processing (&#8230;), Prentice Hall, 2001, página 20</dd>
<dd id="ref3"><a href="#back2ref3" title="Voltar ao contexto desta referência">[3]</a> HUANG, Xuedong; ACERO, Alex; HON, Hsiao-Wuen. Spoken Language Processing (&#8230;), Prentice Hall, 2001, página 20</dd>
</dl>
<p class="alert"><strong>Nota:</strong> Os textos publicados com a identificação [tcc] no título são textos relativos aos assuntos que estou pesquisando para o meu <a href="http://blog.klaus.pro.br/2009/ler/tcc/index.html">TCC</a>. Como eu estou na etapa de pesquisa e formulação das ideias, nem tudo o que for apresentado aqui deve ser encarado como verdade absoluta, além de estar sujeito a erros, como qualquer outro trabalho. Utilize seu senso crítico ao ler estes textos e, se você desejar, deixe seus comentários no formulário abaixo. <img src='http://blog.klaus.pro.br/wp-includes/images/smilies/icon_biggrin.gif' alt=':D' class='wp-smiley' /> </p>
]]></content:encoded>
			<wfw:commentRss>http://blog.klaus.pro.br/2009/ler/tcc-o-processo-de-producao-e-reconhecimento-de-fala/index.html/feed</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
	</channel>
</rss>
