Artigo Java Magazine 04

Esse artigo faz parte da revista Java Magazine ediç�o 04. Clique aqui para ler todos os artigos desta ediç�o

Clique aqui para ler essa revista em PDF.

JavaSpeech

Reconhecimento e sintetizaç�o de voz com Java

O reconhecimento de comandos de voz por computadores sempre fascinou o Homem. V�rios filmes apresentam a possibilidade de conversar com um computador, ditar um texto ou emitir comandos utilizando a voz.

Na outra direç�o, imagine um programa complexo que deve se comunicar com o usu�rio atrav�s de sons. Pense como seria desgastante descrever todas as mensagens poss�veis para se gravar em .wav, por exemplo. � por isso que jogos como o FIFA fazem uso de sintetizadores de voz para as narraç�es das partidas de futebol. Existem ainda muitos outros benef�cios como a possibilidade de pessoas com limitaç�es f�sicas poderem ouvir seus e-mails ou ditar cartas.

Varias empresas trabalham intensamente para permitir esta façanha. Um bom exemplo � o Via Voice da IBM, um programa comercial que permite, entre outras coisas, ditar cartas em produtos como o Microsoft Office. Outras empresas como a Microsoft e a Dragon System oferecem �timos sistemas, ou engines, para tratamento de voz.

Tecnologias e implementaç�es

A tecnologia de fala computadorizada pode ser dividida em duas categorias: reconhecimento de voz e sintetizaç�o de voz.

Reconhecimento de voz habilita o computador a ouvir uma linguagem falada e determinar o que foi dito, ou seja, � o processo de converter em texto um som contendo palavras. Sintetizaç�o de voz � o processo inverso, transformando texto em som. � freq�entemente chamado de text-to-speech.

Java n�o fica atr�s nesta �rea. A Sun definiu uma especificaç�o que representa uma interface gen�rica para um engine, a Java Speech API (JSAPI). A JSAPI n�o implementa o engine em si, funcionando apenas como uma camada entre seus programas e os engines desenvolvidos por terceiros. Os engines podem ser soluç�es em hardware ou software e podem estar na m�quina local ou em um servidor. S�o eles que realmente trabalham com a placa de som capturando as falas ou sintetizando palavras.

Ao contr�rio do que acontece com outras APIs Java, n�o � fornecida uma implementaç�o de refer�ncia da Java Speech API. Em vez disso, no site oficial da JSAPI (veja links) fornece uma lista de produtos e empresas que implementam a API. Algumas implementaç�es s�o relacionadas na Tabela 1.

Na Figura 1 podemos ver o poder da JSAPI. Ela possibilita que nossos programas utilizem qualquer engine de qualquer empresa e em qualquer sistema operacional sem necessidade de alterar uma �nica linha de c�digo e usufruindo de toda a potencialidade do Java.

Produto	Descriç�o
FreeTTS	Sintetizador de voz de c�digo aberto totalmente escrito em Java.
IBM Speech for Java	Implementaç�o da JSAPI baseada no IBM Via Voice.
The Cloud Garden	Implementaç�o desenvolvida para funcionar com engines baseados na SAPI da Microsoft. Funciona com os produtos IBM ViaVoice, Dragon NaturallySpeaking e outros.
Conversa Web 3.0	"

[...] continue lendo...

Artigo Java Magazine 04 - JavaSpeech

Confira nesta edição de Java Magazine uma entrevista Bill Day Java speech, Interface ricas com flash

Artigos relacionados