Artigo .net Magazine 51 - Tecnologia Speech

Natal DevMedia: Assine hoje e ganhe 3 meses gr�tis

Esse artigo faz parte da revista .NET Magazine edi��o 51. Clique aqui para ler todos os artigos desta edi��o

=0>

Boa Id�ia

Tecnologia Speech

Aprenda como fazer softwares com comandos e sintetiza��o de voz

N�o � de hoje que podemos interagir com m�quinas atrav�s da fala. Houve, por�m, uma grande evolu��o e a tecnologia sofreu refinamentos que permitem uma reprodu��o mais pr�xima a nossa linguagem, possibilitando assim desenvolver aplica��es mais avan�adas.

Existem in�meras bibliotecas e hardwares no mercado que permitem recursos de texto para voz (text-to-speech) e reconhecimento de voz, como por exemplo, o Speech SDK da Microsoft. O Framework do .NET, a partir da vers�o 3.0, ganhou uma camada de Speech. Embora ainda n�o t�o difundida quando as demais inova��es da vers�o 3.0, esta camada foi fruto de anos de pesquisa e aprimoramento e por isso merece um destaque especial.

O Microsoft speech SDK 5.1, conjugado com o .net framework 3.5, permite desenvolvimento de aplica��es com recursos de voz bastante interessantes. Antes de entrarmos a fundo na programa��o, � importante conhecermos alguns termos.

Text-to-speech

Text to Speech � um recurso que sintetiza voz a partir de um texto. Este recurso � explorado desde meados do s�culo passado, por�m com o avan�o da tecnologia h� uma reprodu��o cada vez mais pr�xima � fala humana. Uma das principais aplica��es desta tecnologia tem sido a leitura para deficientes visuais.

Speech recognition

� o processo inverso ao text-to-speech, ou seja, converte a fala humana em texto. Este recurso � muito difundido hoje em telefones celulares. � poss�vel programar frases como �Casa�, e automaticamente o telefone liga para sua casa. Em sistemas mais complexos � poss�vel reconhecer o locutor, sendo assim poss�vel usar esta tecnologia para identifica��o pessoal.

Microsoft Speech Server

Com a internet, nos acostumamos a ter acesso � informa��es a qualquer hora. Por�m, isto nem sempre � verdade, pois nem sempre estamos na frente de computadores. Embora existam muitos dispositivos m�veis que permitem acesso � internet, devemos assumir que nem todos usu�rios t�m dispositivos m�veis, ent�o o que fazer?

Uma das solu��es seria a de utilizar o Microsoft Speech Server (MSS), um servidor para rodar aplica��es com suporte a recursos de voz. O MSS pode interagir, por exemplo, com o MS Outlook Voice Access do Microsoft Exchange 2007 Unified Messaging, Windows Speech Recognition do Windows Vista, entre outros. � poss�vel desenvolver aplica��es personalizadas, utilizando .net e padr�es abertos como SALT (Speech Application Language Tags). O SALT � um XML criado pelo W3C (World Wide Web Consortium) permite intera��es da voz com telefonia.

Existem in�meras aplica��es que podem ser desenvolvidas com a tecnologia de reconhecimento de voz. Certamente voc� j� deve ter obtido informa��es de sua conta banc�ria atrav�s do telefone. Para que isto seja poss�vel � utilizada a tecnologia text-to-speech. Existem at� pizzarias que possuem aplica��es similares permitindo que voc� fa�a o pedido atrav�s da voz, em que voc� fala o nome da pizza, a quantidade e a bebida. Ap�s uma confirma��o o sistema, ent�o, calcula o valor total do pedido e depois de algum tempo a pizza chega em sua casa.

Outro exemplos ocorrem em algumas empresas, que possuem sistemas de redirecionamento de chamada atrav�s da voz. Voc� liga para a empresa e uma voz sintetizada pergunta �com quem deseja falar?�. Voc� responde o nome da pessoa, e ap�s uma confirma��o, sua liga��o � redirecionada para o ramal dela. Estes sistemas podem garantir grande redu��o de custo para as empresas, principalmente no longo prazo.

Exemplo e vantagens de aplica��es que podem usar voz

Aux�lio para deficientes visual
E-learning
Leitor de Texto em Geral (narra��o)
Suporte para aplicativos de PDAs e outros dispositivos m�veis
Seguran�a
Suporte
Call Center
Suporte a disl�xicos
Controle de equipamentos a longa dist�ncia, em campo
Opera��es cir�rgicas
Aplica��es cujo acesso � via telefonia
Muito outros...

Vis�o .net

Agora que temos uma vis�o do cen�rio, vamos ver como desenvolver aplica��es que tenham reconhecimento de voz e text-to-speech utlizando a tecnologia .NET.

Como pr�-requisito � necess�rio ter a vers�o 3.0 ou superior do .NET Framework. Instale tamb�m o Speech SDK 5.1 ou superior.

System.Speech.Recognition Namespace

Este namespace � o respons�vel pelo reconhecimento de voz dentro de system.speech. A Tabela 1 mostra uma breve descri��o das principais classes deste namespace.

Classe	Descri��o
AudioLevelUpdatedEventArgs	Classe que manipula eventos gerados quando o n�vel de �udio do sistema � alterado .
AudioSignalProblemOccurredEventArgs	Classe que manipula eventos gerados quando h� algum problema com o sinal de �udio.
AudioStateChangedEventArgs	Classe que manipula eventos gerados quando h� altera��o no fluxo do �udio.
Choices	Representa uma lista de alternativas de uma fala.
...