Artigo .net Magazine 51 - Tecnologia Speech

Esse artigo faz parte da revista .NET Magazine ediç�o 51. Clique aqui para ler todos os artigos desta ediç�o

Clique aqui para ler esse artigo em PDF.
<Rectangle<SPAN >

Boa Id�ia

Tecnologia Speech

Aprenda como fazer softwares com comandos e sintetizaç�o de voz

N�o � de hoje que podemos interagir com m�quinas atrav�s da fala. Houve, por�m, uma grande evoluç�o e a tecnologia sofreu refinamentos que permitem uma reproduç�o mais pr�xima a nossa linguagem, possibilitando assim desenvolver aplicaç�es mais avançadas.

Existem in�meras bibliotecas e hardwares no mercado que permitem recursos de texto para voz (text-to-speech) e reconhecimento de voz, como por exemplo, o Speech SDK da Microsoft. O Framework do .NET, a partir da vers�o 3.0, ganhou uma camada de Speech. Embora ainda n�o t�o difundida quando as demais inovaç�es da vers�o 3.0, esta camada foi fruto de anos de pesquisa e aprimoramento e por isso merece um destaque especial.

O Microsoft speech SDK 5.1, conjugado com o .net framework 3.5, permite desenvolvimento de aplicaç�es com recursos de voz bastante interessantes. Antes de entrarmos a fundo na programaç�o, � importante conhecermos alguns termos.

Text-to-speech

Text to Speech � um recurso que sintetiza voz a partir de um texto. Este recurso � explorado desde meados do s�culo passado, por�m com o avanço da tecnologia h� uma reproduç�o cada vez mais pr�xima � fala humana. Uma das principais aplicaç�es desta tecnologia tem sido a leitura para deficientes visuais.

Speech recognition

� o processo inverso ao text-to-speech, ou seja, converte a fala humana em texto. Este recurso � muito difundido hoje em telefones celulares. � poss�vel programar frases como �Casa�, e automaticamente o telefone liga para sua casa. Em sistemas mais complexos � poss�vel reconhecer o locutor, sendo assim poss�vel usar esta tecnologia para identificaç�o pessoal.

Microsoft Speech Server

Com a internet, nos acostumamos a ter acesso � informaç�es a qualquer hora. Por�m, isto nem sempre � verdade, pois nem sempre estamos na frente de computadores. Embora existam muitos dispositivos m�veis que permitem acesso � internet, devemos assumir que nem todos usu�rios t�m dispositivos m�veis, ent�o o que fazer?

Uma das soluç�es seria a de utilizar o Microsoft Speech Server (MSS), um servidor para rodar aplicaç�es com suporte a recursos de voz. O MSS pode interagir, por exemplo, com o MS Outlook Voice Access do Microsoft Exchange 2007 Unified Messaging, Windows Speech Recognition do Windows Vista, entre outros. � poss�vel desenvolver aplicaç�es personalizadas, utilizando .net e padr�es abertos como SALT (Speech Application Language Tags). O SALT � um XML criado pelo W3C (" [...] continue lendo...

Artigo .net Magazine 51 - Tecnologia Speech

Artigo da Revista .NET Magazine - Edição 51.

Artigos relacionados