Artigo .net Magazine 51 - Tecnologia Speech
Artigo da Revista .NET Magazine - Edição 51.
Clique aqui para ler esse artigo em PDF.
Boa Idéia
Tecnologia Speech
Aprenda como fazer softwares com comandos e sintetização de voz
Não é de hoje que podemos interagir com máquinas através da fala. Houve, porém, uma grande evolução e a tecnologia sofreu refinamentos que permitem uma reprodução mais próxima a nossa linguagem, possibilitando assim desenvolver aplicações mais avançadas.
Existem inúmeras bibliotecas e hardwares no mercado que permitem recursos de texto para voz (text-to-speech) e reconhecimento de voz, como por exemplo, o Speech SDK da Microsoft. O Framework do .NET, a partir da versão 3.0, ganhou uma camada de Speech. Embora ainda não tão difundida quando as demais inovações da versão 3.0, esta camada foi fruto de anos de pesquisa e aprimoramento e por isso merece um destaque especial.
O Microsoft speech SDK 5.1, conjugado com o .net framework 3.5, permite desenvolvimento de aplicações com recursos de voz bastante interessantes. Antes de entrarmos a fundo na programação, é importante conhecermos alguns termos.
Text-to-speech
Text to Speech é um recurso que sintetiza voz a partir de um texto. Este recurso é explorado desde meados do século passado, porém com o avanço da tecnologia há uma reprodução cada vez mais próxima à fala humana. Uma das principais aplicações desta tecnologia tem sido a leitura para deficientes visuais.
Speech recognition
É o processo inverso ao text-to-speech, ou seja, converte a fala humana em texto. Este recurso é muito difundido hoje em telefones celulares. É possível programar frases como “Casa”, e automaticamente o telefone liga para sua casa. Em sistemas mais complexos é possível reconhecer o locutor, sendo assim possível usar esta tecnologia para identificação pessoal.
Microsoft Speech Server
Com a internet, nos acostumamos a ter acesso à informações a qualquer hora. Porém, isto nem sempre é verdade, pois nem sempre estamos na frente de computadores. Embora existam muitos dispositivos móveis que permitem acesso à internet, devemos assumir que nem todos usuários têm dispositivos móveis, então o que fazer?
Uma das soluções seria a de utilizar o Microsoft Speech Server (MSS), um servidor para rodar aplicações com suporte a recursos de voz. O MSS pode interagir, por exemplo, com o MS Outlook Voice Access do Microsoft Exchange 2007 Unified Messaging, Windows Speech Recognition do Windows Vista, entre outros. É possível desenvolver aplicações personalizadas, utilizando .net e padrões abertos como SALT (Speech Application Language Tags). O SALT é um XML criado pelo W3C (" [...] continue lendo...
Artigos relacionados
-
Artigo
-
Artigo
-
Artigo
-
Artigo
-
Artigo