Uso de Voz em Delphi

Você precisa estar logado para dar um feedback. Clique aqui para efetuar o login
Para efetuar o download você precisa estar logado. Clique aqui para efetuar o login
Confirmar voto
0
 (9)  (0)

Neste artigo veremos um pouco da tecnologia do SDK SAPI, que permite fazer uso de voz no Delphi. Este recurso é muito interessante para ler dados diversos nas mais variadas formas de utilidade.

Artigo do tipo Tutorial
Uso de Voz em Delphi
Sistemas de empresas telefônicas e muitas outras hoje em dia, usam recursos de voz devido a simplicidade gerada para entrada de dados. O mesmo poderia ser aplicado nos mais diversos sistemas, por exemplo, em consulta de clientes, agendamentos entre outras situações. É mais fácil e muito mais ágil informar os dados através da voz, no lugar do uso do mouse ou teclado. Obviamente em algumas outras situações, é mais fácil ouvir as informações no lugar de ler. É justamente o que abordaremos neste artigo, fazendo com que o nosso exemplo leia dados dos clientes previamente cadastrados por meio de comandos de voz.


Em que situação o tema é útil
O tema é útil em casos onde há a necessidade de criação de consultas para agilizar processos, além disso, também pode ser utilizado como forma de auxiliar usuários que sofram de algum tipo de deficiência ou dificuldade em manusear o mouse ou teclado.

Em 11 de agosto de 2001, a Microsoft libera o SAPI 5.1 SDK na qual permite seu uso em qualquer linguagem que suporte automação OLE (BOX 1). SAPI é o acrônimo de Speech Application Programming Interface. Consiste em uma API desenvolvida pela Microsoft na qual possibilita o reconhecimento de voz em aplicações Windows. Um exemplo conhecido de software que faz uso desta API é o Microsoft Office.

BOX 1. OLE Automation

OLE Automation ou apenas Automation é um mecanismo comumente utilizado para realizar a comunicação entre aplicações baseadas em COM (Component Object Model). A OLE permite o uso e manipulação de aplicações, ou seja, uma aplicação controlando outra.

Os componentes do SAPI SDK podem ser utilizados para elaborar sistemas com reconhecimento de voz e leitura de dados. Essa tecnologia que é muito robusta pode ser usada não só em Delphi, como em diversas outras linguagens de programação.

Usando a tecnologia do SDK SAPI 5.1

Para seu uso em Delphi, é necessário instalar o SDK SAPI 5.1 e configurá-lo, sendo apenas um detalhe mínimo, bastando importar sua Type Library e usar conforme a necessidade.

Em aplicações que irão usar leitura de textos, não é necessário ter nenhum reconhecimento de voz (SDK) instalado na máquina do cliente, sendo assim, limita-se apenas ao uso das “vozes” que estão instaladas no próprio Windows.

Além disso, podem ser instaladas vozes adicionais para o uso da aplicação, estas são identificadas por nomes de pessoas como as de “Raquel” (Português) e “Alonso” (Espanhol). No caso do idioma em português, existem outras opções, no entanto, a voz mais completa e de entonação melhor seria a voz denominada como “Raquel”. Na seção Links foi disponibilizado seu download.

Para usar os recursos de reconhecimento de voz, deve-se obrigatoriamente atender alguns pré-requisitos. Sendo assim, devem ser instalados no Windows, dentro de Painel de Controle, o reconhecimento de voz, assim como um microfone e a parte de som, que deverá estar funcionando corretamente.

Leitura de textos

Para leitura de textos, não é necessário ter nenhum reconhecimento de voz instalado. O computador irá apenas reproduzir o texto, usando os fonemas do idioma da voz selecionada para a “leitura” do texto.

Reconhecimento de comandos simples

Para um uso de reconhecimento de comandos simples, pra controlar botões e controles diversos dos formulários em geral, basta criar um objeto de reconhecimento (SpSharedRecoContext) e uma gramática para o mesmo. Esta gramática é o conjunto de palavras (comandos), que serão reconhecidos pela aplicação e que podem ser carregados por meio de um arquivo, banco de dados, ou um XML que é o mais comum. Desta forma os usuários podem falar o que for, que será descartado pelo objeto de reconhecimento. Quando uma palavra for falada e estiver na gramática do reconhecimento (XML, por exemplo) o aplicativo irá executar a ação correspondente do seu código.

"

A exibição deste artigo foi interrompida :(
Este post está disponível para assinantes MVP

 
Você precisa estar logado para dar um feedback. Clique aqui para efetuar o login
Receba nossas novidades
Ficou com alguma dúvida?