Projeto CAP Motrix - introdução


Lenira comandando o Motrix


Por quê usar comandos por voz?

O comando por voz é a forma mais usual entre os seres humanos, e deveria ser também a forma mais natural para comandar computadores. Entretanto, historicamente falando, até hoje os computadores foram preparados (por limitações imensas de ordem técnica) a trabalhar de duas formas principais:

a) por abreviaturas ou comandos tecladas (como se fazia no MS-DOS) em que as ordens eram dadas na forma de comandos codificados ou opções de um menu.

b) forma muda, apontando e clicando: é mais ou menos como se estivéssemos conversando com uma pessoa que não falasse a nossa língua: apontamos ou tocamos (clicamos) os objetos que queremos referenciar.

Ambas as formas exigem que a pessoa use suas mãos (ou pés, ou quem sabe a língua ou a testa, no caso de pessoas portadoras de deficiências) para apontar para os elementos desejados ou teclar estes comandos.

O número de programas criados segundo estas formas de comunicação tão pouco naturais para os seres humanos (clicar hoje é considerado normal, mas quando o mouse foi inventado por Douglas Englebart as pessoas diziam que era parecido com segurar uma caneta presa a um tijolo).

Por quê os computadores não usaram desde sempre a comunicação por voz? Bem, as técnicas de compreensão da voz humana só puderam ser usadas muito recentemente, quando a velocidade dessas máquinas atingiu um patamar mínimo e os algoritmos de comparação estatística (cadeias escondidas de Markov e outras) foram desenvolvidos.

Então estamos num momento interessante: já podemos hoje comandar o computador com a voz, mas a maioria dos programas não foi preparado para ser comandado desta forma.


Então comandar o computador por voz é hoje uma coisa experimental?

Bem, de certa forma, sim. Mas a tecnologia de computação evolui muito rapidamente, e é quase certo que em 10 anos, o controle das máquinas será quase exclusivamente feito por voz (e aí estamos falando também de geladeiras e ares condicionados, automóveis e provavelmente robôs caseiros).

Hoje diversas técnicas estão suficientemente maduras para que possam ser usadas de forma mais ou menos confiável. Outras estão ainda em sua infância de desenvolvimento. Comandar o computador (dar ordens num universo pequeno de opções, como num menu) é uma coisa bastante razoável com a tecnologia existente agora. Mas ditar textos de forma livre, ainda é algo que precisa sofrer diversas melhorias para que as pessoas possam utilizar com toda confiança.


Compreendendo a comunicação homem-máquina no Windows

Aula de Motrix com projeção

O sistema Windows utiliza um amplo conjunto de técnicas de interação homem-computador baseado em conceitos que poderiamos chamar de "paradigma da mesa do trabalho". Segundo estes conceitos a tela apresenta uma série de objetos que são tocados e ativados com o uso de dois dispositivos principais: teclado e mouse

Outros dispositivos podem ser usados, como "track balls", painéis de toque, e outros, mas quase sempre estes dispositivos são meros substitutos do mouse, que se tornou o dispositivo padrão para apontar e selecionar informações na tela.

Esses conceitos foram desenvolvidos a partir dos anos 1970 e praticamente não mudaram neste período. Novos dispositivos apareceram, em particular a possibilidade de se utilizar o reconhecimento de voz e de gestos para ativar programas, mas o número de programas que utiliza estas técnicas de forma efetiva ainda é muito pequeno.


Computadores e pessoas portadoras de deficiências

Aula de Motrix com projeção

Para muitas pessoas, os paradigmas usuais de comunicação com o computador são muito complexos. Uma pessoa idosa pode simplesmente não conseguir sincronizar o movimento da mão e dos dedos para fazer um "clique duplo" sobre um ícone da tela.

No caso de pessoas portadoras de deficiência, o problema exige uma análise mais detalhada

a) Um indivíduo que seja apenas surdo, por exemplo, não terá maiores dificuldades para usar o computador na forma convencional dos dias de hoje, pois suas mãos e olhos serão suficientes para processar as informações (bem, mais ou menos isso, muitos surdos terão dificuldades em entender o que está escrito, pois o português é a sua segunda língua, a sua primeira é a libras).

b) Um indivíduo cego terá mais dificuldades. Ele, por não conseguir ver o cursor na tela, não poderá usar os paradigmas de apontar com o mouse, nem ler o que está escrito na tela. Não precisa ser cego total: o mesmo raciocínio se aplica a uma pessoa bem idosa, em que a visão geralmente se degrada muito.

c) Um indivíduo com dificuldades de movimentos ou ausência dos braços não poderá usar o teclado nem o mouse, a não ser acionando estes dispositivos com outros membros (por exemplo os pés ou a língua).

Diversos programas foram criados para dar alternativas para deficientes ao acesso convencional. Um exemplo conhecido é o sistema DOSVOX que permite que pessoas cegas usem o computador, por fazer o acesso unicamento por teclado e feedback através de síntese de voz.

O motrix é um destes novos programas, que visa ser uma ponte para a ativação e controle de programas, usando exclusivamente a voz, dirigido para uso por pessoas com dificuldades motoras graves, em particular, tetraplégicos. Como toda técnica nova, ele deve ser considerado como um passo importante, mas ainda não maduro, nas novas formas de comunicação entre o homem e o computador.


Envie carta para José Antonio Borges

Logotipo do NCE Gerado automaticamente pelo sistema InterCAP
Copyright (c) 2002 - Núcleo de Computação Eletrônica - Projeto DOSVOX
Universidade Federal do Rio de Janeiro
Fale com o Webmaster