Projeto DOSVOX Uma breve história do DOSVOX

Primeiro logotipo do DOSVOX


A difícil tarefa de recuperar a história

Uma nota de Antonio Borges

Ocorre uma surpresa quando nós, que vivenciamos o dia-a-dia do DOSVOX ao longo de tantos anos, olhamos para trás. É espantosamente simples o seu surgimento, um trabalho de um professor e um aluno durante um semestre acadêmico. Mas é espantosamente complexa a cadeia de relações múltiplas que surgiram a partir de um pequeno programa, gerando hoje um sistema imenso de computação, com milhares de usuários, e suportando múltiplos relacionamentos com tantos setores da sociedade.

Foram essas relações, tendo a computação como mola propulsora, e não a qualidade (ou falta de qualidade) dos programas que provocaram a modificação a vida de muitas pessoas, criando perspectivas mais amplas para a atuação dos deficientes visuais na sociedade.

Recuperar históricamente tudo o que ocorreu durante a conformação desta rede que, formada a partir de uma pequena semente, se tornou uma rede de proporções quase continentais, seria uma tarefa hercúlea. Primeiro, porque o tempo é se comporta como um apagador,que passa suavemente sobre os acontecimentos do dia-a-dia que são escritos com giz. Uma leve marca é deixada, mas outras coisas são escritas por cima, e em pouco tempo é muito difícil saber o que existia antes. Segundo, porque somos tentados a introduzir um certo "clima de romance" para tornar a história interessante.

Então, o texto a seguir não deve ser encarado como a "verdade histórica absoluta", mas como alguma coisa próxima. É uma brincadeira antiga afirmar que "A História é algo que não aconteceu contado por alguém que não estava lá". Nós estávamos lá, ou pelo menos estávamos na maior parte dos casos, mas não nos lembramos muito bem. E às vezes temos uma leve tendência a enfeitar o pavão.


Antes do DOSVOX - as dificuldades de um aluno cego na UFRJ

Para entender melhor as razões pelas quais o DOSVOX foi criado, é preciso analisar um problema que ainda hoje persiste não apenas na UFRJ mas em todas as universidades: poucos alunos cegos conseguem entrar no curso superior, e poucos daqueles que entram conseguem concluí-lo. Entre as causas mais importantes está a defasagem educacional a nível médio das pessoas cegas, e o fato de que, uma vez dentro da universidade, o aluno terá que se desdobrar para estabelecer caminhos alternativos para comunicação escrita entre ele, seus colegas e seus professores.

No ano de 1993, no qual foi iniciada este trabalho, havia apenas 7 alunos cegos em toda UFRJ. Um destes alunos era Marcelo Pimentel, estudante de informática de primeiro período.

Nota:

A entrada de um estudante cego é idêntica ao de qualquer aluno, ou seja, através do vestibular. A diferença é a aplicação da prova que pode ser feita em Braille. Na sua aplicação, geralmente se conta com a ajuda de um "ledor" (termo técnico usado para indicar as pessoas que lêem para um cego). As respostas são dadas numa folha branca que é marcada através de uma "reglete" (pequena prancheta com guias para escrita braille manual) ou datilografada numa máquina especial de Braille (Perkins). Essa prova depois será transcrita para tinta (ou para cartões marcados, no caso de múltipla escolha) por um professor especializado em escrita Braille.

Reglete

Máquina Perkins

A prova de Marcelo foi realizada no Instituto Benjamin Constant, uma das instituições especializadas na educação de cegos, no Rio de Janeiro, onde um ledor leu as questões da prova para ele e Marcelo, em sua máquina Perkins, datilografou as respostas, sendo aprovado para Informática.

Marcelo iniciou seu curso, não tendo muitos problemas com as matérias teóricas - contava com a ajuda de amigos e, principalmente, de seu pai. As provas sempre foram feitas de forma diferenciada: eram geralmente realizadas de forma oral, com as respostas transcritas para Braille. Os professores (que não sabem Braille) tinham sempre que criar soluções especiais, mas em geral, existia uma boa-vontade geral de dar solução para essas situações. Porém, trabalhar diretamente com o computador, criar e executar programas, era bem mais complicado, pois Marcelo, com a tecnologia disponível na UFRJ, não podia lidar com isso sozinho, sendo sempre obrigado a fazer parte de grupos de trabalho.

Marcelo descobriu que no SERPRO havia muitos cegos que trabalhavam com informática e conheceu os equipamentos por eles utilizados - um terminal de vídeo 3270 conectado a um mainframe IBM, conectado a um sintetizador de voz (equipamento que custava alguns milhares de dólares), uma impressora a braile e um scanner de mesa. A síntese de voz deste sistema era toda em inglês e a voz produzida era de difícil entendimento.

Um de seus professores, Mário de Oliveira, responsável pela disciplina de Cálculo Vetorial e Geometria Analítica, sugeriu que Marcelo fizesse um projeto de iniciação científica, com o objetivo de desenvolver um sistema que fizesse o computador "falar", à semelhança do que existia no Serpro, mas com tecnologia nacional. Mário de Oliveira escreveu um projeto solicitando à reitoria a aquisição de equipamentos para que pudesse trabalhar, e uma pequena sala no Laboratório do Curso de Informática foi cedida a ele, onde foram instalados os equipamentos conseguidos.

Porém, não é nada fácil para um aluno de primeiro ano desenvolver um projeto desta complexidade, e não havia ninguém com conhecimento técnico suficiente que pudesse orientá-lo, e Marcelo acabou assim desestimulado para dar início ao projeto, que acabou sendo deixado de lado. Marcelo então usava este computador utilizando o sistema operacional MS-DOS sem suporte, a não ser por contar com a ajuda de amigos que liam para ele as informações que apareciam na tela ou através de um pequeno programa que produzia feedback sonoro através do "speaker" do PC, com qualidade muito ruim. Esse pequeno programa era a única forma de Marcelo algum feedback automático.

Em agosto de 1993, no segundo período, Marcelo foi inscrito num curso obrigatório: Computação Gráfica. Aparentemente um contrasenso: como poderia um cego fazer um curso em que as informações são eminentemente visuais? O professor da disciplina, José Antonio dos Santos Borges, diante desse impasse, perguntou se Marcelo gostaria de ser isento desta disciplina, mas ele foi enfático: queria fazer o curso. A solução encontrada por Antonio foi que Marcelo se dedicasse a aprender os aspectos matemáticos e teóricos envolvidos na disciplina, e que substituísse os exercícios gráficos do curso por alguma coisa que fosse mais útil para ele.

Antonio conheceu a pequena sala em que Marcelo tinha seu micro dedicado, e escutou o som horrível do programinha que Marcelo eventualmente usava. Ficou muito claro que seria necessário investir urgentemente na criação de alguma outra forma para comunicação de Marcelo com a máquina. A solução de comunicação através de interfaces mecânicas táteis (displays Braille) tinha sido descartada, pois a tecnologia de mecânica fina não era dominada no Brasil, e o preço de displays braille importados era absolutamente proibitivo. A solução teria que ser criada usando apenas eletrônica barata e software.

A situação parecia ser simples e se tinha idéia sobre o que deveria ser feito, só não se sabia como fazer. Não se dominava ainda a tecnologia de síntese de voz no Brasil. a não ser em pesquisas avançadas que eram realizadas apenas nas grandes empresas de telefonia, ou no centro de pesquisa da Telebrás (CPqD).

Nota: Já havia, na verdade, sido realizada a compra de uma placa com síntese de voz para língua inglesa, chamada DecTalk, produzida pela Digital Corporation (equipamento caríssimo, geralmente em equipamentos para ajuda a cegos nos E.U.A., mas que não era capaz de falar português). Esse equipamento foi entregue um ano depois, devido a diversos entraves burocráticos na alfândega, e acabou sendo muito pouco usado, devido ao desenvolvimento dos programas que se tornaram depois o sistema DOSVOX.

Antonio e Marcelo em 1994


Em busca de uma luz no fim do túnel

Antonio havia orientado algum tempo antes alunos em projetos de fim de curso envolvendo gravação e reprodução digital de som e voz, usando uma técnica chamada CVSD através de circuitos eletrônicos especiais. Este sistema chegou inclusive a sintetizar de forma muito rudimentar falas em português. Mas tudo isso era muito complexo, o desenvolvimento envolveria anos de trabalho e seria inviável para ser aplicado ao caso de Marcelo. Naquela época as placas de som para micros era uma novidade nos Estados Unidos, eram muito caras e de difícil aquisição no Brasil, e sua tecnologia de programação não era dominada.

Antonio conversou com todos os colegas do NCE e o máximo que descobriu foi que em duas workstations SUN existentes no NCE (equipamentos usando UNIX, usados na época para aplicações gráficas) existia a possibilidade de reprodução de som. Uma idéia seria desenvolver algo nesse equipamento para Marcelo, mas a solução seria pouco útil: nesta época, todo curso de informática já havia sido planejado para uso intensivo de computadores PC. Esses equipamentos também eram muito usados em atividades de pesquisa e seria difícil alocar tempo para que Marcelo pudesse usá-las.

Por um desses acasos do destino, Antonio, que é musico, comprou no jornaleiro uma revista de Eletrônica Popular em que num dos artigos era mostrado um pequeno circuito (chamado R-2R), e sua aplicação para conversão digital-analógica de baixo custo. Era mostrado neste artigo como este circuito poderia ser usado para produzir som através de uma interface de impressora nos computadores IBM-PC. O circuito era muito rudimentar, envolvendo apenas resistências e capacitores, e a técnica de síntese musical mais usada era chamada ModPlay, que fazia uso de sons pré-digitalizados de instrumentos musicais contidos num disquete encartado na revista. Antonio comprou as peças e montou o circuito para brincar, sem associar a princípio que aquilo poderia servir para o problema de Marcelo.

Conversor R-2R

Quando o circuito foi colocado em funcionamento, e o som musical foi produzido, Antonio imediatamente vislumbrou que ele poderia ser também usado para reproduzir voz. Bastaria ao invés de usar instrumentos musicais digitalizados, usar voz gravada, e usar a mesma técnica para produzir sons em sequência. Uma aplicação imediata seria produzir feedback das teclas, e soletrar arquivos.

Mas como gravar, se não existiam placas de som? Uma primeira tentativa foi feita nas máquinas SUN, mas o som gravado nesta máquina soava muito estranho no circuito (hoje sabemos que o problema era causado pelo uso na SUN de uma compressão compressão mi-law, mas na época isso tudo era desconhecido para nós).

A solução não tardou a aparecer nesta mesma semana: num Jornal de muambas do Rio de Janeiro, chamado Jornal Balcão, se anunciava uma novidade para jogos: a placa Sound Blaster Pro (que custava 300 dólares na época). O anúncio dizia que a placa era capaz de gravar e reproduzir sons num aparelho de som comum.

Antonio, num impulso, fez a loucura: comprou a placa caríssima com seu próprio dinheiro, mesmo sem saber direito se serviria ou não. Serviu! O som digitalizado por ela era reproduzido perfeitamente pelo conversor digital-analógico da revista. Uma pequena rotina fo criada em Turbo Pascal para controlar este circuito. Era muito rudimentar, e a velocidade de exibição sonora tinha que ser ajustada máquina a máquina. Mas funcionava!

Antonio criou um pequeno programa demonstrativo e levou para Marcelo junto com a "aranha" do circuito, junto com arquivos digitalizados para algumas poucas letras com a voz dele. Em poucos minutos, foi criado pelos dois um pequeno programa o SoleArq, como o nome sugere, soletrava letra a letra, um arquivo tipo texto. Isso já permitia a Marcelo ler, muito lentamente é claro, as informações gravadas num arquivo no computador.

Mas todos ficavam com medo quando aquela coisa era plugada no micro de Marcelo, e um amigo de Antonio, o engenheiro Diogo Fujio Takano, também do NCE foi convidado para melhorar e dar segurança a este circuito, impedindo que aquila montagem provisória provocasse um incêndio no micro. O circuito foi reprojetado por Takano, com uma base mecânica e eletrônica mais confiável, e com a introdução de um pequeno amplificador interno que permitia a conexão direta de um fone de ouvido, sem necessidade de uso de fontes externas, usando apenas a energia existente nos pinos da interface de impressora.

O programa soleArq em poucos dias se transformou num novo programa que permitia que a digitação tivesse feedback. A cada tecla apertada um arquivo contendo o som correspondente era buscado e reproduzido na interface sonora. Isso foi o esboço de um pequeno editor de textos, muito rudimentar e com pouquíssimas opções. Esse programa foi a base do que veio depois a se transformar num poderoso editor de textos, o EDIVOX.

A próxima etapa seria possibilitar a leitura da tela, em tempo real. Para isso era necessário um domínio muito grande de programação de software básico que Marcelo não tinha na época (uma técnica chamada de "programação residente"). A primeira solução encontrada foi baseada num programa de domínio público para "print screen", que foi modificado para permitir que ao se apertar uma certa tecla toda memória de letras da interface de vídeo fosse armazenada num arquivo, que depois seria lida com o soleArq. Um outro programa residente foi criado para produzir um feedback das teclas, e assim Marcelo, mesmo sem saber o que imediatamente estava mostrado na tela pelo menos teclava com mais segurança. Tudo isso era muito desconfortável do ponto de vista operacional, mas situações simples podiam ser tratadas, tais como saber o resultado de um programa ou os erros causados num processo de compilação ou cópia de arquivos.

Um programador do NCE (que era aluno mais adiantado na Informática), trouxe a solução, num engenhoso programa residente. Orlando José Rodrigues Alves (in memoriam), desenvolveu o programa Vox (que fazia uso de sofisticadas rotinas em Assembly), que quando as teclas ALT+ESC eram pressionadas, congelava o programa atual e entrava numa rotina residente que permitia que a tela fosse "lida" através do movimento com as setas.".

O hardware de síntese acabou se mostrando também compatível com alguns programas estrangeiros, inclusive um prático leitor de telas para DOS, shareware (TinyTalk). Chegaram o hardware de síntese de voz DecTalk, e a impressora Braille. O microcomputador ficava cada dia mais acessível.

Ao fim do período letivo, Marcelo já tinha disponíveis as ferramentas mínimas para suportar o uso do computador ao longo de seu curso de informática: um editor de textos simples, um pequeno leitor de telas para MS-DOS e um sintetizador de baixo custo. Mais do que as ferramentas em si, estava a possibilidade de adaptá-las sempre que houvesse a necessidade de novas implementações.

As atividades de Marcelo nestes desenvolvimento foram considerado pelos professores responsáveis pelo curso de informática como substitutos válidos para os trabalhos obrigatórios do curso de Computação Gráfica, e ele foi aprovado com mérito na disciplina.


Disseminando a pesquisa inicial

Muitas outras pessoas cegas acabaram por ter notícias do desenvolvimento desses programas no NCE, especialmente os programadores do Serpro e os outros alunos cegos da UFRJ, e alguns vinham visitar Marcelo e conhecer o que estava sendo feito.

Era urgente a necessidade de disseminação destas soluções para outros possíveis usuários. Decididiu-se então criar um curso que seria aplicado para pessoas que poderiam transformar-se em futuros divulgadores e instrutores.

Só que isso não era tão simples, e dois problemas apareceram imediatamente:

O primeiro destes problemas foi resolvido de forma não ortodoxa. Antonio comprou o material suficiente para duplicar 20 unidades do circuito, foi à empresa de uma pessoa amiga e conseguiu que fosse fabricado um circuito impresso em quantidade pequena, conseguiu a doação de uma outra empresa (LayCab) de pequenas caixas que eram usada para outra finalidade (micro-modem) mas cujo tamanho era similar ao do circuito, e pagou a um técnico para montar. A idéia foi que os alunos que fizessem o curso poderiam comprar, pelo valor de custo, este hardware, ressarcindo assim Antonio pelo gasto.

O segundo problema era mais complexo: era imprescindível a criação de alguma interface operacional que pudesse guiar com segurança e simplicidade um deficiente visual nas funções mais usadas, ao invés de obrigá-lo a interagir diretamente com o sistema operacional MS-DOS.

Antonio programou então um sistema de interface com usuário que possibilitava a ativação de programas e de algumas funções de arquivamento, baseado no uso de menus com mensagens gravadas. A maior parte das operações era acionada através de uma ou duas teclas apenas, e a memorização minimizada pela presença de uma ajuda online (tecla F1). Esse programa é hoje conhecido como o Gerenciador do DOSVOX.

A primeira versão do DOSVOX era composta pelos seguintes programas:

O sistema completo cabia em 3 disquetes de 5 1/4 polegadas.

Clique aqui para ouvir o som das primeiras versões do DOSVOX

Nota: Cláudia Magalhães foi a primeira locutora do sistema DOSVOX. Sua voz grave, sensual e inconfundível ainda povoa o imaginário dos antigos usuários.

O curso afinal foi realizado. Foram chamados os cegos alunos da universidade (eram somente 5 na época) e algumas pessoas conhecidos por Marcelo, formando assim, a primeira turma do curso, que teve duração de uma semana.


A criação do sintetizador de voz

O resultado foi bastante animador, mas diversas falhas muito severas do sistemas ficaram claras. A mais importante delas era a dificuldade de ler um texto através de pura soletragem. Não havia, entretanto, no mercado nenhuma opção de sintetizador de fala para a língua portuguesa, que pudesse ser usada pelo DOSVOX.

Uma idéia simples foi usada para criar uma solução provisória: Antonio criou, com base em um projeto de tradução fonética para português, desenvolvido alguns anos antes como projeto de fim de curso de alguns alunos de informática, um programa tradutor, capaz de fazer a tradução de um texto em português para os fonemas correspondentes.

A geração digital de voz foi criada basicamente gravando através de um microfone todas as possibilidades de sílabas de português. Essas sílabas eram depois tocadas em sequência, a partir do resultado produzido pelo tradutor. A qualidade sonora não podia ser considerada excelente, mas foi suficiente para com um pequeno tempo para acostumar o ouvido, entender tudo o que o computador falava.

Esta síntese de voz apesar de ser limitada pela extrema simplicidade da técnica usada, é ainda hoje distribuída junto com o DOSVOX. É interessante notar que mesmo existindo nos dias de hoje excelentes sintetizadores comerciais para a língua portuguesa que são compatíveis com o DOSVOX, muitos usuários antigos ainda preferem a síntese original pela sua velocidade e ausência da emoção sintética exibida em produtos mais sofisticados.

Nota: A síntese de DOSVOX foi reconhecida historicamente pela revista PC-World como sendo o primeiro compilador de português que foi criado e efetivamente usado em nosso país.

Clique aqui para ler trechos da patente da síntese de voz do DOSVOX.


O mutirão vox

Os usuários exerceram um papel fundamental no desenvolvimento do sistema. A cada dia sugeriam mais e mais idéias que eram imediatamente acrescentadas ao programa.

Uma preocupação de Antonio era que as pessoas se sentirissem atraídas a usar o computador com voz. Parecia óbvia a necessidade de criar programas interessantes, em especial utilitários e jogos, que tornassem o Dosvox um sistema com "algo mais" do que um simples de edição de textos. Antonio convocou então os seus alunos de computação gráfica, colegas de Marcelo, a participarem de um "mutirão vox", onde esses alunos se engajariam no desenvolvimento de outros aplicativos para o ambiente. Nesse mutirão foram criadas as versões iniciais de alguns jogos e do programa Televox.

A partir deste mutirão, diversos outros alunos se juntaram ao esforço de criação de programas, e o DOSVOX foi crescendo sem parar, incorporando muitas funcionalidades, até se transformar ao longo dos anos no que é hoje: um sistema extremamente complexo com quase uma centena de programas.

A partir daí, o DOSVOX não parou mais de ser aprimorado. O DOSVOX foi crescendo, graças ao trabalho dedicado de poucas pessoas e o apoio fundamental dos alunos do curso de Informática da UFRJ.


Iniciando a Distribuição em Massa

A universidade não teria condições de distribuir centenas de unidades do DOSVOX, bem como dar suporte aos usuários. Assim, a TR/1 Sistemas (LAYCAB), indústria de eletrônica situada no Rio de Janeiro, generosamente acolheu o projeto DOSVOX e se propôs a fabricar e vender a preço muito baixo o sintetizador de voz.

O sintetizador LayCab

Foi também gerada uma estrutura de distribuição e suporte, através da criação de uma microempresa por uma pessoa cega, um dos primeiros usuários DOSVOX, Luiz Candido Pereira Castro, que foi um dos maiores responsáveis pela imensa disseminação do sistema.

Luiz Candido se responsabilizou pelas replicação em disquetes, empacotamento, distribuição e suporte à implantação do DOSVOX, sem esquecer o lado social do projeto. O DOSVOX era distribuído pelo com uma pequena margem de lucro, que era em parte revertida para o desenvolvimento do sistema. Em setembro de 1994, já havia mais de 200 pessoas na fila de espera pelo programa. Depois de 6 meses de lançado, o DOSVOX já contava com mais de 500 usuários em todo o Brasil.

Com seu falecimento três anos depois, uma outra pessoa cega assumiu a tarefa de distribuir o DOSVOX: a cantora Katia, que continuou distribuindo até 2002, quando a Internet e as placas de som se tornaram viável que que o sistema DOSVOX fosse tornado completamente gratuito, com distribuição via Internet.


A Criação do CAEC

Na medida em que o tempo foi passando, notou-se que os usuários precisariam ter um suporte melhor. Assim, com uma pequena verba da UFRJ, e com o apoio logístico do Núcleo de Computação Eletrônica (atualmente Instituto Tércio Pacitti de Aplicaçes e Pesquisas Computacionais), foi montado um centro de atendimento no mesmo NCE que foi denominado CAEC - Centro de Apoio Educacional ao Cego - que se tornou um pólo de disseminação de tecnologias de computação para cegos, oferecendo não apenas o suporte aos usuários DOSVOX mas a todas as pessoas deficientes visuais que precisam de apoio.


E a história continua

Muitas coisas aconteceram... Na medida que nós formos lembrando nós iremos colocando mais coisas aqui...


Envie carta para Antonio Borges

Logotipo do NCE Copyright (c) 2000 - Núcleo de Computação Eletrônica - Projeto DOSVOX
Universidade Federal do Rio de Janeiro
Conectada à INTERNET através da RedeRio de computadores
Fale com o Webmaster