Dispositivo gerador de fala - Speech-generating device

Stephen Hawking , falecido astrofísico e proeminente usuário de SGD, morreu em 14 de março de 2018 aos 76 anos

Dispositivos geradores de fala ( SGDs ), também conhecidos como auxiliares de comunicação de saída de voz , são sistemas eletrônicos de comunicação aumentativa e alternativa (AAC) usados ​​para complementar ou substituir a fala ou a escrita para indivíduos com deficiências graves de fala , permitindo que eles se comuniquem verbalmente. Os SGDs são importantes para pessoas com meios limitados de interação verbal, pois permitem que os indivíduos se tornem participantes ativos nas interações de comunicação. Eles são particularmente úteis para pacientes que sofrem de esclerose lateral amiotrófica (ELA), mas recentemente têm sido usados ​​para crianças com deficiências de fala previstas.

Existem vários métodos de entrada e exibição para usuários de várias habilidades para fazer uso de SGDs. Alguns SGDs têm várias páginas de símbolos para acomodar um grande número de declarações e, portanto, apenas uma parte dos símbolos disponíveis são visíveis a qualquer momento, com o comunicador navegando nas várias páginas. Dispositivos geradores de fala podem produzir saída de voz eletrônica usando gravações digitalizadas de fala natural ou por meio de síntese de fala - que pode transportar menos informações emocionais, mas pode permitir que o usuário fale mensagens novas.

O conteúdo, a organização e a atualização do vocabulário em um SGD são influenciados por uma série de fatores, como as necessidades do usuário e os contextos em que o dispositivo será usado. O desenvolvimento de técnicas para melhorar o vocabulário disponível e a velocidade da fala a produção é uma área de pesquisa ativa. Os itens de vocabulário devem ser de alto interesse para o usuário, ser aplicáveis ​​com frequência, ter uma variedade de significados e ser pragmáticos na funcionalidade.

Existem vários métodos de acesso a mensagens em dispositivos: direta ou indiretamente, ou usando dispositivos de acesso especializados - embora o método de acesso específico dependa das habilidades e capacidades do usuário. A saída do SGD é normalmente muito mais lenta do que a fala, embora as estratégias de aprimoramento de taxa possam aumentar a taxa de saída do usuário, resultando em maior eficiência de comunicação.

O primeiro SGD conhecido foi prototipado em meados da década de 1970, e o rápido progresso no desenvolvimento de hardware e software significou que os recursos do SGD agora podem ser integrados em dispositivos como smartphones . Usuários notáveis ​​de SGDs incluem Stephen Hawking , Roger Ebert , Tony Proudfoot e Pete Frates (fundador do ALS Ice Bucket Challenge ).

Os sistemas de geração de voz podem ser dispositivos dedicados desenvolvidos exclusivamente para AAC, ou dispositivos não dedicados, como computadores que executam software adicional para permitir que funcionem como dispositivos AAC.

História

O mecanismo seletor operado pelo paciente (POSM ou POSSUM), foi desenvolvido no início dos anos 1960

Os SGDs têm suas raízes nos primeiros recursos de comunicação eletrônica. O primeiro auxílio desse tipo foi um controlador de máquina de escrever gole e bafe chamado mecanismo seletor operado pelo paciente (POSSUM) prototipado por Reg Maling no Reino Unido em 1960. POSSUM digitalizou um conjunto de símbolos em um display iluminado. Pesquisadores da Universidade de Delft, na Holanda, criaram a máquina de escrever operada por holofote (LOT) em 1970, que fazia uso de pequenos movimentos da cabeça para apontar um pequeno ponto de luz para uma matriz de caracteres, cada um equipado com uma célula fotoelétrica. Embora não tenha tido sucesso comercial, o LOT foi bem recebido por seus usuários.

Em 1966, Barry Romich, um estudante calouro de engenharia na Case Western Reserve University, e Ed Prentke, um engenheiro do Highland View Hospital em Cleveland, Ohio, formaram uma parceria, criando a Prentke Romich Company . Em 1969, a empresa produziu seu primeiro dispositivo de comunicação, um sistema de digitação baseado em uma máquina de teletipo descartada.

Durante a década de 1970 e início de 1980, várias outras empresas começaram a surgir e desde então se tornaram fabricantes proeminentes de SGDs. Toby Churchill fundou a Toby Churchill Ltd em 1973, após perder seu discurso após encefalite. Nos Estados Unidos, o Dynavox (então conhecido como Sentient Systems Technology) surgiu de um projeto de estudante na Carnegie-Mellon University , criado em 1982 para ajudar uma jovem com paralisia cerebral a se comunicar. Começando na década de 1980, as melhorias na tecnologia levaram a um grande aumento no número, variedade e desempenho dos dispositivos de comunicação comercialmente disponíveis, e uma redução em seu tamanho e preço. Métodos alternativos de acesso, como o Target Scanning (também conhecido como apontamento de olhos), calibram o movimento dos olhos de um usuário para direcionar um SGD para produzir a fase de fala desejada. A varredura, na qual as alternativas são apresentadas ao usuário de forma sequencial, tornou-se disponível nos dispositivos de comunicação. As possibilidades de saída de voz incluem voz digitalizada e sintetizada.

O rápido progresso no desenvolvimento de hardware e software continuou, incluindo projetos financiados pela Comunidade Europeia . Os primeiros dispositivos dinâmicos de geração de fala em tela comercialmente disponíveis foram desenvolvidos na década de 1990. Foram desenvolvidos softwares que permitiram a produção de placas de comunicação por computador . Os dispositivos de alta tecnologia continuaram a se tornar menores e mais leves, enquanto aumentavam a acessibilidade e a capacidade; os dispositivos de comunicação podem ser acessados ​​por meio de sistemas de rastreamento ocular , funcionam como um computador para processamento de texto e uso da Internet e como um dispositivo de controle ambiental para acesso independente a outros equipamentos, como TV, rádio e telefones.

Stephen Hawking passou a ser associado à voz única de seu equipamento de síntese particular. Hawking não conseguia falar devido a uma combinação de deficiências graves causadas por ELA e uma traqueotomia de emergência . Nos últimos 20 ou mais anos, o SGD ganhou popularidade entre crianças pequenas com deficiências da fala, como autismo, síndrome de Down e danos cerebrais previstos devido à cirurgia.

A partir do início dos anos 2000, os especialistas perceberam o benefício de usar SGDs não apenas para adultos, mas também para crianças. Os neurolinguistas descobriram que os SGDs eram tão eficazes para ajudar crianças que estavam em risco de déficits temporários de linguagem após serem submetidos a cirurgia cerebral quanto para pacientes com ELA. Em particular, os SGDs digitalizados têm sido usados ​​como auxiliares de comunicação para pacientes pediátricos durante o processo de recuperação.

Métodos de acesso

Existem muitos métodos de acesso a mensagens em dispositivos: direta, indiretamente e com dispositivos de acesso especializados. Os métodos de acesso direto envolvem o contato físico com o sistema, por meio de um teclado ou tela sensível ao toque. Os usuários que acessam SGDs indiretamente e por meio de dispositivos especializados devem manipular um objeto para acessar o sistema, como manobrar um joystick , mouse com cabeça, ponteiro óptico de cabeça, ponteiro de luz, ponteiro infravermelho ou scanner de acesso com interruptor .

O método de acesso específico dependerá das habilidades e habilidades do usuário. Com a seleção direta, uma parte do corpo, um ponteiro, um mouse adaptado , um joystick ou um rastreamento ocular podem ser usados, enquanto a varredura de acesso por comutador costuma ser usada para a seleção indireta. Ao contrário da seleção direta (por exemplo, digitar em um teclado, tocar em uma tela), os usuários de Varredura de Alvo só podem fazer seleções quando o indicador de varredura (ou cursor) do dispositivo eletrônico está na escolha desejada. Aqueles que são incapazes de apontar normalmente calibram seus olhos para usar o olhar fixo como uma forma de apontar e bloquear como uma forma de selecionar as palavras e frases desejadas. A velocidade e o padrão de digitalização, bem como a forma como os itens são selecionados, são individualizados de acordo com as capacidades físicas, visuais e cognitivas do usuário.

Construção de mensagem

Uma captura de tela do programa de aumento de taxa Dasher

A comunicação aumentativa e alternativa é normalmente muito mais lenta do que a fala, com os usuários geralmente produzindo de 8 a 10 palavras por minuto. As estratégias de aprimoramento de taxa podem aumentar a taxa de saída do usuário para cerca de 12-15 palavras por minuto e, como resultado, aumentar a eficiência da comunicação.

Em qualquer SGD, pode haver um grande número de expressões vocais que facilitam a comunicação eficiente e eficaz, incluindo saudações, expressar desejos e fazer perguntas. Alguns SGDs têm várias páginas de símbolos para acomodar um grande número de expressões vocais e, portanto, apenas uma parte dos símbolos disponíveis são visíveis a qualquer momento, com o comunicador navegando nas várias páginas. Dispositivos geradores de fala geralmente exibem um conjunto de seleções usando uma tela que muda dinamicamente ou uma tela fixa.

Existem duas opções principais para aumentar a taxa de comunicação de um SGD: codificação e previsão.

A codificação permite que um usuário produza uma palavra, sentença ou frase usando apenas uma ou duas ativações de seu SGD. Estratégias de codificação icônicas, como compactação semântica, combinam sequências de ícones (símbolos de imagem) para produzir palavras ou frases. Na codificação numérica, alfanumérica e de letras (também conhecida como Abreviação-Expansão), as palavras e frases são codificadas como sequências de letras e números. Por exemplo, digitar "HH" ou "G1" (para Saudação 1) pode recuperar "Olá, como vai?".

Predição é uma estratégia de aumento de taxa na qual o SGD tenta reduzir o número de pressionamentos de tecla usados ​​ao prever a palavra ou frase sendo escrita pelo usuário. O usuário pode então selecionar a previsão correta sem precisar escrever a palavra inteira. O software de previsão de palavras pode determinar as opções a serem oferecidas com base em sua frequência no idioma, associação com outras palavras, escolhas anteriores do usuário ou adequação gramatical. No entanto, os usuários mostraram produzir mais palavras por minuto (usando uma interface de digitalização) com um layout de teclado estático do que com um layout de grade preditiva, sugerindo que a sobrecarga cognitiva de revisar um novo arranjo cancela os benefícios do layout preditivo ao usar uma interface de digitalização.

Outra abordagem para aumentar a taxa é o Dasher , que usa modelos de linguagem e codificação aritmética para apresentar alvos de letras alternativos na tela com tamanho relativo à probabilidade de acordo com o histórico.

A taxa de palavras produzidas pode depender muito do nível conceitual do sistema: o sistema TALK, que permite aos usuários escolher entre um grande número de enunciados no nível da frase, demonstrou taxas de saída superiores a 60 ppm.

Dispositivos de exibição fixos e dinâmicos

Dispositivos de exibição fixos

Um dispositivo de geração de fala com tela fixa

Dispositivos de exibição fixos referem-se àqueles nos quais os símbolos e itens são "fixos" em um formato específico; algumas fontes referem-se a isso como telas "estáticas". Esses dispositivos de exibição têm uma curva de aprendizado mais simples do que alguns outros dispositivos.

Dispositivos de exibição fixos replicam o arranjo típico de dispositivos AAC de baixa tecnologia (baixa tecnologia é definida como aqueles dispositivos que não precisam de baterias, eletricidade ou eletrônicos), como placas de comunicação . Eles compartilham algumas das desvantagens; por exemplo, eles são normalmente restritos a um número limitado de símbolos e, portanto, mensagens. É importante notar que com os avanços tecnológicos feitos no século vinte e um, os SGDs de tela fixa não são mais comumente usados.

Dispositivos de exibição dinâmica

Dispositivos de exibição dinâmica geralmente também são dispositivos de tela sensível ao toque . Eles normalmente geram símbolos visuais produzidos eletronicamente que, quando pressionados, alteram o conjunto de seleções que é exibido. O usuário pode alterar os símbolos disponíveis usando links de páginas para navegar até as páginas apropriadas de vocabulário e mensagens.

Um dispositivo gerador de fala com display dinâmico, capaz de emitir voz sintetizada e digitalizada

A página "inicial" de um dispositivo de exibição dinâmica pode mostrar símbolos relacionados a muitos contextos ou tópicos de conversação diferentes. Pressionar qualquer um desses símbolos pode abrir uma tela diferente com mensagens relacionadas a esse tópico. Por exemplo, ao assistir a um jogo de vôlei, um usuário pode pressionar o símbolo "esporte" para abrir uma página com mensagens relacionadas ao esporte e, em seguida, pressionar o símbolo que mostra um placar para pronunciar a frase "Qual é o placar?".

As vantagens dos dispositivos de exibição dinâmica incluem a disponibilidade de um vocabulário muito maior e a capacidade de ver a frase em construção. Uma outra vantagem dos dispositivos de exibição dinâmica é que o sistema operacional subjacente é capaz de fornecer opções para vários canais de comunicação, incluindo telefone celular , mensagens de texto e e-mail. O trabalho da Linköping University mostrou que tais práticas de redação de e-mail permitiram que crianças usuárias de SGD desenvolvessem novas habilidades sociais e aumentassem sua participação social.

Falando de teclado

Teclado usado para criar fala por telefone usando um conversor de texto em fala.

Os sistemas de baixo custo também podem incluir uma combinação de teclado e alto-falante sem uma exibição dinâmica ou tela visual. Este tipo de teclado envia texto digitado diretamente para um alto-falante de áudio. Pode permitir que qualquer frase seja dita sem a necessidade de uma tela visual que nem sempre é necessária. Um benefício simples é que um teclado falante, quando usado com um telefone padrão ou viva-voz, pode permitir que um indivíduo com deficiência de voz tenha uma conversa bidirecional pelo telefone.

Saída

A saída de um SGD pode ser digitalizada e / ou sintetizada: sistemas digitalizados reproduzem palavras ou frases gravadas diretamente, enquanto a fala sintetizada usa software de conversão de texto em voz que pode transportar menos informações emocionais, mas permite que o usuário fale novas mensagens digitando novas palavras. Hoje, os indivíduos usam uma combinação de mensagens gravadas e técnicas de texto para fala em seus SGDs. No entanto, alguns dispositivos são limitados a apenas um tipo de saída.

Fala digitalizada

Dispositivo simples de geração de voz operado por interruptor

Palavras, frases ou mensagens inteiras podem ser digitalizadas e armazenadas no dispositivo para que a reprodução seja ativada pelo usuário. Esse processo é formalmente conhecido como Voice Banking. As vantagens da fala gravada incluem que (a) fornece prosódia natural e naturalidade da fala para o ouvinte (por exemplo, pessoa da mesma idade e sexo que o usuário AAC pode ser selecionada para gravar as mensagens) e (b) fornece informações adicionais sons que podem ser importantes para o usuário, como rir ou assobiar. Além disso, os SGDs digitalizados são aqueles que proporcionam um certo grau de normalidade tanto para o paciente quanto para seus familiares quando perdem a capacidade de falar por conta própria.

Uma grande desvantagem de usar apenas voz gravada é que os usuários não conseguem produzir novas mensagens; eles são limitados às mensagens pré-gravadas no dispositivo. Dependendo do dispositivo, pode haver um limite para a duração das gravações.

Discurso sintetizado

SGDs que usam fala sintetizada aplicam as regras fonéticas do idioma para traduzir a mensagem do usuário em saída de voz ( síntese de fala ). Os usuários têm a liberdade de criar novas palavras e mensagens e não estão limitados àquelas que foram pré-gravadas em seus dispositivos por terceiros.

Smartphones e computadores aumentaram o uso de dispositivos de fala sintetizada por meio da criação de aplicativos que permitem ao usuário selecionar de uma lista de frases ou mensagens a serem faladas na voz e no idioma que o usuário escolheu. Aplicativos como o SpeakIt! ou Assistive Express para iPhone fornecem uma maneira barata de usar um dispositivo gerador de fala sem ter que ir ao consultório médico ou aprender a usar máquinas especializadas.

Os SGDs sintetizados podem permitir vários métodos de criação de mensagens que podem ser usados ​​individualmente ou em combinação: as mensagens podem ser criadas a partir de letras, palavras, frases, sentenças, imagens ou símbolos. Com a fala sintetizada, há capacidade de armazenamento virtualmente ilimitada para mensagens com poucas demandas de espaço de memória.

Mecanismos de fala sintetizados estão disponíveis em muitos idiomas, e os parâmetros do mecanismo, como velocidade de fala, intervalo de tom, gênero, padrões de ênfase, pausas e exceções de pronúncia podem ser manipulados pelo usuário.

Dispositivo de geração de texto para fala com teclado

Conjunto de seleção e vocabulário

O conjunto de seleção de um SGD é o conjunto de todas as mensagens, símbolos e códigos que estão disponíveis para uma pessoa que usa aquele dispositivo. O conteúdo, a organização e a atualização desse conjunto de seleção são áreas de pesquisa ativa e são influenciados por uma série de fatores, incluindo a habilidade, os interesses e a idade do usuário. O conjunto de seleção para um sistema AAC pode incluir palavras que o usuário ainda não conhece - elas são incluídas para que o usuário "cresça". O conteúdo instalado em qualquer SGD determinado pode incluir um grande número de páginas predefinidas fornecidas pelo fabricante, com um número de páginas adicionais produzidas pelo usuário ou pela equipe de atendimento do usuário, dependendo das necessidades do usuário e dos contextos em que o dispositivo será usado .

Seleção inicial de conteúdo

Os pesquisadores Beukelman e Mirenda listam uma série de fontes possíveis (como familiares, amigos, professores e equipe de atendimento) para a seleção do conteúdo inicial para um SGD. Uma variedade de fontes é necessária porque, em geral, um indivíduo não teria o conhecimento e a experiência para gerar todas as expressões vocais necessárias em um determinado ambiente. Por exemplo, pais e terapeutas podem não pensar em adicionar termos de gíria, como " innit ".

Trabalhos anteriores analisaram o uso de vocabulário de falantes em desenvolvimento típico e o uso de palavras de usuários AAC para gerar conteúdo para novos dispositivos AAC. Esses processos funcionam bem para gerar um conjunto básico de declarações ou expressões vocais, mas são menos eficazes em situações em que um vocabulário específico é necessário (por exemplo, termos relacionados diretamente ao interesse do usuário em passeios a cavalo). O termo "vocabulário marginal" refere-se ao vocabulário que é específico ou exclusivo para os interesses ou necessidades pessoais do indivíduo. Uma técnica típica para desenvolver vocabulário marginal para um dispositivo é conduzir entrevistas com vários "informantes": irmãos, pais, professores, colegas de trabalho e outras pessoas envolvidas.

Outros pesquisadores, como Musselwhite e St. Louis, sugerem que os itens do vocabulário inicial devem ser de alto interesse para o usuário, ser frequentemente aplicáveis, ter uma variedade de significados e ser pragmáticos na funcionalidade. Esses critérios têm sido amplamente usados ​​no campo AAC como uma verificação ecológica do conteúdo de SGD.

Manutenção automática de conteúdo

Usuário AAC com dispositivo customizado

Beukelman e Mirenda enfatizam que a seleção do vocabulário também envolve a manutenção contínua do vocabulário; no entanto, uma dificuldade no AAC é que os usuários ou seus responsáveis ​​devem programar qualquer nova expressão manualmente (por exemplo, nomes de novos amigos ou histórias pessoais) e não há soluções comerciais existentes para adicionar conteúdo automaticamente. Uma série de abordagens de pesquisa têm tentado superar essa dificuldade, que vão desde "entrada inferida", como a geração de conteúdo com base em um registro de conversa com amigos e familiares de um usuário, até dados extraídos da Internet para encontrar materiais linguísticos, como o Projeto Webcrawler. Além disso, ao fazer uso de abordagens baseadas em Lifelogging , o conteúdo de um dispositivo pode ser alterado com base em eventos que ocorrem a um usuário durante o dia. Acessando mais dados de um usuário, mais mensagens de alta qualidade podem ser geradas com o risco de expor dados confidenciais do usuário. Por exemplo, ao fazer uso de sistemas de posicionamento global , o conteúdo de um dispositivo pode ser alterado com base na localização geográfica.

Preocupações éticas

Muitos SGDs desenvolvidos recentemente incluem ferramentas de medição e análise de desempenho para ajudar a monitorar o conteúdo usado por um indivíduo. Isso levanta preocupações sobre privacidade , e alguns argumentam que o usuário do dispositivo deve estar envolvido na decisão de monitorar o uso dessa forma. Preocupações semelhantes foram levantadas em relação às propostas de dispositivos com geração automática de conteúdo, e a privacidade é cada vez mais um fator no design de SGDs. Como os dispositivos AAC são projetados para serem usados ​​em todas as áreas da vida de um usuário, existem questões legais, sociais e técnicas delicadas centradas em uma ampla família de problemas de gerenciamento de dados pessoais que podem ser encontrados em contextos de uso de AAC. Por exemplo, os SGDs podem ter que ser projetados de modo que apoiem o direito do usuário de excluir logs de conversas ou conteúdo que foi adicionado automaticamente.

Desafios

A programação de dispositivos de geração dinâmica de fala geralmente é feita por especialistas em comunicação aumentativa. Os especialistas são obrigados a atender às necessidades dos pacientes porque os pacientes geralmente escolhem os tipos de palavras / frases que desejam. Por exemplo, os pacientes usam frases diferentes com base em sua idade, deficiência, interesses, etc. Portanto, a organização do conteúdo é extremamente demorada. Além disso, os SGDs raramente são cobertos por seguradoras de saúde. Como resultado, os recursos são muito limitados no que diz respeito a financiamento e pessoal. O Dr. John Costello, do Hospital Infantil de Boston, tem sido a força motriz na solicitação de doações para manter esses programas em execução e com uma equipe adequada, tanto em seu hospital quanto em hospitais de todo o país.

Veja também

Referências

Bibliografia

  • Aetna Inc. (2010). "Boletim de política clínica: Dispositivos de geração de fala" .
  • Ashraf, S .; Warden, A .; Shearer, AJ; Judson, A .; Ricketts, IW; Waller, A .; Alm, N .; Gordon, B .; MacAulay, F .; Brodie, JK; Etchels, M. (2002). "Capturando frases para ICU-Talk, um meio de comunicação para pacientes intubados em terapia intensiva.". Anais da quinta conferência internacional ACM sobre tecnologias assistivas - Ativos '02 . p. 213. doi : 10.1145 / 638249.638288 . ISBN 1581134649. S2CID  4474005 .
  • Beukelman, D .; Mirenda, P. (15 de junho de 2005). Comunicação aumentativa e alternativa: apoiando crianças e adultos com necessidades de comunicação complexas (3ª ed.). Publicação de Paul H. Brookes. Co. ISBN 978-1-55766-684-0.
  • Black, R., Reddington, J., Reiter, E., Tintarev, N. e Waller A .. 2010. Usando NLG e sensores para apoiar a narrativa pessoal de crianças com necessidades de comunicação complexas. Em Proceedings of the NAACL HLT 2010 Workshop on Speech and Language Processing for Assistive Technologies (SLPAT '10). Association for Computational Linguistics, Stroudsburg, PA, EUA, 1-9.
  • Blackstone, SW; Williams, MB; Joyce, M. (2002). "Necessidades futuras de tecnologia AAC: Perspectivas do consumidor". Tecnologia Assistiva . 14 (1): 3-16. doi : 10.1080 / 10400435.2002.10132051 . PMID  12739846 . S2CID  42895721 .
  • Blischak, DM, Lombardino, LJ, & Dyson, AT (2003). Uso de dispositivos geradores de fala: em apoio à fala natural. Comunicação Aumentativa e Alternativa, 19
  • Brewer, N (8 de fevereiro de 2011). " 'A tecnologia dá voz ao menino" .
  • Dempster, M., Alm, N., e Reiter, E .. 2010. Geração automática de enunciados conversacionais e narrativa para comunicação aumentativa e alternativa: um sistema protótipo. Em Proceedings of the NAACL HLT 2010 Workshop on Speech and Language Processing for Assistive Technologies (SLPAT '10). Association for Computational Linguistics, Stroudsburg, PA, EUA, 10–18.
  • Dominowska, E., Roy, D., & Patel, R. (2002). Um auxílio de comunicação sensível ao contexto adaptável. Anais da Conferência Internacional CSUN sobre Tecnologia e Pessoas com Deficiência, Northridge, CA.
  • Centro ACE. "Dynavox Series 5" . Arquivado do original em 25 de abril de 2012.
  • "História da Empresa Dynavox" . Arquivado do original em 5 de agosto de 2016 . Página visitada em 26 de dezembro de 2011 .
  • Lund, J. "Roger Ebert's Journal: Finding my own voice 8/12/2009" . Blogs.suntimes.com. Arquivado do original em 19 de agosto de 2011 . Página visitada em 17 de outubro de 2009 .
  • Friedman, MB, G. Kiliany, M. Dzmura, D. Anderson. "The Eyetracker Communication System", Johns Hopkins APL Technical Digest, vol. 3, não. 3, 1982. 250-252
  • Friedman, MB, Kiliany, G. e Dzmura, M. (1985) An Eye Gaze Controlled Keyboard. Procedimentos da 2ª Conferência Internacional sobre Engenharia de Reabilitação , 446-447
  • Hanlon, M. "Stephen Hawking escolhe uma nova voz" . Página visitada em 10 de agosto de 2009 .
  • Glennen, Sharon L. e Decoste, Denise C. (1997). O Manual de Comunicação Aumentativa e Alternativa. Singular Publishing Group, Inc .: San Diego, CA.
  • Hawking, S. "Stephen Hawking e ALS" . Página visitada em 10 de agosto de 2009 .
  • Hedman, Glenn (1990). Tecnologia de Reabilitação . Routledge. pp. 100–01. ISBN 978-1-56024-033-4.
  • Higginbotham, DJ; Shane, H .; Russell, S .; Caves, K. (2007). "Acesso ao AAC: presente, passado e futuro". Comunicação Aumentativa e Alternativa . 23 (3): 243–257. doi : 10.1080 / 07434610701571058 . PMID  17701743 . S2CID  17891586 .
  • Hochstein, DD; McDaniel, MA; Nettleton, S .; Neufeld, KH (2003). "A fecundidade de uma abordagem nomotética para investigar AAC: Comparando dois esquemas de codificação de fala em crianças com paralisia cerebral e sem deficiência". American Journal of Speech-Language Pathology . 12 (1): 110-120. doi : 10.1044 / 1058-0360 (2003/057) . PMID  12680818 .
  • Hochstein, DD; McDaniel, MA; Nettleton, S. (2004). "Reconhecimento de vocabulário em crianças e adolescentes com paralisia cerebral: uma comparação de dois esquemas de codificação de fala". Comunicação Aumentativa e Alternativa . 20 (2): 45–62. doi : 10.1080 / 07434610410001699708 . S2CID  62243903 .
  • Hourcade, J .; Everhart Pilotte, T .; West, E .; Parette, P. (2004). "Uma História da Comunicação Aumentativa e Alternativa para Pessoas com Deficiências Graves e Profundas". Foco no autismo e outras deficiências de desenvolvimento . 19 (4): 235–244. doi : 10.1177 / 10883576040190040501 . S2CID  73593697 .
  • Infinitec.org. "Comunicação Alternativa Aumentativa" . Arquivado do original em 16 de maio de 2011 . Retirado em 16 de março de 2011 .
  • Jans, D .; Clark, S. (1998). "Ajudas de alta tecnologia à comunicação" (PDF) . Em Wilson, Allan (ed.). Comunicação Aumentativa na Prática: Uma Introdução . Centro CALL da Universidade de Edimburgo. ISBN 978-1-898042-15-0.
  • Johansen, AS, Hansen, JP, Hansen, DW, Itoh, K. e Mashino, S. 2003. Tecnologia de linguagem em um teclado preditivo e restrito na tela com layout dinâmico para pessoas com deficiências graves. Em Proceedings of the 2003 EACL Workshop on Language Modeling for Text Entry Methods (TextEntry '03). Association for Computational Linguistics, Stroudsburg, PA, EUA, 59-66.
  • Luo, F., Higginbotham, DJ, & Lesher, G. (2007). Webcrawler: Comunicação aumentativa aprimorada. Artigo apresentado na CSUN Conference on Disability Technology, março, Los Angeles.
  • Mathy; Yorkston, Guttman (2000). "Comunicação Aumentativa para Indivíduos com Esclerose Lateral Amiotrófica". Em Beukelman, D .; Yorkston, K .; Reichle, J. (eds.). Transtornos da Comunicação Aumentativa e Alternativa para Adultos com Transtornos Neurológicos Adquiridos . Baltimore: PH Brookes Pub. ISBN 978-1-55766-473-0.
  • David JC MacKay (2003). Teoria da informação, inferência e algoritmos de aprendizagem . Cambridge University Press. p. 119. ISBN 978-0-521-64298-9.
  • Musselwhite, CR; St. Louis, KW (maio de 1988). Programação de comunicação para pessoas com deficiência severa: estratégias vocais e aumentativas . Pro-Ed. ISBN 978-0-89079-388-6.
  • R. Patel e R. Radhakrishnan. 2007. Melhorar o acesso ao vocabulário situacional, alavancando o contexto geográfico. Resultados e benefícios da tecnologia assistiva
  • Rackensperger, T .; Krezman, C .; McNaughton, D .; Williams, MB; d'Silva, K. (2005). " " Quando eu comecei, eu queria jogá-lo de um penhasco ": Os desafios e benefícios de aprender tecnologias AAC conforme descrito por adultos que usam AAC". Comunicação Aumentativa e Alternativa . 21 (3): 165. doi : 10.1080 / 07434610500140360 . S2CID  143533447 .
  • Radomski, MV e Trombly Latham, CA (2007). Terapia ocupacional para disfunção física . Lippincott Williams & Wilkins. p. 527. ISBN 978-0-7817-6312-7.
  • Reddington, J .; Tintarev, N. (2011). "Gerando histórias automaticamente a partir de dados do sensor". Anais da 15ª conferência internacional sobre interfaces de usuário inteligentes - IUI '11 . p. 407. doi : 10.1145 / 1943403.1943477 . ISBN 9781450304191. S2CID  10394365 .
  • Reddington, J., & Coles-Kemp, L. (2011). Trap Hunting: Encontrando problemas de gerenciamento de dados pessoais em dispositivos AAC de última geração. Em Proceedings of the Second Workshop on Speech and Language Processing for Assistive Technologies (pp. 32-42). Edimburgo, Escócia, Reino Unido: Association for Computational Linguistics.
  • Roark, B., de Villiers, J., Gibbons, C., e Fried-Oken, M .. 2010. Métodos de digitalização e modelagem de linguagem para tipagem de comutação binária. Em Proceedings of the NAACL HLT 2010 Workshop on Speech and Language Processing for Assistive Technologies (SLPAT '10). Association for Computational Linguistics, Stroudsburg, PA, EUA, 28-36.
  • Schlosser, RW; Blischak, DM; K., Rajinder K. (2003). "Funções de saída de voz em AAC" . Em RW Schlosser (ed.). A eficácia da comunicação aumentativa e alternativa: rumo à prática baseada em evidências . San Diego: Acadêmico. pp. 472–532. ISBN 0-12-625667-5.
  • "Recuperando o dom da Gab: os computadores portáteis NexGen permitem que o mudo converta" . Página visitada em 10 de agosto de 2009 .
  • Stassen, HG; Sheridan, TB; Van Lunteren, T. (1997). Perspectivas sobre o controlador humano: ensaios em homenagem a Henk G. Stassen . Psychology Press. ISBN 978-0-8058-2190-1.
  • Sundqvist, A .; Rönnberg, J. (2010). "Uma análise qualitativa das interações por e-mail de crianças que usam a comunicação aumentativa e alternativa". Comunicação Aumentativa e Alternativa . 26 (4): 255–266. doi : 10.3109 / 07434618.2010.528796 . PMID  21091302 . S2CID  29481 .
  • Todman, J. (2000). "Taxa e qualidade das conversas usando um sistema AAC de armazenamento de texto: Estudo de treinamento de caso único". Comunicação Aumentativa e Alternativa . 16 (3): 164–179. doi : 10.1080 / 07434610012331279024 . S2CID  144178797 .
  • "Tipos de Dispositivos AAC, Comunicação Aumentativa, Incorporados" . Página visitada em 19 de março de 2009 .
  • "Toby Churchill, About Us" . Arquivado do original em 10 de dezembro de 2011 . Página visitada em 26 de dezembro de 2011 .
  • Vanderheide, GC (2002). “Uma viagem através da comunicação aumentativa precoce e do acesso ao computador” . Jornal de Pesquisa e Desenvolvimento de Reabilitação . 39 (6 Suplemento): 39–53. PMID  17642032 .
  • Venkatagiri, HS 1995. Técnicas para aumentar a produtividade da comunicação em AAC: Uma revisão da pesquisa. American Journal of Speech-Language Pathology 4, 36–45.
  • Ward, DJ; Blackwell, AF ; MacKay, DJC (2000). "Dasher --- uma interface de entrada de dados usando gestos contínuos e modelos de linguagem". Anais do 13º simpósio anual da ACM sobre software e tecnologia de interface de usuário - UIST '00 . p. 129. doi : 10.1145 / 354401.354427 . ISBN 1581132123. S2CID  189874 .
  • "Taxa de aumento, comunicação aumentativa e alternativa na Universidade de Washington, Seattle" . Página visitada em 19 de março de 2009 .
  • Zangari, C .; Lloyd, L .; Vicker, B. (1994). “Comunicação aumentativa e alternativa: uma perspectiva histórica”. Comunicação Aumentativa e Alternativa . 10 (1): 27–59. doi : 10.1080 / 07434619412331276740 .

links externos