DeepMind - DeepMind

DeepMind Technologies Limited
DeepMind logo.png
Tipo de negócios Subsidiária
Fundado 23 de setembro de 2010 ; 11 anos atrás ( 23-09-2010 )
Quartel general
Fundador (es)
CEO Demis Hassabis
Director Geral Lila Ibrahim
Indústria Inteligência artificial
Produtos AlphaGo , AlphaStar , AlphaFold , AlphaZero
Funcionários > 1.000 (junho de 2020)
Pai Independent (2010–2014)
Google Inc. (2014–2015)
Alphabet Inc. (2015 – presente)
URL www.deepmind.com

DeepMind Technologies é uma subsidiária britânica de inteligência artificial da Alphabet Inc. e laboratório de pesquisa fundado em setembro de 2010. DeepMind foi adquirida pelo Google em 2014. A empresa está sediada em Londres, com centros de pesquisa no Canadá, França e Estados Unidos. Em 2015, tornou-se uma subsidiária integral da Alphabet Inc , empresa controladora do Google.

DeepMind criou uma rede neural que aprende a jogar videogames de forma semelhante à dos humanos, bem como uma máquina de Turing Neural , ou uma rede neural que pode ser capaz de acessar uma memória externa como uma máquina de Turing convencional , resultando em um computador que imita a memória de curto prazo do cérebro humano.

DeepMind ganhou as manchetes em 2016 depois que seu programa AlphaGo venceu um jogador profissional de Go , Lee Sedol , o campeão mundial, em uma partida de cinco jogos , que foi tema de um documentário. Um programa mais geral, AlphaZero , venceu os programas mais poderosos jogando go , xadrez e shogi (xadrez japonês) depois de alguns dias jogando contra si mesmo usando o aprendizado por reforço . Em 2020, a DeepMind fez avanços significativos no problema de dobramento de proteínas .

História

Entrada do prédio onde o Google e a DeepMind estão localizados em 6 Pancras Square, Londres, Reino Unido.

O start-up foi fundada por Demis Hassabis , Shane Legg e Mustafa Suleiman em 2010. Hassabis e Legg encontraram pela primeira vez na University College London 's Gatsby Computacional Unidade de Neurociência .

Durante uma das entrevistas, Demis Hassabis disse que a start-up começou a trabalhar com tecnologia de inteligência artificial ensinando a jogar jogos antigos dos anos setenta e oitenta, que são relativamente primitivos se comparados aos que estão disponíveis hoje. Alguns desses jogos incluíam Breakout , Pong e Space Invaders . A IA foi apresentada a um jogo de cada vez, sem qualquer conhecimento prévio de suas regras. Depois de passar algum tempo aprendendo o jogo, a IA eventualmente se tornaria um especialista nele. “Diz-se que os processos cognitivos pelos quais a IA passa são muito parecidos com os que um ser humano que nunca viu o jogo usaria para entendê-lo e tentar dominá-lo.” O objetivo dos fundadores é criar uma IA de uso geral que pode ser útil e eficaz para quase tudo.

As principais empresas de capital de risco Horizons Ventures e Founders Fund investiram na empresa, bem como os empresários Scott Banister, Peter Thiel e Elon Musk . Jaan Tallinn foi um dos primeiros investidores e consultor da empresa. Em 26 de janeiro de 2014, o Google anunciou que a empresa havia adquirido a DeepMind por US $ 500 milhões e que havia concordado em adquirir a DeepMind Technologies. A venda para o Google ocorreu depois que o Facebook supostamente encerrou as negociações com a DeepMind Technologies em 2013. A empresa foi posteriormente renomeada para Google DeepMind e manteve esse nome por cerca de dois anos.

Em 2014, a DeepMind recebeu o prêmio "Company of the Year" do Cambridge Computer Laboratory .

Em setembro de 2015, a DeepMind e o Royal Free NHS Trust assinaram seu Acordo de Compartilhamento de Informações (ISA) inicial para co-desenvolver um aplicativo de gerenciamento de tarefas clínicas, Streams.

Após a aquisição do Google, a empresa estabeleceu um conselho de ética em inteligência artificial . O conselho de ética para a pesquisa de IA permanece um mistério, com o Google e a DeepMind se recusando a revelar quem está no conselho. DeepMind, junto com Amazon, Google, Facebook, IBM e Microsoft, é membro fundador da Partnership on AI , uma organização dedicada à interface sociedade-AI. DeepMind abriu uma nova unidade chamada DeepMind Ethics and Society e se concentrou nas questões éticas e sociais levantadas pela inteligência artificial, apresentando o proeminente filósofo Nick Bostrom como conselheiro. Em outubro de 2017, a DeepMind lançou uma nova equipe de pesquisa para investigar a ética da IA.

Em dezembro de 2019, o cofundador Suleyman anunciou que deixaria a DeepMind para ingressar no Google, trabalhando em uma função de política. Em 2021, o Wall Street Journal revelou que Suleyman havia sido colocado em licença na DeepMind em 2019, após uma investigação sobre as alegações de funcionários de que ele os intimidou. A empresa contratou um advogado externo para investigar as alegações de que Suleyman havia intimidado funcionários e foi colocado em licença antes de sair para trabalhar no Google. Um e-mail enviado à equipe após a divulgação da história, publicado pela Business Insider , disse que o "estilo de gestão de Suleyman ficou aquém" dos padrões esperados.

O Business Insider também publicou mais detalhes de alegações históricas de bullying contra Suleyman, incluindo alegações de que ele se gabava de "esmagar pessoas", "tinha o hábito de voar do nada" e exigia que os funcionários realizassem tarefas não relacionadas a seus empregos.

Produtos e tecnologias

De acordo com o site da empresa, o objetivo da DeepMind Technologies é combinar "as melhores técnicas de aprendizado de máquina e neurociência de sistemas para construir poderosos algoritmos de aprendizado de uso geral ".

O Google Research lançou um artigo em 2016 sobre segurança de IA e como evitar comportamentos indesejáveis ​​durante o processo de aprendizagem de IA. Deepmind também lançou várias publicações através de seu site. Em 2017, a DeepMind lançou o GridWorld, uma plataforma de teste de código aberto para avaliar se um algoritmo aprende a desabilitar seu interruptor de desligamento ou de outra forma exibe certos comportamentos indesejáveis.

Em julho de 2018, pesquisadores da DeepMind treinaram um de seus sistemas para jogar o jogo de computador Quake III Arena .

Em 2020, DeepMind publicou mais de mil artigos, incluindo treze artigos que foram aceitos pela Nature ou Science . DeepMind recebeu atenção da mídia durante o período AlphaGo; de acordo com uma pesquisa LexisNexis , 1842 notícias publicadas mencionadas DeepMind em 2016, diminuindo para 1363 em 2019.

Aprendizagem por reforço profundo

Ao contrário de outros AIs, como o Deep Blue ou Watson da IBM , que foram desenvolvidos para um propósito pré-definido e funcionam apenas dentro de seu escopo, DeepMind afirma que seu sistema não é pré-programado: ele aprende com a experiência, usando apenas pixels brutos como entrada de dados. Tecnicamente, ele usa aprendizado profundo em uma rede neural convolucional , com uma nova forma de Q-learning , uma forma de aprendizado por reforço sem modelo . Eles testam o sistema em videogames, principalmente nos primeiros jogos de arcade , como Space Invaders ou Breakout . Sem alterar o código, a IA começa a entender como jogar o jogo, e depois de algum tempo joga, para alguns jogos (mais notavelmente Breakout ), um jogo mais eficiente do que qualquer ser humano jamais poderia.

Em 2013, a DeepMind publicou uma pesquisa sobre um sistema de IA que poderia superar as habilidades humanas em jogos como Pong , Breakout e Enduro , enquanto superava o desempenho de última geração no Seaquest , Beamrider e Q * bert . Esse trabalho teria levado à aquisição da empresa pelo Google. A IA da DeepMind foi aplicada a videogames feitos nas décadas de 1970 e 1980 ; o trabalho estava em andamento para jogos 3D mais complexos, como Quake , que apareceu pela primeira vez na década de 1990.

Em 2020, DeepMind publicou Agent57, um AI Agent que supera o desempenho de nível humano em todos os 57 jogos da suíte Atari2600.

AlphaGo e sucessores

Em 2014, a empresa publicou uma pesquisa sobre sistemas de computador capazes de jogar Go .

Em outubro de 2015, um programa de computador Go chamado AlphaGo, desenvolvido pela DeepMind, venceu o campeão europeu de Go Fan Hui , um profissional de 2 dan (de 9 dan possíveis), cinco a zero. Esta foi a primeira vez que uma inteligência artificial (IA) derrotou um jogador profissional de Go. Anteriormente, só se sabia que os computadores jogavam Go em nível "amador". Go é considerado muito mais difícil para os computadores vencerem em comparação com outros jogos como o xadrez , devido ao número muito maior de possibilidades, tornando-o proibitivamente difícil para os métodos tradicionais de IA, como a força bruta .

Em março de 2016, ele derrotou Lee Sedol - um 9º jogador do dan Go e um dos jogadores mais bem classificados do mundo - com uma pontuação de 4–1 em uma partida de cinco jogos .

No Future of Go Summit 2017 , AlphaGo venceu uma partida de três jogos com Ke Jie , que na época manteve continuamente o ranking mundial em 1 por dois anos. Ele usou um protocolo de aprendizado supervisionado , estudando um grande número de jogos jogados por humanos uns contra os outros.

Em 2017, uma versão aprimorada, AlphaGo Zero, derrotou os jogos AlphaGo 100 a 0. As estratégias de AlphaGo Zero eram autodidatas. AlphaGo Zero foi capaz de derrotar seu predecessor depois de apenas três dias com menos poder de processamento do que AlphaGo; em comparação, o AlphaGo original precisava de meses para aprender a jogar.

Mais tarde naquele ano, AlphaZero, uma versão modificada de AlphaGo Zero, mas para lidar com qualquer jogo de dois jogadores com informações perfeitas, ganhou habilidades sobre-humanas no xadrez e no shogi. Como AlphaGo Zero, AlphaZero aprendeu apenas por meio do jogo sozinho.

Tecnologia

A tecnologia AlphaGo foi desenvolvida com base na abordagem de aprendizado por reforço profundo . Isso torna a AlphaGo diferente do resto das tecnologias de IA do mercado. Com isso dito, o 'cérebro' de AlphaGo foi apresentado a vários movimentos com base nos dados históricos do torneio. O número de movimentos foi aumentado gradualmente até processar mais de 30 milhões deles. O objetivo era fazer com que o sistema imitasse o jogador humano e, eventualmente, se tornasse melhor. Ele jogou contra si mesmo e aprendeu não apenas com suas próprias derrotas, mas também com as vitórias; assim, aprendeu a se aprimorar ao longo do tempo e, como resultado, aumentou sua taxa de vitórias.

AlphaGo usou duas redes neurais profundas: uma rede de política para avaliar as probabilidades de movimento e uma rede de valor para avaliar as posições. A rede de políticas foi treinada por meio de aprendizado supervisionado e, subsequentemente, refinada por aprendizado por reforço de gradiente de políticas . A rede de valor aprendeu a prever os vencedores dos jogos disputados pela rede de políticas contra ela mesma. Após o treinamento, essas redes empregaram uma pesquisa antecipada em árvore de Monte Carlo (MCTS), usando a rede de políticas para identificar movimentos de alta probabilidade candidatos, enquanto a rede de valor (em conjunto com implementações de Monte Carlo usando uma política de implementação rápida) avaliou as posições das árvores.

Zero treinou usando aprendizado por reforço no qual o sistema jogou milhões de jogos contra si mesmo. Seu único guia era aumentar sua taxa de vitórias. Fez isso sem aprender com os jogos dos humanos. Suas únicas características de entrada são as pedras pretas e brancas do tabuleiro. Ele usa uma única rede neural, em vez de redes separadas de políticas e valores. Sua pesquisa em árvore simplificada depende dessa rede neural para avaliar posições e movimentos de amostra, sem rollouts de Monte Carlo. Um novo algoritmo de aprendizagem por reforço incorpora a pesquisa antecipada dentro do loop de treinamento. AlphaGo Zero empregava cerca de 15 pessoas e milhões em recursos de computação. No final das contas, ele precisava de muito menos poder de computação do que o AlphaGo, rodando em quatro processadores AI especializados (Google TPUs ), em vez dos 48 do AlphaGo.

AlphaFold

Em 2016, a DeepMind voltou sua inteligência artificial para o dobramento de proteínas , um dos problemas mais difíceis da ciência. Em dezembro de 2018, o AlphaFold da DeepMind ganhou a 13ª Avaliação Crítica de Técnicas para Predição de Estrutura de Proteínas (CASP) ao prever com sucesso a estrutura mais precisa para 25 de 43 proteínas. “Este é um projeto de farol, nosso primeiro grande investimento em termos de pessoas e recursos em um problema científico fundamental e muito importante do mundo real”, disse Hassabis ao The Guardian . Em 2020, no 14º CASP, as previsões de AlphaFold alcançaram uma pontuação de precisão considerada comparável às técnicas de laboratório. O Dr. Andriy Kryshtafovych, um dos jurados científicos, descreveu o feito como "verdadeiramente notável" e disse que o problema de prever como as proteínas se dobram foi "amplamente resolvido".

WaveNet e WaveRNN

Em 2016, a DeepMind lançou o WaveNet, um sistema de conversão de texto em voz . Originalmente, era muito intensivo em termos de computação para uso em produtos de consumo, mas no final de 2017 ficou pronto para uso em aplicativos de consumo, como o Google Assistant . Em 2018, o Google lançou um produto comercial de conversão de texto em fala, Cloud Text-to-Speech, baseado em WaveNet.

Em 2018, a DeepMind apresentou um modelo mais eficiente chamado WaveRNN desenvolvido em conjunto com o Google AI . Em 2019, o Google começou a implementá-lo para usuários do Google Duo .

AlphaStar

Em 2016, Hassabis discutiu o game StarCraft como um desafio futuro, pois requer pensamento estratégico e manuseio de informações imperfeitas.

Em janeiro de 2019, a DeepMind lançou o AlphaStar, um programa que joga o jogo de estratégia em tempo real StarCraft II . AlphaStar usava aprendizado por reforço baseado em replays de jogadores humanos, e então jogava contra si mesmo para aprimorar suas habilidades. No momento da apresentação, AlphaStar tinha conhecimento equivalente a 200 anos de tempo de jogo. Venceu 10 jogos consecutivos contra dois jogadores profissionais, embora tivesse a vantagem injusta de poder ver todo o campo, ao contrário de um jogador humano que tem que mover a câmera manualmente. Uma versão preliminar em que essa vantagem foi corrigida perdeu uma partida subsequente.

Em julho de 2019, AlphaStar começou a jogar contra humanos aleatórios na escada multijogador pública europeia 1v1. Ao contrário da primeira iteração de AlphaStar, que jogou apenas Protoss v. Protoss, este jogou como todas as corridas do jogo e tinha vantagens injustas anteriores corrigidas. Em outubro de 2019, AlphaStar atingiu o nível Grandmaster na escada de StarCraft II em todas as três corridas de StarCraft , tornando-se o primeiro AI a alcançar a liga superior de um esport amplamente popular sem quaisquer restrições de jogo.

Contribuições diversas para o Google

O Google afirmou que os algoritmos DeepMind aumentaram muito a eficiência de resfriamento de seus data centers. Além disso, DeepMind (junto com outros pesquisadores da Alphabet AI) auxilia nas recomendações de aplicativos personalizados do Google Play . DeepMind também colaborou com a equipe Android do Google para a criação de dois novos recursos que foram disponibilizados para pessoas com dispositivos que executam o Android Pie, a nona parcela do sistema operacional móvel do Google. Esses recursos, Bateria Adaptável e Brilho Adaptável, usam aprendizado de máquina para economizar energia e tornar os dispositivos que executam o sistema operacional mais fáceis de usar. É a primeira vez que a DeepMind usa essas técnicas em uma escala tão pequena, com aplicativos típicos de aprendizado de máquina exigindo ordens de magnitude mais poder de computação.

DeepMind Health

Em julho de 2016, uma colaboração entre DeepMind e Moorfields Eye Hospital foi anunciada para desenvolver aplicativos de IA para saúde . DeepMind seria aplicada à análise de anónimos exames oculares, em busca de sinais precoces de doenças que levam à cegueira .

Em agosto de 2016, um programa de pesquisa com o University College London Hospital foi anunciado com o objetivo de desenvolver um algoritmo que pode diferenciar automaticamente entre tecidos saudáveis ​​e cancerosos em áreas de cabeça e pescoço.

Também há projetos com o Royal Free London NHS Foundation Trust e o Imperial College Healthcare NHS Trust para desenvolver novos aplicativos clínicos móveis vinculados a registros eletrônicos de pacientes . A equipe do Royal Free Hospital teria declarado em dezembro de 2017 que o acesso aos dados do paciente por meio do aplicativo economizou uma 'grande quantidade de tempo' e fez uma diferença 'fenomenal' no tratamento de pacientes com lesão renal aguda. Os dados do resultado do teste são enviados para os telefones celulares dos funcionários e os alertam sobre mudanças nas condições do paciente. Também permite que a equipe veja se outra pessoa respondeu e mostre aos pacientes seus resultados de forma visual.

Em novembro de 2017, a DeepMind anunciou uma parceria de pesquisa com o Cancer Research UK Centre no Imperial College London com o objetivo de melhorar a detecção do câncer de mama aplicando o aprendizado de máquina à mamografia. Além disso, em fevereiro de 2018, a DeepMind anunciou que estava trabalhando com o Departamento de Assuntos de Veteranos dos EUA em uma tentativa de usar o aprendizado de máquina para prever o início de lesão renal aguda em pacientes e também de forma mais ampla a deterioração geral dos pacientes durante uma internação hospitalar. que médicos e enfermeiras podem tratar mais rapidamente os pacientes necessitados.

DeepMind desenvolveu um aplicativo chamado Streams, que envia alertas aos médicos sobre pacientes em risco de lesão de risco agudo. Em 13 de novembro de 2018, a DeepMind anunciou que sua divisão de saúde e o aplicativo Streams seriam absorvidos pelo Google Health . Defensores da privacidade disseram que o anúncio traiu a confiança do paciente e parecia contradizer declarações anteriores da DeepMind de que os dados do paciente não seriam conectados a contas ou serviços do Google. Um porta-voz da DeepMind disse que os dados dos pacientes ainda seriam mantidos separados dos serviços ou projetos do Google.

Controvérsia sobre compartilhamento de dados do NHS

Em abril de 2016, a New Scientist obteve uma cópia de um acordo de compartilhamento de dados entre a DeepMind e a Royal Free London NHS Foundation Trust . Este último opera três hospitais em Londres, onde cerca de 1,6 milhão de pacientes são tratados anualmente. O acordo mostra que a DeepMind Health teve acesso a admissões, alta e transferência de dados, acidentes e emergência, patologia e radiologia e cuidados intensivos nesses hospitais. Isso incluía detalhes pessoais, como se os pacientes tinham sido diagnosticados com HIV , sofriam de depressão ou já haviam feito um aborto para realizar pesquisas para buscar melhores resultados em várias condições de saúde.

Uma reclamação foi apresentada ao Information Commissioner's Office (ICO), argumentando que os dados deveriam ser pseudonimizados e criptografados. Em maio de 2016, a New Scientist publicou outro artigo alegando que o projeto não conseguiu obter a aprovação do Grupo de Aconselhamento de Confidencialidade da Agência Reguladora de Medicamentos e Produtos de Saúde .

Em maio de 2017, a Sky News publicou uma carta vazada do National Data Guardian, Dame Fiona Caldicott , revelando que em sua "opinião considerada" o acordo de compartilhamento de dados entre a DeepMind e o Royal Free ocorreu em uma "base jurídica inadequada". O Information Commissioner's Office decidiu em julho de 2017 que o hospital Royal Free não cumpriu a Lei de Proteção de Dados ao entregar dados pessoais de 1,6 milhão de pacientes à DeepMind.

DeepMind Ethics and Society

Em outubro de 2017, a DeepMind anunciou uma nova unidade de pesquisa, DeepMind Ethics & Society. Seu objetivo é financiar pesquisas externas dos seguintes temas: privacidade, transparência e justiça; impactos econômicos; governança e responsabilidade; gerenciamento de risco de IA; Moralidade e valores da IA; e como a IA pode enfrentar os desafios do mundo. Como resultado, a equipe espera entender melhor as implicações éticas da IA ​​e ajudar a sociedade a ver que a IA pode ser benéfica.

Esta nova subdivisão da DeepMind é uma unidade completamente separada da parceria de empresas líderes que usam IA, academia, organizações da sociedade civil e organizações sem fins lucrativos com o nome Partnership on Artificial Intelligence to Benefit People and Society da qual a DeepMind também faz parte. O conselho de ética e sociedade da DeepMind também é diferente do conselho de ética da AI, que o Google concordou em formar ao adquirir a DeepMind.

Professores da DeepMind de aprendizado de máquina

A DeepMind patrocina três cadeiras de aprendizado de máquina:

  1. um na Universidade de Cambridge , ministrado por Neil Lawrence , no Departamento de Ciência da Computação e Tecnologia
  2. outro na Universidade de Oxford , dirigido por Phil Blunsom . no Departamento de Ciência da Computação
  3. outro na University College London , dirigido por Marc Deisenroth . no departamento de Ciência da Computação da Faculdade de Ciências da Engenharia

Veja também

Referências

links externos