Assim funciona Jarvis, o mordomo virtual de Mark Zuckerberg

Executivo do Facebook cumpriu uma das suas resoluções de ano novo: criar um sistema de inteligência artificial capaz de compreender voz e contexto

O CEO de Facebook, Mark Zuckerberg em um evento em setembro. STEPHEN LAM (REUTERS) | FACEBOOK

Mark Zuckerberg leva muito a sério as suas resoluções de ano novo. Sua contínua busca por desafios que permitam “aprender coisas novas e crescer”, segundo suas próprias palavras, o ajudam a escapar do seu asfixiante papel de presidente e executivo-chefe do Facebook. Estudar chinês mandarim, conhecer pessoas diferentes e interessantes a cada dia e ler dois livros por mês foram algumas das muitas resoluções que ele cumpriu e compartilhou na rede social que criou quando ainda era universitário.

O filantropo norte-americano se transformou em um executivo, mas sempre foi, acima de tudo, um programador. Por isso, aproveita qualquer hackaton ou pequeno projeto para se envolver. Seu objetivo para 2016 era desenvolver uma inteligência artificial simples que permitisse controlar a casa: uma espécie de mordomo virtual que dá vida a Jarvis, o ser artificial que, nos filmes da Marvel, controla a casa do Homem de Ferro.

Seu objetivo para 2016 era desenvolver uma inteligência artificial simples para o controle doméstico: uma espécie de mordomo virtual que dá vida a Jarvis

Seu primeiro contato com a inteligência artificial foi aos 18 anos, pouco antes de entrar em Harvard. Foi quando lançou, com seu colega Adam D’Angelo, o Synapse Media Player, reprodutor musical com uma peculiaridade totalmente inovadora para a época: a canção reproduzida era selecionada conforme as preferências do usuário e suas audições prévias. Tornou-se o primeiro sucesso de Zuckerberg, que, no entanto, decidiu compartilhar o produto gratuitamente, em vez de vendê-lo a algum dos vários interessados (incluindo a gigante Microsoft).

Faltando pouco mais de uma semana para o final de 2016, o objetivo definido pelo criador do Facebook já está completamente operacional. Zuckerberg pode falar com Jarvis através do seu computador ou celular para que controle as luzes, a temperatura, o aparelho de som e as câmeras de segurança da sua casa. Distinguir os membros da família Zuckerberg e aprender com suas preferências e padrões é o que torna esse robô especial.

Jarvis inclui vários paradigmas de inteligência artificial, como o processamento e a compreensão da linguagem natural, o reconhecimento facial e de voz, e, o mais importante, a capacidade de aprender com a experiência.

Conectar o lar, a primeira pedra no caminho

O primeiro passo foi conectar todos os aparelhos da casa. Embora aparentemente seja a parte mais simples, revelou-se um dos processos mais complicados, como admite o próprio Zuckerberg na sua postagem no Facebook.

Mediante o assistente podem ser controlado diferentes dispositivos do lar.
Mediante o assistente podem ser controlado diferentes dispositivos do lar.

Antes de começar a criar os algoritmos de inteligência artificial, ele precisou escrever códigos para cada um dos aparelhos conectados, já que cada um deles fala linguagens e protocolos distintos. Um alto-falante Sonos, um televisor Samsung e uma câmera Nest só obedecem aos controles remotos ou aplicativos originalmente associados a eles. Era preciso encontrar uma maneira de todos os aparelhos serem comandados por um só computador conectado à Internet.

Como se fosse pouco, um segundo obstáculo se interpôs no caminho de Zuckerberg. A maioria de eletrodomésticos simplesmente não tem conexão à Internet, o que o obrigou a adaptar cada um deles antes de colocar mãos (ou cérebro) à obra no seu projeto de inteligência artificial. Tratava-se, por exemplo, de ensinar a torradeira a se ligar e baixar a fatia de pão ao receber uma chamada do computador. Só depois de resolvidos esses problemas foi possível atacar o objetivo maior.

“Precisamos de mais dispositivos conectados e que a indústria desenvolva APIs e padrões que permitam aos aparelhos conversar entre si”, concluiu o norte-americano no processo.

Fazer com que Jarvis entenda a linguagem natural

Que uma máquina entenda a linguagem humana é o primeiro e mais importante avanço na hora de personalizar os algoritmos de inteligência artificial. Apple (com a Siri), Google (Assistant), Microsoft (Cortana) e Amazon (Alexa) focam seus avanços nessa direção, já que estes são a única forma de comunicação entre as potentes máquinas e algoritmos dos desenvolvedores e um pedido simples do usuário – o qual pode ser mal interpretado por depender do contexto da comunicação interpessoal.

Jarvis inclui vários paradigmas de inteligência artificial, como o processamento e a compreensão da linguagem natural

Tendo esse objetivo em mente, Jarvis, que antes fazia apenas tarefas simples, como acender a luz num determinado cômodo, passou a realizar ações de acordo com o contexto. Ele é capaz, por exemplo, de atenuar as luzes em um local não especificado, pois sabe qual foi o último cômodo onde as luzes foram acesas, e por aí deduz onde Zuckerberg ou sua mulher se encontram. Com esse dispositivo, a inteligência artificial chega a parecer espontânea, ao mesmo tempo em que conseguimos nos poupar de certas tarefas. Nesse ambiente, o lar está concebido para conhecer as nossas necessidades, evitando a nossa própria interação.

A nova criação do empresário norte-americano é capaz de interpretar ordens que seriam simples para pessoas, mas muito complexas para uma máquina, devido à sua inexatidão. Não é o mesmo dizer “toque Someone Like You”, “toque algo tipo Adele” ou “toque alguma coisa da Adele”. O primeiro é o pedido de uma música específica; o segundo, de uma artista similar; e o terceiro é o pedido para criar uma lista de reprodução com o melhor dessa cantora. Graças ao seu sistema de aprendizagem, Jarvis pode tirar conclusões a partir do feedback dos seus usuários, chegando assim a compreender as diferenças.

A maioria de eletrodomésticos não tem conexão à Internet, o que obrigou a adaptações em todos eles

“Quanto mais contexto tiver, melhor poderá interpretar ordens específicas”, diz Zuckerberg, que se gaba, meio sem querer, de ter criado um algoritmo capaz de reproduzir a música que você deseja usando como base seu histórico de reproduções, seu feedback e o contexto do momento.

Jarvis também distingue entre as vozes de Zuckerberg e da mulher dele. Cada membro da família está associado a um histórico, um padrão e a preferências, e todas as suas ordens são interpretadas, mesmo que deixem de expressar algo com exatidão.

“Descobri que usamos ordens não concretas com uma frequência muito maior que ordens específicas. Não há atualmente nenhum produto comercial que as interprete, e essa parece ser uma grande oportunidade”, diz Zuckerberg.

Fazer com que Jarvis veja e escute

Para conseguir que Jarvis veja, o jovem executivo instalou várias câmeras que abrangem quase todos os ângulos. Conectadas a um servidor, buscam constantemente rostos para serem reconhecidos. Uma vez detectados, a informação chega ao servidor e conclui se é amigo de Zuckerberg. Essa foi uma das tarefas mais simples, já que o Facebook vem há muito tempo trabalhando no reconhecimento facial para marcar fotos em sua rede social. Os olhos de Jarvis fornecem o contexto: saber quando seu filho acorda ou onde Zuckerberg está trabalhando para que, se dá a ordem “acenda as luzes”, o mordomo virtual saiba em qual quarto executar a ação, sem necessitar de uma ordem específica.

Comunicar-se por meio do Messenger

O presidente do Facebook programou Jarvisem seu computador, mas precisava de uma forma de se comunicar com ele em qualquer lugar, então decidiu programar um botdo Messenger para enviar-lhe ordens. Como resultado, tem sido capaz de enviar mensagens de voz e que o servidor as transforme em texto.

Jarvis é pró-ativo e capaz de enviar fotos de pessoas que se aproximem de sua casa através do Messenger quando Zuckerberg não está.

“Escrevo muito mais do que esperava”, diz Zuckerberg, para quem, apesar de todo o Vale do Silício estar focado na voz, dar ordens por meio de um chat é vital. “Faço através de texto por várias razões, mas a principal é que falar pode incomodar as pessoas que estão ao meu redor”, explica. “Sempre fui otimista sobre os bots de inteligência artificial, mas agora sou muito mais, e acredito que todos nos comunicaremos com assistentes como o Jarvis no futuro.”

Jarvis evoluiu das tarefas simples, como acender a luz num determinado cômodo, a ações realizadas segundo o contexto

O problema e a oportunidade da voz

Para poder conversar com Jarvis sem ter que enviar uma mensagem de voz, Zuckerberg programou um aplicativo iOS que permanece sempre na escuta.

Constatou que, embora os avanços nos últimos anos tenham sido imensos, nenhum sistema de inteligência artificial ainda é capaz de entender uma conversa. A compreensão ainda depende de uma comunicação com uma estrutura muito concreta.

Outra de suas conclusões foi que os sistemas de aprendizagem automáticos estão otimizados para resolver problemas muito mais específicos do que as pessoas possam pensar. Por exemplo, se um sistema é treinado com dados do Google, não entenderá muito bem pessoas que conversam com outras no Facebook.

Cada membro da família está associado a um histórico, um padrão e preferências, e todas as suas ordens são interpretadas

“No caso do Jarvis, treinar uma inteligência artificial que sempre te acompanha é diferente de uma que fica imóvel em um quarto, como o Echo, da Amazon. Esses dispositivos são muito mais especializados do que parecem, e isso significa que ainda estamos muito longe de oferecer sistemas mais gerais e aptos para todos os tipos de situações”, conclui Zuckerberg.

Inteligência artificial: mais perto e mais longe do que pensamos

Zuckerberg dedicou 100 horas para programar Jarvis este ano, um sistema que pode aprender coisas básicas e realizar todas as tarefas que precisam ser executadas em casa. Mas reconhece que, ainda que tivesse dedicado 1.000 horas a mais, seu sistema continuaria sem ser verdadeiramente inteligente: não seria capaz de aprender coisas por si mesmo.

“De certa forma, a inteligência artificial está mais perto e mais longe do que se imagina. Está mais perto de realizar coisas mais transcendentes do que as pessoas pensam, como dirigir para nós, oferecer tratamentos para doenças ou descobrir planetas. Essas coisas vão mudar o mundo, mas ainda estamos tentando descobrir o que realmente é a inteligência”, diz Zuckerberg.

Outra das suas conclusões foi que os sistemas de aprendizagem automática estão otimizados para resolver problemas muito mais específicos do que se imagina

Ao responder a um de seus leitores, o executivo explicou o que é a inteligência artificial para ele: “Esta é a graça da inteligência artificial. É quase magia. Chamamos de inteligência artificial ao que ainda não podemos compreender. Enquanto isso, se tornam simples matemática”.