IA

A inteligência artificial arrasa em um dos problemas mais importantes da biologia

Filial do Google consegue um avanço sem precedentes na predição da forma da proteína

Uma das partidas entre o campeão Fan Hui e o programa ‘AlphaGo’.
Uma das partidas entre o campeão Fan Hui e o programa ‘AlphaGo’.Deepmind

Um sistema de inteligência artificial desenvolvido pelo Google resolveu boa parte de um dos problemas mais importantes da biologia. As redes neurais desenvolvidas pela empresa Deepmind, de propriedade do gigante da tecnologia, mostraram em uma competição internacional que sua capacidade de cálculo e predição é muito superior à de qualquer ser humano e até mesmo de qualquer outro sistema de inteligência artificial criado por humanos.

“É uma revolução”, reconhece Alfonso Valencia, um dos maiores especialistas em biocomputação da Espanha e membro do júri técnico do concurso CASP, sigla em inglês de técnicas de predição de estruturas de proteínas. “O aspecto mais importante deste avanço é saber que este problema [que ninguém havia resolvido desde que foi formulado há 50 anos] tem solução, que é possível resolvê-lo”.

O problema do dobramento das proteínas é considerado o segundo código secreto da vida. A Deepmind já havia derrotado os humanos no xadrez e no complicadíssimo jogo de Go, por exemplo, mas este sempre foi seu problema prioritário a resolver.

Para compreender sua importância é preciso partir do primeiro código de vida, o genoma, que contém todas as informações para formar qualquer ser vivo. Uma pessoa é uma sequência genômica de 3 bilhões de letras, cada uma em sua posição correta. Nessas letras estão todas as instruções para fabricar proteínas, que são as verdadeiras operárias da vida, encarregadas de fazer alguém respirar, se mover, pensar, viver. A estrutura básica do código genético é bidimensional, mas as proteínas que forma são tridimensionais, como a diferença entre a planta de uma casa e a casa de verdade.

Um dos principais feitos científicos desta pandemia foi conhecer a estrutura da proteína do novo coronavírus, que se encaixa exatamente em outra proteína das células humanas para se apoderar delas. Proteínas mal construídas, mal dobradas sobre si mesmas, são a causa de doenças tão terríveis como Alzheimer, Parkinson e muitas outras.

Em 1972, o Nobel de Química, Christian Anfinsen postulou que a sequência de aminoácidos de uma proteína [sua planta] deveria predizer a forma que teria. Mas descobrir todas as configurações possíveis de uma única proteína pode levar mais de 13,7 bilhões de anos, a idade do universo.

No concurso CASP, a Deepmind competiu com 100 outras equipes para ser a melhor em predizer a forma de 100 proteínas baseando-se em sua sequência de aminoácidos. A inteligência artificial do Google arrasou. Seu sistema, o Alphafold, predisse corretamente a estrutura de dois terços de todas as proteínas com resolução equivalente à dos métodos convencionais baseados em cristalografia e microscopia, que exigem máquinas da ordem de oito milhões de euros (cerca de 50 milhões de reais) e às vezes anos ou décadas de trabalho.

É um resultado nunca alcançado antes por nenhuma equipe humana nem por nenhuma outra inteligência artificial. A margem de erro das previsões do Google é equivalente ao diâmetro de um único átomo, explica a Deepmind, que já venceu a edição anterior em 2018.

“A pontuação [da Deepmind] é muito, muito superior à de qualquer outra equipe da competição”, explica Tim Hubbard, bioquímico do King’s College de Londres e organizador desse concurso acadêmico durante 10 anos. “Essa contribuição é fundamental porque nos ajuda a resolver um problema que determina não só a biologia humana, mas a dos demais seres vivos do planeta”, destaca Hubbard.

O Alphafold baseia-se em algoritmos que aprendem por si mesmos e enxergam padrões não visíveis aos humanos, pois estão escondidos em vastíssimos bancos de dados com milhares de proteínas compostas por milhões de fragmentos. “Esse tipo de sistema já havia derrotado os humanos em videogames porque encontrava erros de programação que permitiam, por exemplo, atravessar paredes”, explica Valencia. “Supera os humanos com formas de pensar não humanas, por isso, mesmo que esse sistema pudesse falar e nos contasse como fez, não entenderíamos a física que está por trás de uma proteína se dobrando. Só conhecemos o resultado. O Google não fornece o software e essa é a parte frustrante da conquista, pois não beneficiará diretamente a ciência”, detalha.

“Não acreditamos que a Deepmind vá colocar o Alphafold a serviço da comunidade científica, já que não o fez depois da primeira vez que venceu o concurso.” No entanto, haverá uma repercussão “indireta”, acrescenta. A Deepmind descreverá todos os seus métodos em um estudo abrangente e revisado por especialistas independentes e isso poderá ajudar outras equipes a desenvolver sistemas de inteligência artificial semelhantes.

“É um passo muito importante. Há muitos anos se tentava decifrar esse código oculto da vida”, resume Fernando Corrales, pesquisador do Centro Nacional de Biotecnologia do CSIC. Na natureza pode haver dezenas de milhares de proteínas diferentes e cada uma é um mundo completamente diferente do outro. “Há ocasiões em que se pode conhecer a estrutura completa em apenas um mês, e outras em que é extremamente complexo e pode levar anos ou décadas”, aponta Corrales. Para o cientista, a inteligência artificial do Google não deixará sem trabalho os cristalógrafos e especialistas em microscopia no curto prazo, pois ainda são necessários para corroborar as predições da inteligência artificial. Além disso, o problema do dobramento de proteínas não foi totalmente resolvido, pois restam níveis adicionais de complexidade. As proteínas costumam funcionar em grupos formando complexos e compreender sua forma e movimento é um problema que por enquanto permanece sem solução.

A Deepmind explicou a este jornal que em breve publicará todos os detalhes sobre seu sistema em uma revista científica. Seus responsáveis explicarão seu trabalho esta tarde em uma conferência online. Um porta-voz da empresa informou que ainda não foi decidido se o sistema será disponibilizado à comunidade científica. “Embora tenhamos resolvido de alguma maneira o problema do dobramento das proteínas, há muitos outros que gostaríamos de resolver. Estamos otimistas que este sistema pode nos ajudar a compreender doenças e a descobrir novos medicamentos”, afirma.

Arquivado Em:

Pode te interessar

O mais visto em ...

Top 50