Estudo divulgado
IA do Google supera medalhista de ouro humano em olimpíada de matemática
A inteligência artificial AlphaGeometry2 conseguiu resolver 88% dos problemas da Olimpíada Internacional de Matemática (IMO) dos últimos 25 anos
Saúde | 12 de Fevereiro de 2025 as 17h 24min
Fonte: Galileu

Uma inteligência artificial criada pelo Google DeepMind, o principal centro de pesquisa em IA do Google, parece estar no mesmo nível de um medalhista de ouro em matemática. Em um estudo divulgado na última sexta-feira (7), o laboratório anunciou que a IA conseguiu resolver 88% dos problemas da Olimpíada Internacional de Matemática (IMO) dos últimos 25 anos, uma competição mundial para estudantes de ensino médio.
A IA, chamada AlphaGeometry2, é uma versão avançada do AlphaGeometry, sistema introduzido em janeiro de 2024. Considerada uma inteligência artificial geral (AGI) com raciocínio matemático avançado, o AlphaGeometry2 já havia alcançado um desempenho próximo ao de um medalhista de prata da IMO em junho do mesmo ano de seu lançamento. Naquela ocasião, em parceria com outra IA do Google, o AlphaProof, a dupla foi capaz de resolver quatro dos seis problemas da prova de 2024.
O AlphaGeometry2 utiliza um modelo de linguagem da família Gemini, que o auxilia a aplicar regras matemáticas para apresentar soluções possíveis para os problemas e chegar a demonstrações de teoremas de geometria. No entanto, para que a IA consiga resolver os desafios, as provas precisam ser convertidas para uma linguagem que ela reconheça, ou seja, uma linguagem matemática formal — basicamente uma versão simplificada dos enunciados, sem as palavras que ajudam a construir o seu sentido.
Ao "ler" o problema, a IA sugere possíveis etapas e construções em uma linguagem matemática para o sistema, que, ao seguir regras determinadas, valida esses passos em busca de consistência lógica. Para isso, o AlphaGeometry2 articula o modelo Gemini junto com uma base de dados que foi feita exclusivamente para o seu treinamento, contendo mais de 300 milhões de teoremas e provas de diferentes níveis de complexidade.
Medalha de ouro
Para esse novo desafio, os desenvolvedores selecionaram 45 questões de geometria da IMO dos últimos 25 anos, que foram então convertidas em 50 problemas formulados em linguagem matemática. As questões variavam de equações lineares a desafios que exigiam a movimentação de figuras geométricas em um plano. Desses 50 problemas, o AlphaGeometry2 conseguiu resolver 42, superando a pontuação média dos medalhistas de ouro, que é de 40,9.
Uma pontuação como essa em uma prova para alunos do ensino médio pode não parecer uma grande conquista. Porém, a IMO é a competição mais antiga e prestigiada para jovens matemáticos, ocorrendo todos os anos desde 1959. Somente os melhores estudantes de cada país são escolhidos para participar, dedicando milhares de horas de treinamento para enfrentar um exame que abrange álgebra, combinatória, geometria e teoria dos números.
Esse resultado é importante porque a habilidae de provar teoremas matemáticos, ou demonstrar logicamente um problema, exige raciocínio e a articulação de diversos conhecimentos para chegar à solução. O bom desenvolvimento dessas competências pode levar o AlphaGeometry2 e seu sistema híbrido a ser um recurso valioso em futuros modelos de IA.
Limitações
Embora seu desempenho tenha sido notável, os pesquisadores alertam para as limitações do sistema. Por exemplo, o AlphaGeometry2 não é capaz de resolver questões envolvendo equações não lineares, que demandam o uso de diferentes funções algébricas. Seu desempenho também foi abaixo do esperado nas questões classificadas como as mais desafiadoras, assim como nas que trabalham conteúdos que ainda não foram abordados nas competições.
Esses resultados irão ajudar a equipe responsável pelo AlphaGeometry2 a aprimorar cada vez mais o seu sistema híbrido, que ainda precisa de testes e melhorias para atingir o seu máximo potencial. Além disso, o estudo colabora para o debate sobre as diferentes formas de se programar uma inteligência artificial, seja para sua aplicação no campo matemático quanto no cotidiano.
“[Os] resultados apoiam ideias de que grandes modelos de linguagem podem ser autossuficientes sem depender de ferramentas externas [como mecanismos simbólicos]”, escreveu a equipe do DeepMind no artigo, “mas até que a velocidade [do modelo] seja melhorada e as alucinações sejam completamente resolvidas, as ferramentas permanecerão essenciais para aplicações matemáticas”.
Notícias dos Poderes
Plataforma do TCE recebe 23 mil contratos de consignados
Documentos devem ser enviados até o dia 30 de junho; dívida do funcionalismo chega a R$ 12 bilhões
19 de Junho de 2025 as 08h39Prefeitura anuncia concessão de 20 anos para cemitério privado
Medida foi a escolha para lidar com o problema do ‘déficit sepulcral’
18 de Junho de 2025 as 16h37Brasil declara estar livre de gripe aviária e aguarda normalização de embarques de frango
18 de Junho de 2025 as 16h19Locais das provas estão disponíveis para consulta no site da Fundação Getúlio Vargas
As provas serão em 22 de junho; a competição tem uma média de 16,8 candidatos por vaga
18 de Junho de 2025 as 15h47Governo de MT sanciona lei que traz novas regras para contratação de consignados
Limite da margem consignável passa a ser 35% da remuneração líquida e empresas deverão ter postos de atendimento físicos no Estado
18 de Junho de 2025 as 15h12II Seminário Regional debate uso sustentável da água no Alto Teles Pires
Evento será realizado em Sinop e abordará temas como esgotamento sanitário, irrigação, indústria e monitoramento hídrico
18 de Junho de 2025 as 14h51Capacidade de defesa aérea de Israel contra mísseis iranianos pode durar apenas mais 12 dias, diz autoridade dos EUA
A intensidade dos bombardeios iranianos, no entanto, também parece estar diminuindo drasticamente
18 de Junho de 2025 as 14h33