Tecnologia

Gemini 2.5 Deep Think conquista ‘medalha de ouro’ em pódio de programação competitiva

Após uma vitória em matemática em julho, o Gemini 2.5 Deep Think voltou a chamar atenção ao obter desempenho de nível medalha de ouro em uma competição de programação competitiva.

– Publicidade –

Desempenho no ICPC e formato da disputa

O International Collegiate Programming Contest (ICPC) é considerado a “mais antiga, a maior e a mais prestigiosa competição de programação algorítmica no nível universitário” e, segundo o Google, representa um “avanço em nível educacional” em relação à Olimpíada Internacional de Matemática, voltada ao ensino médio. Estudantes de quase 3.000 universidades em 103 países competem por vagas na fase final.

Leia também: Xiaomi HyperOS 3: 6 recursos que vão facilitar sua vida

Na final mundial, as equipes dispõem de cinco horas para resolver 12 problemas práticos de programação. O sistema de classificação leva em conta o tempo (em minutos) até a solução, sendo que apenas soluções perfeitas pontuam.

Resultado: ouro virtual e solução de problema inédito

Quatro equipes (de um total de 139) conquistaram medalha de ouro neste ano. Uma versão avançada do Gemini 2.5 Deep Think, competindo ao vivo em um ambiente online remoto seguindo as regras da ICPC, sob a orientação dos organizadores da competição, resolveu 10 dos 12 problemas em 677 minutos. A avaliação incluiu execução de código e a utilização de uma ampla variedade de estruturas de dados e algoritmos avançados.

O Google enfatiza especialmente que o Gemini solucionou o Problema C, afirmando que “nenhuma outra equipe humana no concurso resolveu.”

IA do Google, Gemini conseguiu encontrar uma solução eficaz com uma percepção inteligente: primeiro, imaginou que cada reservatório tem um “valor de prioridade”, representando o quanto cada reservatório deve ser favorecido em comparação com os outros.

Com um conjunto de valores de prioridade em mãos, a melhor configuração dos dutos foi descoberta usando um algoritmo de programação dinâmica de forma inovadora. Além disso, Gemini aplicou o teorema minimax e ficou empolgado ao perceber que o problema original poderia ser abordado encontrando os valores de prioridade que otimizam o fluxo resultante.

Aproveitando a relação entre os valores de prioridade e os fluxos ótimos, Gemini utilizou uma busca ternária aninhada para encontrar rapidamente os valores de prioridade ideais no espaço de solução convexo em forma de tigela e, assim, resolveu o Problema C com grande sucesso.

Técnicas e avanços por trás do resultado

O Google atribui o desempenho do Gemini a uma “series of breakthroughs” em pré-treinamento, pós-treinamento, técnicas inovadoras de reinforcement learning, raciocínio em múltiplos passos e pensamento paralelo. Essas inovações teriam permitido ao modelo explorar diferentes abordagens, verificar soluções e iterar continuamente antes de apresentar uma resposta.

O Google também destaca que a versão “lightweight version” do Deep Think disponível hoje no app Gemini permanece inalterada.

Impacto e posicionamento

Segundo o Google, esses avanços em programação competitiva e raciocínio matemático mostram um salto significativo na capacidade do Gemini para resolver problemas abstratos, representando um passo no caminho rumo à inteligência artificial geral (AGI). O desempenho em eventos como o ICPC serve como um indicador da evolução das técnicas de treinamento e coordenação entre agentes que executam e testam código automaticamente.

Fonte: 9to5Google

– Publicidade –


Créditos TecStudio