Estamos muito felizes em apresentar o Aqui-Edu-1.1, a mais avançada geração do nosso modelo especializado em raciocínio, matemática e ensino de temas simples e complexos. O Edu-1.1 foi projetado para superar os limites do que é possível em tarefas de lógica, programação e matemática em IAs, sendo a escolha definitiva para estudantes, educadores e profissionais que buscam excelência em inteligência artificial.

Desempenho do Aqui-Edu-1.1 no HumanEval

Destaques e Melhorias do Aqui-Edu-1.1

O Aqui-Edu-1.1 traz uma série de avanços em relação ao Edu-1.0, mantendo o foco em raciocínio avançado e precisão matemática:

  • Raciocínio avançado: O Edu-1.1 foi treinado com técnicas de alinhamento e datasets ainda mais sofisticados, elevando sua capacidade de resolver problemas complexos e explicar soluções passo a passo.
  • State of the Art em benchmarks: O modelo atinge resultados inéditos em avaliações de referência, praticamente obsoletando quase todas as maneiras de medir a inteligência de uma LLM.
  • Especialização em matemática e programação: O Edu-1.1 foi otimizado para desafios matemáticos de alto nível, como olimpíadas e competições internacionais, além de manter excelência em lógica e ciências exatas.
  • Velocidade aprimorada: Sendo menor que o 1.0, Edu-1.1 é um dos nossos modelos mais leves e rápidos.
Desempenho do Aqui-Edu-1.1 no MATH-500

Resultados em Benchmarks

O Aqui-Edu-1.1 estabelece um novo patamar de desempenho em benchmarks de raciocínio e matemática:

  • HumanEval: 98%, demonstrando domínio absoluto em programação e resolução de problemas computacionais.
  • AIME 2024: 93%, superando modelos anteriores em questões de olimpíada de matemática de alto nível.
  • MATH-500: 99%, atingindo quase perfeição em um dos benchmarks mais exigentes de matemática.
Desempenho do Aqui-Edu-1.1 no AIME 2024

O Aqui-Edu-1.1 Beta e Edu-1.1 Search Beta estão disponíveis a partir de hoje (18) para todos os usuários do AquiGPT.