Aqui-v2-5: O Novo Padrão em IA

Apresentamos Aqui-v2-5 e Aqui-v2-5 mini: modelos de alta performance, líderes em benchmarks globais de conhecimento, matemática e programação, com eficiência e custo otimizados.

  • Aqui-v2-5: 300B parâmetros, 256K contexto, topo em conhecimento e matemática.
  • Aqui-v2-5 mini: 21B parâmetros, rápido e eficiente, supera modelos globais da mesma faixa.
  • Aqui-v2-5 Thinking: (veja comparação técnica abaixo)

Benchmarks: Aqui-v2-5 vs. Principais Modelos

Modelo MMLU-Pro AIME 2024 LiveCodeBench Humanity's Last Exam GPQA Diamond Média
Aqui-v2-5 83 75 56 7.6 74 59.12
Aqui-v2-5 mini 80 65 50 6.7 70 54.34
GPT-4.1 81 44 46 4.6 67 48.32
Claude 4 Sonnet 84 41 45 4.0 68 48.40
Gemini 2.5 Flash 81 50 50 5.1 68 50.82
Kimi K2 81 69 53 4.7 75 56.34
Qwen3 235B 83 72 52 10.6 75 58.12
DeepSeek V3.1 82 52 41 5.2 66 49.44

Aqui-v2-5 Thinking: Raciocínio, Programação, Matemática e Agentes

Aqui-v2-5 Thinking entrega raciocínio avançado (Chain-of-Thought), excelência em programação, matemática e benchmarks de agentes. Veja a comparação técnica com os principais modelos agentic do mercado:

Modelo Reasoning
(MMLU-Pro, GPQA-D, HLE)
Programação
(LiveCodeBench, SciCode)
Matemática
(AIME 2024, MATH-500)
Agentes
(TAU-Bench Retail & Airline)
Média
Aqui-v2-5 Thinking 61.7 61.0 96.0 67.9 71.7
Qwen3 2507 Thinking 59.3 60.5 96.0 65.0 70.2
DeepSeek R1 0528 60.3 58.5 93.5 58.7 67.8
GLM-4.5 58.1 54.5 92.5 70.1 68.8
Gemini 2.5 Pro 63.7 61.5 93.0 62.5 70.2
OpenAI o3 62.7 59.5 94.5 61.2 69.5
Claude 4 Opus 59.6 52.0 87.0 70.5 67.3

Aqui-v2-5 mini: Performance Compacta

Aqui-v2-5 mini redefine o padrão para modelos compactos. Com 21B parâmetros, supera modelos globais de 30B+ em conhecimento, matemática e programação, mantendo custo e velocidade superiores.

Modelo MMLU-Pro AIME 2024 LiveCodeBench Humanity's Last Exam GPQA Diamond Média
Aqui-v2-5 mini 80 65 50 6.7 70 54.34
Aqui-v2-0 81 54 48 4.9 70 51.58
GPT-4.1 81 44 46 4.6 67 48.32
Claude 4 Sonnet 84 41 45 4.0 68 48.40

Especificações Técnicas e Preços

ModeloParâmetrosContextoVelocidadePreço (1M i/o)AAIICoTData Conhecimento
Aqui-v2-5300B (a32B)256K100 tps$0.2/0.861NãoOut 2024
Aqui-v2-5 Thinking300B (a32B)256K100 tps$0.3/1.270SimOut 2024
Aqui-v2-5 mini21B (a3B)256K150 tps$0.15/0.657NãoOut 2024

Próximos Lançamentos

  • Aqui-v2-5 Coder: modelo especializado em programação, com benchmarks inéditos.
  • Aqui-v2-5 mini Thinking: raciocínio avançado em um modelo compacto.
  • Atualizações para a linha base: melhorias contínuas em performance, custo e raciocínio.

Disponibilidade

Os modelos Aqui-v2-5, Thinking e mini já estão disponíveis no AquiGPT para todos os usuários. Teste agora e experimente o novo padrão em IA.

Benchmarks e AAII baseados em Artificial Analysis e avaliações internas Aqui Solutions.