Aqui-v3.0: Uma Família de Modelos para Diversos Cenários
Aqui-v3.0 é a nova geração de modelos de IA do AquiGPT, pensada para atender diferentes necessidades. A linha inclui quatro variantes principais — Auto, Normal, Fast e Thinking — além das versões compactas mini e nano, cada uma com características próprias para diferentes tipos de uso.
Conheça as Variantes
Aqui-v3.0 Auto
Um modelo que se ajusta automaticamente ao contexto e à complexidade da tarefa, buscando equilibrar desempenho e uso de recursos de forma dinâmica.
Aqui-v3.0 Normal
Voltado para o uso cotidiano, o Normal oferece uma boa combinação de velocidade e qualidade, sendo indicado para a maioria das aplicações.
Aqui-v3.0 Fast
Para quem prioriza respostas rápidas, o Fast foi projetado para entregar resultados ágeis, sem abrir mão da precisão essencial.
Aqui-v3.0 Thinking
O Thinking é a opção para tarefas que exigem raciocínio mais elaborado e resolução de problemas complexos, com foco em cognição e análise.
Aqui-v3.0 Mini e Nano
Mini: uma versão enxuta, não-thinking, otimizada para eficiência e tarefas convencionais.
Nano: o menor modelo thinking da linha, pensado para cenários onde recursos são limitados, mas ainda se deseja capacidade de raciocínio.
Benchmarks: Resultados em Diferentes Tarefas
Modelos Nano: Eficiência em Tamanho Reduzido
| Benchmark | Aqui-v3.0 nano | GPT-5 nano (high) | Grok Code Fast 1 | GLM-4.5-Air | Qwen3 30B Thinking 2507 | Gemini 2.5 Flash-Lite |
|---|---|---|---|---|---|---|
| MMLU-Pro | 79.1 | 78.0 | 79.3 | 81.5 | 80.5 | 75.9 |
| GPQA Diamond | 66.9 | 67.6 | 72.7 | 73.3 | 70.7 | 62.5 |
| LiveCodeBench | 75.4 | 54.6 | 65.7 | 68.4 | 70.7 | 59.3 |
| AIME 2025 | 76.3 | 83.7 | 43.3 | 80.7 | 56.3 | 53.3 |
| Humanity's Last Exam | 15.2 | 8.2 | 7.5 | 6.8 | 9.8 | 6.4 |
| SciCode | 34.9 | 36.6 | 36.2 | 30.6 | 33.3 | 19.3 |
| AA-Index | 48.1 | 48.5 | 48.7 | 48.1 | 46.4 | 40.1 |
Modelos Preview: Desempenho em Diversos Benchmarks
| Benchmark | Aqui-v3.0 Preview | Aqui-v3.0 mini Preview | Kimi K2 0905 | Qwen3-Max | Gemini 2.5 Flash | Claude Sonnet 4 | DeepSeek V3.1 |
|---|---|---|---|---|---|---|---|
| TerminalBench | 44.5 | 23.1 | 22.7 | 18.9 | 24.8 | 32.1 | 24.1 |
| TAUBench2-Telecom | 73.1 | 64.6 | 73.4 | 43.2 | 54.1 | 71.4 | 37.4 |
| AIME 2025 | 71.3 | 67.2 | 57.3 | 80.6 | 60.3 | 38.0 | 49.7 |
| LiveCodeBench | 62.3 | 58.9 | 61.0 | 63.4 | 49.5 | 44.9 | 57.7 |
| Humanity's Last Exam | 8.2 | 10.2 | 6.3 | 10.6 | 5.1 | 4.0 | 6.3 |
| GPQA Diamond | 78.4 | 77.5 | 76.7 | 77.7 | 68.3 | 68.3 | 73.5 |
| IFBench | 54.4 | 50.2 | 41.7 | 48.5 | 39.0 | 45.4 | 37.8 |
| AA-Index | 58.0 | 53.7 | 50.4 | 50.3 | 40.4 | 44.4 | 44.8 |
Modelos Thinking: Foco em Raciocínio
| Benchmark | Aqui-v3.0 Thinking Preview | GPT-5 (high) | Grok 4 | Qwen3 235B Thinking 2507 | Gemini 2.5 Pro | Claude Opus 4.1 | DeepSeek V3.1 Think |
|---|---|---|---|---|---|---|---|
| TerminalBench | 37.2 | 30.5 | 37.6 | 12.8 | 24.8 | 32.1 | 24.1 |
| TAUBench2-Telecom | 81.0 | 84.8 | 74.9 | 53.2 | 54.1 | 71.4 | 37.4 |
| AIME 2025 | 92.9 | 94.3 | 92.7 | 91.0 | 87.7 | 80.3 | 89.7 |
| SWE-Bench Verified | 75.4 | 74.9 | 72.0 | 62.1 | 67.2 | 74.5 | 66.0 |
| Humanity's Last Exam | 20.3 | 26.5 | 23.9 | 15.0 | 21.1 | 11.9 | 13.0 |
| GPQA Diamond | 85.4 | 85.4 | 87.7 | 79.0 | 84.4 | 80.9 | 77.9 |
| IFBench | 75.7 | 73.1 | 53.7 | 51.2 | 48.7 | 55.4 | 41.5 |
| AA-Index | 68.2 | 66.7 | 65.3 | 57.5 | 59.6 | 59.3 | 54.0 |
Aspectos Técnicos
Aqui-v3.0 foi desenvolvido com melhorias em arquitetura de rede neural, incluindo mecanismos de atenção otimizados e técnicas de compressão para manter desempenho mesmo nas versões menores.
Os modelos foram treinados com conjuntos de dados amplos e variados, buscando garantir conhecimento geral e capacidade de raciocínio adequados para diferentes tarefas.
Disponibilidade
Toda a linha Aqui-v3.0 já está disponível no AquiGPT.
Benchmarks baseados em avaliações internas Aqui Solutions e comparações com modelos públicos disponíveis.
Data de lançamento: 20 de setembro de 2025.