Desempenho Revolucionário
O Aqui-VL-2.0 mini é um modelo MoE otimizado que combina eficiência com raciocínio avançado (Chain-of-Thought). Mesmo com infraestrutura modesta, ele se aproxima de modelos topo de linha como Claude 4 Opus em tarefas complexas. Por enquanto, na versão preview, ele não exibe seus reasoning tokens, mas essa funcionalidade estará disponível em breve.
Aqui-VL-2.0 mini: Pensamento Estruturado
Nosso primeiro modelo da série 2.0 traz uma arquitetura Mixture of Experts a20B com Chain-of-Thought, oferecendo soluções mais claras e precisas. Sua performance rivaliza com modelos como Claude 4 Opus e Gemini 2.5 Pro, mas com maior eficiência.
Aqui-VL-1.5-0609: Mais Confiável
Esta atualização traz melhorias significativas: menos alucinações, mais precisão em código e respostas mais estáveis. Ideal para quem precisa de consistência no dia a dia.
Comparação de Desempenho
Métrica | Aqui-VL-2.0 mini | Aqui-VL-1.5 | DeepSeek R1 | Claude 4 Opus | Gemini 2.5 Pro | o4-mini |
---|---|---|---|---|---|---|
MMLU-Pro | 83.0 | 82.0 | 85.0 | 87.0 | 86.0 | 83.0 |
LiveCodeBench | 62.0 | 41.0 | 77.0 | 64.0 | 80.0 | 80.0 |
GPQA Diamond | 70.0 | 68.0 | 81.0 | 80.0 | 84.0 | 78.0 |
Humanity's Last Exam | 11.7 | 4.9 | 14.9 | 11.7 | 21.1 | 17.5 |
AIME 2024 | 84.0 | 43.0 | 89.0 | 76.0 | 89.0 | 94.0 |
Artificial Analysis | 62.0 | 51.0 | 68.0 | 64.0 | 70.0 | 70.0 |
Destaques
O Aqui-VL-2.0 mini se sobressai em programação e matemática, enquanto o 1.5-0609 foca em confiabilidade para tarefas críticas. Juntos, eles oferecem o melhor dos dois mundos.
Conclusão
Com o Aqui-VL-2.0 mini e o 1.5-0609, continuamos nossa missão de trazer IA avançada e acessível. Experimente essa nova geração de modelos no AquiGPT! O Aqui-VL-2.0 mini está disponível no AquiGPT, enquanto o VL-1.5-0609 substitui o VL-1.5 antigo em ambos AquiGPT e AquiGPT Free.