- A Alibaba lançou a série Qwen3 com oito modelos, incluindo dois com tecnologia de Mistura de Especialistas que apresentam desempenho superior com menor custo.
- Os novos modelos suportam 119 idiomas e oferecem dois modos de pensamento para diferentes tipos de tarefas, rivalizando com soluções da OpenAI e Google.
- O lançamento intensifica a competição no mercado chinês de IA, ocorrendo após inovações da DeepSeek e lançamentos recentes de modelos avançados pelo Baidu.
A Alibaba anunciou nesta terça-feira (29) o lançamento de sua nova família de modelos de inteligência artificial denominada Qwen3. A série inclui oito modelos de diferentes tamanhos e arquiteturas, projetados para oferecer flexibilidade aos desenvolvedores. A gigante chinesa afirma que esta nova geração representa “um marco significativo” em sua jornada rumo à inteligência artificial geral.
O modelo principal, Qwen3-235B-A22B, alcança resultados competitivos em avaliações de benchmark de codificação e matemática. Segundo a empresa, seu desempenho rivaliza com outros modelos de ponta como DeepSeek-R1, o1 da OpenAI, o3-mini da OpenAI, Grok-3 da xAI e Gemini-2.5-Pro do Google. A nova série suporta 119 idiomas e dialetos diferentes, ampliando seu alcance global.
Os modelos introduzem recursos avançados de raciocínio híbrido que combinam funções convencionais com raciocínio dinâmico. A série inclui dois modelos de mistura de especialistas (MoE) e seis modelos Dense com código aberto sob licença Apache 2.0. Esta tecnologia marca a entrada da Alibaba nos chamados “modos de pensamentos híbridos”.
Leia Também:
A tecnologia por trás do Qwen3
O Qwen3 suporta dois modos de pensamento distintos para diferentes tipos de tarefas. Um modo de raciocínio profundo para problemas complexos e um modo não-pensamento para respostas rápidas a consultas mais simples. Esta abordagem dual permite que o sistema se adapte automaticamente à complexidade das solicitações recebidas.
O modelo MoE menor, Qwen3-30B-A3B, possui um tamanho de parâmetro de ativação que é apenas 10% do QwQ-32B. Apesar do tamanho reduzido, demonstra desempenho superior, traduzindo-se em menores requisitos computacionais e custos operacionais. Mesmo o modelo compacto Qwen3-4B rivaliza com o desempenho do anterior Qwen2.5-72B-Instruct.
A tecnologia MoE divide tarefas em conjuntos menores de dados, funcionando como uma equipe de especialistas. Cada componente foca em segmentos específicos de uma tarefa, tornando o processo mais eficiente e semelhante ao raciocínio humano. Isto representa uma tendência crescente na indústria, seguindo inovações similares da Anthropic e do Alphabet.

O acirramento da competição no mercado chinês de IA
O lançamento do Qwen3 ocorre em um momento de intensificação competitiva no setor de IA da China. O mercado ganhou nova dinâmica após o sucesso da startup local DeepSeek, que alegou ter construído modelos de alto desempenho a custos mais baixos. Esta pressão competitiva tem impulsionado inovações aceleradas entre as principais empresas tecnológicas do país.
O gigante de buscas Baidu também entrou na disputa com novos modelos focados em raciocínio. Na sexta-feira anterior ao anúncio da Alibaba, a empresa lançou os modelos Ernie 4.5 Turbo e Ernie X1 Turbo. Este movimento evidencia uma corrida tecnológica para dominar o mercado emergente de sistemas com capacidades avançadas de raciocínio.
A Alibaba já havia lançado seu modelo Qwen 2.5-Max no final de janeiro deste ano. Na ocasião, a empresa alegou superar o desempenho do GPT-4o da OpenAI, Claude 3.5 Sonnet da Anthropic e Gemini 2.0 Flash do Google. O Qwen 2.5-VL também introduziu recursos para manipular PCs e dispositivos móveis.
O impacto do código aberto na democratização da IA
Os seis modelos Dense do Qwen3 foram disponibilizados como código aberto sob a licença Apache 2.0. Esta estratégia visa democratizar o acesso à tecnologia de ponta para pesquisadores e desenvolvedores do mundo todo. A Alibaba afirma que este movimento promoverá significativamente a pesquisa e desenvolvimento de grandes modelos de base.
Os modelos de código aberto incluem versões que variam de 0,6 bilhão a 32 bilhões de parâmetros. Esta variedade permite que desenvolvedores escolham o modelo mais adequado às suas necessidades específicas e às limitações de hardware. A flexibilidade é especialmente importante para implementações em dispositivos de ponta como smartphones.
O compromisso com modelos de código aberto representa uma abordagem distinta no mercado de IA. Enquanto muitas empresas ocidentais mantêm seus modelos mais avançados sob acesso restrito, a estratégia da Alibaba pode acelerar a adoção de suas tecnologias. Esta abordagem também amplia o ecossistema de desenvolvedores em torno de suas soluções.