A empresa chinesa de tecnologia Alibaba lançou nesta quarta-feira, 29, uma nova versão de seu modelo de inteligência artificial Qwen 2.5 que, segundo ela, superou o DeepSeek-V3.

+7 pontos para entender como a DeepSeek pode mudar o jogo na corrida da IA

+Saiba quem é Liang Wengfeng, nerd que fundou startup chinesa DeepSeek

O momento incomum do lançamento do Qwen 2.5-Max, no primeiro dia do Ano Novo Lunar, quando a maioria dos chineses está de folga do trabalho, aponta para a pressão que a ascensão meteórica da startup chinesa de IA DeepSeek nas últimas três semanas exerceu não apenas sobre os rivais estrangeiros, mas também sobre sua concorrência doméstica.

“O Qwen 2.5-Max supera (…) quase todos os GPT-4o, DeepSeek-V3 e Llama-3.1-405B”, disse a unidade de computação em nuvem da Alibaba em anúncio publicado em sua conta oficial na rede social WeChat, referindo-se aos modelos de IA de código aberto mais avançados das norte-americanas OpenAI e Meta.

O lançamento, em 10 de janeiro, do assistente de IA da DeepSeek, equipado com o modelo DeepSeek-V3, bem como o lançamento, em 20 de janeiro, de seu modelo R1, chocou o Vale do Silício e fez com que ações de empresas de tecnologia ao redor do mundo despencassem.

Mas o sucesso do DeepSeek também levou a uma corrida entre seus concorrentes nacionais para atualizar seus próprios modelos de IA.

Dois dias após o lançamento do DeepSeek-R1, a ByteDance, proprietária do TikTok, lançou uma atualização de seu principal modelo de IA, que, segundo ela, superou o o1, da OpenAI, no teste AIME, um exame que mede a capacidade dos modelos de IA de entender e responder a instruções complexas.

Isso ecoou a afirmação da DeepSeek de que seu modelo R1 rivalizava com o o1 em vários benchmarks de desempenho.

Deepseek vs concorrentes chineses

O predecessor do modelo V3 da DeepSeek, o DeepSeek-V2, desencadeou uma guerra de preços de modelos de IA na China após seu lançamento em maio passado.

O fato de o DeepSeek-V2 ser de código aberto e barato, apenas 1 iuan (0,14 dólar) por 1 milhão de tokens — ou unidades de dados processados pelo modelo de IA — fez com que a unidade de computação em nuvem do Alibaba anunciasse cortes de preços de até 97% em uma série de modelos.

Outras empresas chinesas de tecnologia seguiram o exemplo, incluindo a Baidu, que lançou o primeiro equivalente chinês ao ChatGPT em março de 2023, e a empresa de tecnologia mais valiosa da China, a Tencent.

Liang Wenfeng, fundador da DeepSeek, disse em julho em uma rara entrevista ao meio de comunicação chinês Waves que a startup “não se importava” com guerras de preços e que alcançar a AGI (inteligência artificial geral) é seu principal objetivo.

A OpenAI define AGI como sistemas autônomos que superam os humanos nas tarefas mais valiosas do ponto de vista econômico.

Enquanto as grandes empresas chinesas de tecnologia, como a Alibaba, têm centenas de milhares de funcionários, a DeepSeek opera como um laboratório de pesquisa, com uma equipe formada principalmente por jovens graduados e estudantes de doutorado das principais universidades chinesas.

Liang disse na entrevista de julho que acreditava que as maiores empresas de tecnologia da China talvez não fossem adequadas para o futuro do setor de IA, contrastando seus altos custos e estruturas de cima para baixo com a operação enxuta e o estilo de gerenciamento flexível da DeepSeek.

“Grandes modelos fundamentais exigem inovação contínua, as capacidades dos gigantes da tecnologia têm seus limites”, disse ele.