Na última semana do mês de janeiro, a empresa chinesa de tecnologia Alibaba lançou a atualização mais recente de seu modelo de inteligência artificial, o Qwen 2.5. De acordo com a companhia o produto superou o DeepSeek-V3.
A data de lançamento inusitada, no primeiro dia do Ano Novo chinês, em que boa parte dos trabalhadores estão de folga, revela o acirramento da corrida tecnológica causado pela DeepSeek. Além dos concorrentes estrangeiros, pressão também atingiu empresas conterrâneas.
Sindpd promove live sobre Banco Horas nesta quinta; participe e tire suas dúvidas
“O Qwen 2.5-Max supera (…) quase todos os GPT-4o, DeepSeek-V3 e Llama-3.1-405B”, afirmou a unidade de computação em nuvem da Alibaba. O anúncio foi publicado na rede social WeChat e faz referência, além do DeepSeek, aos modelos de IA de código aberto mais avançados da Open AI e da Meta.
O lançamento no dia 10 de janeiro do assistente de IA da DeepSeek, equipado com o modelo DeepSeek-V3, e, no dia 20, do modelo R1, chocou o Vale do Silício e derrubou ações de empresas de tecnologia ao redor do mundo.
Porém o sucesso da empresa chinesa também pressionou outras empresas do país para atualizar os seus modelos de IA.
A ByteDance, proprietária do Tik Tok, lançou uma atualização do seu principal modelo de IA dois dias depois do lançamento do DeepSeek-R1. De acordo com a companhia, o produto superou o o1, principal modelo de inteligência artificial da Meta. A comparação foi feita com o teste AIME, que mede a capacidade de uma IA em entender e responder a instruções complexas.
A novidade ecoou na DeepSeek, que havia afirmado que o seu R1 rivalizava com o o1 em vários benchmarks de desempenho.
Disputa interna
Antes do modelo V3, a empresa chinesa já havia causado agitações no mercado doméstico com o seu V2, lançado em maio de 2024. Houve uma guerra de preços após o seu lançamento.
O fato de o DeepSeek-V2 ser de código aberto e barato, apenas 1 iuan (R$ 0,81) por 1 milhão de tokens —ou unidades de dados processados pelo modelo de IA— fez com que a unidade de computação em nuvem da Alibaba anunciasse cortes de preços de até 97% em uma série de modelos.
Outras empresas chinesas de tecnologia seguiram o exemplo. A Baidu, que lançou o primeiro equivalente ao ChatGPT ainda em 2023, e a Tencent, empresa de tecnologia mais valiosa da China, são dois exemplos.
Em uma rara entrevista, o fundador da DeepSeek, Liang Wenfeng, declarou que “não se importava” com guerras de preços e que alcançar a AGI (inteligência artificial geral) é seu principal objetivo.
AGI são sistemas autônomos que superam seres-humanos em atividades de alto valor econômico, conforme definição da OpenAI.
Enquanto outras empresas chinesas de tecnologia, como a Alibaba, têm em seu corpo centenas de milhares de funcionário, a Deep Seek chama atenção por operar como um laboratório de pesquisa. Nele operam jovens graduados e doutorandos das principais universidades chinesas.
O próprio Liang afirmou na entrevista que não acreditava que as grandes big techs da China fossem adequadas para o futuro da IA no país. Ele apontava a diferença entre as estruturas verticalizadas e onerosas com o modelo mais flexível e enxuto da DeepSeek.
“Grandes modelos fundamentais exigem inovação contínua, as capacidades dos gigantes da tecnologia têm seus limites”, afirmou na ocasião.
(Com informações de Folha de S. Paulo)
(Foto: Camva/Reprodução)