Grupos chineses de lucidez sintético estão se apressando para lançar atualizações de modelos na semana do feriado do Ano Novo chinês, dias posteriormente a startup chinesa DeepSeek anunciar avanços em seu padrão de IA, apesar das restrições de chips dos EUA.
Na segunda-feira (27), véspera do feriado anual mais importante da China, a DeepSeek lançou um padrão de código desimpedido para geração de imagens, consolidando sua reputação uma vez que a principal disruptora em um campo anteriormente escravizado por gigantes dos EUA. Isso ocorreu logo posteriormente os lançamentos de modelos da gigante de tecnologia Alibaba e das startups Moonshot e Zhipu.
Um gerente de resultado de uma startup de modelos de linguagem de grande porte afirmou que as equipes estão fazendo hora extra para viabilizar os lançamentos no feriado e comparou o momento ao que ocorre antes do Natal. O Ano Novo chinês será comemorado nesta quarta-feira (29), mas o feriado começou na terça-feira (28) e vai até a próxima terça-feira (4).
Ao mesmo tempo que a conquista da DeepSeek gerou preocupação nos EUA sobre os avanços que os laboratórios chineses estão fazendo com orçamentos reduzidos, pessoas que trabalham no setor dizem que o proclamação aumentou a crédito na China que haverá um impulso nos investimentos.
De concórdia com um investidor de IA na China. a DeepSeek motivou os rivais locais a buscarem alcançá-la na disputa pelo padrão de IA.
A DeepSeek chamou a atenção mundial com uma série de lançamentos de modelos que mostram desempenho semelhante aos dos rivais dos EUA, uma vez que OpenAI e Meta, com um dispêndio muito menor e um tempo de pesquisa subalterno, usando modelos antigos dos chips da Nvidia.
Na semana passada, lançou seu padrão de raciocínio R1, um padrão avançado que rivaliza com o o1 da OpenAI e pode aprender e melhorar maquinalmente sem supervisão humana.
“A DeepSeek animou o mercado de concorrentes na China e, mais amplamente, a comunidade global de IA de código desimpedido que usará suas descobertas do cláusula R1 para proceder em modelos de raciocínio”, avaliou Wang Tiezhen, engenheiro do meio de pesquisa de IA Hugging Face.
Nesta semana, investidores venderam ações relacionadas à IA, com a Nvidia perdendo quase US$ 600 bilhões em valor de mercado na segunda-feira. Eles estavam reagindo aos avanços chineses que mostram ser provável erigir modelos poderosos enquanto se persegue uma estratégia dissemelhante da dos EUA, que é erigir clusters computacionais cada vez maiores para se ressaltar na corrida da IA.
Na segunda-feira, a Qwen da Alibaba lançou o Qwen2.5-1M, uma série de novos modelos capazes de mourejar com entradas mais longas, um desenvolvimento importante que significaria que o padrão poderia ser implantado para aplicações de agentes de IA com maiores demandas de memória, segundo Wang.
No mesmo dia, a DeepSeek exibiu ao público o Janus-Pro, um padrão de geração de texto para imagem que afirma poder superar os modelos de ponta de concorrentes uma vez que o Dall-E 3 da OpenAI e o Stable Diffusion 3 da Stability AI em alguns benchmarks.
A Zhipu, avaliada em sua última rodada de financiamento em dezembro em US$ 3 bilhões, lançou na semana passada uma atualização para o GLM-PC. O padrão de agente de IA é voltado para clientes empresariais, permitindo que computadores completem maquinalmente tarefas uma vez que preencher formulários ou examinar relatórios financeiros.
Embora a Zhipu não tenha atraído muita atenção para seu desenvolvimento de LLM, ela tem uma liderança entre as startups locais de IA na comercialização de sua tecnologia, com base de governos locais e empresas estatais que se associaram à empresa com sede em Pequim para implantar seus modelos.
Na semana passada, outra startup de Pequim, a Moonshot, que possui o popular chatbot de IA Kimi, atualizou seu padrão de raciocínio para o Kimi k1.5, demonstrando bons resultados na verificação com modelos de IA estabelecidos para tarefas de raciocínio multíplice. O último lançamento pode processar textos e imagens enquanto lida com consultas longas e complexas.
É prática generalidade para empresas de tecnologia chinesas lançar produtos antes do Ano Novo chinês, com o objetivo de aproveitar que potenciais clientes com muito tempo livre durante o feriado podem testá-los e explorá-los.
Uma vez que as empresas chinesas de IA retornem de sua pausa, a corrida voltará com a disputa para se tornar o principal desenvolvedor de aplicações de IA para uso mercantil.