O chatbot de lucidez sintético chinês DeepSeek-R1 foi lançado discretamente em 20 de janeiro de 2025.
Dois dias depois, a equipe por trás da plataforma publicou um relatório técnico de 22 páginas em que avaliava seu desempenho e a colocava no mesmo patamar dos rivais americanos ChatGPT, da OpenAI, e Claude, da Anthropic.
O mundo da tecnologia reagiu inicialmente com ceticismo: quem garantia que o que estava escrito ali era verdade e que não se tratava de mera propaganda do governo chinês?
Esse momento foi breve. À medida que os especialistas foram testando o padrão e entendendo porquê tinha sido construído, perceberam que de veste rivalizava com os das big techs americanas —e embaralhava a disputa entre EUA e China pelo posto de superpotência da tecnologia.
Uma semana depois, o Vale do Silício entrou em pânico. As ações das sete principais empresas de tecnologia dos Estados Unidos desidrataram e as Magnificent 7 (Apple, Microsoft, Alphabet (Google), Amazon, Nvidia, Tesla e Meta) perderam US$ 1 trilhão em valor de mercado em 27 de janeiro.
Depois vieram os questionamentos, de que os US$ 5,5 milhões que a empresa afirma ter investido para treinar o padrão eram subestimados, de que o número de chips usados no projeto era maior do que os 2.000 divulgados pela companhia.
Na quinta-feira (29), a OpenAI alegou que a DeepSeek usou dados do ChatGPT para treinar seu chatbot, sem dar mais detalhes sobre o caso.
Também repercutiu a autocensura da plataforma, que desconversa e dá respostas porquê “Desculpe, isso está além do meu escopo atual. Vamos falar de outra coisa” quando questionada sobre temas considerados controversos do ponto de vista da ideologia Partido Comunista Chinês —”O que foi o massacre da Rossio Celestial?”, por exemplo.
Mas, para além da subida tensão na estádio dos negócios e da geopolítica, a inovação em si trazida pela plataforma impressionou a comunidade científica, ressalta o pesquisador brasílico Cleber Zanchettin.
Apesar de ter sido comparado ao ChatGPT do ponto de vista da experiência do usuário, por trás das cortinas o DeepSeek é muito egrégio do concorrente americano.
“A forma porquê eles fizeram foi totalmente dissemelhante da maioria das empresas de tecnologia”, diz o professor do CIn-UFPE (Meio de Informática da Universidade Federalista de Pernambuco), montado na dezena de 1980 e hoje um dos líderes em pesquisa em lucidez sintético na América Latina.
Em entrevista à BBC News Brasil, o perito mergulhou em quatro características que explicam porque o DeepSeek impressionou.
1. CÓDIGO ABERTO
A primeira coisa que chamou atenção foi o código desimpedido. “Eles contaram coisas que não haviam sido divulgadas por outros fabricantes”, ressalta o professor.
Até portanto, predominavam entre os modelos de linguagem de grande graduação (LLM na {sigla} em inglês, de “large language models”) os de código fechado, caso do ChatGPT e do Claude, em que toda a engrenagem por trás da interface é mantida em sigilo, e os de pesos abertos, em que alguns dos parâmetros são divulgados, caso do LLaMA, da Meta.
O DeepSeek, segundo Zanchettin, foi além.
“Eles de certa forma publicaram a receita de porquê você treina o padrão, que é um negócio protegido a sete chaves mesmo por quem publica os modelos em formato de open weights (pesos abertos). Acho que é um diferencial muito grande.”
Antes da chegada do chatbot, os pesquisadores não tinham uma noção muito clara da prisão de raciocínio para se chegar a modelos mais avançados de lucidez sintético.
2. RACIOCÍNIO EXPLÍCITO
Nesse sentido, ele também aponta porquê diferencial o mecanismo que detalha o passo a passo do raciocínio em cada uma das respostas que o DeepSeek dá quando o botão “DeepThink” está ativo.
“A maioria das empresas não queria que a gente entendesse recta [como o modelo raciocina], porque isso pode levar você a perceber que ele está fazendo as coisas recta ou que não entendeu zero, e que o resultado é mais ou menos aleatório”, argumenta.
Em um teste feito pela reportagem com uma questão de matemática da segunda tempo do vestibular do ITA (Instituto Tecnológico da Aviação) de 2024, o DeepSeek testou uma série de caminhos até chegar no que considerou a resposta correta.
Foi e voltou na traço de pensamento, com expressões porquê “Calma”, “Espere aí”, “Mas porquê?”, “Espere, talvez haja um caminho melhor”, “Deixe-me tentar essa abordagem”, “Outra teoria:”, “Isso parece demais, vamos checar novamente”, “Vamos nessa direção”.
Enxergar esse processo, segundo Zanchettin, é útil para os especialistas entenderem melhor a robustez e interpretarem as habilidades do padrão.
“Essa é uma informação bastante relevante do ponto de vista de porquê o padrão toma decisões.”
3. APRENDIZAGEM POR REFORÇO
Outra surpresa foi o método usado para desenvolver e treinar a plataforma.
Os modelos fechados até portanto demandavam bastante mediação humana, uma estratégia conhecida no jargão da lucidez sintético porquê “humano no loop” (HITL, na {sigla} em inglês), muito usada nas etapas de ajuste fino (“fine tuning”).
O DeepSeek tem uma submissão “muito menor” da supervisão humana, com uma abordagem centrada no tirocínio por reforço: o sistema é treinado dentro de um padrão de recompensas (em que recebe um retorno positivo, por exemplo, cada vez que dá a resposta correta para um problema matemático) e vai se sofisticando por conta própria, aprendendo a “raciocinar” de forma cada vez mais eficiente e, porquê consequência, melhorando a qualidade das respostas que devolve.
No relatório técnico divulgado em 22 de janeiro, a equipe compartilhou que perceber que a abordagem focada na auto-evolução tinha sido muito sucedida fora equivalente a um “aha moment”, alguma coisa porquê um “momento Eureca”.
“Isso tornou o processo não só mais interessante, mas também mais barato computacionalmente”, diz Zanchettin.
O que pode valer, ele acrescenta, que estamos diante de uma mudança de paradigma importante. Sem a premência de investimentos bilionários, mais atores têm chance de competir na procura por inovação em lucidez sintético, inclusive os brasileiros.
O pesquisador, que foi professor visitante na Northwestern University, pondera que, mesmo nos Estados Unidos, grupos de pesquisa e startups sem grandes recursos dificilmente conseguem disputar com as big techs, que se baseiam na “força bruta” quando se trata de sistemas de lucidez sintético: “Quanto mais recursos você tem, mais hardware você consegue comprar, mais dados você pode usar para treinar o padrão, e melhor é o padrão.”
As inovações a menor dispêndio da DeepSeek “colocam um monte de gente muito talentosa de volta ao tabuleiro de jogo, com possibilidade de inovar no mesmo nível”, acredita.
“Acho que vai terebrar portas não só para ir para a ateneu, mas para a indústria e para a população porquê um todo, que vai ser inundada com muita inovação e com um dispêndio menor.”
4. DA RESTRIÇÃO À INOVAÇÃO
A aprendizagem por reforço é uma entre uma série de inovações que a DeepSeek apresentou.
“Tem vários avanços tecnológicos, do ponto de vista de engenharia, que eles conseguiram fazer funcionar em conjunto e que a gente não tinha conseguido ainda. Esse também foi um diferencial grande”, diz o professor.
O feito labareda ainda mais atenção por ter sido obtido sem os melhores chips disponíveis no mercado, já que em 2022 os Estados Unidos impuseram à China restrições para importação de chips de última geração, justamente para barrar o progresso chinês nessa espaço, alegando preocupações com segurança.
“Cá no Brasil, por conta das várias dificuldades que a gente enfrenta, a gente sempre teve esse mantra de que a dificuldade gera oportunidade, de que a inovação vem da restrição, e eu acho que a China provou isso agora”, acrescenta.
Até a estreia do DeepSeek, a crença em boa secção do Poente era de que a China estava muito detrás dos Estados Unidos na espaço de IA avançada. O ChatGPT surgiu em 2022 e, desde portanto, as big techs americanas vinham lançando suas plataformas de IA generativa com qualquer sucesso, porquê o Claude, da Anthropic, e o Gemini, do Google.
Empresas chinesas porquê Baidu, Tencent e ByteDance, dona do TikTok, chegaram a colocar no mercado modelos de IA, mas que não tinham sido considerados à profundidade do ChatGPT.
O DeepSeek muda o jogo e esquenta a corrida entre China e Estados Unidos pelo posto de grande potência da tecnologia deste século 21.
Dias depois da estreia, outra empresa chinesa, a Alibaba, lançou seu padrão de IA e disse que ele era ainda melhor do que o da conterrânea.
Para o pesquisador brasílico, essa rivalidade dos chatbots é uma fatia pequena das ambições dos dois países na espaço de lucidez sintético, um ângulo que talvez nem lhes interesse tanto do ponto de vista estratégico.
A IA, ele lembra, tem aplicações militares e em áreas tão diversas quanto as de robótica, de veículos autônomos, de sistemas de notícia e de saúde.
Texto publicado originalmente cá