A OpenAI diz ter encontrado evidências de que a startup chinesa de perceptibilidade sintético DeepSeek usou os modelos de propriedade da empresa dos EUA para treinar seu próprio concorrente de código descerrado.
A enunciação foi dada à medida em que crescem as preocupações sobre uma potencial violação de propriedade intelectual.
O pregão do progressão de uma forma mais barata de um protótipo de IA feito pela chinesa provocou uma queda em série das ações de empresas de tecnologia nos EUA e na Europa.
Cálculos feitos pelo jornal Financial Times e pela sucursal de notícias Bloomberg apontam que a perda superou US$ 1 trilhão (R$ 5,9 trilhões) em valor de mercado somente nesta segunda-feira (27).
O obreiro do ChatGPT, sediado em São Francisco, disse ao Financial Times que viu algumas evidências de destilação, uma técnica usada por desenvolvedores para obter melhor desempenho em modelos menores usando saídas de modelos maiores e mais capazes.
Isso permite que eles alcancem resultados semelhantes em tarefas específicas a um dispêndio muito menor.
A OpenAI se recusou a dar mais detalhes de suas supostas evidências. Seus termos de serviço afirmam que os usuários não podem imitar nenhum de seus serviços ou usar a saída para desenvolver modelos que competem com a OpenAI.
O lançamento do protótipo de raciocínio R1 da DeepSeek surpreendeu os mercados, muito uma vez que investidores e empresas de tecnologia no Vale do Silício, devido ao seu desempenho impressionante em tarefas cognitivas. Seus modelos alcançaram altas classificações e resultados comparáveis aos principais modelos dos EUA.
Uma nascente próxima à OpenAI disse que a destilação era uma prática geral na indústria e destacou que a empresa oferece aos desenvolvedores uma maneira de fazer isso usando sua própria plataforma, e destacou: “O problema é quando você está fazendo isso para gerar seu próprio protótipo para seus próprios propósitos”.
Procurada, a DeepSeek não atendeu ao Financial Times.
Anteriormente, o superintendente da IA e criptografia do presidente Donald Trump, David Sacks, havia dito que é provável que o roubo de IP tenha ocorrido.
“Há uma técnica na IA chamada destilação, quando um protótipo aprende com outro protótipo [e] meio que suga o conhecimento do protótipo pai”, disse Sacks à Fox News nesta terça (28).
“E há evidências substanciais de que o que a DeepSeek fez cá foi ressumar o conhecimento dos modelos OpenAI, e não acho que a OpenAI esteja muito feliz com isso”, acrescentou Sacks, sem fornecer evidências.
A DeepSeek disse que usou somente 2.048 placas de vídeo Nvidia H800 e US$ 5,6 milhões para treinar seu protótipo V3 com 671 bilhões de parâmetros, uma fração do que a OpenAI e o Google gastaram para treinar modelos de tamanho comparável.
Alguns especialistas apontaram que o protótipo gerou respostas que indicavam que ele havia sido treinado em saídas do GPT –4 delas da OpenAI, o que violaria seus termos de serviço.
Informantes do setor dizem que, na verdade, é prática geral para laboratórios de IA, tanto na China quanto nos EUA, usar saídas de empresas líderes uma vez que a OpenAI.
Líderes do setor uma vez que a OpenAI investiram na contratação de pessoas para ensinar seus modelos a produzir respostas que soem mais humanas. Isso é dispendioso e exige muito trabalho, e informantes do setor dizem que é geral que players menores aproveitem seu trabalho.
“É uma prática muito geral para startups e acadêmicos usar saídas de LLMs comerciais alinhados a humanos, uma vez que ChatGPT, para treinar outro protótipo”, disse Ritwik Gupta, postulante a PhD em IA na Universidade da Califórnia.
“Isso significa que você obtém essa lanço de feedback humano de perdão. Não é surpreendente para mim que a DeepSeek supostamente estaria fazendo o mesmo. Se estivessem, interromper essa prática precisamente pode ser difícil”, ele acrescentou.
A prática também aponta para um mistério financeiro emergente para empresas de fronteira que estão fazendo pesquisas de ponta em IA sobre uma vez que elas defendem sua vantagem técnica quando outros grupos podem pegar carona em seus modelos.
As empresas chinesas absorveram rapidamente as lições de suas contrapartes americanas ao mesmo tempo em que inovaram abordagens para maximizar seu número restringido de chips, tornando mais barato treinar e executar os modelos.
“Sabemos que as empresas sediadas na[China — e outras — estão incessantemente tentando ressumar os modelos das principais empresas de IA dos EUA”, acrescentou a OpenAI em uma enunciação.
“Nós nos envolvemos em contramedidas para proteger nossa PI, incluindo um processo melindroso para quais capacidades de fronteira incluir em modelos lançados, e acreditamos que, à medida que avançamos, é extremamente importante que trabalhemos em estreita colaboração com o governo dos EUA para proteger melhor os modelos mais capazes dos esforços de adversários e concorrentes para tomar a tecnologia dos EUA.”
A OpenAI está atualmente lutando contra alegações de violação de direitos autorais, publicadas por jornais e criadores de teor, incluindo ações judiciais do The New York Times e autores proeminentes, que acusam a empresa de treinar seus modelos em seus artigos e livros sem permissão.