Para expandir o negócio dos direitos autorais, o mundo editorial começa a assinar contratos com empresas de tecnologia para permitir que os seus livros alimentem as necessidades crescentes da perceptibilidade sintético generativa.
A grande editora americana HarperCollins acaba de propor a alguns dos seus autores um contrato com uma empresa de perceptibilidade sintético para que esta possa usar os seus livros para treinar o seu padrão de IA generativa.
Em um e-mail consultado pela dependência de notícias AFP, a empresa de tecnologia, cuja identidade é secreto, propõe US$ 2.500, murado de R$ 14.530, por cada livro selecionado para treinar o seu padrão de linguagem durante um período de três anos.
Para produzir todos os tipos de teor, esta tecnologia precisa ser alimentada continuamente com uma grande quantidade de dados.
Contatada pela AFP, a editora confirmou a operação.
“A HarperCollins fechou um tratado com uma empresa de tecnologia de perceptibilidade sintético para autorizar o uso restringido de determinados títulos para treinar modelos de IA, a termo de melhorar sua qualidade e desempenho”, escreveu.
A editora especificou que o tratado “limita claramente a produção de modelos que respeitem os direitos autorais”.
A oferta gerou opiniões divergentes no setor e escritores uma vez que o americano Daniel Kibblesmith rejeitaram-na categoricamente. “Provavelmente faria isso por um bilhão de dólares. Faria isso por uma quantia de numerário que não me obrigaria a trabalhar mais, porque esse é o objetivo final desta tecnologia”, publicou na rede social Bluesky.
A HarperCollins é um dos maiores atores do setor a dar esse passo, mas não o primeiro.
A editora americana de livros científicos Wiley deu entrada “ao teor de livros acadêmicos e profissionais publicados para uso específico na formação desses modelos por US$ 23 milhões —murado de R$ 133 milhões—, a uma grande empresa de tecnologia”, disse a companhia em março durante a apresentação de seus resultados financeiros.
Leste tipo de colaboração evidencia os problemas ligados ao desenvolvimento da perceptibilidade sintético generativa, treinada com enormes quantidades de dados recolhidos na internet, o que pode resultar em possíveis violações de direitos autorais.
Para Giada Pistilli, gerente de moral da Hugging Face, plataforma franco-americana de IA de entrada livre, o proclamação é um progressão, porque o teor dos livros passa a ser monetizado. Mas lamenta a margem de negociação limitada para os autores.
“O que veremos é um mecanismo de acordos bilaterais entre empresas de novas tecnologias e editoras ou proprietários de direitos autorais, quando na minha opinião seria necessário um diálogo mais espaçoso para incluir todas as partes envolvidas”, afirma.
“Viemos de muito longe”, comenta Julien Chouraqui, diretor jurídico do sindicato editorial gálico SNE. “É um progresso: o trajo de ter um tratado significa que houve um diálogo e uma vontade de depreender um estabilidade no uso de dados de origem que estão protegidos por direitos autorais e que vão gerar valor”, afirma.
Os editores de prelo também estão se organizando para enfrentar esse problema. No final de 2023, o jornal americano The New York Times processou a OpenAI, criadora do programa ChatGPT, e a Microsoft, sua principal investidora, por violação de direitos autorais.
Outros veículos de notícia optaram por fechar acordos com esta empresa pioneira em IA.
As empresas de tecnologia podem não ter outra opção senão investir a fundo para melhorar os seus produtos, já que suas bases de dados e materiais para treinar os seus modelos estão esgotando.
A prelo americana publicou recentemente que os novos modelos em desenvolvimento dão sinais de ter atingido o seu limite, mormente no Google, Anthropic e OpenAI.
“Na internet, você coleta material lícito e ilícito e muito teor pirateado. Isso implica um problema jurídico. Sem olvidar o problema da qualidade dos dados”, afirma Julien Chouraqui, do SNE.
“Para que o desenvolvimento de um mercado seja obtido sobre uma base virtuosa, todos os atores devem estar envolvidos”, destaca.