O setor cultural está para a lucidez sintético generativa assim uma vez que os entregadores estão para o trabalho por aplicativos de delivery. Quem diz isso é Rafael Grohmann, professor de estudos de mídia da Universidade de Toronto.
No Canadá, uma firma de pesquisa em IA, a Moonvalley, afirma ter construído um protótipo de IA generativa que gera vídeos de subida sofisticação, com cinematografia de primeira risco. É mais uma cereja em cima do bolo de preocupações que tira o sono de designers, escritores, atores e demais profissionais da cultura.
O campo trabalhista, porém, é só um dos pontos de preocupação. O setor cultural é de fundamental influência na discussão sobre o progressão da IA pelo mundo. Para o Brasil, porém, esse é um ponto mormente sensível.
A variedade e a riqueza da produção cultural brasileira fazem do país um pote de ouro para as ferramentas de treinamento da IA generativa. Reportagem da Folha mostrou que pelo menos três empresas de americanas usaram livros de autores brasileiros para treinar seus sistemas sem pedir autorização ou remunerar por isso, apelando a cópias piratas que circulam na internet. Pesquisadores da dimensão chamam isso de extrativismo de dados.
Por outro lado, o Brasil está longe de ser líder na produção tecnológica de IA. Apesar de sermos líderes na América Latina, a confrontação com Estados Unidos, Europa e China é desproporcional.
“Se a gente não tem uma indústria de IA vernáculo robusta e também tem exploração das obras brasileiras sem remuneração, estamos numa situação de perde-perde”, diz Mariana Valente, diretora do InternetLab, que pondera que ter chegada à tecnologia é, sim, uma vantagem, mas uma vantagem muito limitada da perspectiva de autonomia econômica e tecnológica.
Países e organizações internacionais têm feito uma corrida pela delimitação das quatro linhas, com o duelo de proteger, sem prejudicar o desenvolvimento da indústria, quem pode ser ameaçado pelo progressão da IA generativa —na cultura, não são poucos.
Apesar de a discussão ser recente, já é provável identificar algumas vertentes. Há quem defenda que os dados só poderiam ser utilizados mediante autorização prévia dos detentores dos direitos autorais da obra. Há quem visualize um protótipo de remuneração coletiva. Muitos concordam com um sistema em que o detentor dos direitos teria de avisar caso não queira permitir o uso de seus dados pela ferramentas de IA, o que é chamado de “cláusula de opt-out”.
Há ainda quem avalie que o uso para treinamento de ferramentas de IA não fere os direitos autorais da obra, ou que esse tipo de uso poderia ser enquadrado no noção de “fair use”, que abre exceções para uso de material protegido, uma vez que acontece em sátiras ou quando a parcela do material usada é considerada ínfima.
Quem saiu na frente em termos de regulação foi a União Europeia, com seu “AI Act”, publicado em julho do ano pretérito —a primeira versão do projeto foi apresentada já em 2021.
O texto não se debruça longamente sobre remuneração a detentores de direitos autorais e prefere reportar diretivas mais antigas sobre o tema, mas traz a inovaão de falar mais explicitamente sobre transparência dos sistemas de treinamento de IA. O “AI Act” determina que provedores de modelos de IA de uso universal devem disponibilizar publicamente um resumo “suficientemente detalhado” sobre o teor usado para o treinamento da utensílio.
Nos Estados Unidos, o Escritório de Direitos Autorais do governo americano dedica um relatório inteiro a questões envolvendo treinamento de IA generativa. O relatório afirma que o tórax lítico americano atual já é suficiente para mourejar com a questão e que ” a mediação governamental seria prematura neste momento”.
O Japão deu um passo além e teve o entendimento de que o uso de dados culturais para treinamento de IA generativa não fere os direitos do responsável, pois são “fins que não têm a ver com o gozo da obra”.
No Brasil, houve a geração da Percentagem Peculiar sobre Lucidez Sintético, em abril, na Câmara, que tem discutido o projeto de lei 2338/23, o chamado PL da IA.
No texto, há uma seção que se dedica aos direitos autorais e conexos, que caminha numa direção semelhante à da União Europeia. O cláusula 62 diz que “o desenvolvedor que utilizar teor protegido por direitos de responsável e conexos deverá informar sobre os conteúdos protegidos usados nos processos de desenvolvimento dos sistemas de IA”.
O texto afirma que não constitui ofensa aos direitos de responsável a mineração de dados caso ela seja feita por instituições de pesquisa e educacionais, museus, arquivos públicos e bibliotecas, caso não haja fins comerciais. O chegada sempre precisa ser feito de forma lícita.
Mas, ao contrário do Japão, o texto brasílico estabelece que o uso de conteúdos protegidos em processos de mineração, treinamento ou desenvolvimento de sistemas de IA deve remunerar os titulares desses conteúdos.
Em julho do ano pretérito, o governo lançou o Projecto Brasílico de Lucidez Sintético, o PBIA, com diretrizes a serem seguidas até 2028. Pelo menos uma dezena de ministérios assinam o documento —mas o Ministério da Cultura não é um deles.
No mesmo mês, a CNI, Confederação Pátrio da Indústria, se posicionou afirmando que a PL da IA prejudicava o desenvolvimento da tecnologia no Brasil e a inovação no setor produtivo.
Marcos Souza, secretário de Direitos Autorais e Intelectuais do Ministério da Cultura, defende um protótipo de regulação que busque “conciliar o protótipo de negócios das empresas de IA às atuais regras internacionais e nacionais sobre direitos autorais”.
Mas há quem já acredite que, a reverência das obras brasileiras já usadas no treinamento de IA, não há mais o que fazer —agora é olhar para o porvir. “Essas músicas, essas obras já estão nessas bases de dados e vários sistemas já mineraram tudo”, diz Guilherme Carboni, jurista especializado em direitos autorais. “Virar isso tudo é muito complicado. É uma discussão que a gente já começa perdendo.”
O secretário do MinC afirma discordar de que não há mais zero que possamos fazer. “As empresas que roubaram esses conteúdos têm de ser responsabilizadas e remunerar pela utilização que já fizeram do nosso patrimônio cultural vernáculo”, diz.
“Costumo expor que se trata do roubo perfeito. Essas empresas, de uma só vez, buscam se apropriar de todo o insumo criativo produzido pela humanidade para nunca mais ter que remunerar os profissionais criativos em função de seus trabalhos”, diz Souza.
Porém há muito trabalho pela frente.
“As grandes plataformas de IA estão que nem loucas detrás de dados”, diz o professor Glauco Arbix, pesquisador do Meio de Lucidez Sintético da Universidade de São Paulo.
Elas precisam incessantemente ser alimentadas. Se acabam os dados do mundo real, elas passam a usar dados sintéticos, isto é, produtos da própria lucidez sintético.
E quando o manjar é um tanto sintético, o resultado produzido pela utensílio acaba sendo de menor qualidade e, portanto, menos competitivo.
Só que o Brasil tem uma vantagem, ou um tiro que saiu pela culatra. Apesar de ser um grande celeiro de produção cultural e artística, nem tudo está devidamente digitalizado ou catalogado. Isso, ele explica, acaba se tornado uma vez que uma proteção para a mineração de dados —já que os dados existem, mas ficam inacessíveis para as grandes empresas de IA que as queiram surrupiar.
Por isso, nem tudo está perdido. De certa forma, fomos salvos pelo demora.
