A geração de uma “lucidez sintético soberana” no Brasil foi defendida pelo governo federalista durante o lançamento do Projecto Brasílio de Lucidez Sintético (Pbia) nesta terça-feira (30). O Pbia foi feito por uma equipe multidisciplinar do Parecer Vernáculo de Ciência e Tecnologia, sob encomenda do presidente Luiz Inácio Lula da Silva (PT).
Durante o evento, a ministra de Ciência e Tecnologia, Luciana Santos, afirmou que o Brasil produz dados, cobiçados pelas big techs, capazes de cevar uma cárcere produtiva de lucidez sintético. Por isso, o país precisaria de alternativas.
O projecto cita, uma vez que objetivos, o desenvolvimento de uma “nuvem soberana” para associar os dados do governo brasílico e de “modelos avançados de linguagem em português, com dados nacionais que abarcam nossa pluralidade cultural, social e linguística, para fortalecer a soberania em IA”.
O desenvolvimento dessa tecnologia iria requerer, além de dados brasileiros, de infraestrutura própria, uma vez que supercomputadores e data centers, e de força de trabalho especializada. O país ainda está aquém desses dois últimos critérios, segundo especialistas consultados pela Folha.
“O Brasil hoje, concretamente, não tem nenhum computador que consiga rodar grandes modelos de linguagem, uma vez que aqueles que estão orientando os trabalhos do Google, da OpenAI e da Anthropic”, diz o professor da USP Glauco Arbix, que pesquisa políticas de inovação.
Ainda assim, o projecto do governo é visto pela comunidade científica uma vez que um progressão em relação à política vigente, a Ebia (Estratégia Brasileira de Lucidez Sintético), criticada por não ter planejamento orçamentário. O Pbia dedica R$ 23 bilhões a projetos de IA, sendo quase R$ 14 bilhões voltados à iniciativa privada.
Os eixos nos quais o país precisa progredir, segundo o documento, são: infraestrutura e desenvolvimento de IA, formação profissional, emprego de IA nos serviços públicos, nos negócios e a elaboração de um tórax regulatório.
Apesar de apresentado pelo presidente, o Pbia ainda depende de aprovação do governo em reunião ministerial, ainda a ser realizada.
O QUE MUDA COM IA EM PORTUGUÊS?
A geração de modelos avançados de linguagem em português é colocada uma vez que ponto-chave para a soberania do dedo em IA.
O governo classifica a medida uma vez que uma forma de prometer a redução de vieses, uma das maiores preocupações na utilização de IA em larga graduação. No pretérito, modelos de empresas uma vez que Google e OpenAI se envolveram em polêmicas por atitudes discriminatórias.
O uso de português e dados brasileiros deve amenizar desvios de vieses culturais, mas não será solução definitiva para o problema, segundo Rodrigo Nogueira, CEO da Maritaca AI, startup de lucidez sintético com dados brasileiros.
“Os problemas que a gente tem no Brasil não vão embora por treinarmos modelos com português. Diminuir vieses e edificar um pouco que represente os interesses do Brasil e de minorias ainda é um repto”, diz. Para especialistas, reduzir preconceitos algorítmicos exige esforços contínuos de treinamento de modelos de IA.
A lógica mais interessante é reduzir a sujeição dos dados de fora, na visão de Nogueira.
“Ficamos à mercê de empresas uma vez que a Meta e OpenAI e, se um dia elas decidirem parar de oferecer os produtos, ficamos na mão deles”.
Países na liderança da tecnologia, uma vez que China e Singapura, já têm as próprias IAs soberanas, para driblar as limitações idiomáticas e culturais dos modelos desenvolvidos nos EUA.
GOVERNO PROMETE SUPERCOMPUTADOR E INFRAESTRUTURA
O primeiro passo listado pelo governo para tirar esse projecto do papel seria a construção de uma infraestrutura do dedo mais robusta. Para isso, seriam dedicados R$ 5,79 bilhões de investimento direto e outros R$ 2,3 bilhões em financiamento para o setor privado.
A estrela do proclamação foi um supercomputador de IA, ao dispêndio de R$ 1,8 bilhão, que seria capaz de processar a quantidade de dados necessária para desenvolver um grande padrão de lucidez sintético.
Com cinco anos para transpor do papel, o projeto aproveitaria a estrutura do computador Santos Dummont, instalado no Rio de Janeiro, e teria uma vez que fontes de verba o FNDCT (Fundo Vernáculo de Desenvolvimento Científico e Tecnológico), da Petrobras e da Fapesp (Instalação de Sustento à Pesquisa do Estado de São Paulo).
O projeto também cita investimentos de R$ 750 milhões para a fabricação pátrio de peças de computadores avançados e chips, além de parcerias com outros países latino-americanos.
O Pbia ainda separa R$ 2,3 bilhões de crédito para financiar a construção de data centers, os grandes centros de processamento de dados que rodam programas avançados, uma vez que os sistemas de lucidez sintético.
O financiamento priorizará as regiões Setentrião e Nordeste e terá uma vez que critério eletivo o uso de fontes de energias renováveis. Ainda não há um cronograma definido para essa risco de crédito, que seria oferecida pelo BNDES (Banco Vernáculo de Desenvolvimento Econômico e Social) e pela Finep (Financiadora de Estudos e Projetos).
Para o professor da UFABC Sergio Amadeu, que integrou a equipe de tecnologia do primeiro governo Lula, é preciso investir para atingir soberania do dedo. “O projecto aponta alguns recursos que precisamos ver se são suficientes.”
AÇÃO DE DADOS DEMANDA REFORÇO EM SEGURANÇA
Outro investimento-chave do Pbia seria a alocação de R$ 1 bilhão para o desenvolvimento de um sistema que agregue as diversas bases de dados sob gestão do governo. Essa é a estrutura chamada de nuvem soberana, pela ministra Luciana Santos.
O professor profissional em IA da PUC-SP Diogo Cortiz afirma que a estruturação de fontes de informação em português sobre os brasileiros facilita o processo de geração de modelos de linguagem no país. “Recentemente, por exemplo, criamos um dataset de emoções em português, porque antes tínhamos de usar um do Google, em inglês, traduzido para o português, e havia imprecisões.”
Além de arquivos textuais, uma vez que livros e jornais já em domínio público, armazenados na Hemeroteca Vernáculo e no Registro Vernáculo, a nuvem soberana pode concentrar os diversos cadastros mantidos pelo governo, que constam com dados pessoais e fotografias.
O diretor do Data Privacy Brasil Bruno Bioni avalia que a integração das bases de dados é um progressão, mas deve redobrar o desvelo com a segurança da informação do governo, que foi vítima neste ano de um número recorde de vazamentos de dados sensíveis.
Para Bioni, a menção explícita a investimentos de R$ 70 milhões em segurança da informação é um bom sinal.
Não existe nenhum país 100% pronto. É para isso mesmo que planos estratégicos servem. Prever, calcular, produzir agenda, fomentar investimentos, diz Tainá Junquilho, advogada e professora de recta e tecnologia no IDP
GOVERNO E INICIATIVA PRIVADA
O Pbia ainda citou uma série de iniciativas de emprego de lucidez sintético em serviços do governo, uma vez que a gestão de imagens e vídeos captados pelas câmeras corporais da polícia, o controle de desmatamento e a política contra evasão do sistema escolar.
Hoje, segundo o projecto, a Receita Federalista já utiliza, em temporada piloto, lucidez sintético para facilitar no julgamento de processos administrativos. O governo também planeja disponibilizar um chatbot para facilitar o atendimento consular em diversos idiomas até dezembro deste ano.
O projecto, porém, não especifica se os modelos de lucidez sintético adotados no serviço público terão de ser desenvolvidos pelo próprio governo ou se terão de ser contratados por terceiros.
“O governo, nessa segmento de tecnologia, tem participação de vários parceiros externos, de serviços terceirizados, mas não comenta muito sobre o tema”, diz Jesaias Arruda, vice-presidente da Abranet (Associação Brasileira de Internet).
Entre 2024 e 2028, o governo investirá R$ 100 milhões em startups que proponham soluções de lucidez sintético a serem adotadas na gestão pública.
A maior segmento do investimento será destinada à iniciativa privada. Startups e micro e pequenas empresas seriam fado de R$ 2,3 bilhões. Mais R$ 9,1 bilhões seriam destinados ao programa de reindustrialização Novidade Indústria Brasil.