Como Evitar Spam De Ia Na Busca Do Google: 'before:2023'

Como evitar spam de IA na busca do Google: ‘before:2023’ – 07/07/2024 – Tec

Tecnologia

Autodenominada uma empresa de lucidez sintético, o Google reconhece que o spam feito a partir de IA generativa —com textos, áudios e vídeos— pode deixar a internet “em ruínas”.

Esse foi o diagnóstico de um estudo elaborado pelo braço de IA da big tech, a Deepmind, e pelo think tank de cibersegurança do grupo, Jigsaw, que veio a público no último dia 21.

Os primeiros sinais da poluição por IA já aparecem em buscas no próprio Google. Entre os 11 primeiros resultados em uma pesquisa por imagens do noticiarista Machado de Assis, duas mostram o avatar de IA que a ABL (Liceu Brasileira de Letras) criou de Machado de Assis —mira de críticas por reproduzir uma versão branca do noticiarista.

Procura por Machado de Assis já retorna imagens geradas por IA

Busca do Google exibe 13 imagens de Machado de Assis

Imagens do avatar de IA criado pela ABL de Machado já aparece no topo das buscas

Reprodução/Google

Os vestígios do uso de IA para produção de teor começam a permanecer visíveis em outras partes da internet. Nos textos, é aparente sobretudo em dúvidas cotidianas, que costumavam ser atendida por sites especializados.

A procura sobre “o que levar a um acampamento”, por exemplo, hoje leva a textos bastantes similares entre si, hospedados em portais comerciais. O estilo do ChatGPT está ali em maior ou menor intensidade e é assinalado por sites de reconhecimento de uso de IA —ainda pouco confiáveis.

Ao usar o comando “before:2023”, que limita os resultados ao que foi publicado de 2022 para trás, ganha destaque, por exemplo, o blog especializado “Eu me aventuro”, mantido pelos jornalistas paranaenses Carolina Leal e Lilo Barros.

Além de mostrar os equipamentos básicos, uma vez que os demais textos adaptados para SEO (otimização para manter um texto no topo dos resultados do Google), o post de Leal e Barros acrescenta dicas úteis ao leitor de quem está habituado a acampar. “Antes de gastar comprando equipamentos de camping, procure alugar ou emprestar de qualquer companheiro”, recomenda o texto.

É esse tipo de toque pessoal que especialistas consultados pela Folha temem que perdida espaço com o progressão da lucidez sintético internet afora.

Em fóruns especializados uma vez que Hacker News e em tweets de personalidades do mundo da tecnologia uma vez que Elon Musk circula a recomendação de procurar páginas anteriores a 2023, com o comando “before:2023”. Trata-se de um filtro, aplicável na procura do Google.

Para o cientista-chefe do Instituto Tecnologia e Sociedade do Rio de Janeiro (ITS-Rio) e também colunista da Folha, Ronaldo Lemos, a tática só não se tornou mais popular no Brasil por falta de divulgação.

A lucidez sintético gera um duelo para a organização da informação na internet, e esse é justamente o trabalho de buscadores uma vez que o Google, diz o pesquisador.

A big tech dispõe de uma utensílio chamada PageRank, das quais propósito é dar uma nota de relevância para cada página da web de pacto com o que o usuário procura. São considerados mais de 14 milénio critérios, uma vez que presença de imagens, vídeos e reputação do site, de pacto com vazamento de uma versão antiga do algoritmo do buscador.

Uma das formas de confundir esse algoritmo é inundar a internet com teor gerado sinteticamente “em graduação descomunal”, segundo Lemos.

“Antes da IA generativa essa técnica já havia sido tentada para dominar os buscadores, por meio das chamadas fazendas de teor”, recorda o profissional.

Eram empresas empregavam, preferencialmente, trabalho de inferior dispêndio em países do sudeste asiático para produzir, em volume, conteúdos genéricos e lucrar com os cliques que esses conteúdos geravam. Mas essa estratégia esbarrava no dispêndio e na quantidade de trabalhadores disponíveis. “Agora [com a IA generativa] esse limite não existe mais na prática”, afirma Lemos.

“Isso começa a influenciar o resultado dos buscadores, que não conseguem mais diferenciar o joio do tribo, o que é real do que é teor produzido de forma coordenada e inautêntica”, resume.

Nos conteúdos em inglês, essa enxurrada de spam sintético já é mais perceptível.

Procura no Google por Sigourney Weaver jovem

Busca do Google exibe 15 imagens de Sigourney Weaver, sendo a segunda uma cópia dela jovem gerada por IA.

Busca do Google exibe 15 imagens de Sigourney Weaver

Segundo resultado da procura atual exibe uma imagem gerada por IA

Reprodução/Google

A pesquisa do Google chamada “Insulto com IA generativa: uma taxonomia das táticas e percepções a partir de dados do mundo real” encontrou 200 matérias reportando sobre usos nocivos da tecnologia, a partir de buscas pelas palavras-chave “ChatGPT”, “gerado por IA”, “deepfake”, entre outras.

Mais de 20 delas tinham relação com o ofício de IA para dar graduação a injeções de spam na internet e outras 20 usavam uma tática chamada de contas-fantoche (sockpuppeting no original) —a geração de contas falsas, facilitada por recursos de lucidez sintético generativa, para publicar teor na internet.

O The Guardian mostrou, por exemplo, que um “tropa de fakes” defendeu no X (ex-Twitter) a candidatura dos Emirados Árabes Unidos à presidência da COP28 (28ª Conferência da ONU sobre Mudanças Climáticas).

A pesquisa do Google indica que há três principais objetivos no uso censurável de IA: manipulação da opinião pública, lucro e fraudes.

Outros levantamentos, uma vez que o da dependência especializada no monitoramento de material malicioso e sintético na internet Newsguard, corroboram o diagnóstico do Google. A empresa americana registrou 976 fontes de notícias duvidosas geradas por IA e já encontrou portais jornalísticos falsos no Brasil. Só entram na lista portais sem curadoria humana adequada, segundo avaliação da Newsguard.

De pacto com Lemos, a escolha preferencial pelo inglês tem a ver com o tamanho do mercado: 52% do teor da rede está em inglês. Porém esse pode ser o fado do português, a sétima língua mais usada na internet.

“Os mercados das línguas menores, por serem menos competitivos, podem até ser mais lucrativos”, diz o pesquisador.

Posteriormente notícias críticas circularem na prensa, o Google atualizou seu algoritmo em março para penalizar textos e imagens geradas por lucidez sintético. A companhia avisou que começaria a tirar da sua lista de sites monitorados aqueles que mantivessem teor de baixa qualidade. A big tech estima que reduzirá a circulação de teor não original em até 40% com a medida.

Para o noticiarista e pesquisador de tecnologia canadense Corey Doctorow, todavia, uma deterioração nos resultados dos resultados do Google vem de ainda antes do progressão a IA generativa. Teria ver com “um foco maior em conseguir lucro com anúncios e conteúdos SEO, nesse momento do mercado em que as big techs estão se capitalizando, com cortes de custos, para investir mais em lucidez sintético.”

“O Google virou o maior símbolo da bostificação: uma companhia revolucionou a procura na internet, com uma pesquisa que parecia mágica, decaiu tanto que sumiu com seções inteiras da internet para 90% dos usuários que usam a plataforma uma vez que o portão para a internet”, afirma o noticiarista.

COMO USAR BUSCA AVANÇADA PARA MELHORAR RESULTADOS NO GOOGLE

O comando “before” é unicamente uma das opções de filtro disponíveis no Google. É verosímil usar uma data qualquer uma vez que parâmetro. Ainda há o comando “after”, que delimita as buscas às datas depois a indicada.

Veja outros comandos da procura avançada:

  • Uso de aspas: colocar palavras ou frases entre aspas delimita a procura a resultados com menções idênticas à indicada
  • Site: Restringe os resultados de buscas a determinado domínio na internet. Exemplo: “site:gov.br” retorna resultados unicamente dos sites do governo
  • Região: Limita os resultados a uma localidade geográfica
  • Filetype: Limita os resultados a arquivos no formato indicado
  • SafeSearch: Evita teor explícito
  • Para excluir palavras da procura: Use o sinal “-” seguido da termo que deseja excluir. Exemplo: “seleção de futebol -brasileira”

Folha

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *