O Google reduziu em 97% o consumo de eletricidade do Gemini para responder a um pedido, com avanços em eficiência de software e hardware, segundo relatório inédito divulgado pela empresa nesta quinta-feira (21).
O estudo analisou os gastos de consumo de robustez entre maio de 2024 e o mesmo mês neste ano. No mesmo período, o processamento de dados se multiplicou 49 vezes, de convenção com dados apresentados por Sundar Pichai em evento para programadores —subiu de 9,7 trilhões mensais de tokens (pequenos fragmentos de texto que a IA processa no lugar das palavras completas) para 480 trilhões por mês.
Em apresentação para investidores em julho, Pichai disse que o valor já subiu para 980 trilhões.
De convenção com o diretor do Meio de Vantagem em Perceptibilidade Sintético (Ceia) da UFG (Universidade Federalista de Goiás), Anderson Gomes, o principal esforço da ciência da computação neste momento está em reduzir o dispêndio de inferência —o processamento de dados do padrão para gerar uma resposta ao comando do usuário. Um dos maiores gastos é com eletricidade.
A redução dos preços é importante para permitir a ampla adoção de perceptibilidade sintético, diz Gomes.
De convenção com o balanço do Google, havia em julho mais de 85 milénio negócios usando o Gemini para empresas, incluindo a gigante do luxo LVMH e a Salesforce. O uso empresarial cresceu 35 vezes em um ano, disse Pichai.
O relatório de sustentabilidade da empresa mostra que o consumo de eletricidade do Google segue tendência de subida desde 2011.
Segundo a big tech, o gasto de robustez de um pedido em texto mediano para o Gemini ficou em 0,24 Wh, o que equivale ao consumo de eletricidade de ver à televisão por nove segundos. Em uma sequência de valores ordenados de forma crescente, a mediana é o número ao núcleo —o quinto número em uma sequência de nove dígitos, por exemplo.
No item, o Google afirma que escolheu a mediana porque alguns poucos prompts gastam muito mais robustez e distorceriam o valor médio do comando para a perceptibilidade sintético. O item também desconsidera a geração de imagens e vídeos, que, de convenção com artigos científicos, gastam dezenas de vezes mais de robustez.
Porém pesquisadores ouvidos pela Folha dizem que a escolha da mediana pode gerar distorções.
O professor de ciência da computação da UFRGS Anderson Rocha Tavares diz que a mediana é mais útil quando a distribuição fica mais concentrada em uma segmento, o contrário do que acontece no caso do uso do consumo de robustez dos modelos de IA.
“Se eles reportassem a média, também seria útil, pois daria para ter essa noção da influência dos prompts ‘caros’”, afirma Tavares. “Se a média é muito superior à mediana, é um sinal que há alguns prompts que custam muito mais custoso que a maioria”, acrescenta.
Ou por outra, o método escolhido pelo Google torna impossível confrontar os gastos com estimativas feitas anteriormente por pesquisadores e outras empresas. Isso porque os autores propõem uma novidade metodologia na qual não consideram o tamanho do pedido nem se houve o uso do chamado “reasoning”, técnica em que a IA testa vários resultados até chegar a um mais adequado.
O Google trabalhou com a curva de gastos de robustez por pedido feito ao Gemini, de forma que só a empresa pode medir esses dados. A IA da big tech é de padrão fechado e só roda nos servidores da companhia.
“Nesse padrão, a sociedade fica dependente do quão verdadeiros são os dados que o Google está mostrando”, diz o professor da UFRGS.
O item da big tech foi divulgado pouco antes da regulação europeia estrear a impor critérios de transparência ambiental, uma vez que a divulgação do consumo de robustez sabido e estimado, e é visto uma vez que um sinal para o mercado. A Percentagem Europeia ainda definirá qual será a metodologia de mensuração a ser cobrada.
Mesmo com essas limitações, na única confrontação confiável apresentada no estudo, o Google mostra que o Gemini é mais de duas vezes mais eficiente do que o padrão da Meta Llama 3.1 70b. Uma vez que o padrão da companhia de Mark Zuckerberg é descerrado, o Google pôde reproduzir seus testes com ele.
De convenção com a gerente dos laboratórios de robustez avançada do Google, Savannah Goodman, o Google teve muito desvelo para vulgarizar um número que refletisse a verdade operacional de seu serviço de IA. “O valor é muito mais plebeu do que estimativas que circulavam anteriormente na ateneu”, disse.
Essa diferença, diz o Google, é motivada por usos mais eficientes de data centers, avanços em projetos de chips mais eficientes e avanços de engenharia nos modelos de linguagem —uma delas, por exemplo, foi a destilação de dados popularizada pela Deepseek.
Ainda segundo Goodman, o gigante das buscas escolheu trabalhar somente com os modelos geradores de texto, por motivo da maior quantidade de pesquisa disponível. A geração de imagens e vídeos pode ser tema de trabalhos futuros.
O vice-presidente da equipe de engenharia do Google, Partha Ranganathan, afirmou que o estudo do Google avançou ao considerar toda a prisão de IA em seus cálculos, desde a fabricação dos chips. Por isso, o valor encontrado passou de 0,14 watt hora para 0,24 watt hora.
As equipes do Google ainda calcularam a pegada hídrica de um pedido mediano ao Gemini, que seria de 0,26 ml —o que equivale a cinco gotas de chuva.
No aglomerado de todas as atividades do Google, seus data centers gastaram 27% mais robustez em 2024 do que em 2023, mostra o relatório de sustentabilidade mais recente da companhia. Apesar disso, a empresa reduziu suas emissões de carbono ligadas à eletricidade em 12%, graças à adoção de robustez limpa.
Para esse proveito em eficiência nos data centers, Ranganathan disse que o uso de sistemas de refrigeração líquida também contribuiu. Em 2024, o Google gastou 306,6 bilhões de litros de chuva em seus data centers, em uma subida de 75,7 bilhões de litros em relação ao ano anterior.
No ano pretérito, 28% das fontes de chuva potável que abastecem o Google estavam em áreas com risco de escassez hídrica.
