O Google lançou ao público nesta terça-feira (14) o Gemini 1.5 Pro, um novo protótipo de lucidez sintético capaz de entender até 14 livros ou duas horas de contexto.
Para superar os erros comumente cometidos por IA, uma vez que as alucinações, o presidente-executivo do Google, Sundar Pichai, diz que a empresa trabalhou para edificar agentes de IA capazes de raciocinar e planejar para executar as tarefas especificadas.
O lançamento ocorre um dia depois a OpenAI ter lançado uma novidade versão do ChatGPT, que impressionou as pessoas nas redes sociais pela capacidade de conversar em tempo real. Na apresentação, feita totalmente ao vivo, o chatbot cometeu alguns deslizes, uma vez que confundir a foto de uma pessoa com um tronco de árvore.
As demonstrações do Google, no entanto, foram gravadas.
Um milhão de pessoas se inscreveram para testar o Gemini —a OpenAI diz que o ChatGPT tem mais de 100 milhões de usuários mensais.
Os agentes de IA do Google usam dados climáticos, informações de catálogos e mapas para aditar contexto aos pedidos feitos pelo usuário, de concordância com a executiva da empresa para buscas, Liz Reid.
O Gemini, apresentado em fevereiro, foi a primeira IA treinada para compreender áudio, vídeo e texto ao mesmo tempo, uma vez que faz novidade versão do ChatGPT. O Google, no entanto, foi criticado por editar vídeos para fazer as respostas do chatbot parecerem mais rápidas.
A empresa demonstrou uma vez que o Gemini pode identificar imagens pela câmera e conversar. O Gemini Pro, no entanto, não demonstrou as capacidades de variação de tom de voz nem de identificação de emoções, apresentadas pela OpenAI na segunda (13).
A versão do chatbot do Google capaz de entender imagens e conversar, chamadas de Projeto Astra, chegará ao público ainda neste ano. Participantes do programa de teste do Google já podem acessar a tecnologia. Já o aplicativo do ChatGPT com essas habilidades começa a estar disponível a partir da próxima segunda (20), para testadores selecionados.
Quando o Projeto Astra for lançado, será verosímil conversar com o assistente para smartphone em tempo real, com a possibilidade de interromper as respostas, de concordância com o Google.
Os assinantes do pacote Gemini Advanced, disponível por US$ 20 (R$ 104), terão aproximação a uma quantidade predeterminada de interações com a versão mais avançada do protótipo, o Gemini 1.5 Pro —serão 1,5 milhão de tokens, a unidade de conversão para geração de palavras correspondentes em média a uma sílaba. O Google não informou se usuários não pagantes terão aproximação à tecnologia.
O Google diz que o protótipo entende até 2 milhões de tokens de contexto —tapume de 14 livros de 400 páginas—, graduação de entendimento sem par no mercado.
O gigante das buscas continua a apostar na integração de lucidez sintético com suas soluções para computador e smartphone.
Em sua plataforma de trabalho, Workspace, o Gemini 1.5 poderá ajudar na redação de emails e de documentos no Google Docs. Também atuará uma vez que assistente na edição de planilhas. A instrumento será lançada no “próximo mês”.
A integração da IA terá um tela próprio nos aplicativos do Google, com sugestões de pedido para aligeirar a interação com a lucidez sintético.
O Google mostrou relatos de programadores que usam também o Gemini para programar. A versão anterior da IA generativa da empresa, Bard, foi criticada por não se confrontar ao ChatGPT no que tocava à geração de código de computação.
Posteriormente uma reunião no Google Meet, será verosímil pedir um resumo dos pontos mais importantes em debate no encontro ao Gemini.
No smartphones Android (sistema operacional do Google), será verosímil, por exemplo, procurar fotos com instruções em texto. Para permitir que celulares operem os modelos de lucidez sintético localmente, o Google lançou uma versão mais ligeiro de sua tecnologia, o Gemini 1.5 Flash, já disponível no smartphone Google Pixel. A empresa também conversa sobre acordos para compartilhar tecnologia com a Apple.
O Google anunciou no último dia 30 o lançamento do aplicativo da lucidez sintético generativa Gemini em português. O app já está disponível na Play Store, em celulares Android, e deve chegar a aparelhos da Apple “nos próximos dias”.
A proposta da solução é turbinar o Google Assistente, que recebe comandos por voz, com lucidez sintético generativa. “O novo serviço de IA pode ajudar as pessoas economizarem tempo recuperando informações relevantes de aplicativos e serviços do Google, uma vez que Gmail, Procura, Google Voos e YouTube”, diz o proclamação do gigante das buscas.
O sistema de lucidez sintético generativa Gemini foi lançado em 8 de fevereiro e substituiu o Bard. O chatbot do Google, mesmo que descerrado ao público e capaz de gerar imagens, não recebeu a mesma projeção do que o ChatGPT. Já no vídeo de proclamação, o Bard cometeu uma gafe e disse que o telescópio James Webb havia conquistado as primeiras imagens de planetas fora do sistema solar.
Também é verosímil acessar o Gemini no navegador Google Chrome. Basta digitar @gemini seguido do comando na barra de endereço do Chrome e o gemini.google.com é iniciado com uma resposta pronta.
LANÇAMENTOS DESTA TERÇA
Gemini 1.5 Pro
Padrão de lucidez sintético generativa mais avançado do Google, apresentado ao público nesta terça. Tecnologia tem capacidade de compreender até 14 livros de 400 páginas de contexto. Podem acessá-los, com limites, os assinantes do projecto Gemini Advanced, vendido por US$ 20 (R$ 104) mensais.
Gemini 1.5 Flash
Padrão de IA generativa compacto, feito para rodar em smartphones. Estará disponível no app do Gemini para celular e no smartphone Google Pixel 9. Tem menor capacidade técnica, mas é útil em funções simples que não precisem de processamento em nuvem, por diminuir o pausa entre o pedido e a resposta.
Projeto Astra
Trabalho do Google para prometer versão de imagem e áudio em plataformas de lucidez sintético da empresa, uma vez que o ChatGPT será capaz de fazer, de concordância com a apresentação da OpenAI de segunda (13). O Google disse que recursos passarão a funcionar “mais tarde neste ano” e estarão disponíveis na internet e no aplicativo para smartphone.
Gemini no Workspace
A partir do mês que vem, o Google começará a disponibilizar ferramentas turbinadas com IA em sua plataforma de escritório Workspace, tal qual preço de adesão é a partir de R$ 28 mensais.
- No Gmail, será verosímil reunir emails e receber sugestões de respostas automáticas a emails com base no contexto. A solução funcionará a partir de botões.
- O Google Meet ganhará a opção de tradução ao vivo com auxílio de lucidez sintético em 60 idiomas.
- No Google Docs, a função de auxílio na escrita passará a funcionar em português e espanhol.
- A plataforma ganha um tela lateral, que funcionará uma vez que um assistente de IA recebendo consultar do usuário.