Com Robótica, Ia Por Trás Do Chatgpt Ensaia Ir Além

Com robótica, IA por trás do ChatGPT ensaia ir além do mundo digital – 12/03/2024 – Tec

Tecnologia

Empresas porquê OpenAI e Midjourney desenvolvem chatbots, geradores de imagens e outras ferramentas de perceptibilidade sintético que operam no mundo do dedo.

Agora, uma startup fundada por três ex-pesquisadores da OpenAI está usando os métodos de desenvolvimento da tecnologia por trás dos chatbots para erigir uma que consegue interagir com o mundo material.

A Covariant, empresa de robótica sediada em Emeryville, na Califórnia, está criando maneiras que possibilitam que os robôs peguem, movam e organizem itens enquanto são transportados por depósitos e centros de distribuição.

O objetivo é ajudar os robôs a entender o que está acontecendo ao seu volta e determinar o que devem fazer em seguida.

A tecnologia também dá aos robôs uma compreensão ampla do inglês, permitindo que as pessoas conversem com eles porquê se estivessem conversando com o ChatGPT.

Ainda em desenvolvimento, a tecnologia não é perfeita. Mas é um sinal simples de que os sistemas de IA por trás dos chatbots e dos geradores de imagens da internet também impulsionarão máquinas em depósitos, estradas e residências.

Assim porquê os chatbots e geradores de imagens, essa tecnologia de robótica aprende suas habilidades analisando enormes quantidades de dados. Isso significa que os engenheiros podem melhorar a tecnologia alimentando-a com cada vez mais dados.

A Covariant, apoiada por US$ 222 milhões em financiamento, não constrói robôs. Ela constrói o software que alimenta os robôs.

A empresa pretende implantar sua novidade tecnologia naqueles que funcionam em depósitos, fornecendo um parâmetro para que outros façam o mesmo em fábricas e talvez até mesmo em estradas com carros autônomos.

Esses sistemas de IA por trás dos chatbots são chamados de redes neurais, remetendo à rede de neurônios no cérebro. Ao identificar padrões em grandes quantidades de dados, esses sistemas podem aprender a reconhecer palavras, sons e imagens —ou até mesmo a gerá-los por conta própria.

Foi logo que a OpenAI construiu o ChatGPT, que consegue responder a perguntas instantaneamente, grafar trabalhos acadêmicos e gerar programas de computador. Ele aprendeu essas habilidades a partir de textos coletados em toda a internet.

Empresas estão agora construindo sistemas que podem aprender com diferentes tipos de dados ao mesmo tempo. Ao estudar tanto uma coleção de fotos quanto as legendas que descrevem essas fotos, por exemplo, um sistema pode compreender as relações entre os dois. Ele pode aprender que a vocábulo “banana” descreve uma fruta amarela e curva.

A OpenAI empregou esse sistema para erigir o Sora, seu gerador de vídeos. Ao estudar milhares de vídeos legendados, o sistema aprendeu a gerar vídeos a partir de uma breve descrição de uma cena.

Fundada por Pieter Abbeel, professor da Universidade da Califórnia em Berkeley, e três de seus ex-alunos, Peter Chen, Rocky Duan e Tianhao Zhang, a Covariant usou técnicas semelhantes na construção de um sistema que alimenta robôs de depóstios.

A empresa ajuda a controlar robôs de classificação em depósitos de todo o mundo. Ela passou anos reunindo dados —de câmeras e outros sensores— que mostram porquê esses robôs operam.

“O sistema coleta todos os tipos de dados que importam para os robôs —que podem ajudá-los a entender o mundo físico e interagir com ele”, disse Chen.

Ao combinar esses dados com a enorme quantidade de texto usada para treinar chatbots porquê o ChatGPT, a empresa construiu uma tecnologia de IA que dá aos seus robôs uma compreensão muito mais ampla do mundo ao seu volta.

Depois identificar padrões nesse caldeirão de imagens, dados sensoriais e texto, a tecnologia dá ao robô o poder de mourejar com situações inesperadas no mundo físico. O robô sabe porquê pegar uma banana, mesmo que nunca tenha visto uma banana antes.

Ele também consegue responder em inglês simples, assim porquê um chatbot. Se você disser para ele pegar uma banana, ele sabe o que isso significa. Se você disser para ele pegar uma fruta amarela, ele também entende.

Ele até pode gerar vídeos que preveem o que provavelmente acontecerá ao tentar pegar uma banana. Esses vídeos não têm uso prático em um arrecadação, mas mostram a compreensão do robô do que está ao seu volta.

“Se ele consegue prever os próximos quadros em um vídeo, ele consegue identificar a estratégia certa a seguir”, disse Abbeel.

A tecnologia, chamada RFM, (protótipo fundamental de robótica, para a {sigla} em inglês), comete erros, assim porquê os chatbots. Embora muitas vezes entenda o que as pessoas pedem, sempre há a chance de que não o faça. Ele deixa desabar objetos de vez em quando.

Gary Marcus, um empreendedor na superfície de IA e professor emérito de psicologia e ciência neural na NYU, disse que a tecnologia poderia ser útil em depósitos e em outras situações nas quais erros são aceitáveis.

Mas ele disse que seria mais difícil e aventuroso implementar em fábricas e em outras situações potencialmente perigosas.

“Isso se resume ao dispêndio do erro”, disse. “Se um robô de quase 70 kg pode fazer alguma coisa prejudicial, esse dispêndio pode ser cume.”

Os pesquisadores acreditam que esse sistema melhorará rapidamente à medida que as empresas o treinam com coleções de dados cada vez maiores e mais variadas.

Isso é muito dissemelhante da forma porquê os robôs operavam no pretérito. Geralmente, os engenheiros programavam os robôs para executar o mesmo movimento preciso repetidamente —porquê pegar uma caixa de um determinado tamanho ou prender um rebite em um lugar específico no para-choque traseiro de um carruagem. Mas esses robôs não conseguiam mourejar com situações inesperadas ou aleatórias.

Ao aprender com dados —centenas de milhares de exemplos do que acontece no mundo físico— os robôs podem encetar a mourejar com o inesperado. E quando esses exemplos são combinados com linguagem, os robôs também podem responder a sugestões de texto e voz, porquê um chatbot faria.

Isso significa que, assim porquê chatbots e geradores de imagens, os robôs se tornarão mais ágeis. “O que está nos dados digitais pode se transferir para o mundo real”, disse Chen.

Folha

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *