O Google caminha em direção à “IA universal” para equipar a Gemini com capacidades de compreensão, planejamento e execução de contexto

A multinacional apresenta suas últimas novidades, que estarão disponíveis primeiramente para os usuários das assinaturas mais avançadas e caras. A Microsoft entra na corrida por agentes


RAÚL LIMÓN 20 DE MAIO DE 2025 - 14:51 ART El Pais, Espanha
O Google está avançando em sua visão de levar o modo de inteligência artificial (IA) a todos os aspectos do trabalho e da vida cotidiana. Durante sua conferência para desenvolvedores ( Google I/O 2025 ), que começou nesta terça-feira em Mountain View, Califórnia, foram apresentados os avanços atuais e futuros da empresa, que basicamente envolvem estender suas conquistas para todos os aplicativos, mas com maior precisão, velocidade e facilidade de uso. Demis Hassabis, pesquisador e CEO do Google DeepMind, resume o conceito, que ele chama de “IA Universal”: “Que seja útil no seu dia a dia, que seja inteligente, que entenda o contexto em que você está e que possa planejar e agir em seu nome em qualquer dispositivo — esse é o nosso objetivo final para o Gemini [la IA de Google] .” As principais melhorias estarão disponíveis começando pela assinatura mais cara (Ultra), ao custo de US$ 249,99 por mês (221,75 euros). A Microsoft também introduziu avanços na mesma linha de agentes capazes de raciocinar e executar tarefas completas e complexas para o usuário.
Sundar Pichai, CEO do Google , se gaba de que uma das conquistas deste ano é ter incorporado com sucesso sua inteligência artificial ao mecanismo de busca mais usado no mundo. Soma-se a isso a personalização, a capacidade de desenvolvimento de código, os avanços na geração de conteúdo audiovisual e a menor latência na obtenção de resultados. O executivo enfatiza que esses recursos têm um custo, mas argumenta que as taxas de assinatura dos modelos "estão caindo significativamente". “Há um equilíbrio difícil entre preço e desempenho, mas, repetidamente, conseguimos oferecer os melhores modelos pelo preço mais econômico”, argumenta ele.
“Reinvenção” das buscas . Pichai anunciou o lançamento de um modo de IA que será incorporado ao mecanismo de busca para lidar com o crescimento exponencial desse uso. “É algo completamente novo, uma reformulação completa da pesquisa com raciocínio mais avançado, respostas para consultas mais longas e complexas [hasta cinco veces la duración de las búsquedas tradicionales] e a capacidade de ir mais longe com perguntas complementares.” Esta nova aba foi lançada nesta terça-feira nos Estados Unidos antes de se espalhar para o resto do mundo.
Avanços audiovisuais . No campo do vídeo, o Google está incorporando o Projeto Starline, uma tecnologia para recriar imagens que simulam três dimensões. “O objetivo é criar a sensação de estar na mesma sala que alguém”, explica Pichai. Nesse sentido, foi apresentado o Google Beam, uma ferramenta que transforma transmissões de vídeo bidimensionais "em uma experiência 3D realista" graças a seis câmeras que capturam e mesclam diferentes ângulos em tempo real. Ele pode ser usado para chamadas de vídeo, mas os primeiros dispositivos com essa tecnologia só estarão disponíveis no final deste ano. O Google também introduziu uma versão aprimorada do Flash e do Astra, as ferramentas de IA que permitem que o Gemini Live interaja com o dispositivo enquanto ele vê, memoriza e analisa o ambiente em que a interação ocorre. Eles são a base dos futuros óculos Android XR, um dispositivo de realidade aumentada para acessar o agente com o dispositivo integrado à pessoa. Da mesma forma, a nova versão do VEO, a plataforma de criação audiovisual alimentada por IA, “combina vídeo com áudio pela primeira vez”, explicou Hassabis.
Tradutor . O recurso Starlight será adicionado ao Google Meet, permitindo a tradução simultânea de videochamadas (inicialmente, disponível apenas em espanhol e inglês). A máquina se adapta ao tom dos interlocutores e recria suas formas de expressão. Também estará disponível para assinantes ainda este ano.
Agentes. A evolução dos chatbots para agentes (ferramentas capazes de atuar em nome do interlocutor) tem como base o Projeto Mariner, um agente que, além de planejar, consegue executar diferentes tarefas simultaneamente e aprender com as ações que executa para ser proativo e antecipar as solicitações dos usuários. Estará disponível a partir deste verão. “Estamos começando a adicionar recursos de agente à pesquisa do Chrome, e o aplicativo Gemini contará com um novo modo de agente”, anunciou Pichai.
Ferramentas de trabalho e estudo . Os avanços da Gemini, com recursos de personalização (adaptação às características do usuário), também serão incorporados, a partir deste verão, em ferramentas de trabalho comuns, como Gmail, Docs e Keep. Melhorias também serão implementadas para os alunos, que poderão usar a IA não apenas para consultas específicas, mas também, de acordo com Hassabis, para "preparação para exames, compreensão de materiais, realização de pré-testes e assistir a vídeos".
Compras . Vidhya Srinivasan, vice-presidente de compras, destaca um dos novos recursos do Google voltados para compras, que visa permitir que a IA execute toda a tarefa, desde a "inspiração" até o pagamento e o pedido. A IA não só mostrará opções de roupas, por exemplo, mas poderá, com base em uma foto pessoal, mostrar como elas ficam no usuário e concluir o processo ou colocá-lo em espera até encontrá-las pelo preço que ele deseja pagar.
Microsoft e X
O caminho do Google é o mesmo trilhado pela empresa fundada há 50 anos por Bill Gates e Paul Allen. Durante o Microsoft Build , evento anual para desenvolvedores da empresa, Satya Nadella, CEO da multinacional, anunciou a "rede aberta de agentes", um conceito semelhante ao do Google que permite que agentes de IA interajam, decidam e ajam em nome de indivíduos, equipes e organizações.
A Microsoft revelou atualizações para seu ambiente de desenvolvimento para facilitar a criação de agentes de IA mais capazes e seguros, avançar na pesquisa científica e promover padrões abertos e infraestrutura e protocolos compartilhados.
Nesse sentido, a empresa apresentou o GitHub Copilot, um agente de programação; Windows AI Foundry e Foundry Local, uma plataforma unificada para desenvolvimento completo e personalizado de inteligência artificial, do treinamento à inferência (a capacidade de raciocinar em novos contextos); e Azure AI Foundry Models, entre outras novas ferramentas para avaliação de modelos.
A Microsoft também anunciou que incorporou os modelos Grok 3 e Grok 3 mini da xAI, empresa liderada por Elon Musk, ao seu ecossistema. Musk participou da reunião por vídeo e reconheceu erros anteriores que, segundo ele, foram corrigidos rapidamente graças à colaboração dos desenvolvedores.
Grok emitiu respostas ao “genocídio branco” na rede social X, do magnata americano, ainda que a pergunta não estivesse relacionada à África do Sul. É o caso de Jen Golbeck, professora da Universidade de Maryland, nos Estados Unidos, que recebeu a seguinte resposta da IA de Musk, uma sul-africana: "A alegação de genocídio branco é altamente controversa. Alguns argumentam que fazendeiros brancos enfrentam violência direcionada, apontando ataques a fazendas e retórica como a música 'Kill the Boer', que consideram incitação."
Chapéu Vermelho
A Red Hat, fornecedora global de soluções de código aberto, também lançou o Enterprise Linux 10 após meio ano em modo de testes . Esta plataforma foi projetada para responder às demandas dinâmicas da nuvem híbrida e da inteligência artificial. “Mais do que apenas uma atualização, o Red Hat Enterprise Linux 10 fornece uma estrutura estratégica e inteligente para gerenciar a crescente complexidade, acelerar a inovação e construir uma base de computação mais segura para o futuro”, disse a empresa.
A Red Hat credita sua plataforma pela capacidade de integrar cargas de trabalho de IA com um sistema operacional que ela descreve como "inteligente, resiliente e durável", além de "flexível e ágil".
“A integração da IA generativa diretamente na plataforma ajuda a fornecer orientação contextualizada e recomendações acionáveis por meio de uma interface de linguagem natural”, de acordo com a empresa, que afirma que esse recurso facilita o gerenciamento para “profissionais novatos e experientes”.