Google revela assistente que descreve objetos e robô que cria vídeos a partir de texto

Publicado em: 14 de maio de 2024

Google revela assistente que descreve objetos e robô que cria vídeos a partir de texto
Foto: Reprodução/Google

O Google revelou nesta terça-feira (14) novidades em inteligência artificial (IA), incluindo um protótipo de assistente virtual e um novo modelo para o Gemini, concorrente da empresa para o ChatGPT.

A nova assistente faz parte do que o Google chama de Projeto Astra, usado para demonstrar a visão da empresa para o futuro de aplicativos que ajudam usuários a automatizar suas tarefas com ajuda de inteligência artificial.

Em uma demonstração, a assistente conseguiu descrever em tempo real objetos e informações capturadas pela câmera do celular. A partir dessas imagens, ela também mostrou ser capaz de lembrar, por exemplo, onde o usuário deixou um objeto.

A empresa também anunciou sua IA poderá analisar imagens e ouvir dúvidas dos usuários ao mesmo tempo. Isso poderá ser usado, por exemplo, para mostrar um aparelho e perguntar por que ele não está funcionando corretamente.

Outra novidade é o o Veo, uma inteligência artificial capaz de criar vídeos a partir de comandos de voz. Ela é parecida com o Sora, anunciada pela OpenAI em fevereiro, mas por enquanto está disponível em fase experimental apenas nos Estados Unidos.

As novidades foram reveladas um dia após a OpenAI lançar o GPT-4o, novo modelo para o ChatGPT e aplicativos parceiros que promete ser mais rápido para ouvir, conversar e descrever objetos para usuários.

Gemini 1.5

O novo modelo de IA do Google foi batizado de Gemini 1.5 Flash, que se junta às categorias Ultra, Pro e Nano. A companhia diz que ele é o mais rápido oferecido em sua API para desenvolvedores e foi criado com foco em eficiência e baixa latência.

Segundo o Google, o Gemini 1.5 Flash é indicado para fazer resumos, interagir em aplicativos de mensagens, criar legendas para imagens e vídeos e extrair documentos de arquivos.

A empresa anunciou ainda que o Gemini 1.5 Pro, revelado em fevereiro, foi liberado para usuários do plano Gemini Advanced em 35 idiomas, incluindo o português. O modelo ficou melhor para entender contextos, segundo a companhia.

Android

O Android vai ganhar novos recursos que usam o Gemini Nano, versão da IA do Google para dispositivos móveis. Uma das novidades adiantadas pela empresa é capaz de analisar áudios em ligações e alertar usuários sobre possíveis golpes.

O recurso “Circule para pesquisar” foi atualizado no sistema operacional do Google e se tornará capaz de ajudar, por exemplo, a resolver estudantes em exercícios por meio do Gemini.

Via G1

Compartilhe essa notícia nas redes sociais!