Google apresenta maior modelo de linguagem visual (VLM) já desenvolvido
Com 562 bilhões de parâmetros, a principal aplicação do PaLM-E é em robótica – ao receber um comando, como "traga-me os chips que estão na gaveta”, o sistema gera um plano de ação completo para um robô, que pode executá-lo por conta própria, sem a necessidade de anotações ou pré-treinamento humano.