Eu me clonei com a ferramenta AI Avatar do Gemini. O resultado foi enervante para mim


É lindo, tarde amena no Dolores Park, em São Francisco, e estou cantando uma canção de aniversário para um dinossauro pré-histórico. Um cupcake com uma vela rosa aparece magicamente na minha mão vazia enquanto termino minha serenata. Quando apago a chama, um olhar calmo de contentamento toma conta da criatura em estilo CGI.

Embora o homem neste vídeo de IA se pareça e soe exatamente como eu, o clipe foi realmente gerado usando um dos novos recursos disponíveis no aplicativo Gemini do Google: avatares. Essas recriações digitais são semelhantes aos principais recursos do agora extinto OpenAI Aplicativo irmã. É um clone digital seu que pode ser inserido em vídeos de IA. Os avatares são alimentados pelo novo modelo de vídeo Omni da empresa, e o recurso está disponível apenas para assinantes.

Eu pago US$ 20 por mês por Plano AI Pro do Google e rapidamente ultrapassou os limites de uso do Gemini, que são redefinidos a cada 5 horas. Simplesmente fiz algumas perguntas e gerei dois clipes de 10 segundos com meu avatar, antes de me dizerem para esperar até mais tarde.

Vídeo: Reece Rogers

Meus dois primeiros vislumbres do que Omni pode fazer com minha imagem foram cantar para um dinossauro em São Francisco e surfar sob a ponte Golden Gate. Fiquei simultaneamente impressionado e assustado. O conteúdo era assustador, com alguns momentos confusos e roupas absurdas, mas o homem do vídeo era eu. Usei meus dedos para ampliar seu rosto e realmente observar o movimento da boca. Os dentes estavam um pouco quebrados, mas fora isso é Reece, até a gordura do queixo.

Diferente OpenAIque anteriormente permitia aos usuários decidir se queriam que outros gerassem vídeos de IA usando sua imagem, Google só permite que usuários adultos façam vídeos com seu próprio avatar.

Levei cerca de cinco minutos para configurar meu avatar através do aplicativo Gemini. O processo envolveu sentar em uma sala bem iluminada com a câmera do meu telefone apontada para meu rosto e ler uma série de números de dois dígitos. Então olhei lentamente para a direita e girei a cabeça para a esquerda, e tudo acabou. Reece 2.0 nasceu e está pronto para ser minha estrela deepfake. (Esteja atento ao que você está vestindo durante esse processo, já que seu ajuste provavelmente aparecerá nas gerações de IA, mas falaremos mais sobre isso mais tarde.)

Vamos analisar o clipe de aniversário quadro a quadro para realmente desvendar meus sentimentos aqui. Solicitação completa: Gere um vídeo meu cantando a música de feliz aniversário para um dinossauro idoso no topo da colina em Dolores Park.

Clipe gerado por IA por Reece Rogers

O primeiro segundo começa com um pausa milenar porque até AI Reece tem alguns hábitos arraigados. O que mais chama a atenção inicialmente é o cenário fotorrealista. Em vez de colocar meu avatar em uma colina enorme em um parque aleatório, o plano de fundo do vídeo de IA do Google é notavelmente semelhante ao local real. Das calçadas ladeadas de palmeiras ao imponente Salesforce ao longe, fica imediatamente evidente qual parque é retratado aqui, mesmo que o resultado não seja perfeito. Faz sentido que uma empresa conhecida por mapear o planeta consiga fazer isso.

Quando eu comecei a cantar, com um barítono menos agudo do que consigo, os primeiros compassos pareceram naturais. Eu balançava minhas mãos para cima e para baixo na batida, como um minimaestro. Então, gaguejo na palavra “para” e Gêmeos corta para uma cena de ângulo mais amplo quando o verdadeiro caos começa. Um cupcake de baunilha aparece aleatoriamente e eu expiro uma nuvem de fumaça para apagar a vela da comemoração. (Honestamente, que rude da parte de AI Reece. Não é o seu dia especial.)



Source link