Como usar a IA Gemini para resumir vĂ­deos do YouTube


Uma pergunta de acompanhamento sobre a pontuação final foi respondida corretamente, mas Gemini obteve o nome do goleador do primeiro touchdown errado: a IA sugeriu que era Johan Dotson. Dotson recebeu um touchdown nos destaques com as pontuações em 0-0, mas foi descartado-um exemplo das nuances que a IA não necessariamente aprende.

Gêmeos identificou com sucesso quando o Kansas City Chiefs recebeu seus primeiros pontos e até incluiu um registro de data e hora ligando direto ao touchdown no clipe do YouTube. Também acertou o nome do artilheiro. Parece que Gêmeos depende fortemente do comentário de clipes de esportes, o que não é surpreendente.

Resuma o conteĂşdo do vĂ­deo

A imagem pode conter arquivo e página da web

A IA pode escolher detalhes do vĂ­deo – se eles sĂŁo mencionados no áudio.

Fotografia: David Nield

Em seguida, tentamos colocar Gêmeos contra um Featurette nos bastidores Para o Grand Budapeste Hotel, dirigido por Wes Anderson. O clipe vai até quatro minutos e meio, e Gêmeos devolveu algumas respostas quase instantaneamente: identificou o nome do filme que está sendo discutido e as principais batidas da narrativa do clipe.

No entanto, tudo depende do áudio (ou da transcrição) novamente – nĂŁo parece haver nenhuma análise do conteĂşdo do vĂ­deo real. A IA nĂŁo sabia dizer quem estava as cabeças falantes no vĂ­deo, mesmo que seus nomes fossem exibidos na tela, e nĂŁo pudesse dizer quem era o diretor (mesmo que isso tambĂ©m tenha sido mencionado na descrição do vĂ­deo).

No lado positivo, Gemini fez um trabalho impressionante ao resumir o áudio do vĂ­deo. Ele identificou corretamente alguns dos desafios de cinema que foram mencionados por toda parte e forneceu timestamps para eles – desde procurar um set para representar o Grand Budapeste, a preenchĂŞ -lo com extras.

Resuma entrevistas

A imagem pode conter arquivo de texto e página da web da página

Os GĂŞmeos podem fornecer registros de data e hora para o vĂ­deo especificado.

Fotografia: David Nield

Finalmente, tentamos o Google Gemini com uma entrevista: Canal 4 no Reino Unido falando com Charlie Brooker e Siena Kelly sobre a última série de Espelho preto (talvez apropriado para um artigo sobre IA). Gêmeos se mostrou muito capaz em escolher os pontos de discussão e adicionar registros de data e hora, embora, é claro, todo o vídeo esteja falando principalmente.

Novamente, porĂ©m, nĂŁo há contexto sobre nada fora do áudio ou da transcrição. Gemini Ai nĂŁo sabia dizer onde a entrevista ocorreu, ou como os participantes estavam agindo, ou qualquer outra coisa sobre o visual do vĂ­deo – que vale a pena ter em mente se vocĂŞ usar vocĂŞ mesmo.

Para vídeos em que as respostas que você deseja estão no áudio de um vídeo do YouTube e sua transcrição associada, Gemini funciona muito bem em resumir e fornecer respostas precisas (desde que os comentaristas mencionem quando um touchdown é descartado, bem como quando alguém é pontuado). Para qualquer tipo de informação visual, você ainda terá que assistir ao vídeo.



Source link