Ai está usando seus gostos para entrar na sua cabeça


Qual é o futuro do botão semelhante na era de inteligência artificial? Max Levchin– O co -fundador do PayPal e o CEO afirmativo – veja um papel novo e extremamente valioso para gostar de dados para treinar a IA para chegar a conclusões mais alinhadas com aqueles que um fabricante de decisão humano faria.

É um dilema bem conhecido no aprendizado de máquina que um computador apresentado com uma função de recompensa clara se envolverá em um aprendizado implacável de reforço para melhorar seu desempenho e maximizar essa recompensa-mas que esse caminho de otimização geralmente leva os sistemas de IA a resultados muito diferentes do que resultariam de humanos que exercem julgamento humano.

Para introduzir uma força corretiva, os desenvolvedores de IA usam frequentemente o que é chamado de aprendizado de reforço com o feedback humano (RLHF). Essencialmente, eles estão colocando um polegar humano na balança à medida que o computador chega ao seu modelo, treinando -o em dados que refletem as preferências reais das pessoas reais. Mas de onde vem esses dados de preferência humana e quanto é necessário para que a entrada seja válida? Até agora, esse tem sido o problema com o RLHF: é um método caro se exigir que a contratação de supervisores e anotadores humanos insira feedback.

E esse é o problema que Levchin acha que pode ser resolvido pelo botão LIME. Ele vê o recurso acumulado em que hoje está em FacebookAs mãos são uma dádiva de Deus para qualquer desenvolvedor que deseje treinar um agente inteligente em dados de preferência humana. E qual é o tamanho disso? “Eu argumentaria que uma das coisas mais valiosas possui o Facebook é a montanha de dados de gostar”, disse Levchin. De fato, nesse ponto de inflexão no desenvolvimento da inteligência artificial, tendo acesso ao “que conteúdo é apreciado pelos seres humanos, usar para o treinamento de modelos de IA, é provavelmente uma das coisas singularmente mais valiosas da Internet”.

Enquanto Levchin imagina a AI aprendendo com as preferências humanas através do botão LIME, a IA já está mudando a maneira como essas preferências são moldadas em primeiro lugar. De fato, as plataformas de mídia social estão usando ativamente a IA não apenas para analisar curtidas, mas para prever – potencialmente tornando o botão obsoleto.

Essa foi uma observação impressionante para nós porque, como conversávamos com a maioria das pessoas, as previsões vieram principalmente de outro ângulo, descrevendo não como o botão semelhante afetaria o desempenho da IA, mas como a IA mudaria o mundo do botão LIFT. Já ouvimos que a IA está sendo aplicada para melhorar os algoritmos de mídia social. No início de 2024, por exemplo, o Facebook experimentou usando ai Para redesenhar o algoritmo que recomenda os vídeos do Reels para os usuários. Poderia criar uma melhor ponderação de variáveis ​​para prever qual vídeo um usuário mais gostaria de assistir a seguir? O resultado desse teste inicial mostrou que poderia: aplicar a IA à tarefa paga em tempos de vigia mais longos – a métrica de desempenho que o Facebook esperava aumentar.

Quando perguntamos YouTube cofounder Steve Chen what the future holds for the like button, he said, “I sometimes wonder whether the like button will be needed when AI is sophisticated enough to tell the algorithm with 100 percent accuracy what you want to watch next based on the viewing and sharing patterns themselves. Up until now, the like button has been the simplest way for content platforms to do that, but the end goal is to make it as easy and accurate as possible with whatever data is available.”

Ele continuou apontando, no entanto, que um dos motivos que o botão semelhante pode ser sempre necessário é lidar com mudanças nítidas ou temporárias na visualização de necessidades devido a eventos ou situações da vida. “Há dias em que eu quero assistir conteúdo que é um pouco mais relevante para, por exemplo, meus filhos”, disse ele. Chen também explicou que o botão semelhante pode ter longevidade por causa de seu papel na atração de anunciantes – o outro grupo -chave ao lado dos espectadores e criadores – porque os semelhantes atuam como a dobradiça mais simples possível para conectar esses três grupos. Com uma torneira, um espectador transmite simultaneamente apreciação e feedback diretamente ao provedor de conteúdo e evidência de engajamento e preferência ao anunciante.



Source link