‘Neo-Nazi Madness’: o principal advogado de IA da Meta sobre por que ele demitiu a empresa


A única exceção a isso é o UMG v. Antrópico caso, porque pelo menos no início, as versões anteriores do Anthropic gerariam as letras das músicas na saída. Isso é um problema. A situação actual desse caso é que implementaram salvaguardas para tentar evitar que isso aconteça, e as partes concordaram que, enquanto se aguarda a resolução do caso, essas salvaguardas são suficientes, por isso já não procuram uma liminar.

No final das contas, a questão mais difícil para as empresas de IA não é é legal participar de treinamento? Isso é o que você faz quando sua IA gera resultados muito semelhantes a um trabalho específico?

Você espera que a maioria desses casos vá a julgamento ou você vê acordos no horizonte?

Pode muito bem haver alguns assentamentos. Espero ver acordos com grandes jogadores que possuem grandes quantidades de conteúdo ou conteúdo particularmente valioso. O New York Times pode acabar com um acordo e um acordo de licenciamento, talvez onde a OpenAI pague dinheiro para usar o conteúdo do New York Times.

Há dinheiro suficiente em jogo e provavelmente obteremos pelo menos alguns julgamentos que estabeleçam os parâmetros. Os demandantes da ação coletiva, acho que eles têm estrelas nos olhos. Existem muitas ações coletivas, e meu palpite é que os réus resistirão a elas e esperarão vencer no julgamento sumário. Não é óbvio que eles vão a julgamento. O Supremo Tribunal no Google x Oracle O caso empurrou fortemente a lei do uso justo no sentido de ser resolvido por julgamento sumário, e não na frente de um júri. Acho que as empresas de IA vão se esforçar muito para que esses casos sejam decididos por julgamento sumário.

Por que seria melhor para eles vencer no julgamento sumário do que no veredicto do júri?

É mais rápido e mais barato do que ir a julgamento. E as empresas de IA estão preocupadas com a possibilidade de não serem vistas como populares, com o fato de muitas pessoas pensarem, Ah, você fez uma cópia do trabalho que deveria ser ilegal e não se aprofundar nos detalhes da doutrina do uso justo.

Houve muitos acordos entre empresas de IA e meios de comunicaçãoprovedores de conteúdo e outros detentores de direitos. Na maioria das vezes, esses acordos parecem ser mais sobre pesquisa do que modelos fundamentais, ou pelo menos é assim que me foram descritos. Na sua opinião, licenciar conteúdo para uso em mecanismos de busca de IA – onde as respostas são obtidas por geração aumentada de recuperação ou RAG – é algo legalmente obrigatório? Por que eles estão fazendo isso dessa maneira?

Se você estiver usando a geração aumentada de recuperação em conteúdo direcionado e específico, seu argumento de uso justo se tornará mais desafiador. É muito mais provável que a pesquisa gerada por IA gere texto retirado diretamente de uma fonte específica na saída, e é muito menos provável que seja um uso justo. Quero dizer poderia ser – mas a área arriscada é que é muito mais provável que esteja competindo com o material original. Se, em vez de direcionar as pessoas para uma história do New York Times, eu lhes der meu prompt de IA que usa RAG para extrair o texto diretamente daquela história do New York Times, isso parece uma substituição que pode prejudicar o New York Times. O risco legal é maior para a empresa de IA.

O que você deseja que as pessoas saibam sobre as lutas generativas de direitos autorais da IA ​​​​que elas talvez ainda não saibam ou sobre as quais possam estar mal informadas?

O que ouço com mais frequência e que está errado do ponto de vista técnico é o conceito de que se trata apenas de máquinas de plágio. Tudo o que eles estão fazendo é pegar minhas coisas e depois devolvê-las na forma de texto e respostas. Eu ouço muitos artistas dizerem isso, e ouço muitos leigos dizerem isso, e simplesmente não é certo do ponto de vista técnico. Você pode decidir se a IA generativa é boa ou ruim. Você pode decidir se é legal ou ilegal. Mas é realmente algo fundamentalmente novo que nunca experimentamos antes. O fato de que ele precisa treinar em um monte de conteúdo para entender como as frases funcionam, como funcionam os argumentos e para entender vários fatos sobre o mundo não significa que seja apenas copiar e colar coisas ou criar uma colagem. Realmente está gerando coisas que ninguém poderia esperar ou prever, e está nos dando muito conteúdo novo. Acho que isso é importante e valioso.



Source link