Eu optei por sair do treinamento de IA. Isso reduz minha influência futura?


Se todos começarmos a optar por sair de nossas postagens sendo usadas para modelos de treinamento, isso não reduzirá a influência de nossa voz e perspectivas únicas sobre esses modelos? Cada vez mais, os modelos serão a janela principal de todos para o resto do mundo. Parece que as pessoas que menos se preocupam com essas coisas serão as com mais dados que acabam treinando o comportamento padrão dos modelos.

—Data influenciador

Honestamente, é frustrante para mim que os usuários da Internet sejam forçados a optar por não participar inteligência artificial treinamento como padrão. Não seria bom se o consentimento afirmativo fosse a norma para empresas generativas de IA como elas Raspe a web E quaisquer outros repositórios de dados que possam encontrar para construir modelos de fronteira cada vez maiores e maiores?

Mas, infelizmente, esse não é o caso. Empresas gostam Openai e Google Argumentar que se Acesso ao uso justo Para todos esses dados, foram retirados deles, então nenhuma dessas tecnologias seria possível. Por enquanto, os usuários que não desejam contribuir para os modelos generativos estão presos a um pântano de processos de opção em diferentes sites e plataformas de mídia social.

Mesmo que a bolha atual em torno da IA ​​generativa apareça, assim como o bolha pontocom Depois de alguns anos, os modelos que alimentam todas essas novas ferramentas de IA não se extinguirão. Portanto, os fantasmas dos seus posts e tópicos de mídia social de nicho que defendem convicções fortemente constituídos viverão dentro das ferramentas de software. Você está certo que a opção de sair significa ativamente tentar não ser incluída em uma peça de cultura potencialmente duradoura.

Para abordar sua pergunta direta e realista, estes processos de exclusão são basicamente inúteis em seu estado atual. Aqueles que optam por não atualmente ainda estão influenciando o modelo. Digamos que você preencha um formulário para um site de mídia social não usar ou vender seus dados para treinamento de IA. Mesmo se essa plataforma respeitar esse pedido, existem inúmeras startups no Vale do Silício com crianças de 19 anos que não pensam duas vezes em raspar os dados publicados nessa plataforma, mesmo que não sejam tecnicamente. Como regra geral, você pode assumir que qualquer coisa que você já publicou on -line provavelmente o transformou em vários modelos generativos.

Ok, mas digamos que você possa bloquear realisticamente seus dados desses sistemas ou exigir que sejam removidos após o fato, diminuiriam sua voz ou impactariam no Ferramentas da AI? Estou pensando nessa pergunta há alguns dias e ainda estou dividido.

Por um lado, sua informação singular é apenas uma contribuição infinitesimalmente pequena para a vastidão do conjunto de dados, então sua voz, como uma figura ou autor não pública, provavelmente não está cutucando o modelo de uma maneira ou de outra.

Nesta perspectiva, seus dados são apenas mais um tijolo na parede de um edifício de 1.000 andares. E vale lembrar que a coleta de dados é apenas o primeiro passo na criação de um modelo de IA. Os pesquisadores passam meses ajustando o software para obter os resultados que desejam, às vezes confiando trabalhadores com baixos salários Rotular os conjuntos de dados e avaliar a qualidade da saída para o refinamento. Essas etapas podem abstrair ainda mais os dados e diminuir seu impacto individual.

No extremo oposto, e se compararmos isso com a votação em uma eleição? Milhões de votos são expressos nas eleições presidenciais americanas, mas a maioria dos cidadãos e defensores da democracia insiste que todo voto é importante – com um refrão constante de “fazer sua voz ouvir”. Não é uma metáfora perfeita, mas e se vissemos nossos dados como tendo um impacto semelhante? Um pequeno sussurro entre a cacofonia do ruído, mas ainda impactante na saída do modelo de IA.

Não estou totalmente convencido desse argumento, mas também não acho que essa perspectiva deva ser descartada. Especialmente para especialistas no assunto, suas idéias distintas e maneira de abordar as informações são exclusivamente valiosas para os pesquisadores da IA. Meta não teria passado pelo trabalho de usar todos esses livros em seu novo modelo de IA, se algum dado antigo faria o truque.

Olhando para o futuro, o verdadeiro impacto que seus dados podem ter nesses modelos provavelmente será inspirar Dados “sintéticos”. À medida que as empresas que fazem os sistemas generativos de IA ficam sem informações de qualidade para raspar, elas entrarão na era Ouroboros; Eles começarão a usar a IA generativa para replicar dados humanos que eles voltarão ao sistema para treinar o próximo modelo de IA para replicar melhor as respostas humanas. Enquanto a IA generativa existir, lembre -se de que você, como humano, sempre será uma pequena parte da máquina – se você quer ou não.



Source link