A Luta dos Direitos Autorais na Era da Inteligência Artificial

A emergente era da inteligência artificial generativa trouxe à tona um embate inédito no mundo do direito autoral. Empresas de tecnologia vêm treinando modelos de IA utilizando vastos acervos de obras alheias – livros, imagens, músicas – enquanto autores, editoras e outros detentores de direitos reclamam do uso não autorizado (e não remunerado) de seus trabalhos. Esse confronto, antes restrito a debates teóricos, explodiu em batalhas judiciais reais.

Nos últimos meses, tribunais norte-americanos começaram a se pronunciar sobre se ensinar máquinas com conteúdo protegido seria uma forma legítima de inspiração e inovação ou uma violação em massa dos direitos autorais. As decisões iniciais indicam alguma tolerância com a prática, desde que o uso seja transformador e não prejudique os mercados originais – mas deixam claro que extrair material de fontes piratas ultrapassa os limites legais e pode acarretar punições severas.

Os Casos em Jogo

Um dos casos pioneiros é o da Anthropic, startup criadora do robô de IA Claude. Em junho de 2025, o juiz federal William Alsup, da Califórnia, decidiu que o treinamento dos modelos da Anthropic com obras literárias legalmente adquiridas configurou uso legítimo amparado na doutrina do fair use. Alsup entendeu que alimentar um modelo de linguagem com milhares de livros não substitui os originais, mas cria algo essencialmente novo – um uso “altamente transformador”, nas palavras do próprio juiz. Foi a primeira grande vitória jurídica de uma empresa de IA nesse tema, possivelmente influenciando dezenas de processos similares em andamento. Contudo, a vitória veio acompanhada de um asterisco importante: descobriu-se que a Anthropic havia construído parte de sua base de treino com mais de 7 milhões de livros obtidos em repositórios piratas, como as bibliotecas shadow Books3 e LibGen.

O juiz classificou essa conduta como claramente fora do escopo do fair use – afinal, a empresa “baixou milhões de cópias piratas […] e manteve essas cópias em sua biblioteca mesmo após decidir que não as usaria para treinar a IA”, conforme observou em sua decisão. Assim, Alsup permitiu que os autores lesados levem adiante a acusação de pirataria em julgamento, separando o que é uso justo do que é uso ilegal. As possíveis consequências econômicas desse desfecho são gigantescas: se cada obra pirateada for considerada uma violação intencional, a lei de direitos autorais dos EUA prevê multas de até US$ 150 mil por obra – em teoria, as penalidades totais no caso Anthropic poderiam chegar à casa das centenas de bilhões de dólares, valor capaz de quebrar qualquer empresa e muito superior ao próprio valuation da startup.

Outra disputa de grande repercussão envolve a Meta, controladora do Facebook e Instagram. Em julho de 2023, um grupo de 13 autores processou a Meta acusando-a de usar arquivos de livros pirateados (as chamadas shadow libraries) para treinar sua IA Llama. Neste mês, quase dois anos depois, a empresa obteve uma vitória: o juiz Vince Chhabria, de San Francisco, arquivou a ação contra a Meta, apontando falhas na demonstração de dano financeiro concreto aos autores. Chhabria concordou que o uso dos textos pela IA foi suficientemente transformador a ponto de ser considerado legítimo sob a lei de direitos autorais.

A decisão, porém, veio acompanhada de fortes obiter dicta (comentários paralelos) sinalizando os riscos dessa prática. O magistrado ponderou que os escritores poderiam ter um argumento convincente de que, ao treinar uma IA poderosa com obras protegidas, as big tech estariam criando uma ferramenta capaz de produzir um fluxo infinito de obras concorrentes – o que poderia prejudicar profundamente o mercado para os livros originais. “Não importa o quão transformador seja o treinamento da IA generativa, é difícil imaginar que possa ser justo usar livros protegidos por direitos autorais para desenvolver uma ferramenta para ganhar bilhões ou trilhões de dólares, ao mesmo tempo que permite a criação de um fluxo potencialmente infinito de obras concorrentes”, escreveu Chhabria em sua decisão.

Entre as obras citadas no processo contra a Meta estavam The Bedwetter, autobiografia da comediante Sarah Silverman, e A Fantástica Vida Breve de Oscar Wao, romance de Junot Díaz – ambas supostamente incorporadas sem licença no dataset de treinamento. A Meta comemorou o arquivamento, afirmando em nota que os modelos abertos de IA “impulsionam inovações transformadoras” e que o fair use de material protegido é um elemento legal vital para o desenvolvimento tecnológico. Importante destacar que Chhabria não fechou a porta a novas ações: ele indicou que um processo futuro mais bem embasado – por exemplo, demonstrando efetivamente o prejuízo comercial sofrido pelos autores – poderá ter mais sucesso em contestar a empresa.

Já a OpenAI, responsável pelo conhecido ChatGPT, enfrenta uma batalha judicial em estágio mais inicial, porém igualmente significativa. Nos EUA, uma ação coletiva movida pela associação Authors Guild e diversos escritores em 2023 acusa a OpenAI de ter copiado integralmente livros inteiros sem autorização para treinar seus modelos. No mesmo ano, o jornal The New York Times apresentou queixa semelhante contra a empresa.

Esses processos foram unificados, e em 2025 o caso avançou para a fase de produção de provas – a Justiça ordenou que a OpenAI preserve registros internos do treinamento (logs) e negou os pedidos da empresa para arquivar a ação, sinalizando que as alegações dos autores têm mérito suficiente para seguirem adiante. Assim como Anthropic e Meta, a OpenAI argumenta que seu uso das obras é amparado pelo fair use; contudo, os autores alegam que ferramentas como o ChatGPT podem derivar textos muito similares aos originais, ou permitir que usuários obtenham resumos e conteúdos derivados que substituem a leitura das obras protegidas, afetando os ganhos dos criadores. O embate ainda não tem previsão de julgamento, e a OpenAI – avaliada em bilhões de dólares – vem montando sua defesa enquanto lida com o escrutínio público e regulatório.

Vale notar que esses não são casos isolados. Dezenas de processos semelhantes tramitam atualmente, incluindo ações contra outras gigantes da tecnologia. A própria seção de tecnologia do tribunal público norte-americano se vê inundada: músicos, artistas visuais, jornalistas e editoras de notícias também processaram empresas de IA por uso não consentido de suas criações. Até a Microsoft foi alvo de uma ação por supostamente usar livros em treinamentos de IA sem permissão. Trata-se, portanto, de um conflito multidimensional que abrange diferentes setores criativos – todos buscando definir onde termina a inovação tecnológica e onde começa a violação de direitos.

O Que Está em Disputa

No cerne dessas batalhas legais está a interpretação da doutrina do fair use (conhecida no Brasil como “uso justo” ou “uso legítimo”). Prevista na lei norte-americana, essa doutrina estabelece exceções em que materiais protegidos por direitos autorais podem ser usados sem autorização, desde que atendam a certos critérios – especialmente que o novo uso seja transformador (ou seja, que não substitua a obra original e agregue algo de novo) e que não cause prejuízo indevido ao mercado daquela obra.

As empresas de IA defendem que treinar um modelo com milhares de obras é um uso transformador e inevitável para a inovação tecnológica, pois a IA não reproduz os textos ipsis litteris, mas sim aprende padrões para gerar algo diferente. Um modelo de linguagem, argumentam eles, assemelha-se a um leitor humano que absorve conhecimento de muitos livros para escrever algo original. De fato, o juiz Alsup concordou que “o que humanos fazem ao ler e memorizar não é diferente em espécie do que computadores fazem ao treinar um modelo”, rejeitando a ideia de que haveria uma distinção fundamental entre aprendizado humano e de máquina nesse contexto.

Por outro lado, autores e juristas alertam que a escala e a natureza do processo de treinamento de IA fogem da analogia simples com um leitor humano. Uma coisa é uma pessoa ler diversos livros e se inspirar; outra é uma empresa copiar milhões de obras integrais para alimentar um sistema comercial que pode replicar partes dessas obras ou criar derivações concorrentes em segundos. O temor dos criadores é que, sem limites, as IAs possam diluir o valor econômico e moral do trabalho autoral.

O juiz Chhabria, no caso Meta, ecoou essa preocupação ao visualizar um cenário em que os modelos gerativos permitam a qualquer um produzir textos no estilo de escritores famosos ou gerar conteúdos substitutos, inundando o mercado e minando a demanda pelas obras originais. A dificuldade de provar esse dano de forma concreta – mensurando quantos livros deixariam de ser vendidos por causa de uma IA, por exemplo – tem sido um obstáculo para os autores nos tribunais, como visto no arquivamento do processo contra a Meta. Ainda assim, a discussão permanece em aberto: até que ponto o treinamento de IA representa um avanço inevitável e benéfico, e quando ele cruza a linha para se tornar exploração indevida do trabalho alheio?

Outro ponto em disputa é a origem do material utilizado. Mesmo juízes favoráveis ao fair use, como Alsup, fazem distinção entre usar conteúdos obtidos de forma legal (comprados ou disponíveis publicamente) e conteúdos pirateados sem qualquer remuneração aos autores. No caso Anthropic, essa diferença ficou evidente: o treinamento em si foi perdoado, mas a construção de um banco de dados com cópias ilícitas não. Essa nuance indica que, mesmo que a prática de treinar IAs venha a ser reconhecida como legítima em termos de direito autoral, as empresas precisarão rever a forma como adquirem seus dados. Contribui para isso a pressão pública e de mercado para que haja mais transparência sobre os chamados datasets de treinamento – muitos dos quais foram compilados discretamente a partir de sites, redes sociais e repositórios diversos. A questão de fundo, portanto, não é apenas jurídica, mas também ética e econômica: se IAs agregam valor a partir de conteúdo de terceiros, os criadores originais deveriam ser compensados ou ao menos consultados?

Possíveis Caminhos

As decisões judiciais recentes, embora favoráveis às empresas de IA em certos aspectos, não encerram a controvérsia – pelo contrário, inauguram uma nova fase. Uma consequência imediata pode ser a mudança de comportamento das próprias empresas: diante do risco de multas astronômicas e danos à reputação, é provável que startups e gigantes de IA passem a buscar fontes legais de treinamento, firmando parcerias ou pagando por licenças de grandes bases de texto, imagem e áudio. Já se fala, por exemplo, em modelos de negócio onde editoras e plataformas de conteúdo sejam remuneradas pelo uso de seus acervos em inteligência artificial, num esquema parecido com o que ocorreu no passado com a indústria musical após confrontos com plataformas digitais.

Do lado dos criadores, a mobilização também cresce. Sindicatos de escritores, associações de fotógrafos, músicos e estúdios de cinema têm se organizado para pressionar por reformas legais que esclareçam os limites do uso de dados em IAs. Uma ideia em discussão é a criação de um tipo de direito conexo ou nova exceção que trate explicitamente de mineração de texto e dados – tema já debatido em legislações da União Europeia e outros países. Nos Estados Unidos, por enquanto, as batalhas estão sendo travadas caso a caso, sob leis existentes e interpretações judiciais. Mas a pressão para que o Congresso ou as cortes superiores se manifestem tende a aumentar conforme esses litígios avancem (o próprio juiz Alsup observou que seu veredicto pode servir de modelo para outros tribunais).

Enquanto isso, surgem propostas de soluções técnicas e colaborativas para amenizar o impasse. A organização sem fins lucrativos Creative Commons, por exemplo, lançou o projeto CC Signals, que busca implementar um tipo de marca d’água legal e técnica no conteúdo publicado online – um sinal pelo qual cada autor ou detentor de dados poderia declarar se, e em que condições, aceita que seu material seja reutilizado por sistemas de IA. Em tese, ferramentas de busca e web crawlers de IA poderiam ler esses sinais e respeitar as preferências dos criadores, excluindo determinado conteúdo de seus datasets ou garantindo atribuição e compensação quando previsto. Embora iniciativas como o CC Signals ainda estejam em fase inicial e dependam de adesão voluntária (ou futura exigência legal), elas mostram uma busca por soluções práticas que evitem o tudo ou nada – isto é, nem um ambiente de faroeste digital onde vale copiar tudo, nem um bloqueio total que impeça avanços da IA.

Outra frente possível é o avanço de tecnologias de watermarking e detecção de conteúdo gerado por IA, o que poderia dar aos autores meios de rastrear se trechos de suas obras aparecem em outputs de modelos e buscar reparação. Grandes empresas de tecnologia também discutem códigos de conduta voluntários e padrões de transparência, comprometendo-se a informar, por exemplo, quais fontes alimentaram seus modelos. Embora tais medidas não resolvam a questão central (o consentimento e a remuneração pelo uso), elas podem construir boa vontade e reduzir assimetrias de informação enquanto o arcabouço jurídico não se define por completo.

Desdobramentos

A luta dos direitos autorais na era da inteligência artificial está apenas no começo, e seus desdobramentos permanecem incertos. As decisões envolvendo Anthropic e Meta mostraram que os tribunais enxergam mérito tanto na proteção à inovação das IAs quanto nas queixas dos autores lesados – cabendo um equilíbrio delicado caso a caso. A OpenAI e outras empresas em litígio terão seus modelos de negócio examinados minuciosamente sob a luz de leis concebidas em um tempo pré-IA, o que cria terreno fértil para jurisprudências contraditórias até que instâncias superiores ou legislações atualizadas tracem linhas mais claras.

Nesse ínterim, cada vitória de um lado tende a ser parcial e temporária. A Anthropic, por exemplo, ganhou no princípio do fair use, mas ainda pode enfrentar consequências pelo uso de material pirata. A Meta escapou de um processo agora, mas outros virão possivelmente mais robustos. E para os autores, cada sentença traz tanto frustrações quanto esperanças: se por um lado veem tribunais acolhendo o argumento do uso transformador, por outro lado testemunham juízes atentos ao potencial impacto econômico adverso que a IA descontrolada pode gerar em seus mercados.

Economicamente, bilhões de dólares estão em jogo – seja na forma de indenizações e multas bilionárias, seja na forma de royalties e acordos futuros que podem ser estabelecidos. Tecnicamente, o rumo das pesquisas em IA pode ser influenciado: modelos abertos ou baseados apenas em dados livres talvez ganhem força se o cerco a dados proprietários se fechar, enquanto abordagens de treinamento mais eficientes (que requerem menos dados) podem ser valorizadas para mitigar riscos legais.

Socialmente e culturalmente, o resultado dessa disputa afetará a relação entre criadores e tecnologia nos próximos anos. Encontrar um equilíbrio é fundamental para que a inovação da inteligência artificial avance sem anular os incentivos à criação humana. Como em todo conflito de proporções históricas, é possível que a solução final surja não de um lado vencendo o outro completamente, mas de compromissos e novos frameworks que hoje ainda estão em gestação.

Por ora, o que se vê é uma guerra de atrito prolongada, em que cada decisão judicial se torna um precedente observado mundialmente. O desfecho definitivo pode demorar – e, até lá, advogados e estrategistas de ambos os lados permanecem em alerta máximo, cientes de que qualquer movimentação (seja uma nova prova de uso indevido, seja um vazamento expondo práticas internas das empresas) pode virar o jogo. A única certeza é que a tensão entre direitos autorais e inteligência artificial veio para ficar, exigindo atenção constante de legisladores, juristas, tecnólogos e criadores. A história está sendo escrita agora, nos tribunais e fora deles, e seu capítulo final ainda está longe do ponto final.

A Luta dos Direitos Autorais na Era da Inteligência Artificial

Os Casos em Jogo

O Que Está em Disputa

Possíveis Caminhos

Desdobramentos

Leia Mais

últimos artigos

explore mais

literatura

repertório