Muito antes de responder dúvidas e ajudar a simplificar tarefas, uma inteligência artificial (IA) passa por um processo de treinamento que envolve a coleta, curadoria e análise de dados.

Uma das técnicas usada nesse processo é capaz de organizar e processar grandes volumes de informação de maneira totalmente automatizada: a Text and Data Mining (TDM), em português, mineração de dados e textos. Mas o metodo tem sido alvo de restrições regulatórias e batalhas judiciais sobre direitos autorais.

+ OpenAI incluirá controle para pais no ChatGPT após morte de adolescente

+ Dona do ChatGPT abre escritório em SP

“A TDM também é utilizada em outras áreas: em escritórios de patentes, laboratórios e até mesmo pesquisa acadêmica. Na época da Covid-19, ela foi aplicada para conseguir filtrar artigos publicados sobre a doença e conseguir melhores insights das descobertas sobre o vírus ”, explica Marina Garrote, coordenadora da pesquisa.

Um levantamento do Reglab mapeou legislações autorais de 50 países e identificou que o Brasil faz parte de grupo com mais restrições no uso de TDM para treinamento de IAs, graças a Lei dos Direitos Autorais de 1998 (L.9610/98).

Mas afinal, isso pode deixar o Brasil pra trás na corrida global da IA?

Flexibilizar ou restringir TDM? 

Argentina, Chile, Cazaquistão e Rússia são, assim como o Brasil, locais considerados de ‘baixa permissividade’ para treinamento de IAs.

Em países como Japão e Alemanha o uso da técnica de TDM é expressamente autorizado e permite a comercialização dos resultados. A União Europeia conta com uma diretiva que introduz exceções específicas para TDM, tanto para fins de pesquisa científica quanto para fins gerais, inclusive comerciais.

Nos EUA, a legislação tem o fair use (uso justo), um conceito flexível que permite, em determinadas circunstâncias, o uso de obras protegidas sem autorização, inclusive para mineração de dados.

Mas mesmo com a existência do fair use, a OpenAI e o New York Times travam uma batalha judicial em terras americanas há pelo 2 anos, após o jornal acusar a empresa de violação de direitos autorais. No início de 2025, o juiz responsável pelo caso rejeitou uma petição para o encerramento do processo, indicando que nem sempre a flexibilidade legislativa vai favorecer a parte violadora dentro dos tribunais.

Legislação no Brasil

O caso ‘New York Times x OpenAI’ inspirou o jornal Folha de S. Paulo, que entrou neste ano com uma ação contra a OpenAI por concorrência desleal, afirmando que a gigante da tecnologia utiliza seu conteúdo para treinar modelos de IA, além de disponibilizar reportagens na íntegra (inclusive matérias pagas).

“Ao contrário dos EUA, nossa Lei de Direitos Autorais não contempla exceções amplas como o fair use, mas sim hipóteses taxativas e bastante restritivas de uso obras sem autorização, como para fins educacionais ou citação”, explica o advogado Fernando Canutto, especialista em Propriedade Intelectual.

Uma pesquisa feita pela BigDataCorp mostrou que entre 2023 e 2025, o número de empresas que possuem “IA”, “inteligência artificial” e termos relacionados à tecnologia emergente em seus nomes cresceu 857% no Brasil. 

São Paulo e o Distrito Federal abrigam 47% das empresas do tipo no país, sendo que a capital paulista conta com uma média de R$ 800 mil investidos por CNPJ.

Os números mostram que o momento exige uma nova análise para avaliar se a legislação atual é capaz de manter o país na corrida global das IAs sem prejudicar titulares de obras protegidas por direitos autorais.

“Essas empresas criaram ferramentas poderosas aos custos de uma produção intelectual de milhares de criadores brasileiros. Esses criadores precisam ser reconhecidos e, é claro, remunerados”, afirma Mariana Mello, diretora Jurídica da Abramus (Associação Brasileira de Música e Artes), em entrevista à IstoÉ Dinheiro.

Entidades culturais pedem proteção

Em 2024, o Senado aprovou o marco regulatório da inteligência artificial, que busca garantir segurança jurídica e ética no uso da tecnologia, além de proteger os direitos fundamentais.

A Comissão Especial sobre Inteligência Artificial da Câmara dos Deputados, que discute o PL 2.338/23, aprovou um plano de trabalho que prevê a realização de audiências públicas sobre o tema. A próxima sessão ocorre na próxima terça-feira, 9, em Brasília, a partir das 13h30. 

“Vamos realizar essas audiências para discutir direitos autorais. Pretendo participar dos debates e ouvir os representantes de cada setor para avaliar em conjunto qual será o melhor caminho a seguir”, afirmou o deputado federal Aguinaldo Ribeiro (Progressistas-PB), relator do projeto, em declaração à Dinheiro.

Na última terça-feira, 2, entidades culturais se uniram e enviaram uma carta conjunta à Câmara dos Deputados solicitando proteção a autores e artistas.

Um dos trechos reforça a importância de que “titulares de direitos autorais tenham ciência e controle sobre o uso de suas obras no desenvolvimento de sistemas de IA, bem como garantias quanto à eventuais violações”.

“A lei atual já protege os titulares das obras, mas eles querem abrir brechas. Estaremos em Brasília e levaremos representantes da nossa classe. A cultura brasileira está sendo usurpada por meia dúzia de empresas, não podemos permitir”, alerta Mello.