A Folha entrou com uma ação judicial contra a OpenAI nesta quarta-feira (20) requerendo que a dona da plataforma de inteligência artificial ChatGPT pare de coletar e usar, sem autorização e pagamento, o conteúdo do jornal.
Também foi pedido o pagamento de indenização por uso indevido das publicações para treinamento de modelos de IA e por fornecer aos usuários resumos e reproduções na íntegra de conteúdo jornalístico, inclusive artigos restritos para assinantes, sem autorização nem pagamento.
A ação acusa a OpenAI de concorrência desleal e violação de direitos autorais, uma vez que “o réu desenvolve e aprimora sua ferramenta de IA […] com base em conteúdo alheio […] sem autorização e sem o pagamento de qualquer remuneração”. Além disso, em resposta a prompts (comandos) dos usuários, reproduz reportagens na íntegra no mesmo dia em que são publicadas, o que desvia “a ‘clientela’ —no caso, os internautas— de forma ilegítima”, consta no processo judicial.
“Há uma nítida prática de concorrência desleal, na medida em que a OpenAI acessa o site da Folha diariamente, driblando os mecanismos do jornal para que isso não ocorra, e distribui o conteúdo para os internautas, com isso tirando a audiência do jornal. As tecnologias que a Folha adota para impedir a prática são solenemente ignoradas ou contornadas pelo réu”, diz a advogada do jornal Taís Gasparian.
A ação, impetrada na Justiça de São Paulo, é semelhante à protocolada pelo jornal The New York Times por violação de direitos autorais contra a OpenAI e a Microsoft nos Estados Unidos em dezembro de 2023. A publicação norte-americana afirma que a empresa de IA deveria pagar bilhões de dólares em indenização por “copiar e usar de forma ilegal o valioso conteúdo”.
O veículo também requer que a OpenAI destrua os modelos de inteligência artificial que usaram seu material protegido, requisição também feita pela Folha em sua ação judicial. O NYT assinou contrato para remuneração pelo uso de seu conteúdo com outra empresa de inteligência artificial, a Amazon.
A Folha anexa à ação documentos que mostram como a companhia liderada por Sam Altman utilizou o site e arquivo do jornal para treinar seu modelo de linguagem. Em um repositório da plataforma GitHub mantido por funcionários da OpenAI, o UOL aparece em lista dos principais domínios que compõem o conjunto de dados de treinamento do ChatGPT. O domínio da Folha é https://www.folha.uol.com.br, uma vez que é hospedado pelo provedor UOL. Por isso, o conteúdo da Folha está contemplado no domínio UOL. O jornal O Globo também aparece como fonte para treinamento.
Além disso, apenas no mês de julho, a Folha registrou mais de 45 mil acessos a seu site feitos por GPT bots, cuja finalidade declarada é o treinamento de modelos da empresa.
O jornal também inclui na ação exemplos em que o ChatGPT reproduz na íntegra ou resume reportagens em resposta a prompts dos usuários. Muito desse conteúdo está sob paywall, ou seja, é restrito para assinantes. E, mesmo assim, é vedada a reprodução do conteúdo sem pagamento de direitos.
A ação pede decisão liminar para interromper imediatamente o uso do conteúdo da Folha. O valor da indenização seria determinado posteriormente.
“Para que a imprensa sobreviva, ela precisa ser remunerada, não sendo possível que o aproveitamento do seu conteúdo seja feito sem qualquer remuneração e autorização. A OpenAI se aproveita de todos os investimentos que a Folha faz para veicular notícias atuais e fidedignas, sem qualquer contraprestação”, diz Gasparian.
Segundo Monica Galvão, também advogada do jornal, diante da tendência de concentração do mercado de comunicação em torno das big techs, “deve-se prestigiar os veículos de mídia nacionais”. “Deve-se ter claro que esses modelos de IA funcionam às custas dos conteúdos produzidos e custeados pela imprensa, que deve ser remunerada por isso.”
A Folha tentou negociar um acordo com a OpenAI no ano passado, mas as conversas não avançaram, “por decisão unilateral do réu”, segundo a ação. “O último email enviado pela autora ficou sem resposta, o que reforça a atitude de descaso do réu.”
O pagamento de direitos autorais por conteúdo protegido usado em treinamento de modelos de IA consta do projeto de lei 2.338 aprovado no Senado em dezembro de 2024, atualmente em tramitação na Câmara.
Em entrevista ao jornal O Globo na semana passada, Nicolas Robinson Andrade, diretor da OpenAI para a América Latina, afirmou que a empresa se opõe ao pagamento de direitos autorais previsto no projeto de lei e compara a remuneração para autores de conteúdo jornalístico, artístico e literário a impostos sobre cadeiras. “É como se o Brasil se tornasse o único país do mundo a taxar a fabricação de cadeiras. Aí é natural que as fábricas de cadeiras no futuro não sejam construídas aqui.”