OpenAI alega que não pode lucrar sem ter acesso a materiais protegidos por direitos autorais
A empresa está solicitando ao Parlamento Britânico a permissão para utilizar obras protegidas por direitos autorais, argumentando que "seria impossível treinar os modelos líderes de hoje" sem esse acesso.
Em um documento apresentado, a companhia sustenta que o uso exclusivo de conteúdo do domínio público seria insuficiente para treinar os grandes modelos de linguagem em desenvolvimento, destacando que os direitos autorais abrangem praticamente todos os tipos de expressão humana, incluindo postagens em blogs, fotografias, postagens em fóruns, fragmentos de código de software e documentos governamentais, e que "limitar os dados de treinamento a livros e obras do domínio público criados há mais de um século pode resultar em um experimento interessante, mas não produzirá sistemas de IA que atendam às necessidades dos cidadãos de hoje".
Em resposta, uma advogada alega que a "decisão da empresa de copiar os trabalhos dos autores, sem oferecer qualquer escolha ou compensação, ameaça o papel e a subsistência dos escritores como um todo".
A OpenAI também está buscando estabelecer parcerias com editoras, embora considere difícil imaginar que todos os jornais, sites ou editoras aceitem tais termos de forma generalizada, especialmente escritores independentes que dependem de seus direitos autorais para sustento.