Apple, Nvidia, Anthropic e outras empresas de tecnologia teriam utilizado mais de 170 mil vídeos do YouTube sem consentimento para treinar modelos de IA
As companhias utilizaram o dataset “The Pile”, que possui um subconjunto de dados de legendas chamado “YouTube Subtitles”, para coletar informações, incluindo conteúdo educacional e de grandes meios de comunicação como Wall Street Journal. Criadores famosos como MrBeast, Marques Brownlee e PewDiePie também tiveram seus vídeos usados sem autorização. A Anthropic afirma que as legendas cobrem apenas uma pequena parte do dataset. As informações são do site Proof.