API do Bluesky permite extração de dados públicos para treinamento de IA
De acordo com um relatório, Daniel van Strien, Gestor de Repositório de Aprendizado de Máquina, utilizou a API Firehose do Bluesky para extrair um milhão de postagens públicas da rede social. O objetivo era viabilizar pesquisas e estudos relacionados a aprendizado de máquina, com o conjunto de dados sendo inicialmente disponibilizado em um repositório público. No entanto, devido à controvérsia gerada, Van Strien optou por remover os dados.
O ocorrido destaca que qualquer conteúdo publicado de forma pública no Bluesky pode ser facilmente acessado e utilizado, incluindo para treinamento de IAs. Embora a própria rede social tenha afirmado que não empregará esses dados para esse fim, isso não impede que terceiros os utilizem. A Bluesky informa que está explorando formas de permitir que os usuários expressem externamente suas preferências de consentimento quanto ao uso de dados, mas reconhece que a decisão de respeitar essas preferências caberá a quem acessar os dados. A plataforma prometeu divulgar mais detalhes sobre o assunto “em breve”.