Bot da OpenAI derruba site ao realizar atividade semelhante a um “ataque DDoS”
O CEO da Triplegangers, Oleksandr Tomchuk, foi alertado sobre a queda do site de e-commerce da empresa, inicialmente identificada como vítima de um ataque DDoS. No entanto, ao investigar a causa, Tomchuk descobriu que o problema estava relacionado a um bot da OpenAI, que tentava raspar dados do site.
A Triplegangers possui mais de 65 mil produtos, cada um com uma página própria e pelo menos três fotos. Segundo Tomchuk, a OpenAI estava enviando “dezenas de milhares” de solicitações para baixar o conteúdo, incluindo centenas de milhares de fotos e suas descrições detalhadas. De acordo com Tomchuk, a OpenAI utilizou 600 IPs para realizar a coleta de dados.
A Triplegangers, uma empresa com sete funcionários, passou mais de uma década criando o maior banco de dados de “dublês digitais humanos” na web, contendo arquivos de imagem 3D escaneados de modelos humanos reais. A empresa oferece arquivos de objetos 3D e fotos — desde mãos e cabelos até pele e corpos inteiros — voltados para artistas 3D, criadores de videogames e outros que necessitam recriar digitalmente características humanas autênticas.
Embora a página de termos de serviço do site proíba o uso de bots para coletar conteúdo sem permissão, o único recurso técnico capaz de impedir essas ações é o arquivo “robots.txt”, que a OpenAI afirma respeitar em seus bots.
No entanto, Tomchuk ainda não conseguiu determinar exatamente o que foi extraído pelo bot ou como remover esse material. Ele também não encontrou uma maneira eficaz de contatar a OpenAI para esclarecer a situação. Tomchuk sugere que as empresas deveriam solicitar permissão antes de realizar esse tipo de coleta, em vez de deixar para os sites a responsabilidade de bloquear os bots.