Então. Não tenho conhecimento profundo em como a tecnologia funciona.
Pretendo me aprofundar pra fazer um sistema próprio que identifique IA em textos. Acredito que demore pra essa funcionalidade sair, já que não sei nem por onde começar ainda. Mas meu objetivo é fazer isso usável e pratico.
Um ponto interessante é que a hugging face fica certeira com mais de 50 tokens, +- 50-60 palavras. E em grande parte dos sites, os paragrafos não são tão longos. Mas se der uma agrupada nos textos ele funciona. E a média disso é apresentada na ultima bolha de valores da extensão. A porcentagem média da página é a mais certeira.