Interessante, mas como ele resolve nomes que dependem do contexto? Por exemplo, dependendo da nacionalidade, alguns nomes podem ser de um gênero ou outro. Testei com "Yuri", que no Japão é um nome feminino, mas na Rússia é masculino. O resultado foi masculino:
{
"name": "Yuri",
"gender": "male",
"score": 0.9507206678390503,
"full_result": [
{ "label": "male", "score": 0.9507206678390503 },
{ "label": "female", "score": 0.04927927255630493 }
]
}
Entendo que ele não dá 100% de certeza, mas ainda sim, um japonês poderia achar que 4,9% é bem baixo para o contexto dele. E não é um problema só do Japão, pois há muitas garotas nipo-brasileiras com este nome, por exemplo (dependendo da aplicação, os resultados teriam que ser ajustados).
E tem vários outros casos: Andrea (masculino na Itália, feminino no Brasil), Kim, Alisson, etc. Tem como ajustar algum parâmetro para que ele considere nacionalidade (ou qualquer outro fator que ajude a desambiguar)? Também fiquei curioso pra saber como ele determina essas probabilidades (quais as fontes dos dados, por exemplo).