Sempre utilizei o jMetter, e sempre me atendeu bem...
Uma coisa que você precisa ter em mente é que os teus testes precisam ser padronizados e replicáveis se você quiser que eles sejam consistentes. Ou seja, você precisa executar eles com o mesmo ambiente e mesma carga.
Por exemplo, o ideal seria você ter um ambiente de teste/homologação, semelhante ao teu ambiente produtivo, e que você possa limpar (ou popular) a base de dados sempre que necessário, pois a quantidade de dados no teu database pode impactar no resultado final do teu teste (visto que mais dados tendem a levar mais tempo para serem carregados), então você precisa achar um ponto ideal que lhe atenda, que pode ser uma base zerada, ou com uma quantidade x de registros no inicio...outra coisa importante também, é que se, por questão de custos, você estiver rodando isso tudo numa máquina só, os serviços vão concorrer entre si e isso vai ser meio aleatório mesmo...pra diminuir essa aleatoriedade, você pode colocar cada serviço num container docker e limitar a quantidade de vcpu e memória do container...