New Relic
É a ferramenta que mais gosto e utilizo em projetos pequenos. Se gerar menos de 100GB de dados por mês é 100% gratuito.
Datadog
Caro demais, sempre tem alternativas melhores, plano free extremamente limitado
Dynatrace
Funciona muito bem para Java. Nunca testei com outra stack pois acho seu preço elevado.
Elastic
INFERNO de configurar. Ou paga o serviço gerenciado por eles ou gastará horas e horas mantendo ele.
Fora isso a ferramenta é incrível.
Prometheus e Grafana
Se você quer ter controle e não se preocupar com preço iria com eles. Subiria num servidor meu e manteria.
Repondendo as perguntas
O que preciso monitorar, observar e analisar?
Server:
- CPU
- RAM
- Uso de disco
Aplicação:
- taxa de erros e que erros são
- Logs de erros com o máximo de contexto possível (variáveis que fizeram dar erro).
- Browser (RUM): Web Vitals e erros de Javascript
Gosto de deixar sempre o mínimo de logs ligados possível.
Qual ou quais ferramentas open-source auto-hospedadas me recomendam utilizar
Hoje está muito em alta o Grafana. Tem que ler na documentação todos os workers que você precisa e os recursos que cada um utiliza.
quais configurações mínimas preciso ter?
Depende da quantidade de dados que você produz. A sugestão é testar se os workers aguentam.
Tem alguma dica de material para estudo?
Sempre usei essas ferramentas só pela documentação, é relativamente simples.
- Precisa instalar
- Injetar o agente na sua aplicação (geralmente uma extensão no SO ou um programa instalado)
- configurar o monitoramento de logs (mas geral nem precisa de configuração)