Executando verificação de segurança...
2

Meus 2 cents:

  • TTL: Venho utilizando o Evolution API e nao tenho notado desconexoes com frequencia - por exemplo tenho sessoes no ar a mais de 1 mes sem problemas

  • No teu caso, qual a frenquencia destas quedas ?

  • Para o monitoramento destas instancias, faco o seguinte:
    a) tenho um zabbix, onde um cada instancia eh um servico monitorado nele e visualizado em uma pagina do NOC da empresa;

    b) Diariamente (que eh o bastante para minha necessidade) executo um script via crontab que envia mensagem via Evolution API de/para as instancias. Caso a mensagem seja bem recebida, coloco o status do servico daquela instancia como OK - caso tenha alguma falha (no envio ou no recebimento), o servico correspondente eh marcado como erro e gera o workflow para analise e eventual escalonamento para correcao (geracao de qrcode e nova sincronizacao) (o escalonamento/alerta pode ser via envio de email, mensagem do telegram, ligacao automatica via robocall do VoIP - o que exatamente eh feito depende do dia, horario, gravidade, etc)

  • Apesar de usar o Evolution API hoje (mais por conta da facilidade de integracao com outras ferramentas como chatwoot, atendechat, n8n, etc) - tambem ja utilizei a API do https://github.com/wppconnect-team que eh muito boa e estavel.

Carregando publicação patrocinada...
1

Muito obrigado pela resposta! Foi de grande ajuda e trouxe alguns insights valiosos.

Sobre a frequência das quedas, na prática, as instâncias geralmente permanecem conectadas por mais de um mês sem problemas significativos. O motivo do meu questionamento veio do meu chefe, que queria entender melhor os possíveis fatores que afetam a conectividade e quais estratégias poderiam ser aplicadas para garantir maior estabilidade. Então, estou reunindo mais fundamentos, experiências e dados para embasar uma solução ou, pelo menos, apresentar uma explicação mais sólida sobre o funcionamento e as melhores práticas.

Gostei bastante da abordagem que você usa para monitoramento. Vou dar uma olhada no uso do Zabbix como ponto central para visualizar o status das instâncias e a automação via crontab para testar a conectividade diariamente, parecem ser estratégias bem interessantes. Esse tipo de workflow para detecção e escalonamento de falhas pode valer a pena implementar no nosso caso também.

Novamente, valeu pelo compartilhamento da experiência! Se tiver mais algum detalhe ou insight, toda contribuição é bem-vinda.