Executando verificação de segurança...
1

[INDICAÇÃO] Erros de "Schrödinger" - Como replicar?

Recentemente, tenho enfrentado uma considerável exaustão no meu trabalho atual devido a falhas "quânticas". Utilizo esse termo porque esses erros ocorrem em um servidor, mas não em outro. Por exemplo, em algum lugar, um registro é inserido na tabela errada ou uma variável é atribuída com um valor incorreto que não condiz com os dados buscados.

Esse tipo de comportamento é recorrente, e a demanda por correções é bastante elevada, pois não existem testes adequados, e o deploy é feito diretamente no cliente, ocorrendo no banco de dados. No entanto, enfrento dificuldades em corrigir esses problemas, pois raramente consigo replicá-los.

Na maioria das vezes, ninguém realizou alterações na implementação, e esta sempre funcionou corretamente. No entanto, para um cliente específico, surgem problemas. Alguns casos ocorreram devido à falta de RAM no servidor e alto consumo de armazenamento, o que provocou falhas nos ponteiros do banco de dados.

Gostaria de ouvir as experiências de vocês e saber como lidaram com situações semelhantes para realizar as correções necessárias.

Carregando publicação patrocinada...
2

isola as coisas...começa resolvendo o alto consumo de disco e ram. resolveu o problema? otimo!

não resolveu? vai pra proxima...tem logs o suficientes? não? comece a logar as informações de modo que consiga replicar localmente

por fim, escreva uns testes automatizados para pegar esse problema antes de ir pra produção

1
  • O alto consumo de disco e ram foi resolvido.
  • Criei um sistema de log, mas vou ter que melhorar ele, pra poder logar também o servidor.
  • Os teste automatizados nunca vão ser uma opção, infelizmente.

Mas obrigado pelas dicas.

1

nunca diga nunca...

consegue então criar um ambiente de pre-prod? antes de rodar a atualização em prod, atualize os dados de pre prod e aplique a change lá. assim vc consegue validar se a change foi aplicada com sucesso e sem nenhum efeito colateral

1

Já existe um ambiente pre-pod, porém a dúvida é justamente essa, como replicar fielmente ao que aconteceu? Como eu disse acima, as vezes são implementações que funcionam em pre-prod, coisas antigas(tipo uns 8 anos) que sempre deram certo e do nada começaram a dar problema.