A forma mais facil seria por meio de testes automatizados.
Uma plataforma que faz algo parecido é o exercism.org, que basicamente tem varios exercícios e cada um deles com o teste, assim que manda o codigo ele ja testa.
O problema seria que voce teria que dazer o teste para uma linguagem em específico, mas parece que o que voce quer é que a pessoa possa mandar em qualquer linguagem, né?
Nesse caso é um pouco mais complicado, voce teria que ter o teste para cada linguagem.
Minhas duas sugestões: tentar usar alguma IA para gerar o código de test e (vai que cola) e a outra seria fazer com que os outros usuários do sistema valide o código enviado, como disse que se inspirou na 42, acho que seria divertido. Seria um tipo de code review