Achei demais mesmo esse projeto!
ML é bem difícil de conseguir evoluir tão rápido no começo, então parabéns por isso!
Eu diria pra vc estudar a criação de APIs com fastAPI ou django. Só olhando as documentações vc consegue subir uma API de testes.
A partir daí, vc já tem um início pra receber esses dados e retornar o valor da predição.
Porém, saiba que se você precisa suportar uma alta escala de requisições, você vai precisar repensar a arquitetura da aplicação.