Eu acho que, o que ele faz é. Primerio ele grava cada fala dele em arquivos separados. Ele dá um start no celular, fala o texto, dá o ok, o video passa pra ele, ele avalia se refaz ou passa para o próximo.
Depois disso ele tem varios arquivos de video em ordem coronologica pela data
Entao ele usa um script pra juntar todos os videos em um só, e anida usa algo pra cortar o video quando nao há som, ou seja, a pausa entre uma fala e outra que tanto ocupa o tempo de edição.
Quanto aos zoons que aparece, eu nao sei dizer se o script faz isso.