Veja os bits (0 e 1), como 1 alavanca com 2 estados, que tudo fará muito sentido.
Imagine que possui uma alavanca, onde pode deixa-la como aberta ou fechada.
Também, outras alavancas mais complexas, com 3 estados (aberta, meio e fechada) e 4 estados (aberta, meio aberta, meio fechada e fechada).
Agora, veja que precisará montar um sistema, com dezenas a centenas dessas alavancas, mas que seja o menos custoso ao final.
A cada estado que se coloca na alavanca, aumentam os custos. Uma de 2 estados (0,1), apenas vai a um lado e outro. Já uma com 4 (0,1,2,3), precisa ser mais sensivel, talvez precisando de mais espaço e materiais.
No fim, se tornou convensão, por ser menos custoso, fazer um sistema usando centenas de alavancas de 2 estados, por serem pequenas, pouco custo e complexidade.
Sendo por isso, a computação ainda nos dias de hoje, não optar por desenvolver processadores que tenham transistores de mais de 2 estados. O custo impede esta tarefa de se tornar viavel. É melhor termos mais nucleos e instruções, do que investir nesta área.
Todavia, vale ressaltar que sim, uma "alavanca" de 4 estados guardaria mais dados que uma de 2 estados. E a junção destes, promove que menos sejam usados para guardar a mesma quantia que um de 2.
Dessa forma, em algumas circunstancias, há o desenvolvimento de sistemas além dos bits 0 e 1.
Alguns exemplos, são a lógica pós-binária, cunhando o termo Trit (0,1,2), sendo usado em sistemas experimentais quanticos chamados de Qutrit. Como no Qubit, há neste 3 possíveis estados, sendo 0 OU 1 OU 2.
Há também outras sistemas acadêmicos que pode encontrar, visando mais bits, todavia, comercialmente falando, a grande maioria se encontra na relação binário mesmo, por ora.