Bom dia onlyDataFans
,
Muito legal que você tenha explicado sobre o numpy e queria contribuir só com o porquê que ele geralmente é o segundo pacote a ser importado (logo após o pandas).
O numpy tem uma performance excelente por vários motivos, mas dois principais:
- Ser escrito em C (que indiscutivelmente é uma linguagem com performance).
- Permitir vetorização (operação com grandes números de elementos simultaneamente)
Então até um filtro utilizando numpy consegue ser mais rápido que o pandas (somente tem que ver se para legibilidade vale a pena).
E para terminar, fiz um teste com duas operações diferentes numpy e list comprehension (que é considerado o método mais rápido para criar listas - onlyDataFans
inclui aí na lista de post 😂) e o numpy consumiu somente 17% do tempo que o list comprehension utilizaria, mostrando realmente que é muito eficiente.