Para este trabalho foi utilizada uma base de dados de speed dating com o objetivo de descobrir a melor estratégia para termos um match.
Nós utilizamos 3 abordagens diferentes de abordagem de modo a comparar qual é que teve melhor resultado. As estratégias foram as seguintes:
- Remover todos os NaNs;
- Preencher todos os Nans com 0;
- Preencher os NaNs com médias, moda e mediana conforme achávamos indicado e remoção de linhas ou colunas que não achávamos importantes.
Os algoritmos estão divididos em pastas, cada pasta equivale a uma estratégia.
Em cada pasta, tem um notebook correspondente para cada modelo e o seu ficheiro python correspondente.
Para executar os programas basta escrever este comando: python3 (nome_do_ficheiro).py