Este repositório contém o projeto final do curso de Certificado Profissional Ciência de dados da IBM, onde foi desenvolvido um projeto prático aplicando os conhecimentos adquiridos ao longo do curso. O projeto abrange desde a obtenção e limpeza dos dados até a aplicação de técnicas de análise e modelagem para a obtenção de insights valiosos.
- data: Pasta contendo conjuntos de dados utilizados no projeto.
- notebooks: Pasta contendo notebooks Jupyter utilizados para a análise e modelagem dos dados.
- scripts: Pasta contendo scripts Python utilizados no projeto.
- reports: Pasta contendo relatórios e apresentações relacionados ao projeto.
- images: Pasta contendo imagens utilizadas na documentação e nos notebooks.
- Análise Exploratória de Dados: Exploração inicial dos dados para entender sua estrutura e características.
- Limpeza e Preparação dos Dados: Processo de limpeza, transformação e preparação dos dados para análise.
- Análise Estatística: Aplicação de técnicas estatísticas para compreender os dados em profundidade.
- Modelagem de Dados: Desenvolvimento e avaliação de modelos de machine learning para previsão ou classificação.
- Python
- Pandas
- NumPy
- Matplotlib
- Seaborn
- Scikit-learn
- Jupyter Notebook
- Clone o repositório:
git clone https://github.com/djeannie29/Capstone-DataScience.git
- Acesse a pasta
notebookspara visualizar e executar os notebooks Jupyter. - Utilize o ambiente Python com as bibliotecas mencionadas instaladas para executar os scripts Python.
Este projeto está licenciado sob a Licença MIT - consulte o arquivo LICENSE para obter detalhes.