Projeto desenvolvido durante o Udacity's Machine Learning Engineer Nanodegree, onde são aplicadas técnicas de aprendizado de máquina para resolver um problema de classificação.
Segue abaixo um resumo do pipeline implementado:
- Explorando os Dados
- Preparando os dados
- Transformação logarítmica
- Normalização de atributos numéricos
- Pré-processamento dos dados - one-hot encoding
- Embaralhar e dividir os dados (train_test_split)
- Avaliando a performance do modelo
- fbeta_score
- accuracy_score
- Modelos de Aprendizado Supervisionado com Sklearn
- KNeighborsClassifier
- DecisionTreeClassifier
- AdaBoostClassifier
- Tuning do modelo
- Validação final do modelo
- Extraindo a importância do atributo
Este projeto utiliza os seguintes software e bibliotecas Python:
Você também precisará ter um software instalado para rodar e executar um notebook Jupyter