Projeto desenvolvido como parte da avaliação prática do processo seletivo da IEEE Computational Intelligence Society - Student UnB.
O desafio envolve a análise de dados clínicos para prever a presença de diabetes utilizando técnicas de ciência de dados, estatística e machine learning.
A crescente incidência de diabetes mellitus é uma preocupação global. Com base em dados clínicos de pacientes indígenas da etnia Pima (sexo feminino, idade ≥ 21 anos), o objetivo é identificar padrões, relações estatísticas e desenvolver modelos preditivos para o diagnóstico da doença.
- Análise exploratória de dados
- Tratamento de valores faltantes e outliers
- Visualização com histogramas, boxplots e scatter plots
- Análise de correlação entre variáveis
- Comparações estatísticas por grupos (ex: idade, IMC)
- Modelagem com Decision Tree e Logistic Regression
- Feature Engineering para otimização dos modelos
- Código limpo e documentado em Python com Google Colab
Python 3.10Google ColabPandas,NumPy,Matplotlib,SeabornScikit-learn,XGBoostSciPy,Statsmodels
├── Desafio-IEEE-definitivo.ipynb # Notebook completo com análises e modelos
├── /figs # Gráficos e visualizações geradas
├── /data # Arquivo original do dataset (.csv)
└── README.md # Esta documentação