Projeto COP30 — Classificação de Risco Socioambiental

Contexto

Este projeto foi desenvolvido no âmbito da COP30 em Belém (2025), com o objetivo de apoiar a tomada de decisão sobre projetos na Amazônia.
Utilizamos algoritmos de classificação supervisionada para identificar se projetos apresentam alto risco socioambiental, considerando variáveis como:

🌳 Percentual de desmatamento
💧 Nível de poluição em água (mg/L)
🗺️ Distância até áreas protegidas (km)
🌍 Emissão de CO₂ (toneladas)

📂 Estrutura do Repositório

projeto-cop30/
├── data/               # Datasets e saídas de predição
│   ├── dataset_socioambiental_60.csv
│   ├── novos_projetos.csv
│   ├── predicoes_novos_projetos.csv
│   └── top5_alto_risco.csv
├── models/             # Modelos treinados e metadados
│   ├── cop30_svm_pipeline.joblib
│   └── cop30_svm_metadata.json
├── scripts/            # Scripts de execução
│   └── infer.py
├── notebooks/          # Notebooks de modelagem e avaliação
│   └── 01_modelagem_e_avaliacao.ipynb
├── governanca.json     # Regras de threshold e revisão
└── README.md           # Este arquivo


## Como Usar
1. Treino e Avaliação

Abra o notebook principal em notebooks/01_modelagem_e_avaliacao.ipynb e execute as etapas de pré-processamento, modelagem e avaliação.

2. Inferência em Novos Projetos
Execute o script em linha de comando:
python scripts/infer.py \
  --model models/cop30_svm_pipeline.joblib \
  --input data/novos_projetos.csv \
  --output data/predicoes_novos_projetos.csv \
  --threshold 0.5

3. Governança

O arquivo governanca.json define:

- Threshold oficial: 0.5
- Datas de revisão periódica
- Critérios máximos de FP/FN
- Responsáveis pela validação


4. Resultados
Validação Cruzada (25 folds)

1. k-NN → F1 = 0.986 | ROC-AUC = 0.999
2. SVM → F1 = 0.982 | ROC-AUC = 1.000
3. Árvore de Decisão → F1 = 0.947 | ROC-AUC = 0.744

- Modelo selecionado: SVM (maior robustez e estabilidade



5. Predições Operacionais
- Arquivo avaliado: predicoes_novos_projetos.csv
- Limiar oficial (governança): 0.50
- Projetos avaliados (N): 5
- Projetos sinalizados como alto risco: 5 (100.0%)
- Mediana das probabilidades: 0.971
- P90 das probabilidades: 0.993

Exportado top5_alto_risco.csv com os 5 projetos mais críticos para revisão humana.

6. Conclusão

O pipeline de classificação foi treinado, validado, salvo e aplicado em novos projetos simulados.
O modelo SVM alcançou alto desempenho (F1 ≈ 0.99) e classificou todos os projetos de teste como de alto risco socioambiental.

7. Próximos Passos

- Monitorar deriva de dados em produção
- Reavaliar limiar de decisão a cada revisão de governança
- Expandir variáveis socioeconômicas e de circularidade

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
.ipynb_checkpoints		.ipynb_checkpoints
data		data
models		models
scripts		scripts
.DS_Store		.DS_Store
README.md		README.md
RESULTADOS_LOTE.md		RESULTADOS_LOTE.md
governanca.json		governanca.json
novos_projetos.csv		novos_projetos.csv
projeto-cop30.ipynb		projeto-cop30.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Projeto COP30 — Classificação de Risco Socioambiental

Contexto

📂 Estrutura do Repositório

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Projeto COP30 — Classificação de Risco Socioambiental

Contexto

📂 Estrutura do Repositório

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages