Skip to content

Extração de dados para criação de datasets de bairros, distritos e povoados do Brasil.

License

Notifications You must be signed in to change notification settings

itallonardi/bairrosEDistritosdoBrasil

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

6 Commits
 
 
 
 
 
 

Repository files navigation

Extração de dados para criação de datasets de bairros, distritos e povoados do Brasil

Este repositório contém um notebook que realiza a coleta de dados de bairros, distritos e povoados do Brasil utilizando uma abordagem combinada entre a API do IBGE e OpenStreetMap, e bibliotecas de geoprocessamento como osmnx e geopandas.

Entendendo o problema

Uma extração de dados utilizando a API do SIDRA, do IBGE, retorna cerca de 14.320 bairros e distritos para um total de 5.570 municípios. Ou seja, apenas 2,57 bairros por cidade. Esta abordagem mista, por outro lado, conseguiu extrair um número significativamente maior de bairros, povoados e distritos, totalizando 46.350 bairros, povoados e distritos (uma média de 8,32 bairros por municípios, 3,23x mais que o retornado pela API SIDRA), proporcionando uma visão mais abrangente das áreas urbanas e rurais no Brasil.

Download (Kaggle)

Os datasets (um para cada estado e outro completo para todo Brasil está disponível no link abaixo, no Kaggle: Bairros, Povoados e Distritos do Brasil (Download dos Datasets)

Requisitos

Para rodar o notebook, você precisará das seguintes bibliotecas:

  • osmnx
  • geopandas
  • requests
  • pandas

Você pode instalar essas bibliotecas usando o seguinte comando:

pip install osmnx geopandas requests pandas

Como usar

  1. Clone o repositório:
git clone https://github.com/itallonardi/bairrosEDistritosdoBrasil.git
  1. Navegue até o diretório do repositório:
cd bairrosEDistritosdoBrasil
  1. Abra o notebook Jupyter:
jupyter notebook bairrosEDistritosDoBrasil.ipynb
  1. Execute o notebook célula por célula para coletar e processar os dados.

Ou acesse o Jupyter notebook no Google Colab: bairrosEDistritosdoBrasil no Google Colab

Estrutura dos dados

Os datasets gerados serão salvos na pasta csv com o padrão de nomenclatura data_BR_UF_cidade.csv, onde UF e cidade podem ser substituídos pela sigla do estado e o nome da cidade, respectivamente, ou * representando todos. Por exemplo:

  • data_BR_BA_*.csv (todas as cidades da Bahia)
  • data_BR_*.csv (todos os estados e cidades do Brasil)

Autor

Este projeto foi desenvolvido por Itallo Nardi.

Licença

Este projeto está licenciado sob a licença MIT.

About

Extração de dados para criação de datasets de bairros, distritos e povoados do Brasil.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published