Este repositório contém um notebook que realiza a coleta de dados de bairros, distritos e povoados do Brasil utilizando uma abordagem combinada entre a API do IBGE e OpenStreetMap, e bibliotecas de geoprocessamento como osmnx
e geopandas
.
Uma extração de dados utilizando a API do SIDRA, do IBGE, retorna cerca de 14.320 bairros e distritos para um total de 5.570 municípios. Ou seja, apenas 2,57 bairros por cidade. Esta abordagem mista, por outro lado, conseguiu extrair um número significativamente maior de bairros, povoados e distritos, totalizando 46.350 bairros, povoados e distritos (uma média de 8,32 bairros por municípios, 3,23x mais que o retornado pela API SIDRA), proporcionando uma visão mais abrangente das áreas urbanas e rurais no Brasil.
Os datasets (um para cada estado e outro completo para todo Brasil está disponível no link abaixo, no Kaggle: Bairros, Povoados e Distritos do Brasil (Download dos Datasets)
Para rodar o notebook, você precisará das seguintes bibliotecas:
- osmnx
- geopandas
- requests
- pandas
Você pode instalar essas bibliotecas usando o seguinte comando:
pip install osmnx geopandas requests pandas
- Clone o repositório:
git clone https://github.com/itallonardi/bairrosEDistritosdoBrasil.git
- Navegue até o diretório do repositório:
cd bairrosEDistritosdoBrasil
- Abra o notebook Jupyter:
jupyter notebook bairrosEDistritosDoBrasil.ipynb
- Execute o notebook célula por célula para coletar e processar os dados.
Ou acesse o Jupyter notebook no Google Colab: bairrosEDistritosdoBrasil no Google Colab
Os datasets gerados serão salvos na pasta csv
com o padrão de nomenclatura data_BR_UF_cidade.csv
, onde UF
e cidade
podem ser substituídos pela sigla do estado e o nome da cidade, respectivamente, ou *
representando todos. Por exemplo:
data_BR_BA_*.csv
(todas as cidades da Bahia)data_BR_*.csv
(todos os estados e cidades do Brasil)
Este projeto foi desenvolvido por Itallo Nardi.
Este projeto está licenciado sob a licença MIT.