Plataforma avançada de Cienciometria, Análise de Redes Sociais (SNA) e Mineração de Textos focada no mapeamento de Programas de Pós-Graduação (PPGs). O sistema analisa a produção acadêmica (teses e dissertações) para revelar a estrutura latente do conhecimento, redes de colaboração, genealogia acadêmica e o papel topológico de pesquisadores e conceitos.
Este projeto transcende a contagem tradicional de publicações. Utilizando a teoria de Sistemas Complexos e Grafos, a aplicação mapeia a "Ecologia do Conhecimento" de ecossistemas acadêmicos. Através de uma arquitetura híbrida (memória + banco de grafos em nuvem) e IA Generativa, o sistema permite:
- Avaliar a maturidade e resiliência de linhas de pesquisa.
- Identificar Brokers (corretores de conhecimento) e Hubs interdisciplinares.
- Rastrear a genealogia acadêmica (alunos que se tornam formadores).
- Recomendar conexões através de similaridade vetorial/topológica.
Renderização de um espaço de fase 3D utilizando as três principais leis de força da rede: Grau (Volume), Betweenness (Intermediação) e Closeness (Proximidade). Permite a identificação visual rápida de anomalias, clusters isolados e líderes do ecossistema.
Implementação inspirada no modelo de Callon para quadrantes de maturidade. Classifica Macrotemas e Palavras-chave em:
- Temas Motores: Alta centralidade e alta densidade.
- Temas de Nicho: Alta densidade, baixa centralidade.
- Temas Emergentes/Declínio: Baixa centralidade e densidade.
- Temas Básicos (Transversais): Alta centralidade, baixa densidade.
Cálculo em tempo real da "física" da rede acadêmica:
-
Assortatividade (
$r$ ): Mede a endogenia (panelinhas) vs. expansão interdisciplinar. -
Rich-Club Coefficient (
$\Phi$ ): Avalia se a "elite" do programa (Top 20% hubs) colabora entre si ou atua em silos. -
Expoente Gamma (
$\gamma$ ) da Lei de Potência: Avalia a dependência da rede em relação aos grandes líderes (validação da estrutura Scale-Free). -
Correlação de Spearman (
$\rho$ ): Mede a presença de Inovadores/Brokers na rede cruzando Grau e Betweenness.
Sistema de recomendação que sugere conexões latentes (Autores parecidos, Teses correlatas, Conceitos vizinhos) calculando a sobreposição do "DNA acadêmico" (similaridade de vizinhança) na rede complexa.
Consultas na linguagem Cypher disparadas diretamente para o Neo4j AuraDB, renderizando subgrafos interativos que mostram a área de influência de um pesquisador ou conceito em até 3 graus de profundidade.
Integração com a API do Google Gemini para ler amostras do repositório em tempo real e gerar descritivos fenomenológicos/epistemológicos do foco de pesquisa de um PPG, eliminando a necessidade de leitura manual massiva.
A plataforma utiliza um modelo de Arquitetura Híbrida:
- Front-end & UI: Streamlit (Python)
- Back-end Matemático: Pandas, SciPy, NetworkX (Cálculo de métricas em RAM para alta velocidade em filtros tabulares).
- Back-end de Grafos: Neo4j AuraDB (Cloud) para armazenamento persistente da ontologia e consultas estruturais complexas via Cypher.
- Visualização de Dados: Plotly (Gráficos 3D, Linhas, Barras, Scatter), Streamlit-agraph (vis.js para redes).
- NLP & IA: Google Gen AI SDK (
google-genai) com Gemini 2.5/2.0 Flash.
- Python 3.9 ou superior.
- Uma conta gratuita no Neo4j Aura.
- Uma chave de API do Google AI Studio.
- Clone o Repositório:
git clone [https://github.com/SEU_USUARIO/ecologia-conhecimento.git](https://github.com/SEU_USUARIO/ecologia-conhecimento.git)
cd ecologia-conhecimento- Instale as dependências:
pip install -r requirements.txt- Configure as credenciais:
O projeto agora aceita tanto
.streamlit/secrets.tomlquanto variáveis de ambiente, o que facilita o deploy no Railway.
Variáveis esperadas:
GEMINI_API_KEY=...
NEO4J_URI=...
NEO4J_USERNAME=...
NEO4J_PASSWORD=...- Deploy no Railway:
Cadastre essas quatro chaves em
Variablesno painel do Railway. O app não depende mais de/app/.streamlit/secrets.tomlpara subir em produção.