Arquitetura completa de microsserviços GenAIOps para operações de TI em bancos, combinando AIOps tradicional com IA Generativa.
Esta plataforma implementa 18 microsserviços distribuídos em 5 camadas funcionais:
- Telemetry Agent Service: Coleta logs, métricas e traces locais
- Ingestion API Service: Endpoint centralizado para recepção de telemetria
- Legacy Connector Service: Integração com sistemas legados
- Normalization Service: Padronização e enriquecimento de dados
- Anomaly Detection Service: Detecção de anomalias com ML
- Topology Service: Mapeamento de dependências entre serviços
- Event Correlation Service: Correlação e redução de ruído de alertas
- Knowledge Embedding Service: Vetorização de base de conhecimento
- Vector Search Service: Busca semântica (RAG)
- Generative Summarization Service: Sumarização de incidentes com LLM
- Code Generation Service: Geração de código de remediação
- NLQ Service: Consultas em linguagem natural
- Automation Runner Service: Execução segura de automações
- Smart Notification Service: Notificações inteligentes
- Feedback Loop Service: RLHF para melhoria contínua
- HR Co-Pilot Service: Assistente de RH com IA
- IT Sentiment Service: Análise de sentimento de equipes
- Audit & Risk Service: Compliance e auditoria automatizada
┌─────────────────────────────────────────────────────────────┐
│ CAMADA 5: GOVERNANÇA │
│ [HR Co-Pilot] [Sentiment Analysis] [Audit & Risk] │
└─────────────────────────────────────────────────────────────┘
▲
┌─────────────────────────────────────────────────────────────┐
│ CAMADA 4: AUTOMAÇÃO │
│ [Automation Runner] [Notifications] [Feedback Loop] │
└─────────────────────────────────────────────────────────────┘
▲
┌─────────────────────────────────────────────────────────────┐
│ CAMADA 3: GENAI │
│ [Embedding] [Vector Search] [Summarization] [CodeGen] [NLQ]│
└─────────────────────────────────────────────────────────────┘
▲
┌─────────────────────────────────────────────────────────────┐
│ CAMADA 2: ANÁLISE │
│ [Normalization] [Anomaly] [Topology] [Correlation] │
└─────────────────────────────────────────────────────────────┘
▲
┌─────────────────────────────────────────────────────────────┐
│ CAMADA 1: INGESTÃO │
│ [Telemetry Agent] [Ingestion API] [Legacy Connector] │
└─────────────────────────────────────────────────────────────┘
- Docker & Docker Compose
- Python 3.11+
- 16GB RAM (recomendado para ambiente completo)
# Clonar repositório
git clone <repo-url>
cd GenAIOps_ferramentas
# Configurar variáveis de ambiente
cp .env.example .env
# Editar .env com suas credenciais (OpenAI, GCP, etc.)
# Subir todos os serviços
docker-compose up -d
# Verificar status
docker-compose ps
# Ver logs de um serviço específico
docker-compose logs -f generative-summarization# Apenas camada de ingestão
docker-compose up -d telemetry-agent ingestion-api legacy-connector
# Apenas camada GenAI
docker-compose up -d knowledge-embedding vector-search generative-summarizationGenAIOps_ferramentas/
├── shared/ # Código compartilhado
│ └── python/
│ ├── models/ # Modelos de dados comuns
│ ├── utils/ # Utilitários
│ └── config/ # Configurações
├── layer1-ingestion/ # Camada 1
│ ├── telemetry-agent/
│ ├── ingestion-api/
│ └── legacy-connector/
├── layer2-analysis/ # Camada 2
│ ├── normalization-service/
│ ├── anomaly-detection/
│ ├── topology-service/
│ └── event-correlation/
├── layer3-genai/ # Camada 3
│ ├── knowledge-embedding/
│ ├── vector-search/
│ ├── generative-summarization/
│ ├── code-generation/
│ └── nlq-service/
├── layer4-automation/ # Camada 4
│ ├── automation-runner/
│ ├── smart-notification/
│ └── feedback-loop/
├── layer5-governance/ # Camada 5
│ ├── hr-copilot/
│ ├── sentiment-analysis/
│ └── audit-risk/
├── docs/ # Documentação
├── docker-compose.yml
└── README.md
- APIs: FastAPI, gRPC
- Mensageria: RabbitMQ, Kafka
- Bancos de Dados: PostgreSQL, Redis, MongoDB
- Vetorial: Pinecone, Weaviate, Milvus
- ML/AI: scikit-learn, TensorFlow, PyTorch
- GenAI: LangChain, OpenAI, Google Gemini
- Observabilidade: OpenTelemetry, Prometheus, Grafana
- Orquestração: Kubernetes, Ansible
- Telemetry Agent detecta latência alta no serviço PIX
- Anomaly Detection identifica anomalia (200ms vs 50ms normal)
- Event Correlation agrupa alertas relacionados (CPU, memória, latência)
- Generative Summarization gera: "PIX lento devido a CPU 99% no DB"
- Code Generation cria script Ansible para escalar pod Kubernetes
- Smart Notification envia para Slack com botão [Aprovar]
- Automation Runner executa após aprovação
- Feedback Loop aprende com resultado
- Gerente pergunta: "Quais devs têm cert. AWS e avaliação >4.5?"
- HR Co-Pilot usa NLQ Service para traduzir em SQL
- Vector Search busca contexto em políticas de RH
- Retorna lista de 5 funcionários com links para perfis
- Audit & Risk analisa logs de acesso admin em produção
- Generative Summarization identifica 3 acessos sem ticket
- Gera relatório executivo para Banco Central
- Smart Notification alerta time de segurança
- Autenticação: OAuth2 + JWT
- Autorização: RBAC com Keycloak
- Criptografia: TLS 1.3 em trânsito, AES-256 em repouso
- Auditoria: Todos os eventos logados com rastreabilidade
- Compliance: LGPD, PCI-DSS, BACEN
# Testes unitários
pytest shared/python/tests/
# Testes de integração
pytest layer3-genai/generative-summarization/tests/integration/
# Testes E2E
./scripts/run-e2e-tests.shAcesse os dashboards:
- Grafana: http://localhost:3000
- Prometheus: http://localhost:9090
- Jaeger (Traces): http://localhost:16686
- Fork o projeto
- Crie uma branch:
git checkout -b feature/nova-funcionalidade - Commit:
git commit -m 'Adiciona nova funcionalidade' - Push:
git push origin feature/nova-funcionalidade - Abra um Pull Request
MIT License - veja LICENSE para detalhes.
- Documentação: docs/
- Issues: GitHub Issues
- Email: [email protected]
Construído com ❤️ para transformar operações de TI em instituições financeiras