AWS Multi-Account Observability & Analytics

What is AWS Multi-Account Observability & Analytics?

A comprehensive AWS multi-account observability view that aggregates, processes, and visualizes cloud infrastructure data across multiple AWS accounts. Built with serverless architecture using AWS Lambda, Aurora PostgreSQL Serverless v2, and designed for enterprise-scale monitoring.

Architecture

Data Flow

[Sender Account] EventBridge -> Lambda -> S3 (Analytics Account) -> Lambda (Receiver) -> Aurora PostgreSQL
                                  │              │                         │
                                  ▼              ▼                         ▼
                               sender.py  data/{ACCOUNT_ID}/*.json    receiver.py

Components

Sender Accounts: Data collection via scheduled Lambda functions
Analytics Account: Centralized data processing and storage
Aurora PostgreSQL: Serverless v2 database for analytics
S3: Encrypted data lake with KMS encryption
EventBridge: Automated scheduling and triggering

Project Structure

Sender Accounts (Data Collection)

Agency360-Sender.yml → CloudFormation template for sender infrastructure
sender.py → Data collection script (stored in S3, executed by Lambda)

Flow

sample-aws-multi-account-observability/
├── cloudformation-template/
│   ├── Agency360-Analytics.yml    # Analytics account infrastructure
│   └── Agency360-Sender.yml       # Sender account infrastructure
├── scripts/
│   ├── receiver.py                # Data processing script
│   └── sender.py                  # Data collection script
├── sql/
│   ├── core-schema.sql            # Database schema
│   ├── core-view-schema.sql       # Analytics views
│   └── core-utility.sql           # Utility functions
├── requirements.txt               # Python dependencies
└── README.md

Key Files

Agency360-Analytics.yml: Complete infrastructure for analytics account
Agency360-Sender.yml: Infrastructure template for sender accounts
receiver.py: Processes JSON data from S3 and loads into Aurora
sender.py: Collects AWS data and uploads to S3
core-schema.sql: Complete database schema with 25+ tables

Features

Data Collection & Processing

Multi-Account Support : Aggregates data from multiple AWS accounts
Comprehensive Coverage: Collects 12+ data categories per account
Real-time Processing : Lambda-based serverless data processing
Automated Cleanup : S3 files automatically deleted after processing

Data Categories

Account Information: Account details, contact info, alternate contacts
Cost Analysis: Current/previous period costs, forecasts, service costs
Service Usage: Detailed AWS service utilization and costs by usage type
Security Posture: Security Hub findings, GuardDuty alerts, compliance status
Configuration: AWS Config compliance rules and non-compliant resources
Inventory: EC2 instances, applications, patches via Systems Manager
Security Services: KMS keys, WAF rules, CloudTrail, Secrets Manager, ACM
Marketplace: Third-party software usage and costs
Trusted Advisor: AWS recommendations and best practices
Health Events: Service health and maintenance notifications
Application Signals: Application performance metrics and traces
Resilience Hub: Disaster recovery assessments and compliance
Audit Logs: Data processing status, error tracking, and health scores

Analytics & Visualization

25+ Database Tables: Comprehensive schema for all AWS services
Optimized Views: Pre-built views for common analytics queries
Cost Optimization: Identify savings opportunities and spending trends
Security Monitoring: Track security findings and compliance status
Performance Insights: Application and infrastructure performance metrics
Compliance Tracking: Config rules, security findings, and remediation

Technology Stack

Compute: AWS Lambda (Python 3.13, 10GB Memory, 15min Timeout)
Database: Amazon Aurora PostgreSQL Serverless v2 (0.5-16 ACU)
Storage: Amazon S3 with KMS encryption and versioning
Infrastructure: AWS CloudFormation with complete automation
Networking: VPC with private subnets and VPC endpoints
Security: IAM roles with least privilege, KMS encryption, Security Groups
Scheduling: EventBridge rules for automated data collection
Monitoring: CloudWatch logs and Dead Letter Queues
SDK: Boto3 1.35.0+ for comprehensive AWS service integration

Prerequisites

AWS CLI configured with appropriate permissions
Python 3.13+ (for local development)
AWS account with the following services enabled:
- Lambda, RDS Aurora, S3, EventBridge
- IAM, VPC, CloudFormation, KMS
- Security Hub, GuardDuty, Config (for security data)
- Cost Explorer, Trusted Advisor (for cost data)
- Systems Manager (for inventory data)

Quick Start

1. Deploy Analytics Infrastructure

Option A: AWS Console (Recommended)

Go to CloudFormation > Create Stack in AWS Console
Upload cloudformation-template/Agency360-Analytics.yml
Stack name: a360-analytics
Parameters: Set SenderAccounts to your account IDs (comma-separated)
Tags (Best Practice): Add tags like Environment=prod, Project=a360, Owner=your-team
Check I acknowledge that AWS CloudFormation might create IAM resources
Click Create Stack

Option B: AWS CLI

aws cloudformation create-stack \
  --stack-name a360-analytics \
  --template-body file://cloudformation-template/Agency360-Analytics.yml \
  --parameters ParameterKey=SenderAccounts,ParameterValue="123456789012,987654321098" \
  --tags Key=Environment,Value=prod Key=Project,Value=a360 Key=Owner,Value=your-team \
  --capabilities CAPABILITY_IAM

2. Upload Processing Scripts

# Get bucket name from stack outputs
BUCKET=$(aws cloudformation describe-stacks --stack-name a360-analytics --query 'Stacks[0].Outputs[?OutputKey==`S3BucketName`].OutputValue' --output text)

# Upload scripts
aws s3 cp scripts/receiver.py s3://$BUCKET/scripts/receiver.py
aws s3 cp scripts/sender.py s3://$BUCKET/scripts/sender.py

3. Initialize Database Schema

Use Aurora Query Editor in the AWS Console:

Navigate to RDS > Query Editor in AWS Console
Select your Aurora cluster (created by the stack)
Connect using the Secrets Manager credentials
Execute the schema files in order:
- Copy and paste contents of sql/core-schema.sql
- Copy and paste contents of sql/core-view-schema.sql
- Copy and paste contents of sql/core-utility.sql (if needed)

4. Deploy Sender Account (Optional)

Option A: AWS Console (Recommended)

Go to CloudFormation > Create Stack in sender account
Upload cloudformation-template/Agency360-Sender.yml
Stack name: a360-sender
Parameters: Set AnalyticsBucket to the S3 bucket from analytics account
Tags (Best Practice): Add tags like Environment=prod, Project=a360, Owner=your-team
Check I acknowledge that AWS CloudFormation might create IAM resources
Click Create Stack

Option B: AWS CLI

aws cloudformation create-stack \
  --stack-name a360-sender \
  --template-body file://cloudformation-template/Agency360-Sender.yml \
  --parameters ParameterKey=AnalyticsBucket,ParameterValue=$BUCKET \
  --tags Key=Environment,Value=prod Key=Project,Value=a360 Key=Owner,Value=your-team \
  --capabilities CAPABILITY_IAM

Database Schema

Core Tables (25+ tables)

accounts: AWS account information and contacts
contact_info: Account contact information
alternate_contacts: Billing, operations, security contacts
services: Service usage and costs by usage type
cost_reports: Cost analysis, forecasts, and service costs
security: Security Hub findings summary by service
findings: Detailed security findings with remediation
guard_duty_findings: GuardDuty threat detection findings
kms_keys: KMS key inventory and rotation status
waf_rules: WAF configurations and compliance
cloudtrail_logs: CloudTrail logging status
secrets_manager_secrets: Secrets inventory
certificates: ACM certificate management
inspector_findings: Inspector vulnerability findings
config_reports: Config compliance reports
non_compliant_resources: Non-compliant resources
inventory_instances: EC2 instances via Systems Manager
inventory_applications: Installed applications
inventory_patches: Patch compliance status
marketplace_usage: Marketplace product usage
trusted_advisor_checks: Trusted Advisor recommendations
health_events: AWS Health events
application_signals: Application performance signals
resilience_hub_apps: Resilience Hub assessments
logs: Processing status and health scores
log_messages: Detailed processing messages

Configuration

Environment Variables (Auto-configured by CloudFormation)

DB_NAME=core
AURORA_CLUSTER_ARN=arn:aws:rds:region:account:cluster:cluster-name
AURORA_SECRET_ARN=arn:aws:secretsmanager:region:account:secret:secret-name
REGION=ap-southeast-1
BUCKET=your-s3-bucket-name
ANALYTICS_KMS_KEY=arn:aws:kms:region:account:key/key-id

S3 Storage Structure

s3://ANALYTICS_ACCOUNT_BUCKET/
├── data/
│   └── {account-id}/
│       ├── 2025-01-15_DAILY.json
│       └── 2025-01-31_MONTHLY.json
├── loaded/
│   └── {account-id}/
│       └── processed-files...
└── scripts/
    ├── sender.py
    └── receiver.py

Data Format

JSON data structure with comprehensive AWS service data:

{
  "account": {
    "account_id": "123456789012",
    "account_name": "Production Account",
    "contact_info": {...},
    "alternate_contacts": {...}
  },
  "cost": {
    "current_period_cost": 1000.00,
    "previous_period_cost": 950.00,
    "top_services": [...],
    "forecast": [...]
  },
  "security": {
    "security_hub": [...],
    "guard_duty": [...],
    "kms": [...],
    "waf": [...],
    "cloudtrail": [...]
  },
  "service": [...],
  "inventory": {...},
  "config": {...},
  "marketplace": [...],
  "trusted_advisor": [...],
  "health": [...],
  "application": [...],
  "resilience_hub": [...],
  "logs": {...}
}

Usage Examples

Query Cost Trends

SELECT 
    a.account_name,
    cr.current_period_cost,
    cr.cost_difference_percentage,
    cr.period_start,
    cr.period_granularity
FROM cost_reports cr
JOIN accounts a ON cr.account_id = a.id
WHERE cr.period_granularity = 'MONTHLY'
ORDER BY cr.cost_difference_percentage DESC;

Security Compliance Overview

SELECT 
    a.account_name,
    s.service,
    s.total_findings,
    s.critical_count,
    s.high_count,
    ROUND((s.resolved_findings::numeric / s.total_findings * 100), 2) as resolution_rate
FROM security s
JOIN accounts a ON s.account_id = a.id
WHERE s.critical_count > 0
ORDER BY s.critical_count DESC;

Service Cost Analysis

SELECT 
    a.account_name,
    s.service,
    s.cost,
    s.currency,
    s.date_from,
    s.date_to
FROM services s
JOIN accounts a ON s.account_id = a.id
WHERE s.cost > 100
ORDER BY s.cost DESC;

WAF Security Compliance

SELECT 
    a.account_name,
    wr.web_acl_name,
    COUNT(*) as total_rules,
    SUM(CASE WHEN wr.is_compliant THEN 1 ELSE 0 END) as compliant_rules,
    ROUND(SUM(CASE WHEN wr.is_compliant THEN 1 ELSE 0 END)::numeric / COUNT(*) * 100, 2) as compliance_percentage
FROM waf_rules_detailed wr
JOIN accounts a ON wr.account_id = a.id
GROUP BY a.account_name, wr.web_acl_name
ORDER BY compliance_percentage ASC;

Security Features

VPC Isolation: Aurora database in private subnets only
KMS Encryption: All data encrypted at rest and in transit
IAM Roles: Least privilege access with constrained policies
VPC Endpoints: Secure connectivity without internet access
Security Groups: Network-level access controls
S3 Security: Bucket policies, versioning, access logging
Dead Letter Queues: Error handling and monitoring
CloudWatch Logs: Comprehensive logging and monitoring
Secrets Manager: Automatic password rotation for Aurora

QuickSight Integration

The platform includes VPC connectivity for secure QuickSight integration:

Setup QuickSight with VPC Connection

Enable QuickSight Enterprise Edition
- Go to QuickSight console
- Upgrade to Enterprise Edition if needed
- Enable VPC connections
Create VPC Connection
- In QuickSight, go to Manage QuickSight > VPC connections
- Click Add VPC connection
- Configure:
  - VPC ID: Use VPC created by the stack
  - Subnet IDs: Select private subnets from the stack
  - Security Group: Use QuickSight security group from stack outputs
  - Availability Zones: Select AZs matching your subnets
Add Aurora as Data Source
- Go to Datasets > New dataset
- Select PostgreSQL
- Configure connection:
  - Data source name: A360-Core
  - Database server: Aurora endpoint from stack outputs
  - Port: 5432
  - Database: core
  - Username: postgres
  - Password: Retrieve from Secrets Manager
  - VPC connection: Select the VPC connection created above
Create Datasets and Dashboards
- Use the comprehensive database schema for analytics
- Create datasets from key tables: accounts, cost_reports, security, services, etc..
- Build dashboards for:
  - Cost Analytics: Track spending trends and forecasts
  - Security Posture: Monitor compliance and findings
  - Inventory Management: Track resources and patch compliance
  - Performance Monitoring: Application signals and health events

Pre-built Analytics Views

The platform provides optimized views for common queries:

Cost trends and forecasting
Security compliance dashboards
Service utilization reports
Multi-account inventory tracking

Monitoring & Troubleshooting

Check Processing Status

SELECT 
    a.account_name,
    l.account_status,
    l.cost_status,
    l.security_status,
    l.config_status,
    l.date_created
FROM logs l
JOIN accounts a ON l.account_id = a.id
ORDER BY l.date_created DESC;

View Error Messages

SELECT 
    a.account_name,
    lm.message,
    lm.message_type,
    lm.created_at
FROM log_messages lm
JOIN logs l ON lm.log_id = l.id
JOIN accounts a ON l.account_id = a.id
WHERE lm.message_type = 'ERROR'
ORDER BY lm.created_at DESC;

Lambda Logs

# Receiver function logs
aws logs tail /aws/lambda/a360-analytics-Agency360ReceiverFunction-[RANDOM] --follow

# Sender function logs
aws logs tail /aws/lambda/a360-analytics-Agency360SenderFunction-[RANDOM] --follow

Check Dead Letter Queue

# Get DLQ ARN from stack outputs
DLQ_ARN=$(aws cloudformation describe-stacks --stack-name a360-analytics --query 'Stacks[0].Outputs[?OutputKey==`DLQArn`].OutputValue' --output text)

# Get queue URL from ARN
DLQ_URL=$(aws sqs get-queue-url --queue-name $(echo $DLQ_ARN | cut -d':' -f6) --query 'QueueUrl' --output text)

# Check for failed messages
aws sqs receive-message --queue-url $DLQ_URL

Stack Outputs Reference

# View all stack outputs
aws cloudformation describe-stacks --stack-name a360-analytics --query 'Stacks[0].Outputs'

# Get specific outputs
aws cloudformation describe-stacks --stack-name a360-analytics --query 'Stacks[0].Outputs[?OutputKey==`AuroraEndpoint`].OutputValue' --output text
aws cloudformation describe-stacks --stack-name a360-analytics --query 'Stacks[0].Outputs[?OutputKey==`S3BucketName`].OutputValue' --output text
aws cloudformation describe-stacks --stack-name a360-analytics --query 'Stacks[0].Outputs[?OutputKey==`VPCId`].OutputValue' --output text

Performance and Scaling

Lambda Configuration

Memory: 10GB for processing large datasets
Timeout: 15 minutes for comprehensive data collection
Concurrency: Reserved concurrency of 10 per function
Dead Letter Queue: Error handling and retry logic

Aurora Serverless v2

Auto-scaling: 0.5 to 16 ACU based on workload
High Availability: Multi-AZ deployment
Backup: 7-day retention with point-in-time recovery
Encryption: KMS encryption at rest

Data Processing

Batch Processing: Efficient upsert operations
Type Casting: Automatic PostgreSQL type conversion
Error Handling: Comprehensive logging and monitoring
File Management: Automatic cleanup after processing

Contributing

Fork the repository
Create a feature branch
Make your changes
Test with sample data
Submit a pull request

License

This project is licensed under the Apache License 2.0 - see the LICENSE file for details.

Support

For issues and questions:

Check the troubleshooting section
Review CloudWatch logs
Verify IAM permissions
Check Dead Letter Queue for failed messages
Ensure all AWS services are properly configured

Agency 360 Analytics - Comprehensive AWS multi-account visibility and analytics platform

Name		Name	Last commit message	Last commit date
Latest commit History 17 Commits
cloudformation-template		cloudformation-template
scripts		scripts
sql		sql
CODE_OF_CONDUCT.md		CODE_OF_CONDUCT.md
CONTRIBUTING.md		CONTRIBUTING.md
LICENSE		LICENSE
README.md		README.md

License

aws-samples/sample-aws-multi-account-observability

Folders and files

Latest commit

History

Repository files navigation

AWS Multi-Account Observability & Analytics

What is AWS Multi-Account Observability & Analytics?

Architecture

Data Flow

Components

Project Structure

Sender Accounts (Data Collection)

Flow

Key Files

Features

Data Collection & Processing

Data Categories

Analytics & Visualization

Technology Stack

Prerequisites

Quick Start

1. Deploy Analytics Infrastructure

2. Upload Processing Scripts

3. Initialize Database Schema

4. Deploy Sender Account (Optional)

Database Schema

Core Tables (25+ tables)

Configuration

Environment Variables (Auto-configured by CloudFormation)

S3 Storage Structure

Data Format

Usage Examples

Query Cost Trends

Security Compliance Overview

Service Cost Analysis

WAF Security Compliance

Security Features

QuickSight Integration

Setup QuickSight with VPC Connection

Pre-built Analytics Views

Monitoring & Troubleshooting

Check Processing Status

View Error Messages

Lambda Logs

Check Dead Letter Queue

Stack Outputs Reference

Performance and Scaling

Lambda Configuration

Aurora Serverless v2

Data Processing

Contributing

License

Support

About

Resources

License

Code of conduct

Contributing

Security policy

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors 2

Languages

Packages