电商广告业务分析 | SQL 数据处理 | Python 全流程分析 | 可视化报告 | 投放策略优化
本项目整合淘宝真实广告数据集与 Kaggle 公开广告数据集,完成两套广告投放场景的全链路数据分析。
从数据清洗、指标计算、多维度拆解、用户画像、漏斗转化、业务优化,形成标准化广告效果分析方法论,
输出可直接落地的投放优化方案,为广告预算分配、渠道选择、用户定向提供数据支撑。
| 数据集文件 |
数据说明 |
| raw_sample.csv |
淘宝广告曝光 / 点击日志 |
| ad_feature.csv |
淘宝广告基本信息表(广告属性、投放位置等) |
| user_profile.csv |
淘宝用户画像数据(性别、年龄、消费力等) |
| UserBehavior.csv |
淘宝用户行为日志(浏览、加购、点击、转化) |
| dirty_ad_campaign_dataset.csv |
Kaggle 原始广告投放数据(含年龄、性别、收入、推广渠道、活动类型、广告消耗等) |
| cleaned_ad_campaign_dataset.csv |
Kaggle 清理后广告投放数据(去重、补全、异常值处理后) |
- 计算广告核心指标:曝光、点击、CTR(点击率)、CVR(转化率)、转化成本(CPA)
- 对比不同资源位、渠道、类目、品牌、设备的广告效果差异
- 挖掘高价值用户画像,完成用户分层与行为关联分析
- 构建转化漏斗,定位全链路流失关键环节
- 输出渠道预算分配、定向优化、素材优化等可落地策略
| 工具/技术 |
应用场景 |
| MySQL |
数据清洗、多表关联、指标聚合计算 |
| Python |
pandas(数据处理)、matplotlib/seaborn(可视化)、tabulate(格式化输出) |
| Jupyter Notebook |
代码 + 可视化一体化分析(支持交互式调试、图表导出) |
| 业务分析方法 |
广告投放效果评估、ROI 优化、R-F-V 用户分层模型 |
- 数据概览、重复值/缺失值/异常值检测与处理
- 数据类型转换、特征衍生(如用户消费等级、广告投放时段)、变量相关性分析
- 多表关联与数据集整合,构建分析宽表(用户-广告-行为全维度)
- 整体投放效果趋势分析(日/周维度曝光、点击、转化变化)
- 资源位/渠道 CTR、CVR、转化量对比与排名
- 预算消耗与产出匹配度分析,定位高效/低效渠道
- 类目/品牌广告点击率、转化率差异分析
- 高产出类目识别,为投放倾斜提供依据
- 性别、年龄、消费力、购物深度对点击率的影响
- 用户历史行为(浏览/加购/收藏)与广告点击关联性
- R-F-V 用户分层,定位高价值投放人群
- 曝光、点击、转化全链路漏斗分析
- 计算核心效率指标,评估投放健康度
- 预算分配建议
- 渠道/资源位优化
- 用户定向优化
- 低效投放关停与素材优化建议
- 渠道/资源位差异显著:优质渠道 CTR/CVR 远高于低效渠道,是影响投放效率的核心因素。
- 高价值用户清晰:中青年、中高消费力、深度购物行为用户点击率与转化率更高。
- 历史行为强相关:有浏览/加购行为的用户,广告点击与转化显著提升。
- 类目/活动效果分化:部分类目与活动类型产出更优,可优先倾斜资源。
- 低效投放可优化:高消耗低转化渠道可缩减预算或优化素材。
| 优化方向 |
具体措施 |
| 预算倾斜 |
向高 CTR、高 CVR 资源位/渠道/类目加大投放 |
| 用户定向 |
聚焦核心人群,对高潜用户做重定向投放 |
| 渠道优化 |
增投高效渠道,缩减或优化低效高 CPA 渠道 |
| 素材与活动 |
优先 Conversion 类活动,对低效素材做 A/B 测试迭代 |
| 长效监控 |
建立核心指标监控体系,持续提升投放 ROI |
├── Ad_Campaign_Data_Analysis.ipynb # Kaggle 广告完整分析代码+可视化图表
├── README.md # 项目说明文档
├── UserBehavior.csv # 用户行为日志(淘宝数据集)
├── ad_feature.csv # 广告基本信息表(淘宝数据集)
├── cleaned_ad_campaign_dataset.csv # 清洗后广告投放数据(Kaggle 数据集)
├── dirty_ad_campaign_dataset.csv # 原始广告投放数据(Kaggle 数据集)
├── raw_sample.csv # 广告曝光/点击日志(淘宝数据集)
├── taobao_ad_analysis.sql # 淘宝广告分析 MySQL 数据处理脚本
├── taobao_ad_analysis.ipynb # 淘宝广告完整分析代码+可视化图表
└── user_profile.csv # 用户画像数据(淘宝数据集)