Skip to content

Latest commit

 

History

History
8 lines (6 loc) · 261 Bytes

README.md

File metadata and controls

8 lines (6 loc) · 261 Bytes

spider

python 爬虫

版本1 功能简述: 以hao123为入口页面,滚动爬取外链,收集网址,并记录网址上的内链和外链数目,记录title等信息

windows7 32位上测试,目前每24个小时,可收集数据为10万左右