Skip to content

OamMot/BluePrint

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

47 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

BluePrint

项目目的

  1. 主要为了自己学东西(稳定爬虫, 提取文章标签, 个性化推荐)
  2. 解决app信息过载问题,达到灵活订阅内容的目的,自己使用
  3. 实现个性化推荐,对个性化推荐进行维护

目标实现订阅的内容

  1. 实现简书用户,主题的订阅
  2. 实现知乎用户,主题的订阅
  3. 实现微信公众号的订阅
  4. ...(掘金等?)

目标实现的方法

  1. 订阅内容都是用爬虫去实现即可。微信爬虫,知乎爬虫,简书爬虫等,主要是对关注内容的监控,需要不断的轮训去获取内容   需要一个爬虫池,然后不断的去获取池子里面的内容,去爬即可。
  2. 标签提取采用LDA算法去做,提取主题的标签,以此标签为基准,当做文章的标准。然后去做个性化推荐

已经实现

  1. 简书主题的订阅已经完成

About

No description or website provided.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages