- 主要为了自己学东西(稳定爬虫, 提取文章标签, 个性化推荐)
- 解决app信息过载问题,达到灵活订阅内容的目的,自己使用
- 实现个性化推荐,对个性化推荐进行维护
- 实现简书用户,主题的订阅
- 实现知乎用户,主题的订阅
- 实现微信公众号的订阅
- ...(掘金等?)
- 订阅内容都是用爬虫去实现即可。微信爬虫,知乎爬虫,简书爬虫等,主要是对关注内容的监控,需要不断的轮训去获取内容 需要一个爬虫池,然后不断的去获取池子里面的内容,去爬即可。
- 标签提取采用LDA算法去做,提取主题的标签,以此标签为基准,当做文章的标准。然后去做个性化推荐
- 简书主题的订阅已经完成