搜狗微信基于关键词爬取相关微信公众号文章

爬取IP并存入数据库

运行wechatpub目录下的getproxy.py文件，爬取IP，存入MongoDB；

在项目目录下，键入命令：

# scrapy crawl pubinfospider

提示输入搜索关键词后键入关键词，即开始爬取，爬取的文章链接存入数据库；

在项目目录下，键入命令：

# scrapy crawl postspider

爬取并存入数据库。

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
wechatpub		wechatpub
README.md		README.md
geckodriver.log		geckodriver.log
ghostdriver.log		ghostdriver.log
scrapy.cfg		scrapy.cfg