Chauncey2 / zhaopin_spider Public

Notifications You must be signed in to change notification settings
Fork 8
Star 17

用scrapy编写的一个可以爬取智联招聘全部职位信息的爬虫

17 stars 8 forks Branches Tags Activity

Notifications

Name		Name	Last commit message	Last commit date
Latest commit History 12 Commits
.idea		.idea
Zhaoping		Zhaoping
test		test
Pipfile		Pipfile
README.md		README.md
keywords.json		keywords.json
run.py		run.py
scrapy.cfg		scrapy.cfg

Repository files navigation

zhaopin_spider

说明

用scrapy编写的一个可以爬取智联招聘全部职位信息的爬虫；
爬虫文件keywords_spider用于爬取智联招聘首页的工作关键字，并存储到json文件中，但是在运行的时候需要关闭pipline；
test.py文件用于编写过程中部分代码测试；
run_spider文件可直接运行爬虫
如果有人需要使用本项目，只需要修改settings文件下的数据库相关设置；
数据存储在MongoDB数据库中,运行前请确保MongoDB服务已启动，数据库以及集合已创建；
Python版本3.6.3
Scrapy版本1.5.1

运行

1.需要安装MongoDB数据库，并开启服务; 2.命令行运行

 python main.py

3.也可以再IDE中直接运行main.py文件;

4.settings.py文件根据自己的系统自行更改。

备注

随着时间的推移，zhilian的网站结构和前段获取数据的方式也许会发生改变，所以要在本工程的基础上修改部分页面解析的逻辑。

About

用scrapy编写的一个可以爬取智联招聘全部职位信息的爬虫

Report repository

Releases

No releases published

Packages

No packages published

Languages

Python 100.0%