Skip to content

chengsx21/THU-Book-Crawler

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

THU-Book-Crawler

前言

此脚本仅供方便清华师生学习之用, 作者坚决反对批量下载书籍的违规行为, 请大家自觉维护版权, 合理使用资源.

使用说明

配置环境

版本为 Python3, 使用命令 pip install -r requirements.txt 安装依赖.

启动爬虫

  1. 进入清华教参平台, 选择你需要下载的书籍, 这是一个示例网址.

  2. 按下 FnF12, 打开开发者工具, 点击 “网络” 选项卡, 并刷新网页.

    example

  3. 点击图中所示的网络请求, 将请求标头中的 User-AgentCookie 以及网页 url、书籍名称填写在 config.json 中.

  4. 在根目录下执行 python main.py, 将自动下载 PDF 并保存到 example 子目录.

联系方式

如有相关想法建议, 欢迎联系作者, 恳请斧正.

About

清华大学教参服务平台简易爬虫

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages