GitHub - wz289494/Crawl_Weibo_repost: 这是一个获取微博帖子转发情况的爬虫。

一、概述这是一个获取微博帖子转发情况的爬虫。

二、依赖详见requirements.txt 终端安装:pip install -r requirements.txt

三、模块介绍 1、crawl模块主要存储爬取配置cookie以及headers信息详细查看:help(Crawl) 2、extract模块主要存储数据解析函数详细查看:help(Extract) 3、store模块主要存储数据保存函数，包含mysql存储详细查看:help(Store) 4、main模块为项目主要流程模块，包含实际业务逻辑，可自行布置

四、说明 1、crawl中setting设置打开F12工具，定位json数据或是文档数据，复制curl 打开网页https://curlconverter.com/，获取cookie及headers 2、store中修改mysql的密码

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
__pycache__		__pycache__
LICENSE.md		LICENSE.md
README.md		README.md
crawl.py		crawl.py
extract.py		extract.py
main.py		main.py
requirements.txt		requirements.txt
store.py		store.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

About

Releases

Packages

Languages

License

wz289494/Crawl_Weibo_repost

Folders and files

Latest commit

History

Repository files navigation

About

Topics

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages