# 1
pip install scrapy # 安装scrapy
scrapy startproject Tencent # 新建一个爬虫项目cd Tencent/Tencent
scrapy genspider tencent ‘www.baidu.com’ # 生成一个爬虫文件
注意: name == spiders/xxspider_name.py 中的name的名字写完tencent.py提取数据 > 再到pipelines.py存储数据 > 管道写好, settings.py启用
scrapy crawl name # 运行爬虫
scrapy check name # 检测爬虫
# 2
为了便于利用xpath, 在浏览器>扩展程序中 安装一个xpath , 便于匹配。
# 3
Scrapy 中文学习网址
https://scrapy-chs.readthedocs.io/zh_CN/1.0/intro/overview.html
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...