【Scrapy爬虫项目】爬取books.toscrape.com上书籍的相关信息并存储为csv文件
文件大小: 2027k
源码售价: 10 个金币 积分规则     积分充值
资源说明:此处准备使用Scrapy爬虫框架对 http://books.toscrape.com/(一个专门用来被爬取的网站)上书籍的相关信息进行爬取。 相关信息包括:书名、价格、评价等级、库存量、产品编码、评价数量。 首先进行页面分析: 这里补充一下,通常现在的浏览器都会对html文本进行一定的规范化, 所以在使用Chrome等浏览器自带的XPath路径的时候, 有可能会导致读取失败。 虽然很多时候用view命令加载出的页面和浏览器打开的是一样的,但是前者是Scrapy爬虫下载的页面,后者是由浏览器下载的页面,有时它们是不同的。 在进行页面分析时,使用view命令更加可靠: 在命令提示符窗口输入 s
本源码包内暂不包含可直接显示的源代码文件,请下载源码包。