52讲轻松搞定网络爬虫笔记10
资料
52讲轻松搞定网络爬虫
遇到动态页面怎么办,详解渲染页面提取
前面我们已经介绍了 Scrapy 的一些常见用法,包括服务端渲染页面的抓取和 API 的抓取,Scrapy 发起 Request 之后,返回的 Response 里面就包含了想要的结果。
但是现在越来越多的网页都已经演变为 SPA 页面,其页面在浏览器中呈现的结果是经过 JavaScript 渲染得到的,如果我们使用 Scrapy 直接对其进行抓取的话,其结果和使用 requests 没有什么区别。
那我们真的要使用 Scrapy 完成对 JavaScript 渲染页面的抓取应该怎么办呢?
之前我们介绍了 Seleni