|
转到爬虫路线工作台,你说你的规则第二页就失效了,而且还没有说采集失败,那么说明到第二页以后,数据采集规则有效,而翻页规则失效了,那么应该看到翻页区和下一页标志都对应不到节点了。
下图是能对应到节点的情况,都有节点编号,点击编号还能看到自动定位到网页上的节点,你的规则应该在这里显示“未映射”。
如果是这样,说明你在第一页上做的翻页规则不适应第二页,要找找原因。很可能自动采用了网页上的@id和@class属性,而到第二页就没有了。可以选择不同的定位偏好试试,注意看“查看网页元素”那里显示的元素详情,显示的class和id属性哪个更加合适,就可以在上面的下拉菜单中选择不同偏好。点击“测试”按钮,可以看到生成的翻页xpath包含的定位属性好不好,如下图
另外,下一页标志可以是文字“下一页”,也可以是网页上的class和id或者其他属性,根据需要选择合适的下一页标志
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
|
共 5 个关于本帖的回复 最后回复于 2021-1-19 17:24