|
在列表页面那里用点击动作逐个点击“展开全文”,这个方法我们是不推荐使用的,因为每点击一次就采集一次,那么采集到的内容既有点击开的,也有没有点击开的,等采集下来以后,要用一个程序把点击开的找出来。很麻烦。所以,建议把含有“展开全文”的微博单独拿出来,放在这个展开全文快捷采集中重新采集一遍。
但看你做的规则,有这几个问题:
1,第一级虽然不想采集数据,但是应该定义整理箱,不然,就没有检查规则是否合适的功能了。也不知道网页内容是否加载全了,很可能网页还没有显示出来,就去点击了,所有都失败了。
2,点击动作的xpath不对,要能定位到“展开全文”这个超链接才行。正确的操作方法如下图,选中那个超链接,点击显示xpath按钮,生成xpath以后,点击“搜索”按钮,并且点击“下一个”,逐个看看有没有漏的
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
|
共 8 个关于本帖的回复 最后回复于 2020-6-24 23:02