集搜客GooSeeker网络爬虫

标题: 我在使用规则时缺失数据是什么原因 [打印本页]

作者: qwertyuiop17    时间: 2020-3-12 10:57
标题: 我在使用规则时缺失数据是什么原因
规则名:代码数据file:///C:\Users\Admin\Documents\Tencent Files\2467820433\Image\Group2\{4\5I\{45IJ1VIN)H9(}]LCO@(_MY.png
file:///C:\Users\Admin\Documents\Tencent Files\2467820433\Image\Group2\{4\5I\{45IJ1VIN)H9(}]LCO@(_MY.png



作者: Fuller    时间: 2020-3-12 10:59
这里面内容这么多,那个抓取内容缺失了?
作者: qwertyuiop17    时间: 2020-3-12 11:00
Fuller 发表于 2020-3-12 10:59
这里面内容这么多,那个抓取内容缺失了?

这个缺了一整行的数据



作者: Fuller    时间: 2020-3-12 11:01
我加载了你的规则,分析看来挺好的
作者: Fuller    时间: 2020-3-12 11:02
qwertyuiop17 发表于 2020-3-12 11:00
这个缺了一整行的数据

我看到了,缺了第5个

作者: qwertyuiop17    时间: 2020-3-12 11:02
Fuller 发表于 2020-3-12 11:01
我加载了你的规则,分析看来挺好的

但是少了3行数据是怎么回事。群里的有人试了一下可是没缺失



作者: qwertyuiop17    时间: 2020-3-12 11:03
qwertyuiop17 发表于 2020-3-12 11:02
但是少了3行数据是怎么回事。群里的有人试了一下可是没缺失

对。一共有50行。我算了下却只有47行

作者: lan_1985    时间: 2020-3-12 11:06
恩,我正常的按顺序映射内容和样例复制是没有问题的。定位标志映射不做都是可以抓全的。
作者: Fuller    时间: 2020-3-12 11:07
[attach]12035[/attach]

这个td下面没有div,所以,为了提高适应性,这个抓取内容用td做内容映射,不要用下面的div。注意:要在第一行数据上修改内容映射

作者: qwertyuiop17    时间: 2020-3-12 13:02
Fuller 发表于 2020-3-12 11:07
这个td下面没有div,所以,为了提高适应性,这个抓取内容用td做内容映射,不要用下面的div。注意:要在第 ...

我的这个下一页为什么不能用


作者: qwertyuiop17    时间: 2020-3-12 13:04
Fuller 发表于 2020-3-12 11:07
这个td下面没有div,所以,为了提高适应性,这个抓取内容用td做内容映射,不要用下面的div。注意:要在第 ...

规则名:代码数据3

我的为什么翻页不好使



作者: Fuller    时间: 2020-3-12 13:28
qwertyuiop17 发表于 2020-3-12 13:02
我的这个下一页为什么不能用

放在集搜客采摘浏览器中运行这个规则。采摘浏览器是新版本,要另外下载,参看:https://www.gooseeker.com/doc/thread-15635-1-1.html

作者: qwertyuiop17    时间: 2020-3-12 13:40
Fuller 发表于 2020-3-12 13:28
放在集搜客采摘浏览器中运行这个规则。采摘浏览器是新版本,要另外下载,参看:https://www.gooseeker.co ...

为啥一直在采集不停



作者: 微舆情    时间: 2020-3-12 14:38
qwertyuiop17 发表于 2020-3-12 13:40
为啥一直在采集不停

是采集不结束吗


作者: lan_1985    时间: 2020-3-12 15:03
qwertyuiop17 发表于 2020-3-12 13:40
为啥一直在采集不停

采集不停,是因为翻页不成功,一直采集第一页,设置终点标志,就会停下来
[attach]12040[/attach]

作者: qwertyuiop17    时间: 2020-3-12 15:12
lan_1985 发表于 2020-3-12 15:03
采集不停,是因为翻页不成功,一直采集第一页,设置终点标志,就会停下来

...

我用的是新版的



作者: Fuller    时间: 2020-3-12 16:20
qwertyuiop17 发表于 2020-3-12 15:12
我用的是新版的

我用新版 集搜客采摘浏览器 都测试过了,翻页都没有问题,你遇到什么问题了?

作者: Fuller    时间: 2020-3-12 16:20
qwertyuiop17 发表于 2020-3-12 15:12
我用的是新版的

我用新版 集搜客采摘浏览器 都测试过了,翻页都没有问题,你遇到什么问题了?

作者: qwertyuiop17    时间: 2020-3-12 17:22
Fuller 发表于 2020-3-12 16:20
我用新版 集搜客采摘浏览器 都测试过了,翻页都没有问题,你遇到什么问题了?
...

名字:分类与代码
一直死循环在新版本里



作者: Fuller    时间: 2020-3-12 18:56
去这个帖子讨论吧:https://www.gooseeker.com/doc/thread-17399-1-1.html




欢迎光临 集搜客GooSeeker网络爬虫 (http://120.55.75.51/doc/) Powered by Discuz! X3.2