集搜客GooSeeker网络爬虫

标题: 抓取页面匹配失败 卡在那里又运行了 失败的那个没有抓取对吧 [打印本页]

作者: coentene    时间: 2016-12-1 09:47
标题: 抓取页面匹配失败 卡在那里又运行了 失败的那个没有抓取对吧
抓取页面匹配失败 卡在那里又运行了 失败的那个没有抓取对吧


作者: ym    时间: 2016-12-1 09:47
失败就是没抓到,爬虫会跳过然后采集下一条线索网址

作者: coentene    时间: 2016-12-1 09:48
失败的记录能查到吗
作者: ym    时间: 2016-12-1 09:49
可以,在DS打数机右击主题名,统计线索就会看到各种线索的状态。或者是登录到集搜客官网,进入会员中心->规则管理->主题的管理页面,也会看到线索的状态。参考《如何管理规则的线索》
作者: coentene    时间: 2016-12-1 09:52
激活失败线索 继续抓取对吧
作者: ym    时间: 2016-12-1 09:52
激活失败线索可以重新抓
作者: coentene    时间: 2016-12-1 09:53
这个失败跟什么有原因啊 网速?还是我定的规则不好

作者: ym    时间: 2016-12-1 09:54
失败一般都是规则不适用,你要分析一下原因,可能要修改规则,然后再重抓,分析的操作参考《怎样解决规则采集失败/遗漏的问题》
作者: coentene    时间: 2016-12-1 09:54
嗯,好




欢迎光临 集搜客GooSeeker网络爬虫 (http://120.55.75.51/doc/) Powered by Discuz! X3.2