集搜客GooSeeker网络爬虫

标题: 【豆瓣小组_话题详情页面】#GooSeeker数据DIY# [打印本页]

作者: scraper    时间: 2016-12-29 17:38
标题: 【豆瓣小组_话题详情页面】#GooSeeker数据DIY#
本帖最后由 scraper 于 2016-12-30 10:55 编辑

【启动采集前的配置】

【运行方法】— 详见数据DIY图文教程


【常见问题】— 欢迎跟帖留言

作者: serenachen    时间: 2018-7-3 10:17
本条规则似乎只适用于纯文字描述的网页,
只要爬到带图片or需要二次点击打开全文or带链接的的网页就会匹配失败
不知有没有可以改良的方法?


屏幕截图(4).png (53.75 KB, 下载次数: 1325)

屏幕截图(4).png

屏幕截图(3).png (163.09 KB, 下载次数: 1321)

打开错误网址查看

打开错误网址查看

屏幕截图(2).png (180.06 KB, 下载次数: 1253)

抓取错误网址

抓取错误网址

屏幕截图(1).png (141.38 KB, 下载次数: 1429)

不匹配

不匹配





欢迎光临 集搜客GooSeeker网络爬虫 (http://120.55.75.51/doc/) Powered by Discuz! X3.2