集搜客GooSeeker网络爬虫

标题: 请问一下各位大神怎么将Gooseeker与Python结合起来用呀,看了官网教程还不是很理解,具体应该怎么做呢?说是 [打印本页]

作者: jianjian520520J    时间: 2017-5-4 14:05
标题: 请问一下各位大神怎么将Gooseeker与Python结合起来用呀,看了官网教程还不是很理解,具体应该怎么做呢?说是
Python即时网络爬虫项目: 内容提取器的定义(Python2.7版本)
开发记录---python爬虫之gooseeker尝试

作者: Fuller    时间: 2017-5-4 15:01
从基本原理上说:
1,GooSeeker只管生成采集规则。当采集的字段很多,一个个写xpath很麻烦,GooSeeker能用直观标注自动生成采集规则,而是能立即做测试,所以,能减轻很多工作量
2,Python从GooSeeker服务器用api或者这个规则,其他都需要Python用程序做,Python只是有了一个规则。这个规则是一个xslt程序,那么Python需要运行xslt引擎,把html网页转换成xml




欢迎光临 集搜客GooSeeker网络爬虫 (http://120.55.75.51/doc/) Powered by Discuz! X3.2