集搜客GooSeeker网络爬虫

标题: 百度关键词搜索结果能采集吗 [打印本页]

作者: TonyJiang    时间: 2016-9-28 11:42
标题: 百度关键词搜索结果能采集吗
我需要从百度上输入关键词,将搜索结果采集下来。可以么

作者: quyixuan    时间: 2016-9-28 11:42
可以,做规则采集就行了
作者: TonyJiang    时间: 2016-9-28 11:42
quyixuan 发表于 2016-9-28 11:42
可以,做规则采集就行了

不需要配置内容页面的模板么
作者: quyixuan    时间: 2016-9-28 11:43
TonyJiang 发表于 2016-9-28 11:42
不需要配置内容页面的模板么

规则就是采集数据的模板,去看教程掌握做规则
作者: TonyJiang    时间: 2016-9-28 11:43
quyixuan 发表于 2016-9-28 11:43
规则就是采集数据的模板,去看教程掌握做规则

问题是搜索结果页面,不是来自同一个网站啊,这个怎么配置模板呢
作者: quyixuan    时间: 2016-9-28 11:43
TonyJiang 发表于 2016-9-28 11:43
问题是搜索结果页面,不是来自同一个网站啊,这个怎么配置模板呢

不用管是否来自同一个网站
只要考虑规则能否适应
如果各个网站的网页结构差别很大,只能做一个最通用的规则,就是把html的body内的内容都存下来,不分详细的字段,这就跟拷站程序一样了

作者: TonyJiang    时间: 2016-9-28 11:44
quyixuan 发表于 2016-9-28 11:43
不用管是否来自同一个网站
只要考虑规则能否适应
如果各个网站的网页结构差别很大,只能做一个最通用的规 ...

明白了。谢谢
作者: wangyong    时间: 2021-5-6 10:46
集搜客数据管家快捷采集可以直接采集百度搜索结果内容1,安装集搜客数据管家,从左侧工具条进入快捷采集,选择百度网页关键词搜索结果
[attach]14203[/attach]
2,输入要采集的关键词搜索链接,例如:https://www.baidu.com/s?wd=%E8%8 ... 0&rsv_sug4=2124
同时选择要采集的页数,最后点击“获取数据”,即可启动爬虫采集窗口开始采集。
3,在快捷采集管理后台中观察到采集状态为“已采集”后,点击打包按钮下载Excel格式的数据
[attach]14204[/attach]
4,数据展示:
[attach]14205[/attach]





欢迎光临 集搜客GooSeeker网络爬虫 (http://120.55.75.51/doc/) Powered by Discuz! X3.2