集搜客GooSeeker网络爬虫

标题: 微博正文下某一评论回复及其爬取,不需要爬取全部的评论及回复。 [打印本页]

作者: 刘晶晶    时间: 2020-7-22 17:39
标题: 微博正文下某一评论回复及其爬取,不需要爬取全部的评论及回复。
请问一下如何进行微博正文下某一评论回复及其爬取,不需要爬取全部的评论及回复?该怎么设置?
另外,可不可以爬取所有出现某关键词的评论及回复?


作者: 内容分析应用    时间: 2020-7-22 17:54
爬取时网页已经打开了, 常用做法是把能抓的内容抓下来, 后续在excel或数据库里进行筛选
作者: Fuller    时间: 2020-7-22 18:37
在爬评论过程中,不能根据关键词进行筛选,把所有评论爬下来以后,在excel中利用关键词筛选功能
作者: Fuller    时间: 2020-7-22 18:39
这是微博采集工具箱中的爬微博评论的工具,在这个工具界面上,输入一条微博正文的网址,点击启动采集,就能把爬虫运行起来:https://www.gooseeker.com/res/softdetail_6.html
作者: 刘晶晶    时间: 2020-7-23 15:21
内容分析应用 发表于 2020-7-22 17:54
爬取时网页已经打开了, 常用做法是把能抓的内容抓下来, 后续在excel或数据库里进行筛选 ...

好的,谢谢您。再向您请教一个问题,如果我想抓取所有微博下的某一评论及回复应该怎么做呢?

作者: 刘晶晶    时间: 2020-7-23 15:22
Fuller 发表于 2020-7-22 18:37
在爬评论过程中,不能根据关键词进行筛选,把所有评论爬下来以后,在excel中利用关键词筛选功能 ...

好的,谢谢您。再向您请教一个问题,如果我想抓取所有微博下的某一评论及回复应该怎么做呢?

作者: scraper    时间: 2020-7-23 15:57
刘晶晶 发表于 2020-7-23 15:22
好的,谢谢您。再向您请教一个问题,如果我想抓取所有微博下的某一评论及回复应该怎么做呢?
...

在微博评论和回复采集界面上输入微博的独立网址可以采集评论及其回复





欢迎光临 集搜客GooSeeker网络爬虫 (http://120.55.75.51/doc/) Powered by Discuz! X3.2