351#
xandy 论坛元老 发表于 2017-3-1 10:55:21 | 只看该作者
lz2666 发表于 2017-3-1 10:53
麻烦问一下,微博数据采集之后,显示已采集,但是“打包”按钮一直是灰色的,等了很久也一样,试了好几次也 ...

1,你的用户名是什么?用的是什么工具,添加的任务ID是?技术人员看一下是什么问题
2,是的,微博粉丝和关注者资料只能抓前5页,因为你手动翻也是这样的,这是微博的限制,微博开放全部资料的话才能采集
举报 使用道具
352#
lz2666 新手上路 发表于 2017-3-1 11:01:10 | 只看该作者
xandy 发表于 2017-3-1 10:55
1,你的用户名是什么?用的是什么工具,添加的任务ID是?技术人员看一下是什么问题
2,是的,微博粉丝和 ...

我的用户名就是lz2666,用的是微博博主详细资料采集,任务ID是名称吗?任务名称叫“weibo”
举报 使用道具
353#
xandy 论坛元老 发表于 2017-3-1 11:25:14 | 只看该作者
lz2666 发表于 2017-3-1 11:01
我的用户名就是lz2666,用的是微博博主详细资料采集,任务ID是名称吗?任务名称叫“weibo”
...

在采集之前你在浏览器上登录了你的微博账号吗?没有的话要先登录。用火狐插件版爬虫就在火狐登录,用GS爬虫浏览器的话就在GS爬虫浏览器上登录。
举报 使用道具
354#
lz2666 新手上路 发表于 2017-3-1 12:37:36 | 只看该作者
xandy 发表于 2017-3-1 11:25
在采集之前你在浏览器上登录了你的微博账号吗?没有的话要先登录。用火狐插件版爬虫就在火狐登录,用GS爬 ...

我的微博账号在GS爬虫浏览器上登录过了
举报 使用道具
355#
xandy 论坛元老 发表于 2017-3-1 14:16:42 | 只看该作者
lz2666 发表于 2017-3-1 12:37
我的微博账号在GS爬虫浏览器上登录过了

如果是采集自己博主资料,登录的微博账号不能是自己的账号(就是说抓的账号和你登的账号不能使一样的,因为页面结构不一样)。如果并没有出现刚刚说的情况,你删掉任务,重新添加一次,重抓一遍,我们测试是正常的。
举报 使用道具
356#
lz2666 新手上路 发表于 2017-3-1 14:24:37 | 只看该作者
xandy 发表于 2017-3-1 14:16
如果是采集自己博主资料,登录的微博账号不能是自己的账号(就是说抓的账号和你登的账号不能使一样的,因 ...

我是抓的别人的主页啊,不是我自己的,也重新添加任务几次了,实在不行我换台电脑试试吧
举报 使用道具
357#
xandy 论坛元老 发表于 2017-3-1 14:27:51 | 只看该作者
lz2666 发表于 2017-3-1 14:24
我是抓的别人的主页啊,不是我自己的,也重新添加任务几次了,实在不行我换台电脑试试吧
...

是的,你重新试下,把全面的任务删除重新添加一次,我们上午测试你的任务都能够顺利打包下载数据的。
举报 使用道具
358#
SeekYuki 新手上路 发表于 2017-3-2 19:21:23 | 只看该作者
您好,我要采的数据>31页,我自己登微博页面发现只能搜到50页数据,我想把这50页含有关键词的微博都扒下来,但我在设置“发布时间”的时候,发现那个溯回的日期,稍微久远一点,比如今天是3月我设的1月1日至1月31日,然后新浪就报错,表示【抱歉,未找到“关键字”相关结果。】,不管在采集界面,还是我拿新浪的搜索手动搜,都是这样的。这个要怎么解决呀
举报 使用道具
359#
SeekYuki 新手上路 发表于 2017-3-2 19:22:04 | 只看该作者
可不可以出一个新规则,用户可以自定义页数,而不是时间啊?
举报 使用道具
360#
shenzhenwan10 金牌会员 发表于 2017-3-2 19:32:39 | 只看该作者
如果搜索结果多, 微博不会全显示的, 你需要把时间段拆分成更细的
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 为什么用微软的excel无法打开xls文件?powe
  • 360或火绒等杀毒软件导致GooSeeker爬虫软件
  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法

热门用户

GMT+8, 2025-6-24 06:03