集搜客GooSeeker网络爬虫

标题: 微博签到经纬度数据 [打印本页]

作者: 数据爬呀爬    时间: 2019-11-21 15:14
标题: 微博签到经纬度数据
在使用微博关键词采集和博主主页信息、博主详细信息采集之后还是无法获取签到地点的经纬度,该怎么办呢

作者: Fuller    时间: 2019-11-21 15:39
在本网站上搜索 “微博签到”,能看到很多以前的讨论。可以在这个网页上搜索:https://www.gooseeker.com/tuto/tutorial.html

比如这篇,看看有没有帮助:https://www.gooseeker.com/doc/thread-13390-1-1.html

要变成经纬度其实挺容易的,在百度地图接口上就能进行翻译,用地址名作为输入,就能翻译成经纬度
作者: 数据爬呀爬    时间: 2019-11-21 15:53
这一篇之前我也看过,就是自定义翻页采集对吧,那经纬度需要用到百度地图接口吗?不能在采集的时候进行设置而得到吗
作者: Fuller    时间: 2019-11-21 16:56
数据爬呀爬 发表于 2019-11-21 15:53
这一篇之前我也看过,就是自定义翻页采集对吧,那经纬度需要用到百度地图接口吗?不能在采集的时候进行设置 ...

我看到这些签到地点全部是一些大地方,没有某某路某某号这种详细的地址,所以,这样也不会有几个地名,手工翻译就行了吧?

作者: 数据爬呀爬    时间: 2019-11-21 18:28
这样的啊,那当然也可以,只是比较繁琐一些。那我先试试看吧

作者: 数据爬呀爬    时间: 2019-11-24 14:39
我试了下,是可以在百度地图上面直接找到地点,但是因为地点比较多的话就不可能一直重复这个操作的,是不是还有别的办法呢
作者: Fuller    时间: 2019-11-24 15:41
数据爬呀爬 发表于 2019-11-24 14:39
我试了下,是可以在百度地图上面直接找到地点,但是因为地点比较多的话就不可能一直重复这个操作的,是不是 ...

你一共有多少个地点?

作者: 数据爬呀爬    时间: 2019-11-24 16:33
目前还没有确定,但是肯定有好几百上千吧,因为都是很具体的地点,景区、博物馆等各方面的点
作者: Fuller    时间: 2020-2-22 19:16
已经上线了4个微博签到数据的快捷采集,不用做规则,直接使用:
1,微博签到采集_主页
2,微博签到采集_探索此地
3,微博签到采集_此地热议
4,微博签到采集_来过此地的人

用这些工具把微博数据采集下来以后,可以把里面的地址信息找出来,然后再在百度地图api上翻译成经纬度。

找的过程中,可以手工找,手工去查百度得到经纬度。如果数量很大,那就要写一个程序翻译经纬度,或者委托我们做处理

作者: Fuller    时间: 2021-6-30 15:28
Fuller 发表于 2020-2-22 19:16
已经上线了4个微博签到数据的快捷采集,不用做规则,直接使用:
1,微博签到采集_主页
2,微博签到采集_探 ...

使用Python程序翻译经纬度的方法参看这篇:《Jupyter Notebook怎样获取微博签到地的经纬度并在地图上显示》。
其实最麻烦的是在数据整理上,采集下来的地址信息不规范,需要转换成规范的地址,把规范的地址交给百度地图,通过api可以获得经纬度。用Jupyter Notebook编写Python程序,可以体验到交互式数据加工





欢迎光临 集搜客GooSeeker网络爬虫 (http://120.55.75.51/doc/) Powered by Discuz! X3.2