|
根据以前的经验,做微博的翻页要注意以下几点:
1,微博翻页用一个事件驱动的,要点对节点。比如是这样的嵌套html标签 div-span-bold-text(),那个“下一页”在text()中,翻页事件在span上,那么爬虫就应该准确点击到span上,而不是其它节点
2,微博页面不知什么原因,有多个翻页标志,虽然你只看到一个“下一页”,还有好几个是隐藏的,这样自动生成的规则可能会有定位不准的问题,需要手工修改。怎样检查是否有多少个“下一页”,可以用MS谋数台的查询功能:http://www.gooseeker.com/doc/article-130-1.html |
|
共 3 个关于本帖的回复 最后回复于 2015-12-22 12:08