|
本帖最后由 wangyong 于 2020-9-29 16:08 编辑
要实现上面的需求就要用到集搜客的连续动作,先点击网页上需要点击的位置再进行页面抓取。
连续动作教程:https://www.gooseeker.com/doc/article-288-1.html
分为两级规则,第一级规则实现点击操作,第二级来进行抓取
连续动作最重要的一步是找到页面上正确的xpath
天猫要实现按顺序点击只需要一个点击动作就行。
天猫评论页看起来需要点击三个位置,实际只需要点击最后的第三步
第一步的累计评论,滚屏后会自动显示,第二步的下拉选项也不需要点击,因为按时间本身就在网页中有节点,直接点击就行,就是需要注意在高级设置里取消模拟点击
这是第三步的xpath:
- //*[@class='tm-r-time']/*
复制代码
采集淘宝天猫时,需要打开滚屏速度不能太快,而且要在爬虫软件中登录账号
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
|
共 2 个关于本帖的回复 最后回复于 2020-9-29 16:07