|
第二步:查看采集规则,编辑自动生成的采集规则,编辑成自定义xpath
如下图,点击“测试”按钮,再点击“采集规则”,把红框里面的xpath拷贝出来
following-sibling::div[position()=1]//*[@class='print-link']/@href 这个xpath不只是定位到Peer Review File,还能定位到其他的。所以,要修改一下,变成
following-sibling::div[position()=1]//*[@class='print-link' and text()='Peer Review File']/@href
如下图,双击那个抓取内容,在设置页面上输入自定义xpath: following-sibling::div[position()=1]//*[@class='print-link' and text()='Peer Review File']/@href
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
|
共 10 个关于本帖的回复 最后回复于 2021-8-6 20:16