安云网 - AnYun.ORG | 专注于网络信息收集、网络数据分享、网络安全研究、网络各种猎奇八卦。
当前位置: 安云网 > 技术关注 > 系统文档 > 神箭手云爬虫如何爬取相同标签或多个一个标签,最后一个标签

神箭手云爬虫如何爬取相同标签或多个一个标签,最后一个标签

时间:2017-03-25来源:未知 作者:安云网点击:
由于神箭手云爬虫使用的xpath,如果当前class下存在多个相同标签,则可使用[]列表来处理, 如上图 div class=light-post-meta span作者: a href=123 title=123123/a/span span日期: a href=http://hackernews.cc/archives/181

blob.png

//安云网咨询系统


//内容来自AnYun.ORG

由于神箭手云爬虫使用的xpath,如果当前class下存在多个相同标签,则可使用[]列表来处理,

//内容来自安云网

如上图

//内容来自AnYun.ORG

<div class="light-post-meta"> //内容来自安云网

<span>作者: <a href="123" title="123">123</a></span>

//安云网咨询系统

<span>日期: <a href="http://1" title="17:19">2016-06-23</a></span>

//内容来自AnYun.ORG

<span class="post-category">分类: <a href="123213" rel="category tag">123闻</a></span> //ANYUN.ORG

<span class="post-comments"><a href="h123">暂无评论</a></span>

//内容来自安云网

</div>

//本文来自安云网


//安云网,anyun.org

即是:
//内容来自安云网

//div[contains(@class,'light-post-meta')]/span[1]/a

//安云网咨询系统

//div[contains(@class,'light-post-meta')]/span[2]/a //安云网咨询系统


//ANYUN.ORG

如果多个标签,要取最后一个标签,则 //本文来自安云网

使用 元素[last()],如:p[last()]/**

//安云网,anyun.org


//安云网咨询系统

顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
验证码: 点击我更换图片
相关内容
推荐内容