开发神箭手爬虫的常用工具
谷歌Chrome浏览器说起谷歌的Chrome浏览器(以下简称Chrome),相信大家都耳熟能详了吧,不仅使用流畅,而且功能强大,对开发神箭手爬虫非常有帮助。 //本文来自安云网 我们主要使用的是Chrome的开发者工具,如下图所示: //本文来自安云网 或者可以直接在网页上点击鼠标右键,选择“检查”,也可打开开发者工具。 开发者工具顶部有 XPath HelperXPath Helper是Chrome浏览器的插件,可以在Chrome应用商店安装下载,主要用来分析当前网页信息的XPath,并将其精简化。具体操作步骤如下: 1、在Chrome浏览器上,选择抽取的html字段并右击,点击“检查”,即可弹出开发者工具;右击已选字段,点击 2、打开 3、在XPath中,如果使用 { name: "article_publish_time", selector: "//span[contains(@class,'date')]/span"}, DHC RESTDHC REST也是Chrome浏览器的插件,可以在Chrome应用商店安装下载,主要用来模拟HTTP客户端发送测试数据到服务器。 正则表达式测试工具推荐使用站长工具中的正则表达式测试工具,链接如下: http://tool.chinaz.com/regex/ |