Python urlparse模块解析URL下载

  • A+
所属分类:Python


Python标准库中的urlparse模块是一个解析与反解析Web网址URL字符串的一个工具。

urlparse模块目录
  1. urlparse模块功能介绍
  2. urlparse模块函数方法
  3. urlparse案例源码演示
  4. urlparse模块知识总结

一、urlparse模块功能介绍

urlparse模块会将一个普通的url解析为6个部分,返回的数据类型都是元组。同时,它还可以将已经分解后的url再组合成一个url地址。

返回的6个部分,分别是:scheme(机制)、netloc(网络位置)、path(路径)、params(路径段参数)、query(查询)、fragment(片段)。

二、urlparse模块函数方法

1 )、 urlparse.urlparse(url),分解url返回元组,可以得到很多关于这个url的数据,网络协议、目录层次等。
2 )、 urlparse.urlunparse(parts),它接收一个元组类型,将元组内对应元素重新组后为一个url网址,与上面功能正好相反。
3 )、 urlparse.urlsplit(url),作用与urlparse非常相似,它不会分解url参数,对于遵循RFC2396的URL很有用处。
4 )、 urlparse.urljoin(base, url ) 功能是基于一个base url和另一个url构造一个绝对URL。

三 、urlparse案例源码演示

img 图片部分,未完待续。

四 、urlparse模块知识总结

Python的一大强项就是它在网络抓取方面的功能,像编写一个爬虫抓取网络上面的资源,往往就需要先对网址url做一个处理,这离不开urlparse模块,自己编写处理url地址的代码费时费力,不如直接找找标准库中的urlparse。

  • 我的微信
  • 这是我的微信扫一扫
  • weinxin
  • 我的微信公众号
  • 我的微信公众号扫一扫
  • weinxin

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: