python(urlparse)模板使用方法总结

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python(urlparse)模板使用方法总结相关的知识,希望对你有一定的参考价值。

一、简介

  urlparse模块用户将url解析为6个组件,并以元组形式返回,返回的6个部分,分别是:scheme(协议)、netloc(网络位置)、path(路径)、params(路径段参数)、query(查询)、fragment(片段)。

 

二、功能列举

1、urlparse.urlparse()(将url解析为组件,url必须以http://开头)

>>> urlparse.urlparse("https://i.cnblogs.com/EditPosts.aspx?opt=1")
ParseResult(scheme=https, netloc=i.cnblogs.com, path=/EditPosts.aspx, params=‘‘, query=opt=1, fragment=‘‘)

返回的元素中也会包含其他属性,比如(username,password,hostname,port):

>>> urlparse.urlparse("https://i.cnblogs.com:80/EditPosts.aspx?opt=1").port
80
>>> urlparse.urlparse("https://i.cnblogs.com:80/EditPosts.aspx?opt=1").hostname
i.cnblogs.com

2、urlparse.urljoin()(将相对的地址组合成一个url,对于输入没有限制,开头必须是http://,否则将不组合前面)

>>> urlparse.urljoin("https://i.cnblogs.com","EditPosts.aspx")
https://i.cnblogs.com/EditPosts.aspx

3、urlparse.urlsplit() :返回一个5个元素的元组,适用于遵循RFC2396的URL

>>> urlparse.urlsplit("https://i.cnblogs.com:80/EditPosts.aspx?opt=1")
SplitResult(scheme=https, netloc=i.cnblogs.com:80, path=/EditPosts.aspx, query=opt=1, fragment=‘‘)

4、urlparse.urlunsplit() : 使用urlsplit的格式组合成一个url,传递的元素必须是5个,或者直接将分解的元组重新组合

>>> urlparse.urlunsplit(("https","i.cnblogs.com","EditPosts.aspx","a=a","b=b"))
https://i.cnblogs.com/EditPosts.aspx?a=a#b=b
>>> parse = urlparse.urlsplit("https://i.cnblogs.com:80/EditPosts.aspx?opt=1")
>>> urlparse.urlunsplit(parse)
https://i.cnblogs.com:80/EditPosts.aspx?opt=1

5、urlparse.urlunparse() :使用urlparse的格式组合成一个url,可以直接将urlparse的返回传递组合

>>> parse = urlparse.urlparse("https://i.cnblogs.com:80/EditPosts.aspx?opt=1")
>>> urlparse.urlunparse(parse)
https://i.cnblogs.com:80/EditPosts.aspx?opt=1
>>> urlparse.urlunparse(("https","i.cnblogs.com","/EditPosts.aspx","","opt=1",""))
https://i.cnblogs.com/EditPosts.aspx?opt=1

 


以上是关于python(urlparse)模板使用方法总结的主要内容,如果未能解决你的问题,请参考以下文章

python 中 urlparse 模块介绍

python 中 urlparse 模块介绍

python基础篇-爬虫urlparse使用及简单示例

【Python中常用的库系列】——操作url的模块urlparse 模块

Python3 urlparse

Python-urlparse