如何在 Python 中使用引用者和 href 查找 url?

Posted

技术标签:

【中文标题】如何在 Python 中使用引用者和 href 查找 url?【英文标题】:How to find the url using the referer and the href in Python? 【发布时间】:2010-11-18 00:48:20 【问题描述】:

假设我有

window_location = 'http://***.com/questions/ask'
href = '/users/48465/jader-dias'

我要获得

link = 'http://***.com/users/48465/jader-dias'

我如何在 Python 中做到这一点?

它必须像在浏览器中一样工作

【问题讨论】:

【参考方案1】:
>>> import urlparse
>>> urlparse.urljoin('http://***.com/questions/ask',
...                  '/users/48465/jader-dias')
'http://***.com/users/48465/jader-dias'

来自urlparse.urljoin的文档页面:

urlparse.urljoin(base, url[, allow_fragments])

通过将“基本 URL”(基本)与 另一个网址 (url)。非正式地,这 使用基本 URL 的组件,在 特别是寻址方案, 网络位置和(部分) 路径,以提供缺少的组件 相对 URL。

如果 url 是绝对 URL(即 以 // 或 scheme://) 开头, url 的主机名和/或方案将是 出现在结果中。

【讨论】:

以上是关于如何在 Python 中使用引用者和 href 查找 url?的主要内容,如果未能解决你的问题,请参考以下文章

Python GC 中跟踪的任何对象都没有引用者吗?

从python2,python3编码问题引伸出的通用编码原理解释

在 HTTP 请求中了解引用者/引用者的安全方法是啥?

在Python中解析大量数据时,如何处理索引超出范围错误?

apache_conf 如何使用.htaccess阻止semalt.com引用者流量

Javascript 路径名引用者