利用a标签自动解析URL

Posted 唸随爱

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了利用a标签自动解析URL相关的知识,希望对你有一定的参考价值。

很多时候我们有从一个URL中提取域名,查询关键字,变量参数值等的需要,而万万没想到可以让浏览器方便地帮我们完成这一任务而不用我们写正则去抓取。方法就在JS代码里先创建一个 a 标签然后将需要解析的URL赋值给 a 的 href 属性,然后就得到了一切我们想要的了。

var a = document.createElement(\'a\');
a.href = \'http://www.cnblogs.com/wayou/p/\';
console.log(a.host);

  

利用这一原理,稍微扩展一下,就得到了一个更加健壮的解析URL各部分的通用方法了。下面代码来自James的博客。

function parseURL(url) {
 var a =  document.createElement(\'a\');
 a.href = url;
 return {
     source: url,
     protocol: a.protocol.replace(\':\',\'\'),
     host: a.hostname,
     port: a.port,
     query: a.search,
     params: (function(){
         var ret = {},
           seg = a.search.replace(/^\\?/,\'\').split(\'&\'),
           len = seg.length, i = 0, s;
         for (;i<len;i++) {
             if (!seg[i]) { continue; }
             s = seg[i].split(\'=\');
             ret[s[0]] = s[1];
         }
         return ret;
     })(),
     file: (a.pathname.match(/\\/([^\\/?#]+)$/i) || [,\'\'])[1],
     hash: a.hash.replace(\'#\',\'\'),
     path: a.pathname.replace(/^([^\\/])/,\'/$1\'),
     relative: (a.href.match(/tps?:\\/\\/[^\\/]+(.+)/) || [,\'\'])[1],
     segments: a.pathname.replace(/^\\//,\'\').split(\'/\')
 };
}

  

以上是关于利用a标签自动解析URL的主要内容,如果未能解决你的问题,请参考以下文章

小技巧之a标签自动解析URL

Python 2.7_爬取CSDN单页面利用正则提取博客文章及url_20170113

jsonp

jsonp

Python中verbaim标签使用详解

安全-Tomcat URL解析差异性及利用