encodeURIdecodeURIencodeURIComponentdecodeURIComponent描述和区别
Posted 「已注销」
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了encodeURIdecodeURIencodeURIComponentdecodeURIComponent描述和区别相关的知识,希望对你有一定的参考价值。
encodeURI
encodeURI() 函数通过将特定字符的每个实例替换为一个、两个、三或四转义序列来对统一资源标识符 (URI) 进行编码 (该字符的 UTF-8 编码仅为四转义序列)由两个 “代理” 字符组成)。
描述
假定一个URI是完整的URI,那么无需对那些保留的并且在URI中有特殊意思的字符进行编码。
http://username:password@www.example.com:80/path/to/file.php?foo=316&bar=this+has+spaces#anchor
encodeURI
会替换所有的字符,但不包括以下字符,即使它们具有适当的UTF-8转义序列:
类型 | 包含 |
---|---|
保留字符 | ; , / ? : @ & = + $ |
非转义的字符 | 字母 数字 - _ . ! ~ * ’ ( ) |
数字符号 | # |
请注意,encodeURI 自身无法产生能适用于HTTP GET 或 POST 请求的URI,例如对于 XMLHTTPRequests, 因为 “&”, “+”, 和 “=” 不会被编码,然而在 GET 和 POST 请求中它们是特殊字符。然而encodeURIComponent
这个方法会对这些字符编码。
另外,如果试图编码一个非高-低位完整的代理字符,将会抛出一个 URIError 错误,例如:
// 编码高-低位完整字符 ok
console.log(encodeURI('\\uD800\\uDFFF'));
// 编码单独的高位字符抛出 "Uncaught URIError: URI malformed"
console.log(encodeURI('\\uD800'));
// 编码单独的低位字符抛出 "Uncaught URIError: URI malformed"
console.log(encodeURI('\\uDFFF'));
并且需要注意,如果URL需要遵循较新的RFC3986标准,那么方括号是被保留的(给IPv6),因此对于那些没有被编码的URL部分(例如主机),可以使用下面的代码:
function fixedEncodeURI (str)
return encodeURI(str).replace(/%5B/g, '[').replace(/%5D/g, ']');
decodeURI
decodeURI() 函数解码一个由encodeURI 先前创建的统一资源标识符(URI)或类似的例程。
描述
将已编码 URI 中所有能识别的转义序列转换成原字符,但不能解码那些不会被 encodeURI 编码的内容(例如 “#”)
encodeURIComponent
encodeURIComponent()是对统一资源标识符(URI)的组成部分进行编码的方法。它使用一到四个转义序列来表示字符串中的每个字符的UTF-8编码(只有由两个Unicode代理区字符组成的字符才用四个转义字符编码)。
描述
encodeURIComponent
转义除了字母、数字、(、)、.、!、~、*、’、-和_之外的所有字符。
注意,如果试图编码一个非高-低位完整的代理字符,将会抛出一个 URIError 错误,例如:
// 高低位完整
alert(encodeURIComponent('\\uD800\\uDFFF'));
// 只有高位,将抛出"URIError: malformed URI sequence"
alert(encodeURIComponent('\\uD800'));
// 只有低位,将抛出"URIError: malformed URI sequence"
alert(encodeURIComponent('\\uDFFF'));
为了避免服务器收到不可预知的请求,对任何用户输入的作为URI部分的内容你都需要用encodeURIComponent
进行转义。比如,一个用户可能会输入”Thyme &time=again”作为comment变量的一部分。如果不使用encodeURIComponent
对此内容进行转义,服务器得到的将是comment=Thyme%20&time=again。请注意,”&”符号和”=”符号产生了一个新的键值对,所以服务器得到两个键值对(一个键值对是comment=Thyme,另一个则是time=again),而不是一个键值对。
对于 application/x-www-form-urlencoded (POST) 这种数据方式,空格需要被替换成 ‘+’,所以通常使用 encodeURIComponent
的时候还会把 “%20” 替换为 “+”。
为了更严格的遵循 RFC 3986(它保留 !, ‘, (, ), 和 *),即使这些字符并没有正式划定 URI 的用途,下面这种方式是比较安全的:
function fixedEncodeURIComponent (str)
return encodeURIComponent(str).replace(/[!'()*]/g, function(c)
return '%' + c.charCodeAt(0).toString(16);
);
decodeURIComponent
decodeURIComponent
方法用于解码由 encodeURIComponent
方法或者其它类似方法编码的部分统一资源标识符(URI)
描述
将已编码 URI 中所有能识别的转义序列转换成原字符。
以上是关于encodeURIdecodeURIencodeURIComponentdecodeURIComponent描述和区别的主要内容,如果未能解决你的问题,请参考以下文章