二十七XPath

Posted 2020-10-10 走遍天涯心随你起落

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了二十七XPath相关的知识，希望对你有一定的参考价值。

二十七、XPath

XPath是一种节点查找手段，对比之前使用标准DOM去查找XML中的节点方式，大大降低了查找难度，方便开发者使用。但是，DOM3级以前的标准并没有就XPath做出规范；直到DOM3在首次推荐到标准规范行列。大部分浏览器实现了这个标准，IE则以自己的方式实现了XPath。

1.IE中的XPath

在IE8及之前的浏览器，XPath是采用内置基于ActiveX的XML DOM文档对象实现的。在每一个节点上提供了两个方法：selectSingleNode()和selectNodes()。

selectSingleNode()方法接受一个XPath模式（也就是查找路径），找到匹配的第一个节点并将它返回，没有则返回null。

var user = xmlDom.selectSingleNode(‘root/user‘); //得到第一个user节点

alert(user.xml); //查看xml序列

alert(user.tagName); //节点元素名

alert(user.firstChild.nodeValue); //节点内的值

上下文节点：我们通过xmlDom这个对象实例调用方法，而xmlDom这个对象实例其实就是一个上下文节点，这个节点指针指向的是根，也就是root元素之前。那么如果我们把这个指针指向user元素之前，那么结果就会有所变化。

//通过xmlDom，并且使用root/user的路径

var user = xmlDom.selectSingleNode(‘root/user‘);

alert(user.tagName); //user

//通过xmlDom.documentElement，并且使用user路径，省去了root

var user = xmlDom.documentElement.selectSingleNode(‘user‘);

alert(user.tagName); //user

//通过xmlDom，并且使用user路径，省去了root

var user = xmlDom.selectSingleNode(‘user‘);

alert(user.tagName); //找不到了，出错

PS：xmlDom和xmlDom.documentElement都是上下文节点，主要就是定位当前路径查找的指针，而xmlDom对象实例的指针就是在最根上。

XPath常用语法

//通过user[n]来获取第n+1条节点，PS：XPath其实是按1为起始值的

var user = xmlDom.selectSingleNode(‘root/user[1]‘);

alert(user.xml);

//通过text()获取节点内的值

var user = xmlDom.selectSingleNode(‘root/user/text()‘);

alert(user.xml);

alert(user.nodeValue);

//通过//user表示在整个xml获取到user节点，不关心任何层次

var user = xmlDom.selectSingleNode(‘//user‘);

alert(user.xml);

//通过root//user表示在root包含的层次下获取到user节点，在root内不关心任何层次

var user = xmlDom.selectSingleNode(‘root//user‘);

alert(user.tagName);

//通过root/user[@id=6]表示获取user中id=6的节点

var user = xmlDom.selectSingleNode(‘root/user[@id=6]‘);

alert(user.xml);

PS：更多的XPath语法，可以参考XPath手册或者XML DOM手册进行参考，这里只提供了最常用的语法。

selectSingleNode()方法是获取单一节点，而selectNodes()方法则是获取一个节点集合。

var users = xmlDom.selectNodes(‘root/user‘); //获取user节点集合

alert(users.length);

alert(users[1].xml);

2.W3C下的XPath

在DOM3级XPath规范定义的类型中，最重要的两个类型是XPathEvaluator和XPathResult。其中，XPathEvaluator用于在特定上下文对XPath表达式求值。

XPathEvaluator的方法

方法	说明
createExpression(e, n)	将XPath表达式及命名空间转化成XPathExpression
createNSResolver(n)	根据n命名空间创建一个新的XPathNSResolver对象
evaluate(e, c, n ,t ,r)	结合上下文来获取XPath表达式的值

W3C实现XPath查询节点比IE来的复杂，首先第一步就是需要得到XPathResult对象的实例。得到这个对象实例有两种方法，一种是通过创建XPathEvaluator对象执行evaluate()方法，另一种是直接通过上下文节点对象(比如xmlDom)来执行evaluate()方法。

//使用XPathEvaluator对象创建XPathResult

var eva = new XPathEvaluator();

var result = eva.evaluate(‘root/user‘, xmlDom, null,

XPathResult.ORDERED_NODE_ITERATOR_TYPE, null);

alert(result);

//使用上下文节点对象(xmlDom)创建XPathResult

var result = xmlDom.evaluate(‘root/user‘, xmlDom, null,

XPathResult.ORDERED_NODE_ITERATOR_TYPE, null);

alert(result);

相对而言，第二种简单方便一点，但evaluate方法有五个属性：1.XPath路径、2.上下文节点对象、3.命名空间求解器(通常是null)、4.返回结果类型、5保存结果的XPathResult对象(通常是null)。

对于返回的结果类型，有10中不同的类型

常量	说明
XPathResult.ANY_TYPE	返回符合XPath表达式类型的数据
XPathResult.ANY_UNORDERED_NODE_TYPE	返回匹配节点的节点集合，但顺序可能与文档中的节点的顺序不匹配
XPathResult.BOOLEAN_TYPE	返回布尔值
XPathResult.FIRST_ORDERED_NODE_TYPE	返回只包含一个节点的节点集合，且这个节点是在文档中第一个匹配的节点
XPathResult.NUMBER_TYPE	返回数字值
XPathResult.ORDERED_NODE_ITERATOR_TYPE	返回匹配节点的节点集合，顺序为节点在文档中出现的顺序。这是最常用到的结果类型
XPathResult.ORDERED_NODE_SNAPSHOT_TYPE	返回节点集合快照，在文档外捕获节点，这样将来对文档的任何修改都不会影响这个节点列表
XPathResult.STRING_TYPE	返回字符串值
XPathResult.UNORDERED_NODE_ITERATOR_TYPE	返回匹配节点的节点集合，不过顺序可能不会按照节点在文档中出现的顺序排列
XPathResult.UNORDERED_NODE_SNAPSHOT_TYPE	返回节点集合快照，在文档外捕获节点，这样将来对文档的任何修改都不会影响这个节点列表

PS：上面的常量过于繁重，对于我们只需要学习了解，其实也就需要两个：1.获取一个单一节、2.获取一个节点集合。

1.获取一个单一节点

var result = xmlDom.evaluate(‘root/user‘, xmlDom, null,

XPathResult.FIRST_ORDERED_NODE_TYPE, null);

if (result !== null) {

alert(result.singleNodeValue.tagName); //singleNodeValue属性得到节点对象

}

2.获取节点集合

var result = xmlDom.evaluate(‘root/user‘, xmlDom, null,

XPathResult.ORDERED_NODE_ITERATOR_TYPE, null);

var nodes = [];

if (result !== null) {

while ((node = result.iterateNext()) !== null) {

nodes.push(node);

}

PS：节点集合的获取方式，是通过迭代器遍历而来的，我们保存到数据中就模拟出IE相似的风格。

3.XPath跨浏览器兼容

如果要做W3C和IE的跨浏览器兼容，我们要思考几个问题：1.如果传递一个节点的下标，IE是从0开始计算，W3C从1开始计算，可以通过传递获取下标进行增1减1的操作来进行。2.独有的功能放弃，为了保证跨浏览器。3.只获取单一节点和节点列表即可，基本可以完成所有的操作。

//跨浏览器获取单一节点

function selectSingleNode(xmlDom, xpath) {

var node = null;

if (typeof xmlDom.evaluate != ‘undefined‘) {

var patten = /\[(\d+)\]/g;

var flag = xpath.match(patten);

var num = 0;

if (flag !== null) {

num = parseInt(RegExp.$1) + 1;

xpath = xpath.replace(patten, ‘[‘ + num + ‘]‘);

}

var result = xmlDom.evaluate(xpath, xmlDom, null,

XPathResult.FIRST_ORDERED_NODE_TYPE, null);

if (result !== null) {

node = result.singleNodeValue;

}

} else if (typeof xmlDom.selectSingleNode != ‘undefined‘) {

node = xmlDom.selectSingleNode(xpath);

}

return node;

}

//跨浏览器获取节点集合

function selectNodes(xmlDom, xpath) {

var nodes = [];

if (typeof xmlDom.evaluate != ‘undefined‘) {

var patten = /\[(\d+)\]/g;

var flag = xpath.match(patten);

var num = 0;

if (flag !== null) {

num = parseInt(RegExp.$1) + 1;

xpath = xpath.replace(patten, ‘[‘ + num + ‘]‘);

}

var node = null;

　　 var result = xmlDom.evaluate(‘root/user‘, xmlDom, null,

XPathResult.ORDERED_NODE_ITERATOR_TYPE, null);

　　if (result !== null) {

　　 while ((node = result.iterateNext()) !== null) {

　　 nodes.push(node);

　　 }

} else if (typeof xmlDom.selectNodes != ‘undefined‘) {

nodes = xmlDom.selectNodes(xpath);

}

return nodes;

}

PS：在传递xpath路径时，没有做验证判断是否合法，有兴趣的同学可以自行完成。在XML还有一个重要章节是XSLT和EX4，由于在使用频率的缘故，我们暂且搁置。

以上是关于二十七XPath的主要内容，如果未能解决你的问题，请参考以下文章

leetcode刷题二十七

javaSE第二十七天

2022/01/23thinkphp源码无差别阅读（二十七）

React学习案例二十七

二十七sed

初级算法探索——动态规划篇（二十七）