名称空间和 xpath 的 libxml2 错误

Posted

技术标签:

【中文标题】名称空间和 xpath 的 libxml2 错误【英文标题】:libxml2 error with namespaces and xpath 【发布时间】:2011-03-09 06:56:40 【问题描述】:

我在这里粘贴一些代码,使用 gcc file.c -lxml2 编译时没有警告,假设您的系统中安装了 libxml2。

#include <libxml/parser.h>
#include <libxml/xpath.h>
#include <assert.h>
#include <libxml/tree.h>
#include <libxml/xpathInternals.h>

xmlDocPtr
getdoc (char *docname) 
    xmlDocPtr doc;
    doc = xmlParseFile(docname);

    if (doc == NULL ) 
        fprintf(stderr,"Document not parsed successfully. \n");
        return NULL;
    

    return doc;


xmlXPathObjectPtr
getnodeset (xmlDocPtr doc, xmlChar *xpath)

    xmlXPathContextPtr context;
    xmlXPathObjectPtr result;

    context = xmlXPathNewContext(doc);
    if (context == NULL) 
        printf("Error in xmlXPathNewContext\n");
        return NULL;
    

    if(xmlXPathRegisterNs(context,  BAD_CAST "new", BAD_CAST "http://www.example.com/new") != 0) 
        fprintf(stderr,"Error: unable to register NS with prefix");
        return NULL;
    

    result = xmlXPathEvalExpression(xpath, context);
    xmlXPathFreeContext(context);
    if (result == NULL) 
        printf("Error in xmlXPathEvalExpression\n");
        return NULL;
    
    if(xmlXPathNodeSetIsEmpty(result->nodesetval))
        xmlXPathFreeObject(result);
                printf("No result\n");
        return NULL;
    
    return result;


int
main(int argc, char **argv) 

    char *docname;
    xmlDocPtr doc;
    xmlChar *xpath = (xmlChar*) "/new:book/section1";
    xmlNodeSetPtr nodeset;
    xmlXPathObjectPtr result;
    int i;
    xmlChar *keyword;

    if (argc <= 1) 
        printf("Usage: %s docname\n", argv[0]);
        return(0);
    

    docname = argv[1];
    doc = getdoc(docname);
    result = getnodeset (doc, xpath);
    if (result) 
        nodeset = result->nodesetval;
        for (i=0; i < nodeset->nodeNr; i++) 
            keyword = xmlNodeListGetString(doc, nodeset->nodeTab[i]->xmlChildrenNode, 1);
        printf("keyword: %s\n", keyword);
        xmlFree(keyword);
        
        xmlXPathFreeObject (result);
    

    xmlFreeDoc(doc);
    xmlCleanupParser();
    return (1);

我的问题是我要解析下面的xml

<?xml version="1.0" encoding="UTF-8"?>
<book xmlns="http://www.example.com/new">
    <section1>Sec_1</section1>
    <section2>Sec_2</section2>
</book>

book 元素在该元素内定义了一个命名空间。我想打印 xpath /book/section1 中的值,它返回 NULL。当我尝试返回命名空间下的元素时,我也会收到错误,即 /new:book/section1

我假设我的代码失败是因为我没有正确使用命名空间前缀。我没时间了。你能帮忙吗?

【问题讨论】:

【参考方案1】:

结果,正如我从here 发现的那样, 这并不是 libXml 的真正失败,而是一个问题,因为 libXml 正确 遵循 XML/XPATH 规范。

R Bourdeau 提出的解决方案是正确的,但是,如果您可以控制正在解析的 xml 文档。

XPATH 查询的上下文独立于 xml 文档中的命名空间限定符。默认命名空间强制所有子标签进入一个命名空间;它们不需要在文档中进行限定,但必须在 xpath 查询中进行限定。幸运的是,您使用 libXml 将命名空间注册为 new,因此 cateof 的解决方案应该可以工作。

xmlXPathRegisterNs(context,  BAD_CAST "new", BAD_CAST "http://www.example.com/new"

xmlChar *xpath = (xmlChar*) "/new:book/new:section1";

我在这里内联 xml 以提高可见性:

<?xml version="1.0" encoding="UTF-8"?>
<book xmlns="http://www.example.com/new">
    <section1>Sec_1</section1>
    <section2>Sec_2</section2>
</book>

【讨论】:

这是与 XPath 和命名空间相关的第一个答案,它实际上解释了发生了什么以及如何解决它。我真诚地感谢你,我的朋友。【参考方案2】:

这是一个令人讨厌的 libXml 库故障。正如 cateof 所指出的,问题在于默认命名空间声明:

xmlns="http://www.example.com/new"

两种选择: (1)去掉你的书标签中的那个声明 要么 (2) 给它一个名字,并在你的标签中使用这个名字。

例如

xmlns:new="http://www.example.com/new"

那么你的标签都是这样的:

新:书 新:第 1 节

等等。

【讨论】:

是否可以告诉libxml 某个命名空间对于文档中的所有元素都是默认/隐式的,以避免在 XPath 查询中一遍又一遍地重复它?【参考方案3】:

这是默认命名空间的问题。要匹配您需要 /new:tag/new:tag 的路径 等等

【讨论】:

以上是关于名称空间和 xpath 的 libxml2 错误的主要内容,如果未能解决你的问题,请参考以下文章

使用 xpath 在 Java 中使用名称空间解析 XML

libxml2的xpath检索中文

XPATHS和默认命名空间

如何使用 xpath 选择名称空间定义标记

为啥命名空间限定节点没有 XPath 语法?

Cannot open include file: 'libxml/xpath.h': No such file or directory