解析XML文件的xerces.jar和xercesImpl.jar包,有啥不同

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了解析XML文件的xerces.jar和xercesImpl.jar包,有啥不同相关的知识,希望对你有一定的参考价值。

参考技术A xercesImpl.jar
解析XML文件前面我们说过映射文件是XML格式,数据库配置文件也可以是XML格式,因此如果能解析XML文件我们就可以获取这两个文件的信息。XML文件格式我简单做下介绍,比如tom这句就是一个XML格式的描述,name代表节点,节点必须有开始标记和结束标记,在开始标记中我们可以添加一些属性的声明比如sex。解析XML的技术可以分为两类那就是SAX和DOM,这两种方式的差别和优缺点大家可以上网查阅或者我们会在以后的文章中提出,请大家关注。实现解析XML文件的功能很方便,我们可以通过下载第三方的一些工具包如xml-apis.jar和 xercesImpl.jar等,也可以使用JDK自带的工具类DocumentBuilderFactory、DocumentBuilder、 Document、Element等等,大家可以通过API文挡查阅这些类的说明。通过这些类我们可以把XML文件的信息读入内存并通过类中的某些方法获取指定节点的名字、值、属性名、属性值这些信息。

C++使用TinyXml(开源库)读取*.XMl文件

xml

什么是xml?

目前,对xml的使用非常广泛,读取和设置xml配置文件是我们最常用的操作。常见C/C++ XML解析器有Tinyxml、XERCES、squashxml、xmlite、pugxml、libxml等等,这些解析器有些是支持多语言的,有些只是单纯C/C++的。
TinyXML是目前非常流行的一款基于DOM模型的XML解析器,简单易用且小巧玲珑,非常适合存储简单数据,配置文件,对象序列化等数据量不是很大的操作。这个解析库的模型通过解析XML文件,然后在内存中生成DOM模型,从而让我们很方便的遍历这棵XML树。

  1. XML 指可扩展标记语言( EX tensible M arkup L anguage)
  2. XML 是一种 标记语言 ,很类似 HTML

格式示例

<Persons>、<Person>、、<desc> 分别为标签,标签内包含了要传递的信息。
标签必须成对出现,有开始标签就需要有结束标签,例如:
**开始标签:<name>
结束标签:</name> **

<Persons>
        <Person ID="1">
            <name>Kobe</name>
            <age>24</age>
        </Person>
        <Person ID="2">
            <name>Michael</name>
            <age>23</age>
       </Person>
 </Persons>

下载TinyXml

官网下载: https://sourceforge.net/projects/tinyxml/
csdn : https://download.csdn.net/download/qq_45254369/86266445 (如果没积分可以私聊我发你)
安装:解压缩tinyXML后,将这六个文件添加到你的C++工程中,分别是tinystr.h、tinystr.cpp、tinyxml.h、tinyxml.cpp、tinyxmlerror.cpp、tinyxmlparser.cpp。在需要操作xml文件的地方,包含tinyxml.h,就可以引入TinyXML类库(#include "tinyxml.h")。

TinyXml结构

类名说明
TiXmlBase整个TinyXML模型的基类。
TiXmlAttribute对应于XML中的元素的属性。
TiXmlNode对应于DOM结构中的节点。
TiXmlComment对应于XML中的注释
TiXmlDeclaration对应于XML中的申明部分,即<?versiong=“1.0” ?>。
TiXmlDocument对应于XML的整个文档。
TiXmlElement对应于XML的元素。
TiXmlText对应于XML的文字部分
TiXmlUnknown对应于XML的未知部分。
TiXmlHandler定义了针对XML的一些操作。

【实战】读取XMl

测试的xml文件

第一行表示版本以及编码格式。

需要建立对应的结构体

struct Cookbook

	string name;
	vector<string> food;
	vector<string> spices;
	vector<string> step;
	void clear()
	
		name.clear();
		food.clear();
		spices.clear();
		step.clear();
	
;

使用到的API

加载xml文件:
bool TiXmlDocument::LoadFile( const char * filename, TiXmlEncoding encoding = TIXML_DEFAULT_ENCODING );
使用给定的文件名解析加载文件。 如果成功返回true。

返回根节点
TiXmlElement* TiXmlDocument::RootElement()

获取该节点对应的文本
const TIXML_STRING& TiXmlElement::ValueTStr()

获取第一个子节点
const TiXmlElement* FirstChildElement() const;

获取下一个子节点
const TiXmlElement* NextSiblingElement() const;

获取该节点对应的文本
const char* GetText() const;

设计一个ParseXML类

传入一个xml文件路径,就会传出所有的Cookbook。

class ParseXML

public:
	ParseXML();
	~ParseXML();
	bool ReadParaXml(string m_strXmlPath, vector<Cookbook>& vecNode);
;

#include "ParseXML.h"

ParseXML::ParseXML() 




ParseXML::~ParseXML()



bool ParseXML::ReadParaXml(string m_strXmlPath, vector<Cookbook>& vecNode)

	Cookbook* pNode = new Cookbook();

	//读取xml文件中的参数值
	TiXmlDocument* Document = new TiXmlDocument();
	if (!Document->LoadFile(m_strXmlPath.c_str()))
	
		cout << "无法加载xml文件!" << endl;
		cin.get();
		return false;
	
	TiXmlElement* RootElement = Document->RootElement();		//根目录

	TiXmlElement* NextElement = RootElement;		//根目录下的第一个节点层
	while (NextElement != NULL)		//判断有没有读完
	
		if (NextElement->ValueTStr() == "menu")		//读到menu节点
		
			TiXmlElement* BoxElement = NextElement->FirstChildElement();
			while (BoxElement->ValueTStr() != "name")		//读到name节点
			
				BoxElement = BoxElement->NextSiblingElement();

			
			pNode->name = BoxElement->GetText(); 
			BoxElement = BoxElement->NextSiblingElement();

			
			while (BoxElement->ValueTStr() == "food")		// 读到food节点
			
				pNode->food.push_back(BoxElement->GetText());
				BoxElement = BoxElement->NextSiblingElement();
			
			while (BoxElement->ValueTStr() == "spices")		// 读到spices节点
			
				pNode->spices.push_back(BoxElement->GetText());
				BoxElement = BoxElement->NextSiblingElement();
			
			while (BoxElement != nullptr && BoxElement->ValueTStr() == "step")// 读到step节点
			
				pNode->step.push_back(BoxElement->GetText());
				BoxElement = BoxElement->NextSiblingElement();
			
			vecNode.push_back(*pNode);
			pNode->clear();
			
		
		NextElement = NextElement->NextSiblingElement();
	

	//释放内存
	delete pNode;
	delete Document;
	cout << "完成xml的读取" << endl;
	return true;

测试结果

因为我这个是QT做的ui界面,这里只需要关注内容是否对应即可。

以上是关于解析XML文件的xerces.jar和xercesImpl.jar包,有啥不同的主要内容,如果未能解决你的问题,请参考以下文章

Java 中是不是有比 Xalan/Xerces 更快的 XML 解析器 [关闭]

如何在通过 SAX Xerces 解析 XML Doc 时引用 XSD Schema 位置?

Xerces链接错误原因之/Zc:wchar_t-设置不一致

com.sun.org.apache.xerces.internal.impl.io.MalformedByteSequenceException: Invalid byte 1 of 1-byte

使用 Xerces 将 DOM 序列化为 FileOutputStream

对大文件有效的轻量级 XML 解析器?