java dom 解析xml

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了java dom 解析xml相关的知识,希望对你有一定的参考价值。

<?xml version="1.0" encoding="UTF-8"?>
<数据组>
<名称>苏州日报</名称>
<出版>苏州日报报业集团</出版>
<创刊>1949/01/01</创刊>
<出版地>江苏省苏州市</出版地>
<国内统一刊号>CN32-0035</国内统一刊号>
<国外发行代号></国外发行代号>
<发行地域>全国</发行地域>
<发行范围>公开</发行范围>
<刊期>日报</刊期>
<语种>中文</语种>
</数据组>
怎么解析成

名称:苏州日报
出版:苏州日报报业集团
……
关键是有个<国外发行代号></国外发行代号>
它老是报错 :空指针

db = dbf.newDocumentBuilder();
Document doc = db.parse("1.xml");
NodeList l = doc.getElementsByTagName("数据组").item(0).getChildNodes();
for (int i = 0; i < l.getLength(); i++)
Node n = l.item(i);
if (n.getNodeType() != Node.TEXT_NODE)
System.out.println(n.getNodeName() + ": " + n.getTextContent());
参考技术A 38.读取XML数据库
/*
import java.io.*;
import javax.xml.parsers.*;
import org.w3c.dom.*;
private Document document;
private Element node;
*/
File xml_file = new File(%%1);
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
try
DocumentBuilder builder = factory.newDocumentBuilder();
document = builder.parse(xml_file);
catch (Exception e)
e.printStackTrace();

String subNodeTag = %%2;
Element rootNode = document.getDocumentElement();
//%%2="Product" //%%4="id" //%%6="port"
//%%3="Name" //%%5="001"
NodeList nlist = rootNode.getElementsByTagName(subNodeTag);
int len = nlist.getLength();
for (int i = 0; i < len; i++)
node = nlist.item(i);
String getNodeAttrValue = null;
NamedNodeMap attrList = node.getAttributes();
for (int j = 0; j < attrList.getLength(); j++)
if (attrList.item(j).getNodeName().equals(%%4))
getNodeAttrValue = attrList.item(j).getNodeValue();
break;


if (getNodeAttrValue.equals(%%5))
nlist = node.getChildNodes();
String %%9=((Element) node).getElementsByTagName(%%3).item(0)
.getFirstChild().getNodeValue();
break;



39.写入XML数据库
/*
import java.io.*;
import javax.xml.parsers.*;
import org.w3c.dom.*;
import javax.xml.transform.*;
import javax.xml.transform.dom.*;
import javax.xml.transform.stream.*;
private Document document;
private Element node;
*/
File xml_file = new File(%%1);
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
try
DocumentBuilder builder = factory.newDocumentBuilder();
document = builder.parse(xml_file);
catch (Exception e)
e.printStackTrace();

String subNodeTag = %%2;
Element rootNode = document.getDocumentElement();
// %%2="Product" //%%4="pid" //%%6="author"
// %%3="Name" //%%5="price"
NodeList nlist = rootNode.getElementsByTagName(subNodeTag);
String ss = null;
int len = nlist.getLength();
for (int i = 0; i < len; i++)
node = (Element) nlist.item(i);
//node.setAttribute(%%4, "0"+String.valueOf(i)); //ID格式化
String getNodeAttrValue = null;
NamedNodeMap attrList = node.getAttributes();
for (int j = 0; j < attrList.getLength(); j++)
if (attrList.item(j).getNodeName().equals(%%4))
getNodeAttrValue = attrList.item(j).getNodeValue();
break;


if (getNodeAttrValue.equals("001"))
nlist = node.getChildNodes();
ss = ((Element) node).getElementsByTagName(%%3).item(0)
.getFirstChild().getNodeValue();
ss = ((Element) node).getElementsByTagName(%%6).item(0)
.getFirstChild().getNodeValue();
ss = ((Element) node).getElementsByTagName(%%5).item(0)
.getFirstChild().getNodeValue();
((Element) node).getElementsByTagName(%%3).item(0)
.getFirstChild().setTextContent(%%7);
((Element) node).getElementsByTagName(%%6).item(0)
.getFirstChild().setTextContent(%%8);
((Element) node).getElementsByTagName(%%5).item(0)
.getFirstChild().setTextContent(%%9);
break;


if (ss == null)
node = document.createElement(%%2);
node.setAttribute(%%4, String.valueOf(nlist.getLength() + 1));
node.appendChild(document.createTextNode("\n"));
Element server = document.createElement(%%3);
server.appendChild(document.createTextNode(%%7));
node.appendChild(server);
Element ipNode = document.createElement(%%6);
ipNode.appendChild(document.createTextNode(%%8));
node.appendChild(ipNode);
node.appendChild(document.createTextNode("\n"));
Element port = document.createElement(%%5);
port.appendChild(document.createTextNode(%%9));
node.appendChild(port);
node.appendChild(document.createTextNode("\n"));
rootNode.appendChild(node);

TransformerFactory tFactory = TransformerFactory.newInstance();
Transformer transformer = null;
try
transformer = tFactory.newTransformer();
DOMSource source = new DOMSource(document);
StreamResult result = new StreamResult(xml_file);
transformer.transform(source, result);
catch (Exception e)
e.printStackTrace();
参考技术B 代码如下 ,把你那个xml文件命名为33.xml放在c盘下
public static void main(String[] args)
try
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
Document document = factory.newDocumentBuilder().parse(new File("c:\\33.xml"));
Element root = document.getDocumentElement();

NodeList datalist=root.getChildNodes();
for(int i=0;i<datalist.getLength();i++)

//System.out.println(books.item(i).getNodeType()+":"+Node.ELEMENT_NODE);
if(datalist.item(i).getNodeType()==1)
if(datalist.item(i).hasChildNodes())
System.out.println(datalist.item(i).getNodeName()+":"+datalist.item(i).getFirstChild().getNodeValue());
else
System.out.println(datalist.item(i).getNodeName()+":"+"");





catch(Exception e)e.printStackTrace();



其实你说的空指针问题关键是少这个判断:datalist.item(i).hasChildNodes()
参考技术C (1)得到DOM解析器的工厂实例

DocumentBuilderFactory domfac=DocumentBuilderFactory.newInstance();

得到javax.xml.parsers.DocumentBuilderFactory;类的实例就是我们要的解析器工厂

(2)从DOM工厂获得DOM解析器

DocumentBuilder dombuilder=domfac.newDocumentBuilder();

通过javax.xml.parsers.DocumentBuilderFactory实例的静态方法newDocumentBuilder()得到DOM解析器

(3)把要解析的XML文档转化为输入流,以便DOM解析器解析它

InputStream is=new FileInputStream("bin/library.xml");

InputStream是一个接口。

(4)解析XML文档的输入流,得到一个Document

Document doc=dombuilder.parse(is);

由XML文档的输入流得到一个org.w3c.dom.Document对象,以后的处理都是对Document对象进行的

(5)得到XML文档的根节点

Element root=doc.getDocumentElement();

在DOM中只有根节点是一个org.w3c.dom.Element对象。

(6)得到节点的子节点

NodeList books=root.getChildNodes();

for(int i=0;i

Node book=books.item(i);



这是用一个org.w3c.dom.NodeList接口来存放它所有子节点的,还有一种轮循子节点的方法,后面有介绍

(7)取得节点的属性值

String email=book.getAttributes()。getNamedItem("email")。getNodeValue();

System.out.println(email);

注意,节点的属性也是它的子节点。它的节点类型也是Node.ELEMENT_NODE

(8)轮循子节点

for(Node node=book.getFirstChild();node!=null;node=node.getNextSibling())

if(node.getNodeType()==Node.ELEMENT_NODE)

if(node.getNodeName()。equals("name"))

String name=node.getNodeValue();

String name1=node.getFirstChild()。getNodeValue();

System.out.println(name);

System.out.println(name1);



if(node.getNodeName()。equals("price"))

String price=node.getFirstChild()。getNodeValue();

System.out.println(price);



参考技术D 那是你里面没有值的原因吧

Java Dom解析xml文件

import java.io.IOException;
import javax.xml.parsers.*;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.NamedNodeMap;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.xml.sax.SAXException;

public class Domtest {

    public static void main(String[] args) throws ParserConfigurationException, SAXException, IOException {
        //创建一个DocumentBuilderFactory对象
        DocumentBuilderFactory dbf=DocumentBuilderFactory.newInstance();
        //创建一个Doucumentbuild对象
        DocumentBuilder db=dbf.newDocumentBuilder();
        //解析对应的xml文件
        Document doc=db.parse("tes.xml");
        //根据标签名获取Node节点list
        NodeList nodelist=doc.getElementsByTagName("book");
        System.out.println("共有"+nodelist.getLength()+"本书");
        //遍历每一个book节点
        for(int i=0;i<nodelist.getLength();i++) {    
            System.out.println("第"+i+"本书");
            //获取个book节点
            //使用Node类型获取book
            Node book=nodelist.item(i);
            System.out.println("Name: "+book.getNodeName()+" Value: "+book.getNodeValue()+" Type: "+book.getNodeType());
            //获取Node节点中的属性
            NamedNodeMap attrs= book.getAttributes();
            //遍历获取属性
            for(int j=0;j<attrs.getLength();j++) { 
            Node x=attrs.item(j);
            //System.out.println(x.getNodeName()+" "+x.getNodeValue()+" "+x.getNodeType());
            }
            
            //使用Element对象获取节点
            Element node =(Element) nodelist.item(i); 
            //使用Element对象下的getAttribute方法可以获取指定名字的属性值
            String id=node.getAttribute("id");
            System.out.println(id); 
            String type=node.getAttribute("type");
            System.out.println(type);
             
            //使用Node节点下的getChildNode可以获取Nodelist数组,以此进行循环解析
            NodeList childnode=book.getChildNodes();
            for(int j=0;j<childnode.getLength();j++) {//getLength后会获取9个节点,因为text类型也算节点,一个<name>……</name>算一个节点,所以共有9个节点,而这些节点中,只有对象节点是我们需要的 
                Node x=childnode.item(j);
                if(x.getNodeType()==Node.ELEMENT_NODE){//当节点类型为Element时,获取该节点
                    //获取element类型的节点名
                    System.out.println("节点"+j+"的名字:"+x.getNodeName()+" 值:/"+x.getLastChild().getNodeValue()+"/种类为"+x.getLastChild().getNodeType());//<name>xyz<name>,xyz属于<name>的子节点,使用getfirstChild或getLastNode效果相同
                    System.out.println("节点"+j+"的名字:"+x.getNodeName()+" 值:/"+x.getTextContent()+"/种类为"+x.getNodeType());//getTextContent方法可以获取节点中所有的text内容 将<name>xyz</name>改为<name><a>123</a>xyz</name>,会获取到xyz123
                }
            }
        }
    }
}
//为了将获取到的xml文件中内容保存下来,可以将内容保存到对象数组中一次来存储数据
<?xml version="1.0" encoding="UTF-8" ?>
<Bookstore>
	<book id="1" type="text">
	<name>冰与火之歌</name>
	<author>乔治马丁</author>
	<year>2014</year>
	<price>80</price>
	</book>
<book id="2">
	<name>安徒生童话</name>
	<year>2004</year>
	<price>79</price>
	<language>English</language>
</book>
</Bookstore>

  技术图片

 

 注意点 

1 空白换行符也算节点,所以遍历节点时需要注意这些无用的节点会混在list中

2 text类节点返回Name值都是#text,而Element类节点返回value值都是null,需要注意

以上是关于java dom 解析xml的主要内容,如果未能解决你的问题,请参考以下文章

02-Java是如何解析xml文件的(DOM)

Java---XML的解析-DOM解析

Java案例:利用dom4j解析XML文件

JAVA中使用DOM解析XML文件

JAva使用DOM读取XML数据(解析)

java解析xml的几种方式哪种最好?