SAX解析的characters方法被多次调用

Posted liuxiaoddd

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了SAX解析的characters方法被多次调用相关的知识,希望对你有一定的参考价值。

android SAX解析,为什么总是对一个tag执行三次 character()方法

原因是xml文件中含有\\n 和 \\t ,解析完想解析的内容之后,后面紧随的\\n 和换行之后缩进带来的\\t 同样会执行characters方法。

解决办法: String.replace("\\n",""); String.replace("\\t","");

以为这样就可以了,但是还是不行!!!replaceAll也不行!

最终我的解决办法是去xml文件把\\n 和\\t 替换掉,没有任何多余字符,就通过了。

但是参照网上内容,有些特殊符号,如&可能也会调用新的characters方法,最完美的解决方案是用StringBuilder,解析的时候去调用sb.append(*,*,*);然后在endelement方法中把sb强制转换为String,解决了当前问题。


续:

刚才又找到一个方法,调用一个函数

public static String getStringNoBlank(String str) {    
        if(str!=null && !"".equals(str)) {    
            Pattern p = Pattern.compile("\\\\s*|\\t|\\r|\\n");    
            Matcher m = p.matcher(str);    
            String strNoBlank = m.replaceAll("");    
            return strNoBlank;    
        }else {    
            return str;    
        }         
    }   

通过正则表达式把空白的空格符,换行符全部去掉,我没有在SAX那个程序中运行,但是在System.out中确实把xml文件的换行神马的都去掉了。

 

以上是关于SAX解析的characters方法被多次调用的主要内容,如果未能解决你的问题,请参考以下文章

python使用SAX解析xml

Java SAX 解析

使用 SAX 解析器时如何获取父节点?

XML编程总结——使用SAX接口操作xml

在 SAX 解析器中删除空格

更快的多重解析:SAX 或 DOM