Selenium2+Python3.6实战:读取xml文件,获得标签信息ExpatError: not well-formed (invalid token)
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Selenium2+Python3.6实战:读取xml文件,获得标签信息ExpatError: not well-formed (invalid token)相关的知识,希望对你有一定的参考价值。
在读取xml文件的标签信息时,运行后出现错误提示:
Traceback (most recent call last):
File "D:/Python/html/read-xml.py", line 3, in
dom = minidom.parse(‘info.xml‘)
File "D:\Program Files\Python36\lib\xml\dom\minidom.py", line 1958, in parse
return expatbuilder.parse(file)
File "D:\Program Files\Python36\lib\xml\dom\expatbuilder.py", line 911, in parse
result = builder.parseFile(fp)
File "D:\Program Files\Python36\lib\xml\dom\expatbuilder.py", line 207, in parseFile
parser.Parse(buffer, 0)
xml.parsers.expat.ExpatError: not well-formed (invalid token): line 11, column 18
仔细查看了xml源代码和python源代码都没有发现有语法的问题,然后又在网上查了一些资料,终于找到了原因:“转码”问题。
如果xml文件中没有中文,自然能够输入所需要的数据,但是现在xml文件中有中文。一般情况我们在做自动化测试的时候,习惯用txt来编辑xml文件进行数据保存,但是在用txt编辑完xml文件后,都习惯性的直接点击保存,默认保存的编码方式是ANSI。问题就出在编码方式,如果我们用UTF-8的编码方式保存后,重新执行脚本,那么程序执行成功,正确输出中文。
找到原因后,我重新将txt文件另存为xml文件,并且在保存时将编码方式选择为UTF-8:
保存好以后再重新运行代码:
from xml.dom import minidom
dom = minidom.parse(‘info.xml‘)
root = dom.documentElement
print (root.nodeName) print (root.nodeValue) print (root.nodeType) print (root.ELEMENT_NODE)
运行结果显示为:
info
None
1
1
附上xml文件代码:
<?xml version="1.0" encoding="utf-8"?>
<info>
<base>
<platform>Windows</platform>
<browser>Firefox</browser>
<url>http://www.baidu.com</url>
<login username="admin" password="123456"/>
<login username="guest" password="654321"/>
</base>
<test>
<province>北京</province>
<province>广东</province>
<city>深圳</city>
<city>珠海</city>
<province>浙江</province>
<city>杭州</city>
</test>
</info>
以上是关于Selenium2+Python3.6实战:读取xml文件,获得标签信息ExpatError: not well-formed (invalid token)的主要内容,如果未能解决你的问题,请参考以下文章
Selenium2 + Python3.6实战:生成HTML测试报告 Invalid argument
Selenium2+Python3.6实战:定位下拉菜单出错,如何解决?用select或xpath定位。
python3.6 + selenium2.53.1 查询数据库并将返回的内容中每一行的内容转换成class对象
《selenium2 python 自动化测试实战》——键盘事件