python 处理xml文件
Posted manuel
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python 处理xml文件相关的知识,希望对你有一定的参考价值。
需求 在实际应用中,需要对xml配置文件进行实时修改,
1.增加、删除 某些节点
2.增加,删除,修改某个节点下的某些属性
3.增加,删除,修改某些节点的文本
<annotation> <folder>qualified_rename</folder> <filename>15572943901</filename> <path>D:\\Project\\Lebal-Img\\windows_v1.2\\qualified_rename\\15572943901.jpg</path> <source> <database>Unknown</database> </source> <size> <width>512</width> <height>384</height> <depth>3</depth> </size> <segmented>0</segmented> <object> <name>qualified</name> <pose>Unspecified</pose> <truncated>0</truncated> <difficult>0</difficult> <bndbox> <xmin>107</xmin> <ymin>109</ymin> <xmax>291</xmax> <ymax>267</ymax> </bndbox> </object> </annotation>
实现思想
使用ElementTree,先将文件读入,解析成树,之后,根据路径,可以定位到树的每个节点,再对节点进行修改,最后直接将其输出
from xml.etree.ElementTree import ElementTree,Element def read_xml(in_path): ‘‘‘读取并解析xml文件 in_path: xml路径 return: ElementTree‘‘‘ tree = ElementTree() tree.parse(in_path) return tree def write_xml(tree, out_path): ‘‘‘将xml文件写出 tree: xml树 out_path: 写出路径‘‘‘ tree.write(out_path, encoding="utf-8",xml_declaration=True) def if_match(node, kv_map): ‘‘‘判断某个节点是否包含所有传入参数属性 node: 节点 kv_map: 属性及属性值组成的map‘‘‘ for key in kv_map: if node.get(key) != kv_map.get(key): return False return True #---------------search ----- def find_nodes(tree, path): ‘‘‘查找某个路径匹配的所有节点 tree: xml树 path: 节点路径‘‘‘ return tree.findall(path) def get_node_by_keyvalue(nodelist, kv_map): ‘‘‘根据属性及属性值定位符合的节点,返回节点 nodelist: 节点列表 kv_map: 匹配属性及属性值map‘‘‘ result_nodes = [] for node in nodelist: if if_match(node, kv_map): result_nodes.append(node) return result_nodes #---------------change ----- def change_node_properties(nodelist, kv_map, is_delete=False): ‘‘‘修改/增加 /删除 节点的属性及属性值 nodelist: 节点列表 kv_map:属性及属性值map‘‘‘ for node in nodelist: for key in kv_map: if is_delete: if key in node.attrib: del node.attrib[key] else: node.set(key, kv_map.get(key)) def change_node_text(nodelist, text, is_add=False, is_delete=False): ‘‘‘改变/增加/删除一个节点的文本 nodelist:节点列表 text : 更新后的文本‘‘‘ for node in nodelist: if is_add: node.text += text elif is_delete: node.text = "" else: node.text = text def create_node(tag, property_map, content): ‘‘‘新造一个节点 tag:节点标签 property_map:属性及属性值map content: 节点闭合标签里的文本内容 return 新节点‘‘‘ element = Element(tag, property_map) element.text = content return element def add_child_node(nodelist, element): ‘‘‘给一个节点添加子节点 nodelist: 节点列表 element: 子节点‘‘‘ for node in nodelist: node.append(element) def del_node_by_tagkeyvalue(nodelist, tag, kv_map): ‘‘‘同过属性及属性值定位一个节点,并删除之 nodelist: 父节点列表 tag:子节点标签 kv_map: 属性及属性值列表‘‘‘ for parent_node in nodelist: children = parent_node.getchildren() for child in children: if child.tag == tag and if_match(child, kv_map): parent_node.remove(child) if __name__ == "__main__": #1. 读取xml文件 tree = read_xml("./test.xml") #2. 属性修改 #A. 找到父节点 nodes = find_nodes(tree, "processers/processer") #B. 通过属性准确定位子节点 result_nodes = get_node_by_keyvalue(nodes, {"name":"BProcesser"}) #C. 修改节点属性 change_node_properties(result_nodes, {"age": "1"}) #D. 删除节点属性 change_node_properties(result_nodes, {"value":""}, True) #3. 节点修改 #A.新建节点 a = create_node("person", {"age":"15","money":"200000"}, "this is the firest content") #B.插入到父节点之下 add_child_node(result_nodes, a) #4. 删除节点 #定位父节点 del_parent_nodes = find_nodes(tree, "processers/services/service") #准确定位子节点并删除之 target_del_node = del_node_by_tagkeyvalue(del_parent_nodes, "chain", {"sequency" : "chain1"}) #5. 修改节点文本 #定位节点 text_nodes = get_node_by_keyvalue(find_nodes(tree, "processers/services/service/chain"), {"sequency":"chain3"}) change_node_text(text_nodes, "new text") #6. 输出到结果文件 write_xml(tree, "./out.xml")
转自:https://www.cnblogs.com/soqu36/articles/9358298.html
1
以上是关于python 处理xml文件的主要内容,如果未能解决你的问题,请参考以下文章
在 Python 多处理进程中运行较慢的 OpenCV 代码片段
你如何在 python 中处理 graphql 查询和片段?
android.view.InflateException:二进制 XML 文件第 15 行:二进制 XML 文件第 19 行:膨胀类片段时出错
当我切换到包含片段的活动时应用程序崩溃(二进制 XML 文件第 10 行:二进制 XML 文件第 10 行:膨胀类片段时出错)