python指定查找html中某个div标签的值

Posted weixin_ancenhw

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python指定查找html中某个div标签的值相关的知识,希望对你有一定的参考价值。

Python爬取html网页中的div标签所有内容,

首先定义word对象,将word复制div所抓取的内容

我们可以先预定正则表达式
re.compile()

代表换行
re.S

通过迭代器查找指定内容
obj.finditer(word)

注意在代码中(?P.?) 代表意思:通过?P将 .?值传给,在后面的循环中将值打印出来

import re

word = """<div id='a1'>java</div>
          <div id='a2'>python</div>
          <div id='a3'>nodejs</div>
       """

# re.S换行,?P<a2>替换需要输出的内容
obj = re.compile(r"<div id='.*?>(?P<a2>.*?)</div>", re.S)
result = obj.finditer(word)
for i in result:
    print(i.group("a2"))




输出结果:

C:\\Programs\\Python\\vis\\Scripts\\python.exe D:/pythonTest/test01/指定查找.py
java
python
nodejs

Process finished with exit code 0

免费源码获得:关注微信公众号:ancenok,然后回复:021

以上是关于python指定查找html中某个div标签的值的主要内容,如果未能解决你的问题,请参考以下文章

使用猫鼬模式将多个选择元素值中的值存储到MongoDB中的数组中

如何获取数组里对象的某个值

js删除某个html标签下的某个子标签

Python爬虫——使用XPath和lxml库解析HTML

python第三天作业

正则表达式在 HTML 中查找特定标签 [重复]