一小段带html格式的python代码—word发布2

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了一小段带html格式的python代码—word发布2相关的知识,希望对你有一定的参考价值。

# coding:utf8

?

from bs4 import BeautifulSoup

import re

?

html_doc = """

<html><head><title>The Dormouse‘s story</title></head>

<body>

<p class="title"><b>The Dormouse‘s story</b></p>

?

<p class="story">Once upon a time there were three little sisters; and their names were

<a href="http://example.com/elsie" class="sister" id="link1">Elsie</a>,

<a href="http://example.com/lacie" class="sister" id="link2">Lacie</a> and

<a href="http://example.com/tillie" class="sister" id="link3">Tillie</a>;

and they lived at the bottom of a well.</p>

?

<p class="story">...</p>

"""

soup = BeautifulSoup(html_doc,‘html.parser‘,from_encoding=‘utf-8‘)

?

print 链接

links = soup.find_all(‘a‘)

for link in links:

#print link

print link.name, link[‘href‘],link.get_text()

?

print 获取单独链接

link_code = soup.find(‘a‘,href=‘http://example.com/lacie‘)

print link_code.name, link_code[‘href‘],link_code.get_text()

?

print 正则表达式匹配

link_code = soup.find(‘a‘, href=re.compile(r"ill"))

#<ctrl+1> 根据re直接import未导入的模块

print link_code.name, link_code[‘href‘],link_code.get_text()

?

print 获取p段落文字

p_class = soup.find(‘p‘, class_=‘title‘)

print p_class.name,p_class.get_text()

?

yesterday

以上是关于一小段带html格式的python代码—word发布2的主要内容,如果未能解决你的问题,请参考以下文章

Python实现word批量转HTML-诺禾=诺禾致源

怎么在mysql数据库中存储一段带html标签的代码

一段带着毒性的代码

word 使用中遇到的小细节2(粘贴图片到Word中显示只有一小部分和按空格键后面字不见)

Python批量提取docx格式Word文档中所有文本框内的文本

Word邮件合并不能发送HTML格式以及怎么带附件?