Spider爬虫清洗数据(re方法)

Posted Yemilice

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Spider爬虫清洗数据(re方法)相关的知识,希望对你有一定的参考价值。

import re
s0 = ‘BOY and GIRL‘
s1 = re.sub(r‘BOY|GIRL‘‘HUMAN‘, s0)
print s1

# HUMAN and HUMAN

替换方法。

以上是关于Spider爬虫清洗数据(re方法)的主要内容,如果未能解决你的问题,请参考以下文章

爬虫 spider

Python爬虫连载17-ItemPipeLine中间件

python 爬取网络小说 清洗 并下载至txt文件

分布式爬虫

爬虫+数据清洗+可视化用Python分析“淄博烧烤“的评论数据

Spider爬虫