python flashtext模块安装使用方法

Posted pcat

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python flashtext模块安装使用方法相关的知识,希望对你有一定的参考价值。

FlashText算法可用于大规模替换、检索文档中的关键字。
本文要介绍的是FlashText算法的python实现模块。
 
------------------
0x01 安装
pip install flashtext

 

0x02 使用方法

传统的replace连用:
s = "spamham sha"
print s.replace(spam,eggs).replace(sha,md5)
# eggmd5m md5

这里的结果是eggsham也被替换成eggmd5m,我们想要一次性替换的话,一般会想到使用re.sub,然而使用正则多次替换字符串的效率很低。

使用flashtext可以提高其替换效率:

参数也可以从字典里获取,只不过注意要替换成的字符串是key:

 

 

0x03 其他用法

等pcat有空再更新

 

以上是关于python flashtext模块安装使用方法的主要内容,如果未能解决你的问题,请参考以下文章

数据清洗工具flashtext,效率直接提升了几十倍数

Flashtext:大规模数据清洗的利器

比正则快 M 倍以上!Python 替换字符串的新姿势!

python扩展实现方法--python与c混和编程 转自:http://www.cnblogs.com/btchenguang/archive/2012/09/04/2670849.html(示例代

python安装numpyscipygensim以及报错unable to import 'smart_open.gcs', disabling that module处理(示例代

我已经安装了 python-dotenv 但 python 找不到它