Clean Text
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Clean Text相关的知识,希望对你有一定的参考价值。
import re
import string
def clean_text(s):
"""
This function cleans the text a bit
:param s: string
:return: cleaned string
"""
# split by all whitespaces
s = s.split()
# join tokens by single space
s = " ".join(s)
# remove all punctuations using regex and string module
s = re.sub(f\'[{re.escape(string.punctuation)}]\', \'\', s)
return s
以上是关于Clean Text的主要内容,如果未能解决你的问题,请参考以下文章