如何从python中的文本文档中删除所有标点符号和其他符号?
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何从python中的文本文档中删除所有标点符号和其他符号?相关的知识,希望对你有一定的参考价值。
我想清理数据集进行分类。我想从文本中删除所有无用的符号。
如何删除所有这些无用的符号,以便文本准备好进行标记化和拆分?
答案
使用此代码,您可以从字符串中删除一个字符:
x = "abcdef"
x = x.replace("a", "")
print(x)
#output: "bcdef"
如果你想删除多个字符,你可以多次使用替换功能,也可以使用另一个字符,或者你可以这样做:
x = "abcdef"
to_remove = "be"
for i in to_remove:
x = x.replace(i, "")
print(x)
#output: "acdf"
以上是关于如何从python中的文本文档中删除所有标点符号和其他符号?的主要内容,如果未能解决你的问题,请参考以下文章
从Firebase的Cloud Firestore删除文档是否会删除该文档中的所有子集合?