如何从python中的文本文档中删除所有标点符号和其他符号?

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何从python中的文本文档中删除所有标点符号和其他符号?相关的知识,希望对你有一定的参考价值。

我想清理数据集进行分类。我想从文本中删除所有无用的符号。

如何删除所有这些无用的符号,以便文本准备好进行标记化和拆分?

答案

使用此代码,您可以从字符串中删除一个字符:

x = "abcdef"
x = x.replace("a", "")
print(x)
#output: "bcdef"

如果你想删除多个字符,你可以多次使用替换功能,也可以使用另一个字符,或者你可以这样做:

x = "abcdef"
to_remove = "be"
for i in to_remove:
    x = x.replace(i, "")
print(x)
#output: "acdf"

以上是关于如何从python中的文本文档中删除所有标点符号和其他符号?的主要内容,如果未能解决你的问题,请参考以下文章

从Firebase的Cloud Firestore删除文档是否会删除该文档中的所有子集合?

我如何编写一种方法来“退格”文本文档中的一行

Python小技巧:打印出来的文本文档中间有空格

怎么用JAVA把Mysql数据库中的表的数据输出至文本文档中

labview如何读取文本文档中某一行的字符串

python:删除重复的文本行组