NLP去特殊字符

Posted demo-deng

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了NLP去特殊字符相关的知识,希望对你有一定的参考价值。

在自然语言处理中,我们有时对文本进行处理,需要去除一些特殊符号,保留中文,这是在预处理过程中常用到的。分享给你,希望对你有帮助!

1 import re
2 def delete_sysbol(line):
3     cop = re.sub([^u4e00-u9fa5^], ‘‘, line)
4     print(cop)
5     return cop
6 
7 delete_sysbol(woa oi^*&%&(3 na我是中国人*(&*(美好)

 

以上是关于NLP去特殊字符的主要内容,如果未能解决你的问题,请参考以下文章

Python中verbaim标签使用详解

laravel特殊功能代码片段集合

我应该如何使用 Outlook 发送代码片段?

如何在 PHP“回声”中插入带有撇号和其他特殊字符的文本? [复制]

快速剪辑-助力度咔智能剪辑提效实践

《自然语言处理实战入门》 ---- NLP方向:面试笔试题集