NLP去特殊字符
Posted demo-deng
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了NLP去特殊字符相关的知识,希望对你有一定的参考价值。
在自然语言处理中,我们有时对文本进行处理,需要去除一些特殊符号,保留中文,这是在预处理过程中常用到的。分享给你,希望对你有帮助!
1 import re 2 def delete_sysbol(line): 3 cop = re.sub(‘[^u4e00-u9fa5^]‘, ‘‘, line) 4 print(cop) 5 return cop 6 7 delete_sysbol(‘woa oi^*&%&(3 na我是中国人*(&*(美好‘)
以上是关于NLP去特殊字符的主要内容,如果未能解决你的问题,请参考以下文章