检查单词是否为英语单词时忽略标点符号

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了检查单词是否为英语单词时忽略标点符号相关的知识,希望对你有一定的参考价值。

我正在寻找纠正字符串中潜在单词拼写错误的最佳方法,而不考虑标点符号。我不想在进行评估之前将其剥离,因为这会改变最终编辑的字符串。我目前的方法是在空格上分割字符串后使用py-enchant(.check()方法),但这不会忽略标点符号。

misspelled_string = 'This is a (tesl strung.'

所需的输出:

corrected_string = 'This is a (test string.'

答案

尝试用re除字母以外的任何内容:

import re
misspelled_string = 'This is a (tesl strung.'

res=re.split(r"[^\w]+", misspelled_string)

输出:

>>> res
['This', 'is', 'a', 'tesl', 'strung', '']

以上是关于检查单词是否为英语单词时忽略标点符号的主要内容,如果未能解决你的问题,请参考以下文章

统计英语文章中单词

如何通过代码拼写检查将所有未知单词添加到字典中,或者当语言不是英语时忽略它们?

从字符串 C++ 中读取单词,同时忽略空格、数字和符号。

产生拼写检查器

英语作文引用名言的标点符号怎么打

英语作文引用名言的标点符号怎么打?