如何对包含数字和特殊字符的字符串进行词法化?

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何对包含数字和特殊字符的字符串进行词法化?相关的知识,希望对你有一定的参考价值。

我需要对包含数字和字母数字字符的字符串进行词法修饰。示例:

'strawberries1234!@ apples123@'

我还需要保留那些特殊字符和数字。因此,上述示例的输出为,

'strawberry1234!@ apple123@'

我需要在大型数据集上执行此操作,因此代码需要尽可能高效。

谢谢。

答案

严重的是,这似乎很简单,不需要进一步详细说明任务。使用正则表达式可以删除所有基于字符的特殊字符序列,这意味着您不仅可以简单地sub()它们,还可以找到索引。使用索引提取剩余的字符串,这将是残留的英语单词。对此进行词形化(词形化是删除英语后缀的过程,这意味着要删除字符串右端的字符串元素。(在其他语言中,您可能会使用encouter中缀(xx-y-xx)和环词修饰(y1- xx-y2),这可能需要更复杂的字符串操作)。此后,只需再次将子字符串与特殊字符连接在一起,结果就得到了词法定理。

以上是关于如何对包含数字和特殊字符的字符串进行词法化?的主要内容,如果未能解决你的问题,请参考以下文章

如何在 JavaScript 中检查字符串是不是包含数字和特殊字符?

正则表达式必须包含字母数字和特殊字符

sql中如何判断字符串中含有特殊字符

http请求特殊字符转码

如何在 Angular 7 中对包含特殊字符的查询参数进行编码?

密码中有特殊的字符IOS如何处理 IOS中URL包含中文参数的问题