如何从字符串中删除所有非希伯来字符并将单词放入数组中?

Posted

技术标签:

【中文标题】如何从字符串中删除所有非希伯来字符并将单词放入数组中?【英文标题】:How to remove all non Hebrew characters from a string and put the words into an array? 【发布时间】:2020-08-10 11:32:28 【问题描述】:

我想从字符串中删除所有非希伯来语字符(包括数字和特殊字符)。 例如: myString = "/43davcשלום דד";

我只需要字符串是带有空格的希伯来字符:“שלום דד”。 我还想将字符串中的所有单词放入字符串数组中。

我尝试使用正则表达式,但无法正常工作...

提前致谢!

【问题讨论】:

【参考方案1】:

这是一些代码。有字母表并检查每个字母,看看它是否是希伯来语。

string hebrewAlphabet = "אבגדהוזחטיכךלמנסעפצקרשתםןףץ";

string FilterText (string input)
     string output = "";

     foreach (char letter in input)
        if (hebrewAlphabet.indexOf( letter ) > 0)
            output += letter;
        
     

     return ouput;
|

【讨论】:

【参考方案2】:

如果你想要正则表达式,可以使用Character classes。

string myString = "/43davcשלום דד";

var result = Regex.Replace(myString, @"\PIsHebrew", string.Empty);

【讨论】:

以上是关于如何从字符串中删除所有非希伯来字符并将单词放入数组中?的主要内容,如果未能解决你的问题,请参考以下文章

Json 问号(“??????”)而不是希伯来字符

拆分一个字符串并将其放入两个数组中

从文件中读取字符串并使用 Groovy 将它们放入数组中

如何从一行中删除某些单词,但将其余部分放入带有批处理的字符串/变量中?

从字符串中删除每个非 utf-8 符号

JavaScript 数组删除重复的单词或字符(如果只输入字符。不要从 1 个单词中删除所有重复项