任何顺序的正则表达式特定搜索行,可能存在也可能不存在

Posted

技术标签:

【中文标题】任何顺序的正则表达式特定搜索行,可能存在也可能不存在【英文标题】:Regex Specific Search lines in any order and may or may not exist 【发布时间】:2015-03-15 16:29:49 【问题描述】:

直截了当。我正在开发一个 IRC 机器人,而且我正站在一堵砖墙上,从今天早上 4 点开始我就一直在敲打我的头。

我正在尝试专门在正则表达式组中对 IRC Raw 005 (IS_SUPPORTED) 字符串进行排序。示例字符串如下所示。

Nickname MAXTARGETS=20 WALLCHOPS WATCH=128 WATCHOPTS=A SILENCE=15 MODES=12 CHANTYPES=# PREFIX=(qaohv)~&@%+ CHANMODES=beI,kfL,lj,psmntirRcOAQKVCuzNSMTGZ NETWORK=Network CASEMAPPING=ascii EXTBAN=~,qjncrRa ELIST=MNUCT

到目前为止,我已经清理了数据包的其余部分,所以这一行正是我正在使用的,尽管它可能有我的示例中未显示的其他字段。我有所有字符串都以该数据包中每个可能的字段命名。我希望将每个字符串、整数和布尔值设置为每个结果信息,按 C# 中的正则表达式组排序

为了更清楚,

我的public int maxtargets 将设置为正则表达式组的结果 <maxtargets> 我的public bool wallchops 将设置为真,如果 正则表达式组<wallchops> 返回自身。 我的public string chantypes 将设置为正则表达式组<chantypes> 的结果

在字段可能不存在且字段顺序可能完全不同的情况下,我无法组装搜索和匹配字段和值的正则表达式搜索字符串。

我希望我对此很清楚,并会填补我忘记的任何空白。

【问题讨论】:

【参考方案1】:

在一个字段可能不存在的情况下,字段的顺序可能完全不同。

我认为为上述案例编写正则表达式并不是最佳实践。相反,您可以使用简单的字符串方法来实现您的目标。

class IrcParser

    private string input;

    public IrcParser(string input)
    
        this.input = input;
    

    public Irc GetResult()
    
        Irc irc = new Irc();
        string[] result = input.Split();
        for (int i = 0; i < result.Length; i++)
        
            string[] FieldValue = result[i].Split('=');
            switch (FieldValue[0])
             
                case "MAXTARGETS":
                     irc.maxTargets = Convert.ToInt32(FieldValue[1]);
                     break;
                case "WALLCHOPS":
                     irc.wallChops = true;
                     break;
                case "CHANTYPES":
                    irc.chanTypes = FieldValue[1];
                    break;
            
        
        return irc;
     

    public Irc GetResultByRegex()
    
        Irc irc = new Irc();
        MatchMaxTargets(ref irc.maxTargets);
        MatchWallChops(ref irc.wallChops);
        MatchChanTypes(ref irc.chanTypes);
        return irc;
    

    private void MatchMaxTargets(ref int maxTargets)
    
        Regex regex = new Regex(@"(?<=MAXTARGETS=)(\d+)");
        Match m = regex.Match(input);
        if (m.Success)
            maxTargets = Convert.ToInt32(m.Groups[1].Value);
        
    

    private void MatchWallChops(ref bool wallChops)
    
        if (Regex.IsMatch(input, "WALLCHOPS"))
        
            wallChops = true;
        
    

    private void MatchChanTypes(ref string chanTypes)
    
        Regex regex = new Regex(@"(?<=CHANTYPES=)(.*?)(?=\s)");
        Match m = regex.Match(input);
        if (m.Success)
        
            chanTypes = m.Groups[1].Value;
        
    



class Irc

    public int maxTargets;
    public bool wallChops;
    public string chanTypes;

更新: 我添加了对单个字段值执行 REGEX 匹配的方法。如果我们编写单行 REGEX,组结果顺序将根据字段可用性而改变。(在这种情况下,您无法将组值分配给适当的字段。)

希望对您有所帮助。 --SJ

【讨论】:

虽然我同意可能有更好的方法可以做到这一点,但是我正在寻找一个正则表达式字符串来返回它。我正在尝试学习正则表达式,以及为什么这会或不会成为我想要完成的最佳实践。我想在代码中犯自己的错误并从中学习并最终改善结果。我一定会采用你的字符串方法,看看我能在这方面做些什么。但是,我最终需要一个正则表达式来解决我的问题。 我们无法为您的案例编写单行正则表达式模式。因为,您的字段值可能会也可能不会出现在给定的字符串中。我更新了我的答案。【参考方案2】:

一位朋友终于帮我解决了这个问题,我们想出了如何成功匹配我上面的字符串,不管它有没有字段,不管它可能是什么顺序。

(?:(?:SILENCE=(?<silence>\d+)\s?)|(?:MODES=(?<modes>\d+)\s?)|(?:CHANTYPES=(?<chantypes>\S+)\s?)|(?:PREFIX=(?<prefix>\S+)\s?)|(?:MAXTARGETS=(?<maxtargets>\d+)\s?)|(?:WATCH=(?<watch>\d+)\s?)|(?<wallchops>WALLCHOPS)|(?:NETWORK=(?<network>\w+)\s?)|(?:CASEMAPPING=(?<casemapping>\w+)\s?)|(?:CHANMODES=(?<chanmodes>\S+)\s?)|(?:EXTBAN=(?<extban>\S+)\s?)|(?:ELIST=(?<elist>\w+)\s?)|(?:WATCHOPTS=(?<watchopts>\S+)\s?)\s?)

是的,我意识到这是一个巨大的正则表达式搜索字符串,它会根据我的需要将行作为组返回。我也意识到这在实践中并不是最好的主意。这条搜索线会增长到巨大的规模并且可以,并且可能会产生大量的开销并浪费 CPU 时间来执行。

SJ, 非常感谢您的反馈,我将使用您建议的代码并以这种方式使其工作,当然还有一些小的改动。

【讨论】:

以上是关于任何顺序的正则表达式特定搜索行,可能存在也可能不存在的主要内容,如果未能解决你的问题,请参考以下文章

正则表达式:我想要这个和那个和那个......以任何顺序

以任何顺序匹配正则表达式

Python中正则表达式的替代品

正则表达式以任何顺序匹配字符串标记?

正则表达式匹配特定的 URL 片段而不是所有其他 URL 可能性

存在一些顺序无关紧要的单词的正则表达式