匹配浮点数 >= 100

Posted

技术标签:

【中文标题】匹配浮点数 >= 100【英文标题】:Matching floating point numbers >= 100 【发布时间】:2014-10-11 19:27:16 【问题描述】:

我正在逐行读取文件,并希望得到以任何而不是 AB 开头的行,并且 包含(至少)三位浮点数,后跟百分号(即任何大于或等于 100% 的浮点数%)。

例如:

AA whatevs 102.342% dontcare #MATCH
AB whatevs 102.342% dontcare #MISMATCH
AC whatevs 12.3042% dontcare #MISMATCH *
AD whatevs 102% dontcare #MATCH *
AE whatevs 2002.3042% dontcare #MATCH
AF whatevs 22.3021% dontcare #MISMATCH
AG whatevs 102.342 12.342% dontcare #MISMATCH **

到目前为止,我有以下正则表达式解决方案,它没有捕获AD whatevs 102% dontcare,原因很明显。

/^(?!AB).*\d3\.\d*%/

/^(?!AB).*\d3\.?\d*%/ 也不起作用,因为它匹配AF whatevs 22.3021% dontcare

我知道我可以通过基于. 的存在将我的正则表达式分成两个子正则表达式来做到这一点。不过,我想看看是否有单一的正则表达式解决方案。

【问题讨论】:

试试这个/^(?!AB).*\d3(\.\d+)?%/(未测试) 【参考方案1】:

您已经注意到,有很多不同的方式来表示浮点数。您可以使用Regexp::Common::number 来处理它们,而不是滚动您自己的正则表达式:

use strict;
use warnings;

use Regexp::Common qw(number);

while (<DATA>) 
    next if /^AB/;

    print if /\b$REnumreal-keep%/ and $1 >= 100;


__DATA__
AA whatevs 102.342% dontcare #MATCH
AB whatevs 102.342% dontcare #MISMATCH
AC whatevs 12.3042% dontcare #MISMATCH *
AD whatevs 102% dontcare #MATCH *
AE whatevs 2002.3042% dontcare #MATCH
AF whatevs 22.3021% dontcare #MISMATCH
AG whatevs 102.342 12.342% dontcare #MISMATCH **
AH whatevs 1.02342E02% dontcare #MATCH
AI whatevs -102% dontcare #MISMATCH

输出:

AA whatevs 102.342% dontcare #MATCH
AD whatevs 102% dontcare #MATCH *
AE whatevs 2002.3042% dontcare #MATCH
AH whatevs 1.02342E02% dontcare #MATCH

我在数据集中添加了一个负数和一个指数,以展示使用Regexp::Common 的便利性。无论您的数据集是否包含此类值,您都无需调整正则表达式。

另请注意,将数字视为数字而不是一系列字符时,比较数字会更容易。 -100 是三位数字,但肯定不是 &gt;= 100

【讨论】:

【参考方案2】:

唯一的窍门是确保 3 位数字前面没有小数点。

use strict;
use warnings;

while (<DATA>) 
    if (/^(?!AB).*\b(?<!\.)\d3,(?:\.\d*)?%/) 
        print;
    

__DATA__
AA whatevs 102.342% dontcare #MATCH
AB whatevs 102.342% dontcare #MISMATCH due to AB
AC whatevs 12.3042% dontcare #MISMATCH
AD whatevs 102% dontcare #MATCH *
AE whatevs 2002.3042% dontcare #MATCH
AF whatevs 22.3021% dontcare #MISMATCH
AG whatevs 102.342 12.342% dontcare #MISMATCH

输出:

AA whatevs 102.342% dontcare #MATCH
AD whatevs 102% dontcare #MATCH *
AE whatevs 2002.3042% dontcare #MATCH

【讨论】:

你太快了! @谢谢米勒。我也解决了这个问题。您能否在您的正则表达式中添加一些 cmets... 仍在尝试感知。

以上是关于匹配浮点数 >= 100的主要内容,如果未能解决你的问题,请参考以下文章

浮点数

浮点数四舍五入到小数点后两位

js正则匹配浮点数或整数

AcWing 开平方 浮点数二分

js 后端返回浮点数,前端用乘法或者除法处理,得到超常值

舍入浮点数的源代码