用于验证科学记数法的 RegEx

Posted

技术标签:

【中文标题】用于验证科学记数法的 RegEx【英文标题】:RegEx for validating scientific notations 【发布时间】:2019-06-07 21:31:13 【问题描述】:

我试图找出一个数字是否使用科学计数法表示。我已经使用在线正则表达式工具用有效/无效的测试用例测试了我的正则表达式模式。但是,当我在 python 中使用我的正则表达式模式时,它与一些有效的测试用例不匹配。

这是正则表达式模式:

^-?([1-9]1|[1-9]?\.[0-9]+)[eE][+\-]?0?[1-9]+0*$

有效的测试用例:

-9.99E+9
9E-1
1e-12
1e12
1e-06
1e-066
1e6000
4.2e06
4.2e-06
4.2e60
.1e12
3.2e23
-4.70e+9
-.2E-4
4e6666
4e6660
4e-6666

无效的测试用例:

37.e88 
1.2e001
10e1
0.0e12
-0.9e2
-9e-0
0e12
9.3e0.2
0e000
1e00009
1e00090
1e000
1
1.000
e112
45e12
0.1e12

但如果我在 python 中尝试:

pat = re.compile('^-?([1-9]1|[1-9]?\.[0-9]+)[eE][+\-]?0?[1-9]+0*$')
match = re.search(pat, str(4.2e6))

它返回无。这是一个有效的测试用例。此外,4.2e06、4.2e666、4.2e-66 都是有效的测试用例,但它返回 None。为什么它适用于在线正则表达式工具而不适用于 python 正则表达式引擎?

我查看了一些 *** 帖子并尝试了那里给出的答案,例如: pat = re.compile(r'^[+-]?(?:0|[1-9]\d*)(?:.\d*)?(?:[eE][+-]?\d+ )$')

它不适用于 4.2e06、4.2e666、4.2e-66。

【问题讨论】:

想要测试的人的链接:regex101.com/r/QFFidh/1 这里有一个提示:转到 Python 提示符(行首带有 >>> 的提示符)并尝试查看 str(4.2e6) 是什么。 @JohnY 哦哇!太疯狂了。我有 str() 的原因是因为 python 一直在抱怨“预期的字符串或类似字节的对象”。我认为它会保持原样,但不确定为什么它会转换为浮点数,然后将其存储为字符串。 “转换为浮动”是什么意思? 4.2e6 是一个浮点数。 str() 然后将其转换为字符串。如果你想要一个字符串,你应该首先使用"4.2e6" @melpomene 我的意思是保持科学记数法。例如,str(4.2e-6) 保持原样。我只发布了一个例子。最初,我有一个 numpy 浮点数组,我试图在数组中检测一个带有科学记数法的数字。因此,使用 str() 【参考方案1】:

只需通过

修复您的匹配搜索
match = re.search(pat, '4.2e6')

【讨论】:

【参考方案2】:

我觉得你需要这个

(?m)^[+-]?(?:\d+(?:\.\d*)?|\.\d+)(?:[eE][+-]?\d+)$

https://regex101.com/r/oLA3hH/1

【讨论】:

以上是关于用于验证科学记数法的 RegEx的主要内容,如果未能解决你的问题,请参考以下文章

验证没有符号的数字(科学)

是否有用于转换非标准科学记数法的 R 函数?

用于 ggplot2 的不带科学记数法的 R 标记中的 cut 函数

程序访问的局部性原理---进行科学性验证

正则表达式入门

用于验证美国电话号码格式的 RegEx