正则表达式没有想象中的那么难

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了正则表达式没有想象中的那么难相关的知识,希望对你有一定的参考价值。

参考技术A 正则表达式在涉及到文本数据的整理方面极其重要,它实际上就是一种字符串的模式,运用正则可以在文本中匹配出符合模式的字符。不同程序语言中正则表达式的写法有所差异,但基本的思想是一致的,就是找出模式,并从文本中将模式匹配出来。需要注意的是:在openrefine中采用的是java语言的正则,由于openrefine的实时预览方式,可以说是学习正则、调试正则最理想的工具。

正则表达式初看起来向天书,比较抽象,感觉很难的样子,但是掌握了学习的方法,学习起来就容易多了。学习正则最好的方法就是多看、多练,首先要弄懂正则的基础知识,多看别人的例子,读懂正则的书写规律,加上不断的练习,人人都可以学好正则。

元字符是正则表达式中的具有特殊意义的字符,在openrefine中常用的元字符以下这些。

除了元字符以往,正则表达式又给我们提供了一些常用的字符形式,让我们使用起来更加方便。

有了元字符和通用字符以后,就需要有表示数量的单位与元字符和通用字符配合,来表示字符的个数

举例说明:

在openrefine中,使用的是Java正则,以括号来进行分组,在后面可以使用$符号加数字或\加数字来对前面的分组进行引用,节省我们的时间和精力。

举例说明:

例子

此外正则表达式还有零宽断言等其他内容,我们将来再学习,还有要注意的是,在openrefine中,find()、match()等函数匹配的结果都是列表形式,需要通过取值或.join()等方式来获取字符串。

以上是关于正则表达式没有想象中的那么难的主要内容,如果未能解决你的问题,请参考以下文章

正则表达式没那么难

面试常见的7个高频正则表达式,没你想的那么难!

正则表达式教程——语法篇

正则表达式学习

正则表达式练习之Regex Golf

正则表达式