正则表达式
Posted 智慧大数据
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了正则表达式相关的知识,希望对你有一定的参考价值。
一、简单介绍
正则表达式(Regular Expression)是一种文本模式,包括普通字符(例如a-z之间的字符)和特殊字符(称为元字符)。它是使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串。
别着急,容小伙伴慢慢给你道来,这个东西该怎么玩?
说实话,这货就是用来加强版的windows查找和替换功能,所以要使用它就起码要掌握一些基本知识。其实就字符一共就两类,一类是咱们普遍认识的字符,咱们普遍不认识的字符,叫特殊字符;下面是教程正文:
1、非打印字符
\s:匹配任何空白字符,包括空格、制表、换页符等等,等价于[\f\n\r\t\v];
\S:匹配任何非空白字符,等价于[^\f\n\r\t\v];
\w:表示匹配大小写英文字母、数字以及下划线,等价于[A-Za-z0-9_].
\W:表示匹配除大小写英文字母、数字以及下划线的所有字符,等价于[^A-Za-z0-9_];
\d:表示匹配数字,等价于[0-9];
\D:表示匹配非数字,等价于[^0-9];
\.:匹配除换行符之外的任意单字符;
\f:匹配换页符,等价于\x0c和\cL;
\n:匹配一个换行符,等价于\x0a或\cJ;
\r:匹配一个回车符,等价于\x0d或\cM;
\t:匹配一个制表符,等价于\x09或\cl;
\v:匹配一个崔志制表符,等价于\x0b或\cK;
2、括号的使用
():标记一个子表达式的开始和结束位置,子表达式可以获取供以后使用,通过$1或者$2来调用,从1开始;
[]:囊括一个表达式的范围,即只能符合在里面的表达式。如[\w\n];
{}:对前面的表达式进次数限制,如{1,}最少一次,{1,8}最少一次,最多并且包含八次;
3、关于描述特殊字符的限定:
?:匹配前面的子表达式零次或一次,或指明一个非贪婪界定符;
+:匹配前面的子表达式一次或多次,要匹配+,请使用\+;
*:匹配前面的子表达式零次或多次;
二、实际运用
三、目的:学习正则表达式,可以更好的做数据处理方面的工作;此篇文章我们先简单的学习一下在perl下面如何简单的处理一些不太重
的数据;
以上是关于正则表达式的主要内容,如果未能解决你的问题,请参考以下文章