正则表达式——html

Posted qq308015824

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了正则表达式——html相关的知识,希望对你有一定的参考价值。

1 正则表达式

正则表达式(英语:Regular Expression,在代码中常简写为regexregexpRE)使用单个字符串来描述、匹配一系列符合某个句法规则的字符串搜索模式。

 

搜索模式可用于文本搜索和文本替换。

 

什么是正则表达式?

正则表达式是由一个字符序列形成的搜索模式。

 

当你在文本中搜索数据时,你可以用搜索模式来描述你要查询的内容。

 

正则表达式可以是一个简单的字符,或一个更复杂的模式。

 

正则表达式可用于所有文本搜索和文本替换的操作。

 

应用:表单的检验,文本搜索,爬取数据

 

语法

/正则表达式主体/修饰符(可选)

其中修饰符是可选的。

 

 

实例:

var patt = /sxt/i

 

实例解析:

 

/sxt/i  是一个正则表达式。

 

sxt  是一个正则表达式主体 (用于检索)

 

i  是一个修饰符 (搜索不区分大小写)

 

使用字符串方法

javascript 中,正则表达式通常用于两个字符串方法 : search() replace()

 

search() 方法 用于检索字符串中指定的子字符串,或检索与正则表达式相匹配的子字符串,并返回子串的起始位置。

 

replace() 方法 用于在字符串中用一些字符替换另一些字符,或替换一个与正则表达式匹配的子串。

 

search() 方法使用正则表达式

实例

使用正则表达式搜索 "Runoob" 字符串,且不区分大小写:

var str = "Visit Runoob!";

var n = str.search(/Runoob/i);

输出结果为:6

 

search() 方法使用字符串

search 方法可使用字符串作为参数。字符串参数会转换为正则表达式:

 

实例

检索字符串中 "Runoob" 的子串:

var str = "Visit sxt!";

var n = str.search("sxt");

 

replace() 方法使用正则表达式

实例

使用正则表达式且不区分大小写将字符串中的 Microsoft 替换为 sxt :

var str = document.getElementById("demo").innerhtml;

var txt = str.replace(/microsoft/i,"sxt");

结果输出为:

 

Visit Runoob!

 

 

replace() 方法使用字符串

replace() 方法将接收字符串作为参数:

var str = document.getElementById("demo").innerHTML;

var txt = str.replace("Microsoft","Runoob");

 

注意:

 

正则表达式参数可用在以上方法中 (替代字符串参数)

正则表达式使得搜索功能更加强大(如实例中不区分大小写)

 

正则表达式基础知识

正则表达式修饰符

修饰符 可以在全局搜索中不区分大小写:

 

修饰符 描述

i 执行对大小写不敏感的匹配。

g 执行全局匹配(查找所有匹配而非在找到第一个匹配后停止)。

m 执行多行匹配。

 

正则表达式模式

方括号用于查找某个范围内的字符:

 

表达式 描述

[abc] 查找方括号之间的任何字符。

[0-9] 查找任何从 0 9 的数字。

(x|y) 查找任何以 | 分隔的选项。

元字符是拥有特殊含义的字符:

 

元字符 描述

. 匹配除\n”之外的任何单个字符。但是一般语言如果是多行都会自动将.可以匹配\n

^ 匹配输入字符串的开始位置。如果设置了RegExp对象的Multiline属性,^也匹配“\n”或“\r”之后的位置。

$ 匹配输入字符串的结束位置。如果设置了RegExp对象的Multiline属性,$也匹配“\n”或“\r”之前的位置。

\d 查找数字。

\s 查找空白字符。

\S 匹配任何非空白字符。等价于[^ \f\n\r\t\v]

\b 匹配单词边界。

\w 匹配包括下划线的任何单词字符。等价于[A-Za-z0-9_]”。

\W 匹配任何非单词字符。等价于[^A-Za-z0-9_]”。

\d 匹配一个数字字符。等价于[0-9]

\D 匹配一个非数字字符。等价于[^0-9]

\b 匹配一个单词边界,也就是指单词和空格间的位置。例如,er\b”可以匹配“never”中的“er”,但不能匹配“verb”中的“er”。

\B 匹配非单词边界。er\B”能匹配“verb”中的“er”,但不能匹配“never”中的“er”。

量词

 

量词 描述

n+ 匹配任何包含至少一个 n 的字符串。

n* 匹配任何包含零个或多个 n 的字符串。

n? 匹配任何包含零个或一个 n 的字符串。

? 当该字符紧跟在任何一个其他限制符(*,+,?nn,n,m)后面时,匹配模式是非贪婪的。非贪婪模式尽可能少的匹配所搜索的字符串

N11 匹配任何包含11N的字符串

n n是一个非负整数。匹配确定的n次。例如,“o2”不能匹配“Bob”中的“o”,但是能匹配“food”中的两个o

n, n是一个非负整数。至少匹配n次。例如,“o2,”不能匹配“Bob”中的“o”,但能匹配“foooood”中的所有o“o1,”等价于“o+”“o0,”则等价于“o*”

n,m mn均为非负整数,其中n<=m。最少匹配n次且最多匹配m次。例如,“o1,3”将匹配“fooooood”中的前三个o“o0,1”等价于“o?”。请注意在逗号和两个数之间不能有空格。

 

(pattern) 匹配pattern并获取这一匹配。

 

使用 RegExp 对象

JavaScript 中,RegExp 对象是一个预定义了属性和方法的正则表达式对象。

 

test()

test() 方法是一个正则表达式方法。

 

test() 方法用于检测一个字符串是否匹配某个模式,如果字符串中含有匹配的文本,则返回 true,否则返回 false

 

以下实例用于搜索字符串中的字符 "e"

 

实例

var patt = /e/;

patt.test("The best things in life are free!");

 

 

字符串中含有 "e",所以该实例输出为:true

 

你可以不用设置正则表达式的变量,以上两行代码可以合并为一行:

/e/.test("The best things in life are free!")

 

使用 exec()

exec() 方法是一个正则表达式方法。

 

exec() 方法用于检索字符串中的正则表达式的匹配。

 

该函数返回一个数组,其中存放匹配的结果。如果未找到匹配,则返回值为 null

 

以下实例用于搜索字符串中的字母 "e":

 

Example 1

/e/.exec("The best things in life are free!");

字符串中含有 "e",所以该实例输出为:e

 

 

一、校验数字的表达式

1. 数字:    ^[0-9]*$

2. n位的数字:^\dn$

3. 至少n位的数字:^\dn,$

4. m-n位的数字:^\dm,n$

  1. 零和非零开头的数字:^([0-9]*)$

 

二、校验字符的表达式

1. 汉字:^[\u4e00-\u9fa5]0,$

2. 英文和数字:^[A-Za-z0-9]+$

3. 长度为3-20的所有字符:^.3,20$

4. 26个英文字母组成的字符串:^[A-Za-z]+$

 

三、特殊需求表达式

1.域名:[a-zA-Z0-9][-a-zA-Z0-9]0,62(\.[a-zA-Z0-9][-a-zA-Z0-9]0,62)+\..*

2. InternetURL[a-zA-z]+://[^\s]*

3.帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线)^[a-zA-Z][a-zA-Z0-9_]4,15$

4.腾讯QQ号:[1-9][0-9]4, (腾讯QQ号从10000开始)

5. IP地址:\d1,3\.\d1,3\.\d1,3\.\d1,3 (提取IP地址时有用)

以上是关于正则表达式——html的主要内容,如果未能解决你的问题,请参考以下文章

攻破难啃的骨头-正则表达式(转)

text 正则表达式片段

markdown 正则表达式模式片段

python 正则表达式

循环通过 python 正则表达式匹配

asp.net 使用正则表达式验证包含打开/关闭括号片段的属性字符串