javascript 之正则匹配HTML

Posted 残宠魔法袋

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了javascript 之正则匹配HTML相关的知识,希望对你有一定的参考价值。

正则表达式 <(\S*?) [^>]*>.*?</\1>|<.*? />
匹配 <html>hello</html>|<a>abcd</a>
不匹配 abc|123|<html>ddd

 

正则表达式 ^[^<>`~!/@\#}$%:;)(_^{&*=|‘+]+$
匹配 This is a test
不匹配 <href = | <br> | That‘s it

 

正则表达式 &lt;!--.*?--&gt;
匹配 &lt;!-- &lt;h1&gt;this text has been removed&lt;/h1&gt; --&gt; | &lt;!-- yada --&gt;
不匹配 &lt;h1&gt;this text has not been removed&lt;/h1&gt;

 

正则表达式 (\[(\w+)\s*(([\w]*)=(‘|&quot;)?([a-zA-Z0-9|:|\/|=|-|.|\?|&amp;]*)(\5)?)*\])([a-zA-Z0-9|:|\/|=|-|.|\?|&amp;|\s]+)(\[\/\2\])
匹配 [link url=&quot;http://www.domain.com/file.extension?getvar=value&amp;secondvar=value&quot;]Link[/li
不匹配 [a]whatever[/b] | [a var1=something var2=somethingelse]whatever[/a] | [a]whatever[a]

 

正则表达式 href=[\"\‘](http:\/\/|\.\/|\/)?\w+(\.\w+)*(\/\w+(\.\w+)?)*(\/|\?\w*=\w*(&\w*=\w*)*)?[\"\‘]
匹配 href="www.yahoo.com" | href="http://localhost/blah/" | href="eek"
不匹配 href="" | href=eek | href="bad example"

 

正则表达式 &quot;([^&quot;](?:\\.|[^\\&quot;]*)*)&quot;
匹配 &quot;This is a \&quot;string\&quot;.&quot;
不匹配 &quot;This is a \&quot;string\&quot;.

 

正则表达式 (?i:on(blur|c(hange|lick)|dblclick|focus|keypress|(key|mouse)(down|up)|(un)?load|mouse(move|o(ut|ver))|reset|s(elect|ubmit)))
匹配
  onclick | onsubmit | onmouseover
不匹配 click | onandon | mickeymouse

 

正则表达式 (?s)/\*.*\*/
匹配 /* .................... */ | /* imagine lots of lines here */
不匹配 */ malformed opening tag */ | /* malformed closing tag /*

 

正则表达式 <(\S*?) [^>]*>.*?</\1>|<.*? />
匹配 <html>hello</html>|<a>abcd</a>
不匹配 abc|123|<html>ddd

 

正则表达式 \xA9
匹配 ?
不匹配 anything

 

正则表达式 src[^&gt;]*[^/].(?:jpg|bmp|gif)(?:\&quot;|\‘)
匹配 src=&quot;../images/image.jpg&quot; | src=&quot;http://domain.com/images/image.jpg&quot; | src=‘d:\w
不匹配 src=&quot;../images/image.tif&quot; | src=&quot;cid:value&quot;

 

正则表达式 /\*[\d\D]*?\*/
匹配 /* my comment */ | /* my multiline comment */ | /* my nested comment */
不匹配 */ anything here /* | anything between 2 seperate comments | \* *\

 

正则表达式 <[a-zA-Z]+(\s+[a-zA-Z]+\s*=\s*("([^"]*)"|‘([^‘]*)‘))*\s*/>
匹配 <img src="test.gif"/>
不匹配 <img src="test.gif"> | <img src="test.gif"a/>

以上是关于javascript 之正则匹配HTML的主要内容,如果未能解决你的问题,请参考以下文章

JavaScript之基础-10 JavaScript 正则表达式(概述定义正则RegExp对象用于模式匹配的String方法)

javascript 正则表达式之分组与前瞻匹配详解

JavaScript之正则匹配索引RegExpmatchAllreduceconcattoStringsplitincludesString/d

JavaScript - 正则表达式

JavaScript - 正则表达式举例

Python之re模块----正则匹配