Linux Shell编程实战---解析文本中的邮件地址和url

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Linux Shell编程实战---解析文本中的邮件地址和url相关的知识,希望对你有一定的参考价值。

解析文本中的邮件地址和url

(1)、使用场景

从给定的文件中解析出所需要的文本是从事文本处理时常见的一项任务。诸如电子邮件地址、URL等都能够借助适合的正则表达式找出来。我们通常需要从一个包含大量无关字符及单词的电子邮件客户列表或html网页中将电子邮件地址解析并提取出来。


(2)、正则匹配

匹配一个电子邮件地址的正则表达式如下:

[A-Za-z0-9._][email protected][A-Za-z0-9.]+\.[a-zA-Z]{2,4}

匹配HTTP URL的正则表达式如下:

http://[a-zA-Z0-9\-\.]+\.[a-zA-Z]{2,4}


(3)、示例

示例1:匹配电子邮件

[[email protected]_01t]# cat a5.txt

this is aline of text contains,<email> #[email protected] </email> andemail address,

blog"http://www.google.com", [email protected] dfdfdfdddfdf;[email protected]<br/>

<ahref="http://code.google.com"><h1>Heading</h1>

[[email protected]_01t]# cat a5.txt |grep -E -o"[A-Za-z0-9._][email protected][A-Za-z0-9.]+\.[a-zA-Z]{2,4}"

[email protected]

[email protected]

[email protected]

[[email protected]_01t]#

 

示例2:匹配URL

[[email protected]_01t]# cat a5.txt

this is aline of text contains,<email> #[email protected] </email> andemail address,

blog"http://www.google.com", [email protected];[email protected]<br />

<ahref="http://code.google.com"><h1>Heading</h1>

[[email protected]_01t]# cat a5.txt |grep -E -o"http://[a-zA-Z0-9\-\.]+\.[a-zA-Z]{2,4}"

http://www.google.com

http://code.google.com

[[email protected]_01t]#


本文出自 “微小信的运维之道” 博客,请务必保留此出处http://weixiaoxin.blog.51cto.com/13270051/1963698

以上是关于Linux Shell编程实战---解析文本中的邮件地址和url的主要内容,如果未能解决你的问题,请参考以下文章

《跟老男孩学Linux运维之shell编程实战》-第三章 shell变量知识进阶

Shell编程之正则表达式

云计算 | Shell脚本自动化编程实战视频教程

Shell编程实战

Shell编程实战

Linux Shell编程实战---shell实现图片下载神器