文本检索
Posted the-eassy-of-mindon
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了文本检索相关的知识,希望对你有一定的参考价值。
文本检索
grep:
功能:根据模式搜索文本,并将符合模式的文本行显示出来(默认只支持基本正则表达式)
模式:有文本字符和正则表达式显示出来
用法:
greep [options] "pattern" file
选项
-i : 忽略大小写
--colour:高亮
-v:显示没有被模式匹配的行
-o:只显示被模式匹配到的字符串
-E:pattern中的模式转表成为扩展的正则表达式
-A:gerp -A n(被匹配的后面两行)会被显示
-B--------------------------前面----------------
-C:------------------------前后--------------------
正则表达式:
元字符:
.:任意单个字符
[]:
匹配次数:
*:匹配前面字符重复任意次
例如:
a*b可以被匹配到的字符: b,ab,aab,aaab,aaaab,aaaaab,......
.*(贪婪模式):表示任意长度的任意字符
?:匹配前面的字符一次或者0次
例如: a?b-->匹配的字符为:b,ab
/:转义字符
{m,n}:匹配前面的字符至少出现m,至多出现n次
位置锚定:
^:锚定行首,该字符后面的字符串必须出现在行首
$:锚定行尾,该字符前面的字符串必须出现在行尾
^$:空白行
单词锚定:
<或:其后面的字符串必须作为单词的首部出现
>或者:其前面的字符串必须作为单词的尾部出现
分组:
()
(ab)*
1,2,3.........................
扩展正则表达式:
字符匹配:
.:
[]:
[^]:
次数匹配:
*:
?:
+:表示匹配其前面的字符至少一次
{m,n}:匹配其前面的字符至少m次之多n次
锚定字符:
^
$
/<
/>
():分组
1 2 3
|:或者
C|cat:表示匹配C或cat,或者是左右两边
以上是关于文本检索的主要内容,如果未能解决你的问题,请参考以下文章