文本检索

Posted the-eassy-of-mindon

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了文本检索相关的知识,希望对你有一定的参考价值。

文本检索


grep:

  功能:根据模式搜索文本,并将符合模式的文本行显示出来(默认只支持基本正则表达式)

   模式:有文本字符和正则表达式显示出来

  用法:

    greep [options] "pattern" file

  选项

    -i : 忽略大小写

    --colour:高亮

    -v:显示没有被模式匹配的行

    -o:只显示被模式匹配到的字符串

    -E:pattern中的模式转表成为扩展的正则表达式

    -A:gerp -A n(被匹配的后面两行)会被显示

    -B--------------------------前面----------------

    -C:------------------------前后--------------------


正则表达式:
 元字符:

  .:任意单个字符

  []:

  匹配次数:

    *:匹配前面字符重复任意次

    例如:

    a*b可以被匹配到的字符: b,ab,aab,aaab,aaaab,aaaaab,......

    .*(贪婪模式):表示任意长度的任意字符

    ?:匹配前面的字符一次或者0次

       例如: a?b-->匹配的字符为:b,ab

    /:转义字符

    {m,n}:匹配前面的字符至少出现m,至多出现n次

  位置锚定:

    ^:锚定行首,该字符后面的字符串必须出现在行首

    $:锚定行尾,该字符前面的字符串必须出现在行尾

    ^$:空白行

  单词锚定:

    <或:其后面的字符串必须作为单词的首部出现

    >或者:其前面的字符串必须作为单词的尾部出现

  分组:

    ()

    (ab)*

    1,2,3.........................


扩展正则表达式:

  字符匹配:

    .:

    []:

    [^]:

  次数匹配:

    *:

    ?:

    +:表示匹配其前面的字符至少一次

    {m,n}:匹配其前面的字符至少m次之多n次

   锚定字符:

    ^

    $

    /<

    />

   ():分组

    1 2 3

    |:或者

      C|cat:表示匹配C或cat,或者是左右两边

  

 

    

    

 

  

以上是关于文本检索的主要内容,如果未能解决你的问题,请参考以下文章

从Android小部件的文本框中检索文本?

使用 SendMessage 从闪烁控件中检索文本

文本检索

如何将检索到的文本与我的预期文本进行比较?

如何检索文本字段文本并将其作为整数 32 存储在核心数据中?

如何使用 Selenium 和 Python 从文本节点中检索部分文本