第二周_文本处理

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了第二周_文本处理相关的知识,希望对你有一定的参考价值。

简单文本处理工具:
cut -d分隔符 -f字段数(格式可以 # #,#... #-# #,#-#) -c 安字符切割 --output-dellimiter=STRING指定输出分隔符
wc 文本统计 默认统计行数 字数 字节数 -l只计行数 -w只计单词数 -c只计字节数 -m只计字符数 -L显示文件中最长行的长度
sort 排序 -n 按数字大小升序排序 -f忽略字符串大小写 -u删除重复行 -t STR指定分隔符 -k指定字段 tk组合使用
uniq -c显示每行重复出现的次数 -d仅显示重复过的行 -u仅显示不重复的行
grep -v取反 -i忽略大小写 -n显示匹配的行号 -c统计匹配的行数 -o仅显示匹配到的字符串 -q不输出任何信息($?可以显示命令是否执行成功 0为成功 非0为失败) -A#前#行 -B#后#行 -C#前后各#行 -e 或(grep -e PATTERN -e PATTERN file) -w匹配整个单词

正则表达式:
单词 连续的字母数字下划线
字符匹配:
. 任意单个字符
[STRING] 范围内任意单个字符
[^STRING] 范围内外任意单个字符

匹配次数:

  • 匹配前字符任意次 0-任意次
    .
    任意长度字符
    ? 匹配前字符0-1次 懒惰模式
    + 匹配前字符至少一次
    {n} 匹配n次
    {n,m} 匹配n到m次

位置锚定:
^ 行首锚定 "^PATTERN"以字符串开头的行
$ 行尾锚定 "PATTERN"以字符串结尾的行
<或 词首锚定 "<PATTERN"以字符串开头的单词
>或 词尾锚定 "PATTERN>"以字符串结尾的单词
<PATTERN> 匹配整个单词

以上是关于第二周_文本处理的主要内容,如果未能解决你的问题,请参考以下文章

第二周——团队项目(小小大佬带飞队)

20165232 第二周学习总结

第二周学习总结

第六课-第二讲06_02_sed命令

linux学习第二周;vim文本编辑器

(第二周)新英文词频统计