Linux之数据提取操作

Posted buling_buling_

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Linux之数据提取操作相关的知识,希望对你有一定的参考价值。

数据提取操作

1、操作命令(都可以结合pipe使用)

1、cut:切分操作(可以切分出一整列)

2、grep:检索(可以使用正则表达式)

3、sort:排序(可以对整列排序)

4、wc:统计字符、字数、行数

5、uniq:去重(只去除连续的重复值)

6、tee:双向重定向

7、split:文件切分(按字节大小、按行等)

8、xargs:参数代换(结合pipe使用)

9、tr、替换、压缩和删除

2、具体操作

(1)cut 切分:cut [option] <file>

-d c:以c字符分割
-f num:显示num字段的内容【n-;n-m;-m;m,n】

-b num:按字节切分 <<=>> -c num:按字符切分

(2)grep 检索

-c :统计搜寻到的行数

-i:忽略大小写
-n :顺序输出行号

-v:反向输出(去掉不想要的内容)

-w:匹配整个单词而不是一部分

(3)sort 排序(默认以字符串第一个字符从小到大排序)

-f:忽略大小写
-M:以月份名称排序
-n:根据数值排序
-r:反向排序
-t:分割字符:指定排序时用的栏位分割字符
-k:以哪个区间排序
例如:将 /etc/passwd中的内容按照uid反向排序

(4)wc 统计字符、字数、行数

-l :仅列出行数
-w:仅列出字数
-c:列出字节数
-m:列出字符数
-L :统计最长行字符数

(5)uniq 去重

-i:忽略大小写
-c:对重复项计数
-u:只输出不重复的行
使用last命令输出登录用户名及次数

(6)tee 双向重定向

-a:append追加(既打印在屏幕上又打印进文件中)

(7)splite 文件切分

-b SIZE:切分为SIZE bytes 大小的文件
-C SIZE:切分为SIZE bytes大小的文件不断开一行
–l num:以num行为大小进行切分

图中切分为每3行一个文件,所以ls之后有了6个文件

(8)xargs 参数代换(管道后面不收标准输入时使用)

-p:执行命令前先询问
-n num:每次执行command时需要的参数个数
-eEOF:执行到EOF这个参数就结束

按照用户名查看 /etc/passwd中的用户,当读到‘sync’用户时结束

(9)tr 替换、删除、压缩(tr [ option] <字符集1><字符集2>)

-c :替换所有不属于第一字符集的字符
-d:删除所有属于第一字符集的字符
-s:将连续重复的字符以单独一个字符表示

词频统计

a.txt 文件的内容
进行统计

以上是关于Linux之数据提取操作的主要内容,如果未能解决你的问题,请参考以下文章

Linux之数据提取操作

Linux之数据提取操作

Python操作Excel之数据提取

Jmeter之beanshell多种提取嵌套Json数据

Linux 文本三剑客之 grep

Linux 命令之 linux 四剑客