Linux18_数据操作

Posted Grooovvve

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Linux18_数据操作相关的知识,希望对你有一定的参考价值。

grep命令 筛选数据
Globally search a Regular Expression and Print的缩写
全局搜索一个正则表达式,并打印
在文件中,查找关键字,并显示关键字所在的行;

基本用法:
grep text file
text 搜索的文本
file 要搜索的文件名

 

 

查看etc/profile文件中查找path关键字,返回含有path关键字的行;

 

 

默认情况下grep是区分大小写
如果加上-i (ignore)表示忽略大小写

-n参数显示搜索的行号

 

 

 

grep高级用法
配合正则表达式

-E extended regular expression的第一个字母
使用正则表达式
类似命令egrep 等同于 grep -E

 

正则表达式的使用这里就不多说了;

有些发行版,正则表达式式默认激活的,不需要-E

=====================================================

sort命令,为文件排序

 

 

 

 

 

 

 

sort 文件名
这并不会改变文件内容,只是将排序后的内容显示在屏幕上;

如果需要保存排序后的结果,可以使用-o参数;
-o 将排序后的结果,写入新文件;output缩写;

 

 

-r参数    倒序排列

-R参数   随机排序

-n参数   对数字排序,从小到大排序  //使用sort默认排序时,会把数字看成字符串来处理,按照1-9顺序来排;

=================================================

wc命令   文件的统计

word count

统计行数、字符数、字节数

 

 

 

这个结果看着有点迷惑

第一列:表示行数,10

第二列:表示单词数,9

第三列:表示字节数,51

第四列:表示文件名

 

-l参数   只统计行数

-w参数 统计单词数

-c参数  统计字节数

-n参数  统计字符数

==================================================

uniq 命令   删除文件中的重复内容

 

uniq 命令要注意的是:只能将连续的重复行变成一行;

 

 

 

 

 

类似于sort,如果要将结果保存下来的话,就要保存到新的文件中;

 

 

 

 

-c 参数 显示重复的行数

 

 

 

-d  参数  显示重复的行

 

 

================================================

cut命令   剪切文件的一部分内容

cut命令用于对文件的每一行进行剪切处理

 

 

-c 参数  根据字符数来剪切

cut -c 2-4 name.txt     //每一行只保留第二到第四个字符

 

 

===================================================================

总结:

grep   查找指定内容

sort     排序

wc      统计字符、字节数、行数

uniq   去重

cut     剪切

 

以上是关于Linux18_数据操作的主要内容,如果未能解决你的问题,请参考以下文章

MyBatis学习总结_18_MyBatis与Hibernate区别

mysql基础_操作文件中的内容

请谨慎操作Ubuntu18.04升级GLIBC_2.29,解决ImportError: /lib/x86_64-linux-gnu/libm.so.6: version `GLIBC_2.29‘

Linux06_文件操作

Spark+Hadoop+Hive集群上数据操作记录

es在linux命令行直接操作数据