文本处理工具简略
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了文本处理工具简略相关的知识,希望对你有一定的参考价值。
文本处理工具 简略
cat [OPTION]...[FILE]
-E:显示行结束符$
-n:对显示出的每一行进行编号
-A:显示所有控制符
-b:非空行编号
-s:压缩连续的空行成一行
cat <fliename 创建一个新文件
cat file1 file2 > file 将几个文件合并为一个文件
tac(反向列示)
tac 是将 cat 反写过来,所以他的功能就跟 cat 相反, cat 是由第一行到最后一行连续显示在萤幕上,
而 tac 则是由最后一行到第一行反向在萤幕上显示出来!
在Linux中echo命令用来在标准输出上显示一段字符,比如:
echo "the echo command test!"
这个就会输出“the echo command test!”这一行文字!
rev
rev 命令是 reverse 的缩写,也是从文件的第一行扫描到最后一行,不过每行都是反转输出的。
more :分页查看文件
-d:显示翻页及退出提示
less:一页一页的查看文件或STDIN输出
查看时的命令: /文本 搜索 文本
n/N 跳到下一个 或上一个匹配 (n是顺序,N是倒序)
less 命令是man命令使用的分页器
head:显示文本前行内容(默认前十行)
语法: [option]...[file]...
-c# 指定获取前#字节
-n# 指定获取前#行
-# 指定行数
tail 显示文本后行内容 (默认十行)
语法:[option]...[file]...
-c# 指定获取后#字节
-n# 指定获取后#行
-# 指定行数
-f 跟踪显示文件fd新追加的内容,常用于日志监控,相当于 --follow=descriptor
-F 跟踪文件名,,相当于 --follow=name --retry
tailf 类似于tail -f,当文件不增长时不访问文件
cut 按列抽取文本
语法:[option]...[file]...
-d :指明分隔符,默认tab
-f :
#:第#个字段
#,#[,#]:离散的多个字段,例如1,3,6
-c:按字符切割
--output-delimiter=STRING指定输出分隔符
显示文件或STDIN数据的指定列
cut -d: -f1 /etc/passwd
cat /etc/passwd |cut -d: -f7
cut -c2-5 /usr/share/dict/wrods
pastee 合并两个文件同行号的列到一行
语法: paste [OPTION]... [FILE]...
-d 分隔符:指定分隔符,默认用TAB
-s : 所有行合成一行显示
wc:文本数据统计
计数单词总数、行总数、字节总数和字符总数
-l :只计数行数
-w :只计数单词总数
-c :只计数字节总数
-m :只计数字符总数
-L :显示文件中最长行的长度
sort 文本排序
把整理过的文本显示在STDOUT,不改变原始文件
语法:sort [options] file(s)
常用选项
-r 执行反方向(由上至下)整理
-R 随机排序
-n 执行按数字大小整理
-f 选项忽略(fold)字符串中的字符大小写
-u 选项(独特,unique)删除输出中的重复行
-t c 选项使用c做为字段界定符
-k X 选项按照使用c字符分隔的X列来整理能够使用多次
diff 比较两个文件之间的区别
-u
patch 复制对文件进行的改变
-b 选项来自动备份改变了的文件
uniq 从输入中删除前后相接的重复的行
语法:uniq [OPTION]... [FILE]...
-c: 显示每行重复出现的次数
-d: 仅显示重复过的行
-u: 仅显示不曾重复的行
注:连续且完全相同方为重复
以上是关于文本处理工具简略的主要内容,如果未能解决你的问题,请参考以下文章