16文本处理工具

Posted 小小ITa

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了16文本处理工具相关的知识,希望对你有一定的参考价值。

文本内容查看命令

cat

cat可以查看文本内容

格式  cat [option]...file...

常见选项

-E 显示行结束符$

-A 显示所有控制符

-n 对显示出每一行进行编号

-b 非空行编号

-s 压缩连续的空行为一行

16、文本处理工具_显示文件

nl

相当于 cat -b

16、文本处理工具_显示文件_02

tac

逆向显示文本内容(针对行)

16、文本处理工具_分隔符_03

rev

逆向显示文本内容(针对一行中内容)

16、文本处理工具_显示文件_04

hexdump

查看二进制文件内容

od

查看二进制文件内容

xxd 

查看16进制文件内容

分页查看内容

more

分页查看内容,可以使用管道  (无法向上翻页)

more [option...] file...

选项 

-d 显示翻页及退出提示

less

分页查看内容

/文本 搜索文本

n/N 调到下一个或上一个匹配

显示文本前或后行内容

head

显示文件或标准输入的前面行

格式  head [option]...[file]...

选项

-c # 指定获取前#个字节

-n # 指定获取前#行  或 -#

16、文本处理工具_显示文件_05

tail

显示文件或标准输入的后面行

格式 tail [option]...file..

选项

-c # 指定获取后#字节

-n # 指定获取后#行 或 -#

-f 跟踪显示文件fd新追加的内容,常用于日志监控,相当于 --follow=descriptor,当文件删除在新建同名文件,将无法继续跟踪文件

-F 跟踪文件名 相当于 --follow=name --retry 当文件删除再新建同名文件,将可以继续跟踪文件

tailf 等同于 tail -f

tail -n+2 从第二行到最后一行

16、文本处理工具_字段_06

16、文本处理工具_分隔符_07

16、文本处理工具_分隔符_07

16、文本处理工具_分隔符_09

按列抽取文本cut

cut命令可以提取文本文件或stdin数据的指定列

格式  cut [option]...[file]...

选项  

 -d 分隔符  指定分隔符,默认tab

 -f fileds:

   #第#个字段 3

   #,#[,#]:离散多个字段 3,7,11

   #-# 练习多个字段 1-9

   混合使用 1-3,7

-c 按字符切割

--outpit-delimiter=string 指定输出的分隔符

16、文本处理工具_显示文件_10

16、文本处理工具_字段_11

16、文本处理工具_显示文件_12

16、文本处理工具_分隔符_13

合并多个文件paste

合并多个文件同行好的列到一行

格式   paste [option]...[file]...

-d 分隔符 指定分隔符,默认tab

-s 所有行合并一行显示

16、文本处理工具_字段_14

16、文本处理工具_显示文件_15

16、文本处理工具_字段_16

分析文本的工具

wc 文本统计数据

wc命令可用于统计文件的行总数、单词总数、字节总数和字符总数

可以对文件或stdin中的数据统计

常用选项

-l 只计算行数

-w 只计算单词数

-c 只计算字节总数

-m 只计算字符总数

-L 显示文件中最长行的长度

16、文本处理工具_显示文件_17

16、文本处理工具_显示文件_18

16、文本处理工具_分隔符_19

统计进程数

sort 文本排序

把整理过的文本显示在stdout,源文件不变更(针对行)

格式  sort [option]...file(s)

常用选项

-r  执行反方向排序

-R 随机排序

-n 执行按照数字大小排序

-f 选项忽略字符串中的大小写

-u 合并重复项(去重)

-t c 选项使用c作为字段分隔

-k # 选项按照使用c字符分隔的#列进行排序

16、文本处理工具_显示文件_20

16、文本处理工具_字段_21

按照磁盘空间使用率进行排序

16、文本处理工具_分隔符_22

16、文本处理工具_显示文件_23

a b 文件夹合并后去重

uniq 去重

uniq命令从输入中删除相邻的重复的行

格式  uniq [option]...[file]...

常见选项

-c 显示每行重复出现的次数

16、文本处理工具_分隔符_24

-d 仅显示重复过的行

16、文本处理工具_分隔符_25

-u 仅显示不曾重复行

16、文本处理工具_字段_26

统计用户进程数,每个用户的进程数 ps -aux

16、文本处理工具_显示文件_27

16、文本处理工具_分隔符_28

比较文件

diff命令

比较两个文件之间的区别

16、文本处理工具_分隔符_29

u选项来统一输出统一的diff格式文件

patch 命令

复制在其他文件中进行的改变

适用 -b 选项来自动备份改变了的文件

16、文本处理工具_分隔符_30

cmp命令

查看二级制文件的不同

16、文本处理工具_分隔符_31

以上是关于16文本处理工具的主要内容,如果未能解决你的问题,请参考以下文章

16.自学Linux之路:文本处理工具egrep,fgrep

2017-12-9Linux基础知识(16)文本处理工具

sklearn文本特征提取——TfidfVectorizer

Linux之文本处理工具

自然语言处理介绍

16.3awk使用介绍