Linux命令篇之wc命令和tr命令

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Linux命令篇之wc命令和tr命令相关的知识,希望对你有一定的参考价值。

wc

统计文件里面有多少单词,多少行,多少字符。

wc语法

[[email protected]~]# wc [-lwm]

选项与参数:

-l  :仅列出行;

-w  :仅列出多少字(英文单字);

-m  :多少字符;

 

默认使用wc统计/etc/passwd

#wc /etc/passwd

40   451719 /etc/passwd

40是行数,45是单词数,1719是字节数

 

wc的命令比较简单使用,每个参数使用如下:

技术分享

#wc -l /etc/passwd   #统计行数,在对记录数时,很常用

40 /etc/passwd      #表示系统有40个账户

 

#wc -w /etc/passwd  #统计单词出现次数

45 /etc/passwd

 

#wc -m /etc/passwd  #统计文件的字节数

1719



tr命令简介

1、关于tr

通过使用 tr,您可以非常容易地实现 sed 的许多最基本功能。您可以将 tr 看作为 sed 的(极其)简化的变体:它可以用一个字符来替换另一个字符,或者可以完全除去一些字符。您也可以用它来除去重复字符。这就是所有 tr 所能够做的。

tr用来从标准输入中通过替换或删除操作进行字符转换。tr主要用于删除文件中控制字符或进行字符转换。使用tr时要转换两个字符串:字符串1用于查询, 字符串2用于处理各种转换。tr刚执行时,字符串1中的字符被映射到字符串2中的字符,然后转换操作开始。

带有最常用选项的tr命令格式为:

tr -c -d-s ["string1_to_translate_from"]["string2_to_translate_to"] < input-file

这里:

-c 用字符串1中字符集的补集替换此字符集,要求字符集为ASCII。

-d 删除字符串1中所有输入字符。

-s 删除所有重复出现字符序列,只保留第一个;即将重复出现字符串压缩为一个字符串。

input-file是转换文件名。虽然可以使用其他格式输入,但这种格式最常用。

2、字符范围

指定字符串1或字符串2的内容时,只能使用单字符或字符串范围或列表。

[a-z]a-z内的字符组成的字符串。

[A-Z]A-Z内的字符组成的字符串。

[0-9] 数字串。

\octal 一个三位的八进制数,对应有效的ASCII字符。

[O*n] 表示字符O重复出现指定次数n。因此[O*2]匹配OO的字符串。

tr中特定控制字符的不同表达方式

速记符含义八进制方式

\aCtrl-G 铃声\007

\bCtrl-H 退格符\010

\fCtrl-L 走行换页\014

\nCtrl-J 新行\012

\rCtrl-M 回车\015

\tCtrl-I tab键\011

\vCtrl-X \030

1、将文件file中出现的"abc"替换为"xyz"

 

# cat file | tr "abc""xyz" > new_file

 

【注意】这里,凡是在file中出现的"a"字母,都替换成"x"字母,"b"字母替换为"y"字母,"c"字母替换为"z"字母。而不是将字符串"abc"替换为字符串"xyz"。

 

2、使用tr命令“统一”字母大小写

(小写 --> 大写)
# cat file | tr [a-z] [A-Z] > new_file

(大写 --> 小写)
# cat file | tr [A-Z] [a-z] > new_file

 

3、把文件中的数字0-9替换为a-j

 

# cat file | tr [0-9] [a-j] >new_file


4
、删除文件file中出现的"Snail"字符

 

# cat file | tr -d "Snail"> new_file

 

【注意】这里,凡是在file文件中出现的‘S‘,‘n‘,‘a‘,‘i‘,‘l‘字符都会被删除!而不是紧紧删除出现的"Snail”字符串。

 

5、删除文件file中出现的换行‘\n‘、制表‘\t‘字符

 

# cat file | tr -d "\n\t" >new_file

 

不可见字符都得用转义字符来表示的,这个都是统一的。

 

6、删除“连续着的”重复字母,只保留第一个

 

# cat file | tr -s [a-zA-Z] >new_file

 

7、删除空行

 

# cat file | tr -s "\n" >new_file

 

8、删除Windows文件“造成”的‘^M‘字符

 

# cat file | tr -d "\r" >new_file
或者
# cat file | tr -s "\r" "\n" > new_file

 

【注意】这里-s后面是两个参数"\r"和"\n",用后者替换前者

 

9、用空格符\040替换制表符\011

 

# cat file | tr -s "\011""\040" > new_file

 

10、把路径变量中的冒号":",替换成换行符"\n"

 

# echo $PATH | tr -s ":""\n"

 

tr(translate character)

功能说明:转换字符。

语  法:tr [-cdst][--help][--version][第一字符集][第二字符集]

补充说明:tr指令从标准输入设备读取数据,经过字符串转译后,输出到标准输出设备。

参  数:

-c或--complerment 取代所有不属于第一字符集的字符。

-d或--delete 删除所有属于第一字符集的字符。

-s或--squeeze-repeats 把连续重复的字符以单独一个字符表示。

-t或--truncate-set1 先删除第一字符集较第二字符集多出的字符。

--help 在线帮助。

--version 显示版本信息。


本文出自 “鹏哥的博客” 博客,谢绝转载!

以上是关于Linux命令篇之wc命令和tr命令的主要内容,如果未能解决你的问题,请参考以下文章

linux常用命令-文本处理cut,sort,uniq,wc,tr

Linux centos7 shell特殊符号cut命令sort_wc_uniq命令tee_tr_split命令shell特殊符号

linux变量cut_sort_wc_uniq_tee_tr_split 命令使用方法

linux-12基本命令之 cat,more,head, tail ,tr,od,wc,cut,diff

Linux CentOS 7 shell中的特殊字符及与管道相关的命令(cut,sort,wc,uniq,tee,tr,split)

shell中的特殊符号和cut,sort,wc,uniq,tee,tr,split命令