linux-统计一个文件中出现的单词数

Posted 一秒のリフレイン

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了linux-统计一个文件中出现的单词数相关的知识,希望对你有一定的参考价值。

#!/bin/bash
if [ $# -ne 1 ]
then
echo "Usage: $0 filename";
exit -1
fi

filename=$1
egrep -o "\b[[:alpha:]]+\b" $filename | awk { count[$0]++ }
END{ printf("%-14s%s\n", "word", "count");
for(ind in count)
{ printf("%-14s%d\n", ind, count[ind]); }
}
egrep -o "\b[[:alpha:]]+\b" $filename 可以得到文件中所有的单词 \b为单词边界标记符

以上是关于linux-统计一个文件中出现的单词数的主要内容,如果未能解决你的问题,请参考以下文章

个人作业项目报告

Linux命令经典面试题:统计文件中出现次数最多的前10个单词

Linux统计文件内容

linux中wc -l指令用法,我知道怎么得到一个文件的内容行数,但是是怎么得到多个文件的内容的总行数

linux文件行数统计

Linux统计文件中单词出现的次数