从大文件中计算字符长度

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了从大文件中计算字符长度相关的知识,希望对你有一定的参考价值。

我需要从包含140000行的文件中找到字符长度,每个字符串长度各不相同。

aaaaa
bbb
ccccc
ddddd
fff

期望输出如下

strings char-length
2       3
3       5

(表示2个字符串字符长度为3,3个字符串字符长度为5)。我已经尝试过for循环,它会读取每一行,但是由于我的文件有140000个字符串行,所以需要时间。

答案

如果您有awk可用,您可以尝试以下命令:

awk '{ print length($0) }' <your_file> | sort | uniq -c

(在我的虚拟机上运行27ms,样本测试文件为7000行,每行约10个字符长)。

以上是关于从大文件中计算字符长度的主要内容,如果未能解决你的问题,请参考以下文章

c语言任意输入5个数,并按从大到小顺序输出

JavaScript 代码片段

将 JavaScript 字符串拆分为固定长度的片段

2016.06.06 周一 C语言 将字符串根据字符的ASCII码从大到小排序并打印出字符串中的字符类型的总数

C语言字符串长度如何数?

C语言字符串长度如何数?