从大文件中计算字符长度
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了从大文件中计算字符长度相关的知识,希望对你有一定的参考价值。
我需要从包含140000行的文件中找到字符长度,每个字符串长度各不相同。
aaaaa
bbb
ccccc
ddddd
fff
期望输出如下
strings char-length
2 3
3 5
(表示2个字符串字符长度为3,3个字符串字符长度为5)。我已经尝试过for循环,它会读取每一行,但是由于我的文件有140000个字符串行,所以需要时间。
答案
如果您有awk可用,您可以尝试以下命令:
awk '{ print length($0) }' <your_file> | sort | uniq -c
(在我的虚拟机上运行27ms,样本测试文件为7000行,每行约10个字符长)。
以上是关于从大文件中计算字符长度的主要内容,如果未能解决你的问题,请参考以下文章