Linux 文本处理工具好强啊

Posted maxuewei2

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Linux 文本处理工具好强啊相关的知识,希望对你有一定的参考价值。

Shuffle contents of multi files

现在有 1000 个文本文件(0.txt ~ 999.txt),每个文件大概 11M,总共 11G,我想把这 1000 个文本文件的内容随机组合成一个文件。

cat *.txt | shuf > random试了下,大概第 8 秒内存占用就达到 96%,然后就不再上涨了,最后大概用了 55 秒完成,要求也完美达成。


输出第n到m个词

一个文本文件,可能有多行,每行有多个单词,单词通过空格分隔,现希望输出第 100 到第 500 ([100,500],闭区间) 个词。

tr ‘ ‘ ‘ ‘ < inputfile | cut -d‘ ‘ -f 100-500 > outputfile

以上是关于Linux 文本处理工具好强啊的主要内容,如果未能解决你的问题,请参考以下文章

Linux文本处理工具三剑客之grep

Linux篇 | 文本处理工具和正则表达式

Linux文本处理工具之grep sed简概

编程小技巧之 Linux 文本处理命令

Linux篇 | 文本处理工具和正则表达式

苹果mac 系统下有啥处理大文本的工具?