对G级别文件的简易排序思路
Posted 张某人ER
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了对G级别文件的简易排序思路相关的知识,希望对你有一定的参考价值。
最近在处理数据的时候,遇到了2G多文件(文本文件)排序问题,刚开始试图通
过现有的文本编辑软件(UE)进行排序,但文件太大,总是报错。
然后想到了Linux中的sort命令,刚开始想先用split命令对文件进行分割,然
后合并。不过,经过试验,sort命令2G的文件直接OK。
sort -n example.txt
对example.txt进行排序,-n选项是按数字序。
当文件很大时,就先分割,分别排序,再合并排序(shell思路):
split -l $lines $1 part_
for file in part_*
do
sort $file > sort_$file
&
done
wait
sort -m sort_* > $2 #没有去重,直接合并多个已排序文件
$1,$2是shell运行时的参数,$1是inputfile,$2是outputfile.
以上是关于对G级别文件的简易排序思路的主要内容,如果未能解决你的问题,请参考以下文章
华为OD机试 - 磁盘容量排序(Java) | 机试题+算法思路+考点+代码解析 2023