对G级别文件的简易排序思路

Posted 张某人ER

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了对G级别文件的简易排序思路相关的知识,希望对你有一定的参考价值。

              最近在处理数据的时候,遇到了2G多文件(文本文件)排序问题,刚开始试图通
过现有的文本编辑软件(UE)进行排序,但文件太大,总是报错。

              然后想到了Linux中的sort命令,刚开始想先用split命令对文件进行分割,然

后合并。不过,经过试验,sort命令2G的文件直接OK。

              sort -n example.txt

              对example.txt进行排序,-n选项是按数字序。

               

              当文件很大时,就先分割,分别排序,再合并排序(shell思路):

split -l $lines $1 part_
for file in part_*
do

sort $file > sort_$file
 &
done
wait
sort -m sort_* > $2   #没有去重,直接合并多个已排序文件
$1,$2是shell运行时的参数,$1是inputfile,$2是outputfile.



以上是关于对G级别文件的简易排序思路的主要内容,如果未能解决你的问题,请参考以下文章

5 行代码实现快速排序(简易版)

华为OD机试 - 磁盘容量排序(Java) | 机试题+算法思路+考点+代码解析 2023

华为OD机试 - 磁盘容量排序(Java) | 机试题+算法思路+考点+代码解析 2023

拓扑排序

Graphviz 在不同级别的节点之间强制排序

海量数据查找排序