数据存储小算法

Posted stone531

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据存储小算法相关的知识,希望对你有一定的参考价值。

记录一个问题: 有一个10G大小的文件,文件内为一行一个的整数,给定可使用内存为2G.要求统计出现次数最多的数字。

1、流式数据处理(这块后面单独写吧,埋坑....)

2、分文件处理

      读入部分文件,对数值模10.取值相同放入一个文件。然后处理10个文件。统计出现次数最多的。

      我认为上面这种方案可以解决一种情况。就是文件数值不重复。或者重复较少的情况

假设一种极端情况。文件内容全部取模值全部相同。或者超过2G就不在适用上面的方法了。而更适合将相同的数字放入同一个文件。

     情况不同解决方案也不尽相同。没有银弹
---------------------
作者:乔帆
来源:CSDN
原文:https://blog.csdn.net/weixin_40596063/article/details/82895458
版权声明:本文为博主原创文章,转载请附上博文链接!

以上是关于数据存储小算法的主要内容,如果未能解决你的问题,请参考以下文章

数据结构与算法--第5周作业(线性表合并算法)

哈希算法:你会如何存储重要数据

数据结构与算法

算法小专栏:选择排序

倒排索引PForDelta压缩算法——基本假设和霍夫曼压缩同

求数据结构答案