Big Txt File

Posted watergood

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Big Txt File相关的知识,希望对你有一定的参考价值。

对于当今的数据集来说,动不动就上G的大小,市面的软件大多不支持,所以需要自己写一个。

常见的txt文本行形式存储的时候也不过是行数多些而已,可以考虑只观测部分行的方式,基于这个思路可以搞一个大数据的浏览工具。

贴图:

技术分享图片

内部的原理很简单,就是先记录下文件的每行的末尾坐标,然后存起来,到需要的时候直接seek到位置然后读取。

这样的思路在z400的工作站10G文件几秒就打开了。

VC做的10G在win7 64位系统下几乎卡死,还未研究。但是1G左右的文件差不多几秒也能打开。

我用的list,如果换成editor的话几乎可以实现文本的处理。

git源码:https://github.com/watergao/A-Little-in-Big-text-file

 

喜欢的打赏我吧:

 支付宝

技术分享图片

 

微信

技术分享图片

 

技术分享图片

 

以上是关于Big Txt File的主要内容,如果未能解决你的问题,请参考以下文章

Java io

Big Txt File

批量重命名文件

getPath

从INSANE BIG WORDLIST中删除重复项

批量移动文件