java学到哪才可以检测两个文本的相似度?
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了java学到哪才可以检测两个文本的相似度?相关的知识,希望对你有一定的参考价值。
参考技术A 学到IO流可以比较文本了, 不过用IO比较文本比较麻烦, 而且效率低如果要效率高的话, 就需要学
linux + thread + progress
这样子可以通过java调用linux命令
linux中有一个comm -12命令来实现比较两个文件的共同数据, 生成一个新文本。 拿到新文本的大小/旧文本的大小, 旧可以粗略计算出相似度, 而且效率极其高
如果文本有上百万行数据的话, 用IO可能要十几个小时才有结果, 但是linux命令只需要1分钟左右就可以出结果
以上是关于java学到哪才可以检测两个文本的相似度?的主要内容,如果未能解决你的问题,请参考以下文章