IK 歧义分析-A部分

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了IK 歧义分析-A部分相关的知识,希望对你有一定的参考价值。

今天看了一下IK的源代码,网上已经有很多文章,此文章是他们的补充。
比如有个字符串 “张三说的确实在理”, 经过分词后变成

第一部分: 张三 三(数词)
第二部分: 说的 的确 确实 实在 在理

其中第一部分是有交集的,于是可以进入judge阶段,最终“三”被PK下去,只留下了“张三”。 然后加入最优集合
this.pathMap.put(path.getPathBegin(), path);

第二部分也是有交集的,于是这5个词进入judge, 最终留下“说的” “确实” “在理”,三个词,然后加入最优集合。

最终将这两个部分的词加入结果集中
private LinkedList<Lexeme> results;

最终result集合经过数量词合并(合并英文数词+中文数词,英文数词+中文量词,中文数词+中文量词)及停词剔除,输入最终的分词结果。

以上是关于IK 歧义分析-A部分的主要内容,如果未能解决你的问题,请参考以下文章

IK分词器原理与源码分析

ikanalyzer 可以做词性标注吗

如何解决情感分析中的歧义?

fortran调用 带有参数 且 返回类型为数组的函数 及 相关歧义分析

fortran调用 带有参数 且 返回类型为数组的函数 及 相关歧义分析

fortran调用 带有参数 且 返回类型为数组的函数 及 相关歧义分析