LanguageTool默认有4万多的拼写检查需要忽略的词

Posted 柳鲲鹏

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了LanguageTool默认有4万多的拼写检查需要忽略的词相关的知识,希望对你有一定的参考价值。

  最近做到忽略功能,加了两个单词进去,想看一下列表。结果看到显示,心里奇怪了(大量的数组)。今天输出了一下。代码是:

	    for (Rule rule : langTool.getAllActiveRules()) 
	        if (rule instanceof SpellingCheckRule) 
	        	SpellingCheckRule check = (SpellingCheckRule)rule;
	        	List<String> wordsToIgnore = Arrays.asList("specialword", "myotherword");
	        	check.addIgnoreTokens(wordsToIgnore);

                //getIgnoreTokens()是自己添加的接口
	        	System.out.println("getIgnoreTokens="+check.getIgnoreTokens().size());
	        
	    

输出是多少呢?41819。听着有点多,其实想想英文单词数量,还真不多。

以上是关于LanguageTool默认有4万多的拼写检查需要忽略的词的主要内容,如果未能解决你的问题,请参考以下文章

需要文字修正功能

OFFICE拼写语法检查:WORD是怎么做的?

C# 英语纠错 LanguageTool

LanguageTool性能简单测试分析

标星 7 万多的知名开源项目,惨遭 GitHub 强行封杀下架

机器学习之单词拼写检查