OpenOffice/Mozilla *.dic 文件格式
Posted
技术标签:
【中文标题】OpenOffice/Mozilla *.dic 文件格式【英文标题】:OpenOffice/Mozilla *.dic file format 【发布时间】:2010-12-29 18:51:46 【问题描述】:我想在自己的应用程序中使用 openoffice/mozilla 字典。我尝试查找 dic 文件格式文档(看起来很容易),但我对此有疑问。如果有人有这种文件,我将不胜感激
【问题讨论】:
【参考方案1】:一开始是 MySpell,然后是 UTF-8 版本,Hunspell...
长话短说,基本上有两个文件:*.dic 和 *.aff。
第一个包含正确单词的列表。 第二个有affixes。
我找到了一个解释它的link。
【讨论】:
【参考方案2】:根据我在谷歌上的first result,它是一个纯文本(UTF-8 编码)文件,它从第 2 行开始按字母顺序在不同的行(\r\n
行尾)列出所有单词。第 1 行包含字数。
对随机 .dic 文件的简短查看可以确认这一点。找到这样的东西应该不会太复杂。
【讨论】:
我认为这并不容易,这是GB字典的开头(来自mozilla xpi文件)它看起来在缩写/ M abdicate/ DNGSn Abelard/ M abider / 后面添加了一些前缀M Abidjan ablaze bloom 地上磨蚀机/ M Abram/ 我也见过,好像是性别信息什么的。我相信你已经尝试过了。以上是关于OpenOffice/Mozilla *.dic 文件格式的主要内容,如果未能解决你的问题,请参考以下文章
please set a system env PAODING_DIC_HOME or Config paoding.dic.home in paoding-dic-home.properties p