OpenOffice/Mozilla *.dic 文件格式

Posted

技术标签:

【中文标题】OpenOffice/Mozilla *.dic 文件格式【英文标题】:OpenOffice/Mozilla *.dic file format 【发布时间】:2010-12-29 18:51:46 【问题描述】:

我想在自己的应用程序中使用 openoffice/mozilla 字典。我尝试查找 dic 文件格式文档(看起来很容易),但我对此有疑问。如果有人有这种文件,我将不胜感激

【问题讨论】:

【参考方案1】:

一开始是 MySpell,然后是 UTF-8 版本,Hunspell...

长话短说,基本上有两个文件:*.dic 和 *.aff。

第一个包含正确单词的列表。 第二个有affixes。

我找到了一个解释它的link。

【讨论】:

【参考方案2】:

根据我在谷歌上的first result,它是一个纯文本(UTF-8 编码)文件,它从第 2 行开始按字母顺序在不同的行(\r\n 行尾)列出所有单词。第 1 行包含字数。

对随机 .dic 文件的简短查看可以确认这一点。找到这样的东西应该不会太复杂。

【讨论】:

我认为这并不容易,这是GB字典的开头(来自mozilla xpi文件)它看起来在缩写/ M abdicate/ DNGSn Abelard/ M abider / 后面添加了一些前缀M Abidjan ablaze bloom 地上磨蚀机/ M Abram/ 我也见过,好像是性别信息什么的。我相信你已经尝试过了。

以上是关于OpenOffice/Mozilla *.dic 文件格式的主要内容,如果未能解决你的问题,请参考以下文章

字典 dict

copy 浅拷贝和深拷贝

python第二十三课——dict中的函数

数据类型(字典)

dic常用方法

please set a system env PAODING_DIC_HOME or Config paoding.dic.home in paoding-dic-home.properties p