深蓝词库转换2.4版发布,支持最新的搜狗用户词库备份bin格式

Posted studyzy

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了深蓝词库转换2.4版发布,支持最新的搜狗用户词库备份bin格式相关的知识,希望对你有一定的参考价值。

很高兴的告诉大家,感谢GitHub上的h4x3rotab提供python版的搜狗用户词库备份bin格式的解析算法,感谢tmxkn1提供了C#版的实现,深蓝词库转换终于迎来了一个重大更新,能够支持搜狗用户词库的bin格式备份的导出了。再也不用受到搜狗输入法的钳制,可以自由切换到其他输入法了。搜狗bin词库只解析到了用户词条和词频,没有拼音,所以如果要导出其他拼音输入法,中间转换工具会根据词条的内容重新生成拼音。

技术分享图片

另外在2.4版中,增加了用户词频强制设置的功能,比如将搜狗用户词库bin格式备份转换为Win10自带的微软拼音,那么词频会导致该词条在微软拼音上的位置不对,那么我们就需要忽略掉搜狗bin格式解析出来词频,而是使用1表示词频,这样在微软拼音中才会显示正常。

技术分享图片

设置了强制的默认词频后,所有词频将按照新词频算法生成。

技术分享图片

导入到Win10自带微软拼音的用户自定义短语后的效果如图:

技术分享图片

最新版的深蓝词库转换的下载地址:

https://github.com/studyzy/imewlconverter/releases

以上是关于深蓝词库转换2.4版发布,支持最新的搜狗用户词库备份bin格式的主要内容,如果未能解决你的问题,请参考以下文章

深蓝词库转换2.8发布——支持微软拼音自学习词库导入导出

中州韵输入法导入搜狗词库

如何扩充rime五笔词库

怎样导出搜狗词库到文本?

Rime 输入法挂载自定义词库

怎么在极点五笔中添加海峰98词库