python 分裂日语单词 - 日本语単语分かち书き

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python 分裂日语单词 - 日本语単语分かち书き相关的知识,希望对你有一定的参考价值。

import MeCab
mt = MeCab.Tagger("-Ochasen")

def wakati_text_mecab(text):
    res = mt.parseToNode(text.encode("utf-8"))
    
    words = []
    try:
        while res:
            surface = res.surface
            part = res.feature.split(",")[0]
            if part != "BOS/EOS":
                words.append(surface)
            res = res.next
    except Exception as ex:
        print ex
        
    return ' '.join(words)
    
wakati = wakati_text_mecab(u"原子番号92のウランより重い元素は全て人工的に合成され、118番まで発見の報告がある.")
print wakati
# 原子 番号 9 2 の ウラン より 重い 元素 は 全て 人工 的 に 合成 さ れ 、 1 1 8 番 まで 発見 の 報告 が ある 。 

以上是关于python 分裂日语单词 - 日本语単语分かち书き的主要内容,如果未能解决你的问题,请参考以下文章

新编日语第二册前文翻译

学日语用啥教材比较好呢?哪里可以学日语?

新编日语教程

10年日语营业转行IT从深圳到日本东京圈工作生活2019

新编日语教程第二版第二册的mp3有没有,共享一下

日语学习词汇量