使用Python进行英文单词分割

Posted herosunly

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了使用Python进行英文单词分割相关的知识,希望对你有一定的参考价值。

  由于在一些场景中,所有的字母都连在了一起,所以我们需要将字母分割成单词的形式。

1. 安装

pip install -U symspellpy

2. 下载词典

  下载链接为https://download.csdn.net/download/herosunly/18903125

3. 单词分割

import pkg_resources
from symspellpy.symspellpy import SymSpell

sym_spell = SymSpell(max_dictionary_edit_distance=0, prefix_length=7)
dictionary_path = pkg_resources.resource_filename(
    "symspellpy", "frequency_dictionary_en.txt")

sym_spell.load_dictionary(dictionary_path, term_index=0, count_index=1)

# a sentence without any spaces
input_term = "thequickbrownfoxjumpsoverthelazydog"
result = sym_spell.word_segmentation(input_term)
print(", , ".format(result.corrected_string, result.distance_sum,
                          result.log_prob_sum))

需要注意的是distance_sum的范围为[0, len(input_term)],其中0表示input_term就是一个单词,而len(input_term)表示该单词无法进行划分。

以上是关于使用Python进行英文单词分割的主要内容,如果未能解决你的问题,请参考以下文章

python中split的用法分割的字符串怎么命名?

华为OD机试 - 单词反转(Python)| 真题含思路

用Python设计一个函数,该函数接受一个字符串,其功能是返回这个字符串中的最后一个英 文单词的长度。

使用 Python 进行时间序列分割

使用Python进行单词翻译

链表题 面试题02.04. 分割链表290. 单词规律20. 有效的括号