nltk

Posted yangyang12138

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了nltk相关的知识,希望对你有一定的参考价值。

1.wsd模块

返回上下文中不明确单词的synset。

nltk.wsd.lesk([‘I‘, ‘went‘, ‘to‘, ‘the‘, ‘bank‘, ‘to‘, ‘deposit‘, ‘money‘, ‘.‘], ‘bank‘)

 

2.util模块

from nltk.util import *

 

choose这个函数是一种快速计算二项式系数的方法,通常称为nck,即一次取k的n个事物的组合数。

技术图片

 

 

 bigram返回二项组合

技术图片

 

 

trigrams以迭代器的形式返回从一系列项生成的三角图技术图片

技术图片

 

 ngram以迭代器的形式返回从一系列项生成的ngrams。

技术图片

 

 flatten把清单弄平。

技术图片

 

 guess_encoding 尝试对字符串进行解码,返回正确的解码方式

以上是关于nltk的主要内容,如果未能解决你的问题,请参考以下文章

NLTK替换和矫正单词代码示例

nltk分词

NLTK - nltk.tokenize.RegexpTokenizer - 正则表达式未按预期工作

snownlp和nltk啥关系

nltk与ipython悲伤的故事之内存也许溢出。。。

使用 NLTK 的半监督朴素贝叶斯 [关闭]