分类和标注词汇
Posted nxf-rabbit75
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了分类和标注词汇相关的知识,希望对你有一定的参考价值。
1.词性标注器 parts-of-speech 或 POS tagger nltk自带英文标注器
import nltk
text = nltk.word_tokenize("And now for something completely different")#list
print(nltk.pos_tag(text))
print(nltk.help.upenn_tagset(‘RB‘))#标记的文档
text1 = nltk.Text(word.lower() for word in nltk.corpus.brown.words())
print(type(text1))#<class ‘nltk.text.Text‘>
text1.similar(‘bought‘)
2.标注语料库
3.自动标注
4.N-gram标注
5.基于转换的标注:Brill标注器
以上是关于分类和标注词汇的主要内容,如果未能解决你的问题,请参考以下文章
如何在 Drupal 7 中使用视图模块列出和显示它们被分类词汇标记的项目