分类和标注词汇

Posted nxf-rabbit75

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了分类和标注词汇相关的知识,希望对你有一定的参考价值。

1.词性标注器 parts-of-speech 或 POS tagger  nltk自带英文标注器

import nltk

text = nltk.word_tokenize("And now for something completely different")#list
print(nltk.pos_tag(text))
print(nltk.help.upenn_tagset(‘RB‘))#标记的文档
text1 = nltk.Text(word.lower() for word in nltk.corpus.brown.words())
print(type(text1))#<class ‘nltk.text.Text‘>
text1.similar(‘bought‘)

 

技术分享图片

2.标注语料库 

3.自动标注

4.N-gram标注

5.基于转换的标注:Brill标注器 

以上是关于分类和标注词汇的主要内容,如果未能解决你的问题,请参考以下文章

如何在 Drupal 7 中使用视图模块列出和显示它们被分类词汇标记的项目

爬虫小案例:联想词汇搜索

朴素贝叶斯分类器是不是需要了解整个词汇表?

词汇与分词技术

加载泡菜 NotFittedError:TfidfVectorizer - 未安装词汇

HTML 在词汇表中打印分类术语