NLP笔记

Posted 小_龟

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了NLP笔记相关的知识,希望对你有一定的参考价值。

 

词性标注器

>>> text = nltk.word_tokenize(‘what are your name?‘)
>>> text

>>> nltk.pos_tag(text)
[(‘what‘, ‘WDT‘), (‘are‘, ‘VBP‘), (‘your‘, ‘PRP$‘), (‘name‘, ‘NN‘), (‘?‘, ‘.‘)]

 

CC 并列连词

RB 副词

IN 连词

JJ 形容词

 

帮助文档使用

nltk.help.upenn_tagset( ‘RB*‘)

 

text = nltk.Text(word.lower() for word in nltk.corpus.brown.words())

text.similar(‘woman‘)  #找出与woman相似的词

 

nltk.tag.str2tuple()  #已标记的词构建为列表

nltk.corpus.brown.tagged_words()  

nltk.corpus.nps_chat.tagged_words()

nltk.corpus.conll2000.tagged_words()

 

以上是关于NLP笔记的主要内容,如果未能解决你的问题,请参考以下文章

西湖大学张岳老师NLP课程笔记1 Introduction

NLP一文了解词性标注CRF模型

NLP笔记

NLP 笔记: 序列标注与BIO标注

NTU 课程笔记 :NLP - language model

中文NLP笔记:11. 基于 LSTM 生成古诗