Spacy 使用
Posted demo-deng
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Spacy 使用相关的知识,希望对你有一定的参考价值。
# 前提是必须安装: python -m spacy download en
nlp = spacy.load(‘en‘)
text = u"you are best. it is lemmatize test for spacy. I love these books. amines (when protonated)"
doc = nlp(text)
# 观察分词
token = [t for t in doc]
# 分词我们就用这个orth_ 可以识别标点符号
token2 = [token.orth_ for token in doc]
# 观察词干化
lemma = [l.lemma_ for l in doc]
# 词性标注
pos = [p.pos_ for p in doc]
以上是关于Spacy 使用的主要内容,如果未能解决你的问题,请参考以下文章
使用 Spacy 使用 PySpark 和 Jupyter 解析文本时出错
使用 spaCy 3 进行自定义 NER 训练会引发 ValueError