斯坦福Stanford coreNLP宾州树库的词性标注规范
Posted 一休Q_Q
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了斯坦福Stanford coreNLP宾州树库的词性标注规范相关的知识,希望对你有一定的参考价值。
宾州树库(PENN Treebank)中的《汉语词性标注规范》
词性标记 | 英文名称 | 中文名称 | 示例 |
AD | Adverbs | 副词 | 还 |
AS | Aspect marker | 体标记 | 了,着,过,的 |
BA | In ba-const | 把、将 |
|
CC | Coordinating conjunction | 并列连词 | 和、与、或、或者 |
CD | Cardinal numbers | 数字、基数词 | 一百 |
CS | Subordinating conj | 从属连词 | 若,如果,如 |
DEC | For relative-clause etc | 标句词,关系从句“的” | 我买“的”书 |
DEG | Associative | 所有格、连接作用“的” | 我“的”书 |
DER | In V-de constructive ,and V-de-R | V得,表示结果补语的“得” | 跑“得”气喘吁吁 |
DEV | Before VP | 表示方式状的“地” | 高兴/NA地/DEV说/VV |
DT | Determiner | 限定词 | 这 |
ETC | Tag for words in coordination phrase | “等”,“等等” | 科技文教 等/ETC 领域 |
FW | Foreign words | 外语词 | Intel |
IJ | Interjection | 感叹词 | 啊 |
JJ | Noun-modifier other thannouns | 其他名词修饰语 | 共同/JJ的/DEG目的/NN 他/PN是/VC男//JJ的/DEG |
LB | In long bei-construction | “被” | “被”他打了 |
LC | Localizer | 方位词 | 桌子“上” |
M | Measure word(including classifiers) | 量词 | 一“块”糖 |
MSP | Some particles | 其他结构助词 | 他/PN所/MSP需要VV的/DEC 所,而,以 |
NN | Common nouns | 普通名词 | 桌子 |
NR | Proper nouns | 专有名词 | 天安门 |
NT | Temporal nouns | 时间名词 | 清朝 |
OD | Ordinal numbers | 序数词 | 第一 |
ON | Onomatopoeia | 拟声词 | 哗啦啦 |
P | Prepositions | 介词 | 在 |
PN | pronouns | 代词 | 你,我,他 |
PU | punctuations | 标点 | , 。 |
SB | In long bei-consturction | 被 | 他/PN被/SB训了/AS |
SP | Sentence-final particle | 句末助词 | 你好吧、SP 吧 呢 啊 吗 |
VA | Predicative adjective | 谓词形容词 | 太阳红彤彤/VA 雪白 丰富 |
VC | Copula | 系动词 | 是 为 非 |
VE | as the main verb | “有”作为主要动词 | 有,无 |
VV | verbs | 普通动词 | 喜欢,走 |
参考《NLP汉语自然语言处理原理与实践》整理。
以上是关于斯坦福Stanford coreNLP宾州树库的词性标注规范的主要内容,如果未能解决你的问题,请参考以下文章
斯坦福大学Stanford coreNLP 宾州树库依存句法标注体系
斯坦福 stanford coreNLP 中的PCFG parser-lexparser