机器学习如何进行中文命名实体识别?(面试回答)

Posted Better Bench

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了机器学习如何进行中文命名实体识别?(面试回答)相关的知识,希望对你有一定的参考价值。

如何进行中文命名实体识别?

(1)划分分类

命名实体一般有两种划分:3大类和7小类。

三大类:实体类、时间类、数字类

7小类:人名、地名、组织机构名、时间、日期、货币量、百分数

(2)识别思想

通常是先进行实体识别、然后识别单个实体、最后再识别复合实体

(3)实体标注方法

不同的数据集可能采取不同的实体标注方法,常见的标注方法又IOB、BIOES、Markup

其中IOB标注法,I表示内部,O表示外部,B表示开始

(4)识别方法

  1. 基于规则的方法
  2. 基于统计的方法
  3. 基于深度学习的方法

以上是关于机器学习如何进行中文命名实体识别?(面试回答)的主要内容,如果未能解决你的问题,请参考以下文章

机器学习 - 命名实体识别之Hidden Markov Modelling

阿里巴巴狗尾草苏大联合论文:基于对抗学习的众包标注用于中文命名实体识别

基于统计的中文实体识别方法简述

机器不学习:浅析深度学习在实体识别和关系抽取中的应用

Java命名实体识别

基于深度学习做命名实体识别