机器学习如何进行中文命名实体识别?(面试回答)
Posted Better Bench
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了机器学习如何进行中文命名实体识别?(面试回答)相关的知识,希望对你有一定的参考价值。
如何进行中文命名实体识别?
(1)划分分类
命名实体一般有两种划分:3大类和7小类。
三大类:实体类、时间类、数字类
7小类:人名、地名、组织机构名、时间、日期、货币量、百分数
(2)识别思想
通常是先进行实体识别、然后识别单个实体、最后再识别复合实体
(3)实体标注方法
不同的数据集可能采取不同的实体标注方法,常见的标注方法又IOB、BIOES、Markup
其中IOB标注法,I表示内部,O表示外部,B表示开始
(4)识别方法
- 基于规则的方法
- 基于统计的方法
- 基于深度学习的方法
以上是关于机器学习如何进行中文命名实体识别?(面试回答)的主要内容,如果未能解决你的问题,请参考以下文章
机器学习 - 命名实体识别之Hidden Markov Modelling