第09课:RNN 在序列问题中的应用——序列标注

Posted wangongxi

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了第09课:RNN 在序列问题中的应用——序列标注相关的知识,希望对你有一定的参考价值。

在前两节课的内容中,我们介绍了循环神经网络及变种的基本原理,并介绍了 Many-to-One 和 One-to-Many 两种架构下,如何基于 Deeplearning4j 进行文本分类和文本生成的应用。

本节课开始,我们将继续为大家介绍另外一种架构,Many-to-Many 在序列标注和机器翻译问题中的应用。这两类问题是 NLP 中的经典问题。尤其对于序列标注问题来说,分词、实体识别、句法分析都可以基于序列标注进行。这里介绍的也是平时企业中最常见的问题——分词。本节课核心内容包括:

  • 基于 Many-to-Many 架构的序列标注应用

9.1 基于 Many-to-Many 架构的序列标注应用

序列标注是自然语言处理应用中常见的问题。基于序列标注的思想,我们可以解决分词、实体识别、浅层句法分析等实际应用。序列标注在以往一般会依赖于 HMM、CRF 等模型来实现,并且已经可以达到产品级别的准确率。基于神经网络的方法目前也有很多工作和研究成果,虽然在准确性上不一定有质的飞跃,但端到端的思想可以体现得更为彻底,毕竟类似 CRF 的模型设计特征模版需要做比较大量的预研工作。

下面我们就详细介绍下如何基于 Deeplearning4j 中的 LSTM 结构来实现分词的问题。使用的架构是 Many-to-Many。我们先来看下示意图。

从截图中我们可以清楚地看到,每一个 RNN Cell 输出的结果即为我们的标注序列。和之前讲述的 Many-to-One/One-to-Many 不同,在 Many-to-Many 架构中,输出和输出的序列都是我们关心的。在分词的场景中,我们可以用最简单的 BESM

以上是关于第09课:RNN 在序列问题中的应用——序列标注的主要内容,如果未能解决你的问题,请参考以下文章

第07课:RNN 在序列问题中的应用——文本分类

第08课:RNN 在序列问题中的应用——文本生成

吴恩达《深度学习》第五门课循环序列模型(RNN)

吴恩达《深度学习》第五门课循环序列模型(RNN)

学习笔记TF020:序列标注手写小写字母OCR数据集双向RNN

RNN中处理不等长序列的问题