再聊聊自然语言处理中的结构化预测问题

Posted 机器学习算法与自然语言处理

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了再聊聊自然语言处理中的结构化预测问题相关的知识,希望对你有一定的参考价值。

上次文章从广泛意义上说了结构化预测【见下文】 本文聊一下自然语言处理中的结构化预测问题。

Structured Prediction

一开始还是说一下结构化预测的概念,结构化预测不是输出一个标量(回归问题)或者一个类别(分类问题),而是输出一个结构,树、图或者其它序列能够互相影响彼此。

在自然语言处理中,结构化预测问题有以下几种:

  • Sequence segmentation

  • Sequence labeling / Tagging

  • Parsing

下面来分开举例

Sequence Segmentation
再聊聊自然语言处理中的结构化预测问题

序列分割,指的是将一个序列分割为连续的片段。

更广泛的有句子分割,段落分割,他们的输出片段与片段直接其实是互相联系,全部构成一个整体sequence。

Sequence Labeling / Tagging
再聊聊自然语言处理中的结构化预测问题

序列标注是一类问题,是对一个序列的每个word打上一个标签,在nlp中非常多的任务都可以转为序列标注任务,这里不是重点,只是说序列标注是结构化预测问题。序列标注问题还有:

再聊聊自然语言处理中的结构化预测问题
再聊聊自然语言处理中的结构化预测问题
再聊聊自然语言处理中的结构化预测问题
再聊聊自然语言处理中的结构化预测问题

以上任务均可以转化为序列标注任务,然后通过一定的解码算法就能得到需要的结果,它们是结构化预测问题,不是简单回归或者分类问题。

Parsing Algorithm
再聊聊自然语言处理中的结构化预测问题

最后一类问题是parsing问题,对句法分析的介绍可以看:

再聊聊自然语言处理中的结构化预测问题

上面两篇文章(知乎搜索相关关键字即可!)

本篇文章主要总结了在自然语言处理方向的结构化预测问题,每一类问题其实都可以展开讲解,欢迎大家交流!

所以ppt来自哈工大车万翔老师slides



推荐阅读:



  

知乎:忆臻


以上是关于再聊聊自然语言处理中的结构化预测问题的主要内容,如果未能解决你的问题,请参考以下文章

预测句子中的缺失词 - 自然语言处理模型 [关闭]

预测词向量而不是词(自然语言处理)

自然语言处理之文本标注问题

n-gram语言模型

条件随机场介绍—— An Introduction to Conditional Random Fields

R语言实现DNA结构预测