再聊聊自然语言处理中的结构化预测问题
Posted 机器学习算法与自然语言处理
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了再聊聊自然语言处理中的结构化预测问题相关的知识,希望对你有一定的参考价值。
上次文章从广泛意义上说了结构化预测【见下文】 本文聊一下自然语言处理中的结构化预测问题。
一开始还是说一下结构化预测的概念,结构化预测不是输出一个标量(回归问题)或者一个类别(分类问题),而是输出一个结构,树、图或者其它序列能够互相影响彼此。
在自然语言处理中,结构化预测问题有以下几种:
Sequence segmentation
Sequence labeling / Tagging
Parsing
下面来分开举例
序列分割,指的是将一个序列分割为连续的片段。
更广泛的有句子分割,段落分割,他们的输出片段与片段直接其实是互相联系,全部构成一个整体sequence。
序列标注是一类问题,是对一个序列的每个word打上一个标签,在nlp中非常多的任务都可以转为序列标注任务,这里不是重点,只是说序列标注是结构化预测问题。序列标注问题还有:
以上任务均可以转化为序列标注任务,然后通过一定的解码算法就能得到需要的结果,它们是结构化预测问题,不是简单回归或者分类问题。
最后一类问题是parsing问题,对句法分析的介绍可以看:
上面两篇文章(知乎搜索相关关键字即可!)
本篇文章主要总结了在自然语言处理方向的结构化预测问题,每一类问题其实都可以展开讲解,欢迎大家交流!
所以ppt来自哈工大车万翔老师slides
推荐阅读:
知乎:忆臻
以上是关于再聊聊自然语言处理中的结构化预测问题的主要内容,如果未能解决你的问题,请参考以下文章