选区解析器和依赖解析器之间的区别
Posted
技术标签:
【中文标题】选区解析器和依赖解析器之间的区别【英文标题】:Difference between constituency parser and dependency parser 【发布时间】:2012-05-11 04:18:15 【问题描述】:选区解析器和依赖解析器有什么区别?两者有什么不同的用法?
【问题讨论】:
【参考方案1】:选区分析树将文本分成子短语。树中的非终结符是短语的类型,终结符是句子中的单词,边缘是未标记的。对于一个简单的句子“John sees Bill”,选区解析将是:
Sentence
|
+-------------+------------+
| |
Noun Phrase Verb Phrase
| |
John +-------+--------+
| |
Verb Noun Phrase
| |
sees Bill
依赖解析根据单词之间的关系连接单词。树中的每个顶点代表一个词,子节点是依赖于父节点的词,边由关系标记。 “John sees Bill”的依赖解析将是:
sees
|
+--------------+
subject | | object
| |
John Bill
您应该使用最接近目标的解析器类型。如果您对句子中的子短语感兴趣,您可能需要选区解析。如果您对单词之间的依赖关系感兴趣,那么您可能需要依赖解析。
斯坦福解析器可以给你任何一个 (online demo)。实际上,它真正起作用的方式是始终使用选区解析器解析句子,然后,如果需要,它会对选区解析树执行确定性(基于规则)的转换,以将其转换为依赖树。
更多信息可以在这里找到:
http://en.wikipedia.org/wiki/Phrase_structure_grammar
http://en.wikipedia.org/wiki/Dependency_grammar
【讨论】:
关于NLP,成分解析的应用在哪里?依赖解析非常有用,但我究竟可以在哪里使用组成解析输出? > 基于成分的解析方法提供了类似的信息,但通常必须通过第 11 章中讨论的头部查找规则等技术从树中提炼出来。web.stanford.edu/~jurafsky/slp3/11.pdf @arjun 成分解析有很多应用程序。这里仅举一个例子,在从文本中提取信息/关系时,您可能只需要从文本中提取 VP/NP/子句,然后将这些短语/子句对分类为是否指示关系类型。所以在这种情况下,我不一定需要短语/子句中的细粒度关系信息,但我只需要短语/子句跨越文本。这就是选区解析器派上用场的时候。以上是关于选区解析器和依赖解析器之间的区别的主要内容,如果未能解决你的问题,请参考以下文章