学习自然语言处理技术:第十八讲 义位
Posted 人工智能引擎
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了学习自然语言处理技术:第十八讲 义位相关的知识,希望对你有一定的参考价值。
词汇义是语义研究的首要对象。在上述句子(4-1)中, 造成歧义的原因就是因为一个词有多个词义。在词典编撰中, 称每一个词义为一个义项, 在语义学中也称之为义位。例如在《现代汉语词典》中“, 明白”有四个不同的意思:
内容、意思等使人容易了解; 清楚; 明确
公开的、不含糊的
聪明; 懂道理
知道; 了解
即是表明“明白”这个词包含四个不同的义位(义项) 。
为特定句子中的某个词在它的多个可能义位中确定一个合适的义位是语义消歧的重要任务。一个可能的方案是依据上下文其他词的义位确定后产生的约束来进行歧义消除。这里主要考察不同义位之间搭配的可能性, 例如在上述例句(4-1 )中, machine 的义位确定为“机器”后, 主要考察ran 的几种可能的义位哪一个与machine 的义位搭配更合适,即确定“跑”、“ 竞选”以及“ 操作”等义位与“机器”搭配的可能性, 而确定这一点实际上是与语言本身无关的。如在本例中, 利用世界知识就可以确定“ 跑机器”、“竞选机器”搭配的可能性要比“操作机器”小得多, 因此可以确定ran 在本句中应取义位“ 操作”。从上面的简单分析可以看到, 不同义位的选取依赖于义位间的搭配情况, 而义位间的搭配依赖于一些基本的义位间的关系。下面考察几种基本的义位间关系。
1 .上下义关系
上下义关系是指在两个义位(分别称为上义义位和下义义位) 间存在类属关系, 下义义位是上义义位的子类, 例如:“狮子”是“ 动物”的一个子类, 即“狮子”和“ 动物”两个义位构成上下义关系“, 狮子”是“动物”的下义位“, 动物”是“狮子”的上义位。利用上下义关系可以进行如下的推理过程。对于某个义位a, 已有如下的判断:
X 是a
如果存在另外一个义位b ,b 是a 的上义位, 则可以推出:
X 是b
例如: 由“X 是狮子”必然可以推出“X 是动物”。
注:
(1) 句子间的这种推理关系( 一个句子表示的判定是另一个句子所表示的判定的必然结论)是后面考察句子语义时的主要研究对象, 但并非所有的这种推理都需要利用上下义关系才能进行。
(2) 义位间的上下义关系也常用来进行概念定义, 这即是所谓的属+ 种差的定义方法。例如在《现代汉语词典》中, 狮子的定义是: 哺乳动物。身长约3 米, 四肢强壮, 有钩爪, 掌部有肉块, 尾巴细长, 末端有一丛毛。雄狮的颈部有长鬣, 全身长棕色毛。多产于非洲和亚洲西部。捕食羚羊、斑马等动物, 吼声很大, 有“ 兽王”之称。
在这个定义中, 就是先指出狮子是一种动物( 确定其所属) , 其后再给出狮子的一些性质特征(不同于所属类别其他子类的区别性特征) 。
(3) 多个义位的上下义关系可以组成一个分类体系。图4-1 就是一个简单的分类体系, 上层的义位是下层义位的上义位。
在上述的分类体系中“, 狮子”“、狗”“、牛”等分别都与“动物”构成上下义关系,而这三个义位是处于相同层次的。
同时, 也可以看到, 上下义关系也不是绝对的,“ 动物”这个义位对于“ 狮子”而言是上义位;而对于“生物”这个义位来说,则是下义位“, 生物”是上义位。
(4) 不单是表示名词事物的义位可以具有上下义关系, 对于表示动作或事件的义位也可以构成上下义关系, 如图4-2 所示。
很多歧义都可以通过上下义关系进行消歧。实际上, 在例句(4-1 ) 的消歧过程中, 就隐含地用到了这种关系: 义位“竞选”通常是选某个职位,“ 操作”通常作用在某个人工机构“, 机器”正是一种“人造机构”的下义位,而非一种职位,因此不能用“竞选”与之搭配。
2 .整体-部分关系
这种关系表示在两个义位中, 一个义位( 部分义位)所表达的对象是另一个义位( 整体义位)所表达的对象的组成部分。例如,“ 上肢”是“ 身体”的一部分。整体-部分关系与类属关系有许多类似的特点, 例如, 多个义位之间的部分整体关系也可以组成一个层次体系, 如图4-3 所示。
下层的义位总是其上层义位的组成部分。可以利用这种关系推理, 但是与上下义关系稍有不同, 考察“ 狮子”与“ 动物”和“ 森林”之间的关系的差别, 它们反映了两类关系的主要不同之处。
(1)“狮子”与“动物”是上下义的关系,“狮子”是“ 动物”的下义义位, 对于上下义关系, 可以说“ 狮子是一种动物”, 即两个义位之间的这种关系可以用谓词“IS-A”来描述。
(2)“狮子”与“森林”是部分-整体的关系,“ 狮子”是“ 森林”的一部分, 对于部分-整体关系, 可以说“ 狮子是森林的一部分”, 即两个义位之间的这种关系可以用谓词“IS-PARTOF”来描述。
同样, 整体-部分关系也在很多消歧过程中起作用。例如, 在句子
I saw a boy with my eyes .
中,my eyes 是I 的一个组成部分, 而不可能是a boy 具有的, 因此, 不可能作为a boy 的修饰成分。
3 .同义关系
同义关系是指两个义位表达的意义是相同的, 例如: 计算机和电脑。但是或许没有任何两个词会是真正的完全同义。通常所说的同义是在认知意义下的同义, 即两个词在认知意义下具有相同的指称。
4 .反义关系
两个义位A 和B 是反义关系, 如果“X 是A”能表明“X 不是B”。例如:“X 是高的”能表明“X 不是矮的”, 那么义位“高”和“ 矮”就是互为反义的。两个互为反义的义位可能有两种情况。
一种情况是在两个反义义位之间不存在中间状态, 它们是非此即彼的, 即如果“X 不是A”, 那就能断定“X 就是B”。例如,“男”和“女”就是这样的反义关系。
另外一种情况是在两个互为反义的义位之间还有中间状态, 它们不是非此即彼的。
这时, 如果“X 不是A”并不能表明“X 就是B”。例如“, X不是高的”并不能就断定“X 是矮的”, 有可能既不“高”也不“矮”。
5 .包含关系
有些义位包含了另外一些义位所指的对象。例如“父母”包含了“父亲”和“母亲”“, 兄弟”包含了“ 哥哥”和“ 弟弟”等等。
上面只是列举了几种较为常见的义位之间的关系, 义位关系的种类是十分丰富的。
通过义位关系可以构成另一个在进行语义分析时十分重要的概念———语义场, 因为对于不同义位间关系的研究, 通常需要限定在某个语义场中才能进行并产生有意义的结论。
要想看前十七期讲座,请点击原文阅读。
以上是关于学习自然语言处理技术:第十八讲 义位的主要内容,如果未能解决你的问题,请参考以下文章
HTML篇第十八讲:css选择器后代选择器子元素选择器分组选择器