提要:本文将自然语言中的歧义现象归纳为三种性质,歧义性、多义性和模糊性。在此基础上,依据自然语言的计算模型给出它们各自确切的形式定义,并论述了对这三个性质的不同处理策略。
关键词:歧义性;多义性 ;模糊性;自然语言计算模型
Abstract: In the paper three different properties of natural language, ambiguousness,polysemy and fuzziness, are concluded from the so-called vague phenomenon of natural language. These properties are formally defined based on the computational model of natural language communication. Finally the different strategies for processing these properties are presented and discussed.
Keywords: ambiguousness, polysemy, fuzziness, Computational model of natural language
自然语言歧义现象各种性质的形式定义
1.导言:
人们总说自然语言的表达存在着模棱两可或者含混不清的问题。凡此种种,我们统称为自然语言中的歧义现象。语言学家们很早就注意到了这个问题,并开展了对它的研究。
汉语的歧义现象的研究始于1959年赵元任先生的《汉语的歧义问题》,到上个世纪70年代末,歧义问题的研究蓬勃发展,诸位大家及语言工作者纷纷对歧义现象发表看法和见解,并试图对歧义做出界定。纵观这些研究文献,给歧义下定义的不下20种,其中以吕叔湘、朱德熙、赵元任、沈家煊、祝注先、邵敬敏、等诸位先生的定义较有代表性。
吕叔湘先生(1984:321)认为:“歧义是由于同一片段可以分析成几种结构,或者是由于这个片段之中有一个多义成分。前者又可以分别指两种情形:或者是结构切分不同,或者是结构关系不同。后者也可以分别指两种情形:或者是多义成分引起不同结构,或者是不引起不同结构”;朱德熙先生在《汉语句法中的歧义现象》(1980:81)中认为,“所谓语法歧义指的是句子的多义现象。一个词不止一个意思叫多义词,那么一个句子不止一个意义也可以叫做多义句”;赵元任先生(1988)在《汉语的歧义问题》中提出:“一个符号可以作不止一种理解时,我们就说它有歧义。”;祝注先先生(1984:77)认为:“所谓歧义,是指同一语言材料的意义不明确,可以做出不同理解的现象。”;而邵敬敏先生(1991:38)则认为“歧义结构是同形结构”。
这些观点大致可以概括为同一个语言形式对应了多种结构或多种意义的现象,但彼此之间存在不同程度的差异,反映了研究者在歧义的定性方面的认识存在分歧。有从结构上谈歧义,有的侧重从语义上来分析,对歧义的认识和界定不是那么统一。
歧义现象是自然语言中的一个普遍存在的重要现象。它的产生是由多方面原因引起的,实际上是自然语言的多种性质的体现。正因为如此,各家对歧义的定义才会存在着很大的分歧。歧义现象也是自然语言处理中的一个难题。在计算语言学中,要想很好地处理自然语言的歧义现象,就需要明确歧义现象是有哪些性质所引起的,并给出它们各自的明确的形式定义,这样才能够为进一步处理自然语言中的歧义现象打好基础。
本文的工作就是对引起自然语言歧义现象的各种性质给出明确的形式定义。在文中,我们首先把自然语言中的歧义现象归纳为表层语义的歧义和深层语义的歧义。其中,表层语义的歧义是语言单位的语义结构的多样性,我们称之为歧义性;而深层语义的歧义则表现为多义性和模糊性。然后我们在分别对其进行论述的基础上,依据自然语言的计算模型给出它们各自的形式定义。最后,我们从计算的角度讨论了对它们的不同的处理策略。
2.自然语言歧义现象中的几种性质
从上述各家对歧义现象的论述中不难看出,吕叔湘先生侧重从结构角度谈歧义,认为歧义就是由结构切分或者结构关系不同引起的;朱德熙先生在谈到歧义时的观点有相矛盾的地方。他在《句法结构》中认为歧义句是不同句子之间的关系,是不同句子采取同一语言形式的现象,而不是同一句子具有多种意义的现象,实际上否认了多义语言片段存在,而后在《汉语句法中的歧义现象》中则明确地肯定了多义语言片段的存在,并认为歧义句就是多义句;赵元任先生将可以作不同理解的符号都称之为歧义,对歧义界定的边界不明确。总结各家的观点,不难发现,为歧义现象下定义总是或多或少地涉及或者混淆了自然语言的一些不同的性质。经过分析和归纳,我们认为由各种不同原因引起的自然语言歧义现象可以归纳为三种不同的性质。我们把它们分别称之为歧义性、多义性和模糊性。
(1) 歧义性:首先在自然语言的各种歧义现象中,有一种歧义现象是与背景知识无关的。引起这种歧义的原因在于构成语言单位的各个成分之间在表层语义结构关系上不是唯一的,即人们通常所说的语法上的歧义。例如:
图1:例1的歧义结构 assoc
(b)
assoc head head 宿舍 修理 工人
head 宿舍
assoc pred obj 工人 修理 例1:修理工人的宿舍。它具有两个不同的语义结构,分别如图1中(a)和(b)所示的语义网络。
subj assoc pred obj head 必要 批评
没有 是 害人的 pred obj subj assoc pred obj head 没有 必要
批评 是 害人的 pred obj (a) (b) 图2:例2的歧义结构 例1是由于其内部的组合关系不同而引起歧义的短语。又如吕叔湘先生的《歧义类例》中的一个歧义的句子。例2:没有必要的批评是害人的。
它也具有两个不同的语义结构,如图2中(a)和(b)所示的语义网络。
例2是因其中的短语“没有必要的批评”的内部组合关系不同而引起的歧义性。
少数人 subj assoc pred ? head 反对 ★
是 pred obj 图3:例3的歧义结构 有些歧义结构是因其中某些省略成分的语义关系不明确而造成的。例如祝注先先生的《歧义纵横谈》中的一个例子:例3:反对的是少数人。
其语义结构如图3所示。其中标记?号的弧是暂时无法确定的。因为例3中含有一个“的”字结构,其中零代词所表示的对象,即图3中★所标示的结点既可充当“反对”的施动,又可充当它的受事,其语义关系不明确,故而造成歧义。
以上的歧义现象都是发生在表层语义层面上的,是与背景知识无关。我们将自然语言中引起这种歧义现象的性质归纳为歧义性。
(2) 多义性:在自然语言的各种歧义现象中,有一种歧义现象是与背景知识有关的。在这种歧义现象中,语言单位的语义结构是唯一的,可是它在言语交际中仍然会因为交际方的理解不同而具有不同的意义。引起这种歧义现象的原因不在语言单位的表层语义,而在语言的深层语义,是与背景知识有关的。这是因为自然语言理解的过程是人们运用自身的知识对语言单位进行处理的结果,背景知识不同就自然会造成不同的理解。