很多的模糊概念都可以作用在不同概念类上,因此定义模糊概念的隶属度函数往往是重载的函数。比如,“高”这个模糊概念就可以作用于许多不同的概念类,对建筑物而言,30米高度的隶属于“高”的隶属度就几乎为1了;但是对山而言,30米高度的隶属于“高”的隶属度就几乎为零。因而它的隶属度函数在不同的定义域上的定义是不同的。这种隶属函数的重载性可以用面向对象语言中的多态性来处理。
值得指出的是,模糊概念的隶属函数因涉及到个人的知识背景也会因人而异的。比如“高山”这个概念。什么样的山才叫做“高山”,每个人内心的主观判断不同,对它的定义,即隶属度函数,也就会不同。一座海拔200米的山丘,也许会被一个出生在平原从来未见过山的人认为是“高”的了,但是决不会被一个来自青藏高原的人认为是“高”的。所以模糊性是多义的,它的处理也是属于深层语义的计算。
5.总结
纵观程序设计语言几十年的发展历程,就会发现一个很有趣的轨迹。早期的程序设计语言严格要求符号表达的唯一性,但是随着发展却逐渐地放开这种限制,允许同一个符号表示不同的函数。这就是现在流行的面向对象程序设计语言中的一个重要的特性——多态性。换言之,程序设计语言的发展伴随着歧义现象的出现和丰富。多态性提高了程序设计语言的表达手段,提高了语言的抽象能力,得到了人们的赞许和喜爱。或许,自然语言的歧义现象正是其历经数千年发展所致,是人脑智能抽象能力提高的结果。自然语言的表达能力和抽象能力远远超过了任何程序设计语言。所以丰富的歧义现象正是自然语言的优越之处。因此,我们在研究用计算的手段处理自然语言时,一定要很好地保留和展现它的优越之处。这是我们在研究中务必要注意的。这也正是我们把自然语言歧义现象分成三种不同性质的初衷。
我们将引起自然语言歧义现象的原因归纳为三个不同性质:歧义性、多义性和模糊性;然后依据自然语言的计算模型给出它们形式化的定义;并对它们的处理策略做了大体方法上的简要讨论。一是限于篇幅,二是限于工作,本文中没有对各种性质的处理策略进行更深入的介绍,比如,在计算语言学角度上如何去识别和消除歧义性、如何去模拟人脑对多义性的处理、等等。其中有些工作我们将撰写另文介绍,其中有些问题还需要我们进一步做深入的探讨和研究。我们认为,对自然语言歧义现象进行了各种性质的明确划分和形式定义之后,我们对自然语言的歧义现象不再是胡子眉毛一把抓了,而是能够根据各自不同的性质来深入研究它们的规律以及处理方法,这样才能够很好地认识和处理自然语言的歧义现象。
参考文献:
[1] 赵元任,汉语中的歧义问题 . 《语言学论丛(十五)》北京:商务印书馆,1988。
[2] 朱德熙,汉语句法里的歧义现象. 中国语文第2期,P81页,1980。
[3] 吕叔湘 ,歧义类例。中国语文第5期 ,1984。
[4] 祝注先 ,歧义纵横谈。中南民族学院学报第4期,P77页,1984。
[5] 邵敬敏 ,歧义分化方法探讨。语言教学与研究第1期,P38页,1991。
[6] 吴竞存、侯学超, 层次相同的同形结构例释。北京大学学报(哲学社会科学版)第6期,1981。
[8] 周经野 ,基于自然语言计算模型的汉语理解系统 软件学报第6期 P42页,1993。