设两个系统A和B,若系统A有K个组成要素:a,a,…,a,系统B有L个组成要素:b,b,…,b,则系统A和B可以分别表示为它们对应的组成要素的集合:
![]()
A=a,a,…,a
![]()
B=b,b,…,b
如果A、B这两个系统中存在相似要素,那么系统A与B即为相似系统,设两系统间相似要素的个数为N。我们把系统A、B间相似要素的数量与系统A、B间共有且不重复要素数量的比值,称为系统要素数量的相似度,记为Qn,用公式表示为:

Qn=(N≤K,N≤L)[7]
相似性科学中关于系统要素数量的相似度计算方法适用于一切相似系统。由于语言中的同义词彼此之间具有相似性,因此如果我们将同义聚合体中的一个成员视为一个系统,并且分析出它的组成要素,那么我们就可以利用相似性科学中系统相似度的度量方法来确定同义词之间的相似系数。现代语义学界提出的义素分析法为我们分析词义的内部构成提供了一种可资借鉴的方法。
语义系统是由不同的语义单位组成的,其中最基本的语义单位叫做义位,它是能够独立运用的最小的语义单位。“一个单义词只有一个义位,多义词有多个义位。”[8]对义位进行分解可以得到最小的语义单位——义素,义素是义位的组成成分,如果义位是由两个或两个以上相同的表彼此共性的义素和相应的表彼此差异的义素组成的,那么这些义位的聚合叫做语义场,[9]对义位的义素分析必须在一定的语义场内进行。同一语义场内的各个义位之间是“相互联系、相互制约的,它们既有普遍性特征,又有区别性特征。”[10]义素分析法就是对这些义位进行对比,找出它们所包含的相同义素与不同义素的方法。[11]义素分析法的提出具有重要意义,它不仅可以通过不同义位间的比较分析确定出一个义位区别于另一个义位的标志、特征,从而实现对义位进行微观分析与描述的目的,而且它对义位内部构成的分析,为我们研究同义词的相似性提供了有效途径。
从语义学的观点来看,同义词之间的相似实际上是不同词语中构成同义关系的义位之间的相似。我们可以将一个义位视作一个系统,该系统的组成要素即为义素。当我们利用相似性科学中关于系统要素数量的相似度计算方法计算出两个义位中义素数量的相似程度时,也就计算出了两个同义词语之间的相似系数。
三 汉语同义词的模糊聚类分析举例
应用模糊聚类分析法来研究同义词的基本思想是:首先将所研究的全部词语各自分为一类,然后通过比较它们之间的相似程度,将其中最相似的两个词语率先归为新的一类,如此反复进行,直到所有的词语都归为一类为止。套用模糊关系的数学定义,词语的同义关系可以表述如下:设彼此间具有同义关系的词语所构成的同义聚合体为论域U,其中任意两个词语之间具有的同义关系就是U自身的笛卡尔积U×U的一个模糊子集。用来描述词语同义关系的矩阵为具有自反性和对称性的模糊相似矩阵,矩阵中的元素即为彼此间具有同义关系的词语之间的相似系数。因为模糊相似矩阵不一定具有传递性,所以需要利用平方自合成法求出模糊相似矩阵的传递闭包,将其构造成模糊等价矩阵,然后以此等价矩阵为基础就可以进行模糊聚类分析。基于模糊等价矩阵的模糊传递闭包法有其完整的操作过程,下面我们就通过一个实例来具体介绍模糊聚类分析法在汉语同义词研究中的应用。
![]()
令论域U=巨大,硕大,庞大,宏大,即同义聚合体中的成员为同义形容词“巨大”、“硕大”、“庞大”、“宏大”,这里聚合形成同义语义场的是这四个词语中构成同义关系的义位。利用词典的释义分别对它们进行义素分析,得到的结果可以用图表的形式表示如下(其中“+”表示某义位包含有该义素,“-”表示某义位不含有该义素): 义素
![]()
词语 规模 数量 形体 大 大而无当 宏伟 巨大 + + + + - - 硕大 + - + + - - 庞大 + + + + + - 宏大 + - - + - + 表中任意两个词语之间所具有的同义关系就是U上的一个模糊关系,它是U自身的笛卡尔积U×U的一个模糊子集,笛卡尔积U×U=<巨大,巨大>,<巨大,硕大>,<巨大,庞大>,<巨大,宏大>,<硕大,巨大>,<硕大,硕大>,<硕大,庞大>,<硕大,宏大>,<庞大,巨大>,<庞大,硕大>,<庞大,庞大>,<庞大,宏大>,<宏大,巨大>,<宏大,硕大>,<宏大,庞大>,<宏大,宏大>。用来描述所有词语两两之间同义关系的工具为模糊相似矩阵,同义词之间的相似系数r就是矩阵中的元素。根据同义关系的自反性,有r(巨大,巨大)= r(硕大,硕大)= r(庞大,庞大)= r(宏大,宏大)=1;根据同义关系的对称性,有r(巨大,硕大)= r(硕大,巨大),r(巨大,庞大)= r(庞大,巨大),r(巨大,宏大)= r(宏大,巨大),r(硕大,庞大)= r(庞大,硕大),r(硕大,宏大)= r(宏大,硕大),r(庞大,宏大)= r(宏大,庞大)。在该相似矩阵中,待定元素为后六组具有对称性的同义词之间的相似系数,在确定它们的具体数值之前,我们先把上表中的各词语分别表示为它们对应义素的集合:
![]()
巨大:规模,数量,形体,大
![]()
硕大:规模,形体,大
![]()
庞大:规模,数量,形体,大,大而无当
![]()
宏大:规模,大,宏伟

这样,我们就可以清楚地看出每个词语的义位所具有的义素个数及其与其它词语的义位相同的义素个数。例如,“巨大”的义素个数为4,“硕大”的义素个数为3,二者相同的义素个数为3,所以词语“巨大”与“硕大”的相似系数为。利用相似性科学中提出的计算公式,上述四个同义词两两之间的相似系数分别为:
《湘潮下半月》
编辑QQ
编辑联络
