有监督局域线性嵌入(SLLE)是建立在无监督的LLE算法的基础上,并逐步演变而来的。由于当LLE算法第一步是建立在与k最近邻来确定点xi的最近邻的数据是本身不存在类别属性。但当算法用于分类问题的降维时,LLE算法有点相形见绌了。为解决这种问题,对原来的LLE算法中的距离公式作了形式上的修正:
显然上式当а=0时,算法就退回到无监督的LLE了,当а=1时,得到的是完全的有监督的SLLE算法,当а∈(0,1)时,我们称之为半监督的LLE算法(а-SLLE)。1-SLLE是一个完全无参的有监督算法。
语音情感的识别过程可分为训练和识别两个阶段进行,首先对每个语音进行预筛选;然后提取情感特征参数,并生成情感特征向量。接着应用训练样本特征向量,进行训练,即通过设定好的有监督的SLLE模型,对要进行识别的语音情感特征参数降维,得到模型库文件。最后,利用训练好的模型库文件,输入识别样本特征向量,进行识别得到识别结果。本文的识别样本是基于支持向量机(SVM)分类器,而SVM是利用操作简单而有效的软件LIBSVM[8]来实现的。
表3 SLLE降维后识别率的比较 识别率
维度数 LLE 0-SLLE 0.5-SLLE 1-SLLE 2 33.5 33.5 43.0 60.0 4 34.5 34.5 60.5 73.5 6 34.0 34.0 59.5 72.5 8 35.5 35.5 62.5 77.0 10 34 34.5 65.0 77.5 12 37.0 37.0 65.0 77.0 14 39.5 39.5 64.5 77.5 结合表3所示,在当а=0时,有监督局域线性嵌入(SLLE)降维算法就退回到无监督的LLE了,从上表3还中可以看出有监督局域线性嵌入(SLLE)对语音情感信号降维处理后,再经过基于支持向量机(SVM)识别的情感识别率明显是随着а的增大而提高的。当а=1时,识别率是最高地,最高识别率可达到77.5%。显然完全无参的有监督算法效果最好。 3 结论有监督局域线性嵌入(SLLE)对语音信号进行降维处理,其准确识别率明显要高于无监督的非线性降维算法的识别率,但若要在实际应用时还有待提高。
参考文献
[1] Feng Yun, Eric Change, Ying-Qing Xu,et al.(2001).Emotion Detection from Speech to Enrich Multimedia Content. In Proceedings of The Second IEEE Pacific Rim Conference on Multimedia,550-557.
[2] Ang J, Dhillon R, Krupski A, et al.(2002).Prosody-based automatic detection of annoyance and frustration in human-computer dialog. In Proceedings of the ICSLP,Denver,2037-2039.
[3] 王治平,赵力,邹采荣.(2003).利用模糊熵进行参数有效性分析的语音情感识别.《电路与系统学报》,3(08):109-112.
[4] 赵力,王治平,卢韦等.(2004). 全局和时序结构特征并用的语音信号情感特征识别方法.《自动化学报》,3(30):423-429.
[5] R.Tato, R Santos, R Kompe, et al.(2002).Emotional space improves emotion recognition. In Proceedings of the ICSLP,Denver,2029-2032.
[6] C Gobl and A Ni Chasaide.(2003).The role of voice quality in communicating emotion,mood and attitude.《Speech Communication》,40:189-212.
[7] SchullerB,Rigoll G,Lang M.(2003). Hidden Markov model-basedspeech emotion recognition.In Proceedingsof IEEE ICASSP Conference,2:1-4
[8] Conmen,Leiserson,Rivest,Stein,Introduction toAlgorithms(2nd edition). United states: MIT press, 2001.