H18:合作物资的市场需求厂家数量与供应风险相关
H19:合作物资的市场供应厂家数量与供应风险相关
H20:合作物资的市场供需状况与供应风险相关
H21:供应商是否具备核级资质与供应风险相关
(2)实证研究 本文利用研究变量之间密切程度的相关分析实证前文假设的科学性。考虑到数据的特点,采用基于秩次大小、对变量分布不作要求的Spearman方法计算相关系数:
(1)
其中:d为每对变量(x,y)的秩次之差,n为对子数;
借助SPSS12.0,经由Analysis->Correlate->Bivariate>Spearman操作,相关分析的结果如表1所示:是否核级,人才、技术支持,自然、经济、科技环境指标未通过显著性检验,表示这6个指标与供应风险的相关性不明显,假设未得到验证;除此之外的15个假设得到了验证,对应的15个指标构建了供应风险的影响因素并用于风险预测的研究。
表1相关分析结果 RD投入
强度 关系管理能力 是否
核级 质量
控制 人才
支持 服务
及时率 付款
准时度 供应厂家数量 需求厂
家数量 -.688* -.630** .192 -.684** .031 -.712* -.435** -.710** -.399** .000 .000 .070 .000 .406 .000 .000 .000 .001 经济
环境 技术
支持 科技
环境 政治
因素 进度
控制 自然
环境 RD人员比例 市场供需状况 质量管理
体系状况 .126 .030 .113 .240* -.235* .055 -.608** -.218* -.373** .168 .411 .195 .033 .036- .339 .000 .047 .002 周期供应额与全
部供应额的比例 周期采购额占全
部采购额的比例 新产品产值占
企业产值比例 不带*号的指标,表示其未通过显著性检验,与风险度的相关性不显著。 -.287* .457** -.280* .013 .000 .015 3.2 实现技术及数据处理
(1)实现技术:本文采用STATISTICA 软件来实现供应风险DT的预测建模,该软件整合了数据分析、图表绘制、数据库管理等功能,操作平台为Windows2000。
(2)数据处理:为了防止数据库中特征值极大的指标对特征值极小的指标生成控制效应,避免计算过程中数据过大的情况,对样本数据进行归一化处理,公式为:
(2)
其中:,,N为样本数,P为特征数。
3.3试验步骤
步骤1:模型的训练
(1)算法的选择:DT有两种算法,Classification Analysis适用于离散变量的分类,Regression Analysis适用于连续变量的回归,根据本文的研究目标及数据的特点,选择Regression Analysis,如图2所示。
图2 算法的选择
(2)变量的选择:将供应风险度指标选定为因变量,其余15个指标选定为自变量,分别计算各个指标与供应风险度的相关系数,如图3所示。
图3 变量的选择
在图4中选择“Test sample”,选择测试样本控制变量,其余选择系统默认值。
图4测试样本选择
步骤2:模型的预测
经上述录入、选择及操作过程后,得出了DT的预测模型。将用于风险预测的数据库录入模型,整理STATISTICA7.1的输出,可得到Predicted Values报表,该报表将给出DT回归得到的预测值与目标变量之间的统计分析信息。
步骤3:模型的评价
机器学习及统计理论用于模型评价的系数主要有,,和。令分别表示第家供应商供应风险的实际值与回归模型求得的预测值。
(1)均方误差(Mean square error):实际值与预测值之差平方的期望,其值越小,表示模型预测的误差越小:
(3)
(2)平均差(Mean difference between measurement and simulation):实际值与预测值之差的平均数,反映模型的一致性。>0,表示预测值相对于实际值偏低;<0,则预测值相对于实际值偏高;=0,模型的模拟效果最好:
(4)
MD 的t检验值(t检验所用自由度为),若=2.10成立,则模型系统误差不显著,模拟效果较好;反之,模型系统误差较显著,模拟效果较差。
其中:
(3)确定系数(Coefficient of determination):实际值与预测值变异度的比值,反映二者变异的一致性。=1,表示二者变异相同;0<<1,模型存在一定的系统误差;>1,则模型不能完全描述个别极值:
(5)
(4)整群剩余系数(Coefficient of residual mass):全部预测值之和偏离全部实际值之和的程度。<0,表示整体预测值大于实际值;>0,则整体预测值小于实际值;其值越接近于0,系统误差的可能性越小,模型的一致性越好: