基于决策树方法的核电装备制造业供应风险预测模型研究

来源：互联网 sk001 | 孟大鹏，石春生

【分　类】文化研究
【关键词】决策树；核电装备制造业；供应风险；预测模型
【来　源】互联网
【收　录】中文学术期刊网

正文：

　　H18：合作物资的市场需求厂家数量与供应风险相关

　　H19：合作物资的市场供应厂家数量与供应风险相关

　　H20：合作物资的市场供需状况与供应风险相关

　　H21：供应商是否具备核级资质与供应风险相关

　　(2)实证研究本文利用研究变量之间密切程度的相关分析实证前文假设的科学性。考虑到数据的特点，采用基于秩次大小、对变量分布不作要求的Spearman方法计算相关系数：

(1)

　　其中：d为每对变量(x,y)的秩次之差，n为对子数;

　　借助SPSS12.0，经由Analysis->Correlate->Bivariate>Spearman操作，相关分析的结果如表1所示：是否核级，人才、技术支持，自然、经济、科技环境指标未通过显著性检验，表示这6个指标与供应风险的相关性不明显，假设未得到验证;除此之外的15个假设得到了验证，对应的15个指标构建了供应风险的影响因素并用于风险预测的研究。

　　表1相关分析结果 RD投入

　　强度关系管理能力是否

　　核级质量

　　控制人才

　　支持服务

　　及时率付款

　　准时度供应厂家数量需求厂

　　家数量 -.688* -.630** .192 -.684** .031 -.712* -.435** -.710** -.399** .000 .000 .070 .000 .406 .000 .000 .000 .001 经济

　　环境技术

　　支持科技

　　环境政治

　　因素进度

　　控制自然

　　环境 RD人员比例市场供需状况质量管理

　　体系状况 .126 .030 .113 .240* -.235* .055 -.608** -.218* -.373** .168 .411 .195 .033 .036- .339 .000 .047 .002 周期供应额与全

　　部供应额的比例周期采购额占全

　　部采购额的比例新产品产值占

　　企业产值比例不带*号的指标，表示其未通过显著性检验，与风险度的相关性不显著。 -.287* .457** -.280* .013 .000 .015 3.2 实现技术及数据处理

　　(1)实现技术：本文采用STATISTICA 软件来实现供应风险DT的预测建模，该软件整合了数据分析、图表绘制、数据库管理等功能，操作平台为Windows2000。

　　(2)数据处理：为了防止数据库中特征值极大的指标对特征值极小的指标生成控制效应，避免计算过程中数据过大的情况，对样本数据进行归一化处理，公式为：

(2)

其中：,,N为样本数，P为特征数。

　　3.3试验步骤

　　步骤1：模型的训练

　　(1)算法的选择：DT有两种算法，Classification Analysis适用于离散变量的分类，Regression Analysis适用于连续变量的回归，根据本文的研究目标及数据的特点，选择Regression Analysis，如图2所示。

　　图2 算法的选择

　　(2)变量的选择：将供应风险度指标选定为因变量，其余15个指标选定为自变量，分别计算各个指标与供应风险度的相关系数，如图3所示。

　　图3 变量的选择

　　在图4中选择“Test sample”，选择测试样本控制变量，其余选择系统默认值。

　　图4测试样本选择

　　步骤2：模型的预测

　　经上述录入、选择及操作过程后，得出了DT的预测模型。将用于风险预测的数据库录入模型，整理STATISTICA7.1的输出，可得到Predicted Values报表，该报表将给出DT回归得到的预测值与目标变量之间的统计分析信息。

　　步骤3：模型的评价

机器学习及统计理论用于模型评价的系数主要有，，和。令分别表示第家供应商供应风险的实际值与回归模型求得的预测值。

(1)均方误差(Mean square error)：实际值与预测值之差平方的期望，其值越小，表示模型预测的误差越小：

　 (3)

(2)平均差(Mean difference between measurement and simulation)：实际值与预测值之差的平均数，反映模型的一致性。>0，表示预测值相对于实际值偏低;<0，则预测值相对于实际值偏高;=0，模型的模拟效果最好：

(4)

MD 的t检验值(t检验所用自由度为)，若=2.10成立，则模型系统误差不显著，模拟效果较好;反之，模型系统误差较显著，模拟效果较差。

其中：

(3)确定系数(Coefficient of determination)：实际值与预测值变异度的比值，反映二者变异的一致性。=1，表示二者变异相同;0<<1，模型存在一定的系统误差;>1，则模型不能完全描述个别极值：

(5)

(4)整群剩余系数(Coefficient of residual mass)：全部预测值之和偏离全部实际值之和的程度。<0，表示整体预测值大于实际值;>0，则整体预测值小于实际值;其值越接近于0，系统误差的可能性越小，模型的一致性越好：

2/3 首页上一页 1 2 3 下一页尾页

相关推荐

同住成年家属签收民事诉讼文书的立法缺陷与修改建议

虚拟的“村落”：乡村青年的城市体验与城市适应 ——以一个乡村青年QQ群为例

水泥混凝土路面早期开裂原因分析及预防措施研究

热门期刊

《南阳师范学院学报》
《南阳师范学院学报》杂志，双月刊，于2002年经国家新闻出版总署批准正式创刊，由河南省教育厅主管，南阳师范学院主办的学术性刊物，本刊在国内外有广泛的覆盖面，题材新颖，...

《广东输电与变电技术》
《广东输电与变电技术》（双月刊）创刊于1999年，是广东省电机工程学会主办的一份非盈利性科技类杂志，读者对象为全体输变电行业人员，内容主要为：新技术、新理论的研究动...

《砖瓦世界》
《砖瓦世界》杂志，于1984年经国家新闻出版总署批准正式创刊，CN:11-5376/TU，本刊在国内外有广泛的覆盖面，题材新颖，信息量大、时效性强的特点，其中主要栏目有：企业管理、...

《世界教育信息》
《世界教育信息》杂志，于1987年经国家新闻出版总署批准正式创刊，CN:11-4123/G4，本刊在国内外有广泛的覆盖面，题材新颖，信息量大、时效性强的特点，其中主要栏目有：院校风...

《中国卫生》
《中国卫生》杂志，月刊，于1985年经国家新闻出版总署批准正式创刊，由国家卫生健康委员会主管，《中国卫生》杂志社有限公司主办的学术性刊物，本刊在国内外有广泛的覆盖...

《上海大学学报(自然科学版)》
《上海大学学报》杂志，于1995年经国家新闻出版总署批准正式创刊，CN:31-1718/N，本刊在国内外有广泛的覆盖面，题材新颖，信息量大、时效性强的特点，其中主要栏目有：建筑科...