正文:摘要:随着信息技术的发展,供应链已经越来越成为商业发展的趋势,供应商作为供应链的源头,其质量很大程度上决定了整条供应链的竞争能力。本文在总结比较常见的供应商评价方法的基础上,提出了将数据挖掘中的ID3算法应用到供应商的评价中,以使对供应商的评价更客观,更准确。
关键词:供应链管理,供应商评价,数据挖掘,ID3算法
Study of Supplier Evaluation Approach Based on ID3 Algorithm
Abstract: Along with the rapid development of Information Technology, supply chain becomes the new trend of business operation. As the beginning of the supply chain, supplier’s quality can determine the competition of the whole supply chain. This paper, based on summarizing the current supplier evaluation methods, brings forward an approach based on ID3 algorithm to evaluate supplier, in order to make the evaluation more objective and correct.
Key Words: SCM, Supplier Evaluation, Data Mining, ID3 Algorithm
供应商的评价问题是供应链的核心问题之一。作为供应链的源头,供应商产品的质量很大程度上决定了供应链最终产品的质量以及整条供应链的竞争能力,因此,对供应商的评价一直是供应链上的企业非常重视的问题。
1 供应商评价方法
对供应商评价的方法主要有三种:定性方法、定量方法和定性与定量相结合的方法。定性方法主要依据的是以往的经验或是某个决策人的主观判断,这一类方法主要有直观判断法、招标法和协商选择法等
[4];后来人们开始采用定量的方法选择供应商,通过指定一些量化的指标并通过对不同供应商在这些指标上取值的大小来评价供应商,这类方法包括成本比较法,线性权重法以及层次分析法等;再后来人们在选择供应商时考虑的因素越来越多,仅仅从成本角度考虑是不够的,于是便提出了定性与定量相结合的方法,如人工神经网络法。
2 ID3算法
ID3算法是决策树方法的典型代表,它利用信息论中的信息增益(Information Gain)寻找数据库中具有最大信息量的属性字段,建立决策树的一个节点,并根据该属性字段的不同取值建立树的分枝
[5]。ID3算法比较简单,计算速度较快,同时得到的决策树是较为优化的形式。
ID3算法的关键在于如何选取一个决策属性形成决策树的决策节点,并从当前节点形成决策分枝。ID3算法中,决策节点属性的选择主要是运用了信息论中熵的概念来完成的。在这种属性选择方法中,选择具有最大信息增益的属性做为当前节点。通过这种方式选择的节点属性可以保证决策树具有最小的分枝数量,使最终得到的决策树冗余最小。
ID3算法中决策属性信息增益的计算方法如下:
设S是训练样本数据集,S中类别标识属性有m个独立取值,也就是说定义了m个类c
i,i=1,2,∙∙∙,m,R
i为数据集S中属于c
i类的子集,用r
i标识子集R
i中元组的数量。
集合S在分类中的期望信息量可以由以下公式给出:
I(r
1,r
2,∙∙∙,r
m)=−

(公式1)
式中p
i表示任意样本属于c
i的概率,p
i=

,其中

为训练样本数据集中的元组数量。
假设属性A有v个不同的取值分别为{a
1,a
2,∙∙∙,a
v},则通过属性A的v个取值可以将数据集S划分为v个子集,其中S
j表示在数据集S中属性A的取值为a
j的子集,j=1,2,∙∙∙,v。如果A被选做为决策属性,则这些子集将对应该节点的不同分枝。
如果用s
ij表示S
j子集中属于c
i类的元组的数量,则属性A对于分类c
i(i=1,2,∙∙∙,m)的熵(也称为属性A对于分类c
i的期望信息量)可由下式计算:
E(A)=

(公式2)
令w
j=

,则w
j为S
j子集的权重,表示S
j子集在数据集S中的比重,而属性A的每个取值对分类c
j的期望信息量可由下式计算:
I(s
1j,s
2j,∙∙∙,s
mj)= −

(公式3)
上式中,p
ij=

,它表示在S
j子集中属于c
i类的比重。
通过上述计算准备,可得到对属性A作为决策分类属性的度量值(称为信息增益),由下式给出:
Gain(A)= I(r
1,r
2,∙∙∙,r
m)−E(A) (公式4)
ID3算法需要计算每个决策属性的信息增益,具有最大信息增益的属性将作为给定数据集S的决策属性节点,并同过该属性的每一个取值建立有该节点引出的分枝。
基于ID3算法对供应商进行评价,就是根据判断供应商数据中的不同决策属性对于供应商分类的信息增益的大小,决定各个决策属性作为决策树节点的先后顺序,从而逐渐构造出整个决策树的过程。通过对建立好的决策树进行解释说明就可以得到最初隐藏在海量的供应商数据中的规则和知识,这些规则和知识就可以作为对以后的供应商评价的依据。
利用ID3算法建立供应商分类决策树的过程如图1所示:
1/2 1 2 下一页 尾页