您的当前位置:首页基于微分进化算法的支持向量机预测模型及其在制造业发展预测中的应用

基于微分进化算法的支持向量机预测模型及其在制造业发展预测中的应用

2023-03-06 来源:飒榕旅游知识分享网
维普资讯 http://www.cqvip.com 第25卷第1期 科技进 步与对策 VOl-25 No.1 2008年1月 Science&Technology Progress and Policy Jan.2008 基于微分进化算法的支持向量机预测模型 及其在制造业发展预测中的应用 郭雪松,孙林岩,刘 哲 (西安交通大学管理学院,陕西西安710049) 摘 要:根据支持向量机的自适应问题,通过对比传统进化算法的不足,提出基于微分进化算法的支持向 量机模型,并以日本制造业时间序列数据为例,进行了较为准确的多步预测。 关键词:支持向量机;微分进化算法;制造业 中图分类号:F40 文献标识码:A 文章编号:1001—7348(2008)01—0063—04 分类发展而来,它通过固定经验风险,再最小化置信风险. 1概述 将输入空间映射到一个高维内积空间内.有限避免了“维 假定一时间序列 },那么时间序列预测就是构造映 数灾难”问题。它通过解一个线性约束的二次规划问题得 射关系,:尺 — ,Xt ( … ,…, - ̄r--m+ ),其中P≥l, 到全局最优解,因而不存在局部极小值问题,其快速算法 m≥1,T>0。为叙述方便,将上述映射关系表示成系统输入 保障了收敛速度。 与系统输出Y 之间的关系,即Yi_厂( ),Y ∈R,托∈R 。 给定样本数据集{(Xi Yi)),i=1,2,…,n,其中 ∈R 是 Takens F 定理保证在一定条件下,对于任意时间延迟 与 输入向量,Y ∈R为输出向量,n为样本容量。利用一个非 线性映射‘p,将数据 映射到一个高维特征空间,然后进 某些m≤2D+l(系统轨迹落在分形为D的流型上),存在 光滑映射厂:尺 尺.而基于机器学习的时间序列预测就是 行函数逼近,找到映射,:尺 尺,使得,( )=y,也就是寻求 回归函数: 通过n个独立同分布的观测样本( …Y), 1,…,n,在函数 集S=i ,W),W∈n}中寻求一个最优函数f(x,W。),使得预 )= ‘ ( )+6 (1) 期风险或者实际风险最小化。人工神经网络为逼近这一非 那么函数逼近问题就等价于极小化下面的泛函数 线性映射关系提供了很好的选择,因为从理论上讲,如果 尺 I=R ] ∑c ) (2) 给定足够多的神经元,就可以对任意连续函数进行任意精 度的逼近Z2,3】,但神经网络也存在严重的局限性,比如隐层 其中尺 ]为经验风险,由s不敏感损失函数来度 节点数的确定、局部最优,尤其是网络训练以训练误差最 量,有良好的数据稀疏性,能保证结果有较好的泛化能力。 小化为原则,限制了其泛化能力。 为寻求W和b,引入松弛变量 和 .,就转化为如下 统计学习理论 以结构风险最小化为原则.在经验风 优化问题: 险与置信范围两者间进行权衡,最终降低真实风险,等价 mi } II +c∑( . ) (3) 于推广误差最小。因此,支持向量机较传统方法具有小样 本学习特性、全局最优和泛化能力强等特点。 {【 : 一  ( )一 ≤b  《 c4’ 2基于支持向量机的预测 根据wolf对偶定理,同时引入核函数,回归函数可以 写成: 2.1支持向量机预测的机理 支持向量机最初用于解决模式识别问题.随着Vapnik f(x,ai,。 )=∑( 一。 ) ( , )+6 (5) 的£不敏感损失函数的引入.它已经扩展到解决非线性函 转化为一个凸规划问题,其任一解均是全局最优解, 数回归问题 。支持向量机是从解决线性可分问题的最优 不存在局部极值问题,而利用支持向量机进行回归主要就 收稿日期:2006一l1—15 基金项目:国¥863计划项目(2003AA413033);国家自然科学基金重点项目(70433003) 作者简介:郭雪松(1978一),男,河北保定人,西安交通大学管理学院博士研究生,研究方向为先进制造管理。 维普资讯 http://www.cqvip.com

・64・ 科技进步与对策 2008拄 是求解上述优化问题的过程.详细分析计算过程见文献 [4]。 2.2支持向量机的自适应问题 预测模型的功能是根据对象的历史信息和未来输人 预测其未来输出,通过前文的论述已经知道支持向量机为 解决该问题提供了很好的思路。但是,支持向量机中不同 参数的选取会对其应用效果产生显著的影响,选取合理的 参数成为其应用过程中面临的一个重要问题。反观人T神 经网络.其本身就通过模拟人脑的思维过程而具有自适应 学习能力,而在大部分支持向量机的应用过程中,都是根 据经验设定参数.直接输出结果.使得支持向量机的效能 不能够得到充分发挥。 针对上述问题,近年的支持向量机研究中.陆续引人了 相关的优化算法对参数选取问题进行在线优化,其中以遗 传算法为代表的进化算法在其中占据了重要位置 j。由于 这些优化算法的引人,使得支持向量机获得了和人]二神经 网络一样的自适应学习能力,具体如图l所示。 图1支持向置机自适应过程示意 但是传统进化算法也面临着一些挑战,主要是计算速 度慢,以及南于优化函数的复杂特性,容易收敛于局部最 优等问题,使其在解决支持向量机自适应问题中具有一定 的局限性。因此,本文研究引人进化算法中较新的微分进 化算法解决支持向量机的自适应问题 3微分进化算法 微分进化算法(DE)是一种较新的进化优化算法r9],同 所有的进化优化算法一样,微分进化算法也是对候选解的 种群进行操作,但不只是对单一解进行操作。DE利用实数 值参数向量作为每一代的种群,它的自参考种群繁殖方案 与其它进化优化算法不同,其新参数向量是通过把种群中 两个成员之间的加权差向量加到第三个成员上来产生的, 这称为“变异”(与遗传算法“变异”的比较见网2),然后将 变异向量的参数与另外预先决定的目标向量参数按照一 定规则混合来产生试验向量,通常称为“交叉”,如果试验 向量的代价函数比目标向量的代价函数低,试验向量就在 下一代中代替目标向量,这一操作称为“选择”。这样利用 随机偏差扰动产生新个体的方式可以获得一个具有非常 好的收敛性质的自适应程序. .与其它进化算法变异操作主要依靠随机分布函数不 同,微分进化算法依靠随机选取的一对目标向量的差分进 行变异。而目标向量的分布很大程度上依赖于目标函数的 特性,那么这种变异方式就使得微分进化算法搜索方式更 加适合于目标函数而具有更强的鲁棒性和全局搜索能力 3.1基本DE算法 概括来讲,DE算法主要包含以下几个重要内容: (1)初始化。DE利用ⅣP个维数为D的实数值参数向 量作为每一代的种群,每个个体表示为Individual , l,2,…,NP,其中Individual表示个体在种群中的序列,G 表示种群所属的代数,在优化过程中,NP保持不变。为了 建立优化搜索的初始点,种群必须被初始化,其初始化的 范围应该涵盖整个解的空间。 (2)变异。对于每个目标向量X ,变异向量的产生可 以采取如下形式:1)i,G+l= G+F( 一X“),其中随机选择的 序号r1、r2、r3互不相同,且rl、r2、r3与目标向量的序号 也应不同,所以NP必须大于或等于4以满足上述条件。 系数F∈[0,2]是一个实数因子,控制着偏差变量的放大 作用,具体见图2(b)。 V . ∥ (a)遗 算法变异 意 (b)微分进化算法变异,J 意 图2 遗传算法与微分进化算法变异方式比较 (3)交叉。为了增加干扰参数向量的多样性,DE中引 人交叉操作,则试验向量变为: 一I vj:++1 i f( U)≤ CR ) or j=r nb r(i‘ () 6),  其中,ran@U)是产生[0,1]之间随机数的第 个值,rnbr ( )∈l,2,…,D是一个随机选择的序列,用来确保u . 至少 从 获得一个参数,GR是交叉因子,取值范围为『0,1]。 (4)选择。为了决定试验向量1Z 是否会成为下一代 中的成员,将试验向量与目前种群中的目标向量Xi进行G .比较,如果试验向量的目标函数值比当前向量小.则替换 当前向量。 微分进化算法的步骤如下:①确定DE的控制参数和 选择的具体策略;②随机产生初始种群,进化代数 =l;③ 对初始种群进行评价,即计算目标函数值;④判断是否达 到中止条件,若是,则此时的最佳个体作为解输出.否则. 继续;⑤进行变异和交叉操作,对边界解进行处理.得到临 时种群;⑥对临时种群进行评价,计算目标函数值:⑦进行 选择操作,得到新种群;⑧进化代数刷新k=k+l,转步骤4。 维普资讯 http://www.cqvip.com 第l期 郭雩松,孙林岩,刘哲:基于微分进化算法的支持向量机预测模型及其在制造业发展预测中的应用 .65. 3.2基于微分进化的支持向量机训练 支持向量机的关键参数可以很容易映射到微分进化 算法种群的每个个体之中(编码过程),具体如图3所示。 lndividual I C 图3支持问量机参数编码示意 基于微分进化算法的技持向量机参数选择过程,实际 上就是利用微分进化算法寻求最优支持向量机参数的过 厂— ———— 程,目标函数定义为MSEc=g』L 1/∑(Yi一∥ ,其rf】y。为训 练样本的实际输m值,矿,为选用特定参数的支持向量机进 行回归的预测数值。令0为表示支持向量机参数的向量, 那么实际上就是求解如下优化问题: Min(MSE) S.t L≤0≤f, 其中£和 分别表示支持向量机参数下限和上限, 具体流程见图4。 图4基于微分进化的支持向量机训练示意 4模型在制造业发展预测中的应用举例 制造业发展预测问题的闲难在于其不确定的内生、外 生影响冈素众多。从宏观层面上讲,某同制造业发展政策、 以及其它产业的发展甚至世界范围内的政治、经济环境的 变化.都会对制造业的发展轨迹产生影响。微观层面上如 劳动成本的变化等,都有显著影响,但是这种影响很难体 现在预测模型中,从而使得Takcns定理所讲的时问序列 过去值与外来值之间的光滑映射,在制造业发展的原始数 据中很难存在,而且由于影响因素众多,把这种影响因素 全部包含在预测模型中是不现实的。所以本研究首先通过 小波分析,剔除不确定及短期因素的影响,力求对制造业 发展的趋势进行预测,这样虽然从技术层面上降低了预测 精度,但实际上,这样使得预测具有更强的可操作性。更重 要的是,我们对于制造业的预测,实际上更加关注其发展 趋势.而原始数据虽然包含了趋势信息,但还掺杂了许多 其它信息,而这些信息本身并不反映制造业发展的根本趋 势。因此,剔除这信息,实际上是一个信息筛选、提取根本 内容的过程,尽管表面上降低了原始数据预测的精度,但 从更高的层面上讲,恰恰将最根本的信息展现出来,因而 具有更深意义上的准确性,这种思路已经为许多预测研究 所采用IO-L2 本文选取日本纺织行业产值在整个日本制造业的比 重作为主要分析数据,数据来源于日本官方网站 选取 1957~1992年的数据为训练样本,1993~2002年l0年的数 据为检验样本。首先对时间序列进行小波变换,然后将高 频部分置0,而后对数据求一阶差分,进行标准化处理,再 进行相空间重构,得到序列。其中,映射关系,1: R中的 m取15,预测方式采用递归预测。 支持向量机的核函数选定为径向基函数,那么支持向 量机的自适应学习过程实际上就是针对给定训练样本的 参数修正过程。给定相应参数的范围:C∈『l,200],,f∈ [0.0001,1]and ∈[0.001,20],微分进化算法的控制参数 种群规模为10,种群中每个个体包含上述3个参数。编码 方式见图3 经过优化,得到最优解为:  fC=54.953373 {s=0.O00100 (7) I tr=O.724983 与此相对应的MSE值为0.000098。 lteration (a)微分进化算法的逼近轨迹 lteration (b)遗传算法的逼近轨迹 图5基于不同进化算法的支持向量机训练效果比较 为了便于同其它进化算法进行比较,本文依据文献 ”。 中介绍的遗传算法,构建了基于遗传算法的进化支持向量 机模型 分别利用微分进化算法、遗传算法对相同训练样 本的支持向量机模型参数进行优化,取相同的种群规模、 编码方式以及变异概率等关键参数,在Matlab计算平台 上分别进300次重复计算,其中微分进化算法平均需要迭 维普资讯 http://www.cqvip.com ・66- 科技进步与对策 2008拄 代104.4次,遗传算法平均需要208.94次,其最优、最差以 及平均水平逼近轨迹如图5所示。其中在300次计算过程 中.基于微分进化算法的计算过程全部收敛于目标函数的 最小值.而基于遗传算法的计算过程则有36次由于陷入 局部最优而没有收敛于最小值,准确率为88%。每次迭代 的平均时问分别为0.1729秒和0.1731秒,大体相同,所以 平均迭代次数明显小于遗传算法的微分进化算法,无疑消 耗的时问更少,同时具有更强的全局搜索能力。 按照训练得到的支持向量机进行预测,结果见表1, 整体拟合结果见图6。 附表 支持向量机预测输出数据列 Figure ofTendency of Share ofTextile in Manufacturing in Japan 2005 Year 图6原始数据、趋势数据及预测数据拟合曲线 图6中,虚线表示原始数据,实线表示经小波分析后 得到的趋势数据,点序列表示预测数据,可以看出,预测结 果具有很高的精度。 5结语 本研究在Takens定理的基础上,根据观测到的序列 构建训练样本对(她,Yi),而后基于微分进化算法对支持向 量机模型进行训练,使其能够对未知数据进行更加准确的 预测。为满足Takens定理的条件,通过小波去噪得到制造 业指标变化的趋势序列,虽然不是对原始数据的精确预 测,但其预测结果(见附表和图6)仍然具有很强的现实意 义。 通过基于微分进化的支持向量机预测,其平均迭代步 数和训练时间较遗传算法大大缩短,寻找最优参数的精度 大大提高.使得支持向量机具有了更强的自适应学习能力。 最终预测结果与实际值(见表1)的均方差为0.00041873, 显示了较高的预测精度。 Takens定理证实了光滑映射的存在性,但没有说明如 何构建输入矢量,那么如何选取映射关系厂:尺 尺中的m 以及延迟r和P才能取得最优的预测效果,则应根据具体 情况进行调整。 参考文献 [1]Takens F.On the Numerical Determination of the Dimension of an Attractor[A].In Rand D,Young L S.Dynamical Systems and Turbulence,Warwick,Lecture Notes in Mathematic[C].Sp ringer--Verlag,1981,(898):316.381. [2]Hartman E J,Kowalski J M.Layered Neural Networks with Gaussian Hidden Units as Universal Approximations[J]. Neural Computation,1990,2(1):210-221. 『3] Krenovich V Ya.Arbitrary Nonlinearity is Sufficient to Represent all FunctiOns by Neural Networks:A Theorem[J]. Neural Networks,1991,4(2):38,1389. [4]V・Vapnik,The Nature of Statistical Learning Theory[M].New York:Springer—Verlag,1995. [5]Taeshik Shon,Yongdae Kim,Cheolwon Lee,Jongsub Moon,A Machine Learning Framework tor Network Anomaly Detection Using SVM and GA[A].In Systems,Man and Cybernetics (SMC)Information Assurance Workshop,Proceedings from the Sixth Annual IEEE[C].2005,(6):176—183. [6]ZhengChunhong,Jiao Licheng,Automatic Parameters Selection for SVM Based on GA [A].In Fitfh World Congress on Intelligent Control and Automation[C].2004,(2):1869—1872. [7] Zhang Xiangrong;Liu Fang,A Paaenr Classification Method Based on GA and SVM[A].In 6th International Conference on S ignal Processing[C],2002,(1):110-113. [8] 熊建秋,邹长武,李祚泳.基于免疫进化支持向量机的年用 电量预测[J].四川大学学报(工程科学版),2006,38(2): 6—10. [9]Stonr R,Price K,Differentila Evolution.a Simple and Efficient Adaptive Scheme for Global Optimization over Continuous Spaces[J].Journal of Global Optimization,1997,(1 1):341— 359. [10] 梁强,范英,一呜.基于小波分析的石油价格长期趋势预测 方法及其实证研究[J].中国管理科学,2005,13(1):30—35. [11] 朱卫华,唐向宏,张福洪.小波分析在短期经济预测中的应 用[J].杭州电子科技大学学报,2005,25(1):48—51. [12]赵黎明,吴文清.基于小波分析的游客流量神经网络预测 研究[J].系统工程学报,2006,21(2):221—224. [13] K-P-Wong and A.Li.Virtual Population and Acceleration Techniques for Evolutionary Power Flow Calculation in Pow— er Systems in Evolutionary Optimization[M].R.Sarker,M. Mohammadian and X.Yao Eds,Kluwer Academic Publish— ers,USA,20o2.329—345. (责任编辑:赵贤瑶) 

因篇幅问题不能全部显示,请点此查看更多更全内容