一种基于半监督集成SVM的土地覆盖分类模型
2020-01-26
来源:飒榕旅游知识分享网
第4O卷第7期 2013年7月 一计算机科学 Vo1.40 No.7 Computer Science July 2013 种基于半监督集成SVM的土地覆盖分类模型 刘颖 张柏。王爱莲 桑娟 何咏梅 (吉林财经大学管理科学与信息工程学院 长春130117) (中国科学院东北地理与农业生态研究所摘长春130102) (中国科学院研究生院 北京100049)。 要 目前,支持向量机技术(SⅥ )在遥感信息获取中普遍受到参数选择不准确和小样本问题的制约。针对这些 问题,提出一种新的半监督集成SVM(EPS3VM)分类模型。模型一方面利用自适应变异粒子群优化算法对SVM参 数寻优以提高基分类器精度(PSVM);另一方面采用自训练算法(Self-training),充分利用大量廉价的未标记样本产生 性能差异的半监督分类器个体(Ps3ⅥⅥ),其中,在未标记样本标注过程中,引入模糊聚类算法(Gustafson-kesse1)来控 制错误类别的输入,最后对个体分类器采用加权集成策略,以进一步提高分类模型的泛化能力。为了测试其性能,应 用该模型进行多光谱遥感影像的土地覆盖分类实验,并与PSVM、PS3VM进行对比,分类精度从PSVM的88.48 提 高到96.88 ,Kappa系数由0.8546提高到0.9606。结果表明,EPS3VM在克服传统SVM参数选择不准确的同时, 有效地应对了小样本问题,分类性能更优。 关键词支持向量机,半监督学习,集成学习,Gustafson-kessel模糊聚类,土地覆盖,分类 TP391.4 文献标识码A 中图法分类号Ensemble Model with Semisupervised SVM for Remote Sensing Land Cover Classification LIU Ying ’ ’。ZHANG Bai2 WANG 一1ian1 SANG Juan1 HE Yong-mei (College of Management Science and Information Engineering,Jilin University of Finance and Economics,Changchun 130117,China) (Northeast Institute of Geography and Agroecology Chinese Academy of Sciences,Changchun 130102,China) (Graduate University of Chinese Academy of Sciences,Beijing 100049,China)。 Abstract Nowadays,most SVM-based remote sensing classification methods are challenged by incorrectly selecting pa- rameters values and the small sample problems.This paper proposed a novel ensemble model with semisupervised SVM (EPs3VM)tO address the problem of remote sensing images classification.The key characteristics of this approach are to 1)self-adaptive mutation particle swarm optimizer is introduced to improve the generalization performance of the SVM classifier(PSVM),2)self-training semisupervised learning method that leverages large amounts of relatively inex— pensive unlabeled data is presented to produce a number of semisupervised classifiers(PS3VM).Then by the weighted voting method,these classifiers are combined SO as to improve the generalization ability of the classification mode1.In or- der tO reduce the impact of this issue by incorrect labels,Gustafson-kessel fuzzy clustering algorithm(GKclust)is used for selecting the usefu1 points from the unlabeled set.The effectiveness of the proposed classification approach is de- monstrated for identifying different 1and cover regions in multispectral remote sensig inmagery.In particular,the perfor- mance of the EPS3VM iS compared with PSVM and PS3VM in terms of classification accuracy and kappa coefficient. On an average,the EPS3VM model yields an overall accuracy of 96.88 against 88.48 for PSVM and outperformed PS3VM in terms of overal1 accuracy(by about 5 ).The obtained results clearly confim rthe effectiveness and robust— ness of the EPS3VM approach to the remote sensing land cover classification. Keywords Support vector machines,Semisupervised larening,Ensemble 1earning,Gustafson-kessel fuzzy clustering, Land cover,Class ̄f ̄cation 言  ̄NNlll是指人类施加于地表的活动,是基于人类活动 到稿日j朝:2012-09—19返修日期:2012-12-22 刘目课题(KZZD-EW-08—02),吉林省科技发展计划项目(2O13O522177JH)资助。 耋 覆盖归属和识别。目前许多机器学习算法被应用于多光谱土 本文受国家重点基础研究发展计划(973计划)课题(2OO9cB4211O3),中国科学院重点部署项 柏(1962一),男,研究 颖(1979一),女,博士生,主要研究方向为模式识别、计算智能、遥感图像处理等,E-mail:lyaihua1995@163.com;张员,博士生导师,主要研究方向为遥感应用研究、智能模型构建等,E-mail:zhangbai@neigae.ac.en(通信作者)}王爱莲(1967一),女,副教授,主 要研究方向为模式识别、数据库技术等;桑智能计算、计算机网络等。 ・娟(1964一),女,讲师,主要研究方向为人工智能等;何咏梅(1968一),女,副教授,主要研究方向为 206・ 地覆盖分类领域[2],其中支持向量机技术(Support Vector Machines,SVM)由于能较好地解决高维特征、非线性、过学 习,且具有局部极小等优点,成为土地覆盖信息获取技术新的 研究热点,广泛应用于森林类型识 ̄Uc3.,l、农业作物监测[5]、 道路信息提取[ 、图像分割m等领域。 SVM尽管在遥感信息获取中取得了很好的效果[8],但仍 存在有待改进和完善之处,主要表现在以下两方面,1)参数选 择问题:分类参数的选择没有特别好的办法,应用时不容易找 到最优分类参数;2)小样本问题:当训练样本集远远小于测试 样本集时,SVM即便具有较强的泛化性,也难以给出令人满 意的结果。针对上述问题,诸多专家学者开展一系列卓有成 效的工作,并取得丰硕的研究成果。 对于分类参数选择问题,常用的方法是网格法,然而,这 图1半监督集成SVM分类模型技术路线 2.1个体生成算法 2.1.1基于自适应变异粒子群的SVM参数优化分类算法 种方法消耗大量时间,结果不是很理想[9]。很多学者利用智 能优化算法对SVM参数进行优化,如采用遗传算法(Genetic Algorithms,GA)实现SVM特征子集的选择与参数同步优 化[1。。,用粒子群优化算法(Particle Swarm Optimization, PSO)构建SVM分类器优化模型[1 。在寻优过程中相比GA 方法,PSO没有GA算法的选择、交差、变异过程,算法收敛速 度快、结构简单。但PSO也同时存在着容易早熟收敛、搜索 精度较低、后期迭代效率不高等缺点。 对于小样本问题,学者们普遍采用半监督学习和集成学 习两种范式对SVM进行改进。半监督学习[12]利用未标记样 本所隐含的地物类型在特征空间中的结构信息,拟合出一个 更有代表性的分类器;集成学习[1。]综合多个同构或异构学习 机对同一个问题进行学习,进而提高分类器的泛化能力。然 而两种方法的发展几乎是并行的,最近一项研究结果表明,集 成学习与半监督学习之间存在许多互补性,且二者的混合范 式(即半监督集成)可以更大程度地改进学习系统的泛化能 力[1 。因此,设计有效的半监督集成方案是处理小样本问题 的另一个崭新思路[1引。 鉴于上述分析,本文提出一种新的半监督集成SVM分 类模型,该模型可以同时解决SVM参数选择不准确和小样 本问题,并在多光谱遥感影像的土地覆盖分类实验中获得很 好的分类效果。 2半监督集成SVM的分类模型构建 Krogh和VedelsbyC ]以回归学习集成推导的泛化误差 公式表示为: E= 一 (1) 式中, 表示个体分类器固有误差,万表示个体分类器之间差 异。该公式表明,要获得好的集成,就需要降低个体分类器的 误差并增加个体分类器之间的差异。因此本文从个体生成 (使用程序来生成个体分类器)和结论生成(选择特定的策略 来组合分类器)两个部分考虑,提出半监督集成SVM分类策 略。具体技术路线如下:(1)个体生成部分一方面利用自适应 变异粒子群算法(Self-adaptive Mutation PSO,S )优 化SVM分类器参数以获得高精度分类器个体,另一方面采 用Gustafson-kessel(GKclust)模糊聚类算法控制Self-training 错误标记样本的加入以提高个体分类器的差异性;(2)结论生 成部分采用加权投票策略将半监督分类器个体集成。具体描 述如图1所示。 (Ps1,M) SVM的主要思想是建立一个超平面作为决策曲面,使得 正例和反例之间的隔离边缘(Margin width)被最大化。寻找 最优超平面即正反例间隔最大化问题,最终归结为一个二次 规划问题。 假设给定训练样本集{(Xi, ),i=1,2,…, }由两类组 成,其中,五ER"为N维向量, ∈{+1,一1)。SVM通过解 决式(2)所示的优化问题获得理想的分类超平面决策函数 ,( )一( ・z)+6,其中 和b分别为权向量和偏移量。 J‘ 专 +强8t;l ● ● L ・蕊+6)≥1—8,8≥O, =1,2,…, 式中,c为惩罚系数,控制对错分样本的惩罚程度,C越大表明 对错误分类的惩罚越大。当训练样本为非线性时,采用适当 核函数就可代替向高维空间的非线性映射,从而实现某一非 线性变换后的线性分类。建立lagrange函数求得其对偶式, 最终得到的分类决策函数为式(3)所示。 ,( )==sgn{w・ ( )+6) =sgn{∑ tK(麓, )+6 ) (3) 在SVM 4种核函数中应用最广泛的是径向基核(Radial Basis Function,RBF)核,如式(4)所示,RBF核具有较宽的收 敛性,不受维数以及样本数量的严格限制,是较为理想的分类 依据函数。 1 K(蕊, )=exp(一专Ix/一 l ) (4) 本文SVM的主要参数,除了惩罚系数c,还包括RBF核 函数参数7。粒子群算法(PSO)是常见的s、 vI参数寻优方 法,然而,PSO算法运行过程中容易陷入局部最优,即出现所 谓的早熟收敛现象,这种缺点会造成SVM分类参数寻找不 准确,进而影响分类精度。Liuc"]提出利用自适应变异粒子 群算法优化SVM分类参数,算法通过分析早熟收敛的判定 准则确定算法是否达到全局收敛,当出现早熟收敛时,通过变 异算子改变粒子的前进方向,从而让粒子进入其它区域进行 搜索,在其后的搜索过程中,算法就可能发现新的个体极值以 及全局极值。Liu将所提出的模型应用于遥感影像分类,并 与传统PSO优化SVM参数比较,实验表明所提模型可以有 效提高SVM分类精度,详细算法参考文献[17]。 2.1.2 自训练半监督分类算法(PS3VM) 自训练方法是半监督学习比较常用的方法,其基本思想 是首先用少量标签样本训练一个分类器,然后用此分类器对 ・207・ 所有无标签样本进行分类,并给每个无标签样本标上类别标 签和相应的置信度;再将置信度高的样本连同它的类别标签 合并到训练集中继续训练分类器;重复上述过程,直至结束条 件满足。自训练方法利用数量很少的标签样本获得初始弱分 类器,然后利用弱分类器估计无标签样本的标签置信度,很有 可能将错误类别加到训练集中,以致在迭代的过程中这个错 误累积并加强。Maulik等l1。 曾提出利用FCM模糊聚类算 法筛选标注对象,以控制错误样本的加入,然而FCM不考虑 图像上下文中的任何空间信息,使得它对噪声非常敏感;此外 FCM算法采用平方误差和准则,仅适合于发现球形或类似球 形分布的类别,这些很难满足趋于超椭球体分布的遥感数据 分类。鉴于此,本文在PS3VM模型中引入GKclust模糊聚 类算法,GKclust算法是距离自适应动态聚类算法的模糊推 广,可以有效地搜索超椭球、平面或线型的数据类别_19](限于 篇幅,GKclust算法从略)。 PS3VM算法的主要思想:在未标签样本标注过程中,利 用GKclust对未标签样本产生模糊隶属度函数,然后通过判 定模糊隶属度函数值的大小确定是否将其作为标注对象,从 而远离无效标签样本值。PS3VM算法如表1所列。 表1 PS3VM算法 步骤 执行内容 step 1 初始化标签样本集T—L,无标签样本集M,r= 。 Setp 2 当M≠中执行如下操作。 St印3 利用标签集训练SVM,并利用自适应变异PSO进行参数优化, 构建初始分类器。 step 4 在集合T中利用Gkclust模糊聚类算法产生聚类中心v。 step 5 以V为初始聚类中心,在无标签集合中生成无标签样本的模糊 隶属度函数值。 St印6 将隶属度高的样本点组成候选集合N。 st∞7 利用PSVM对N进行标注。 steD 8 基于r产生标签子集‘j,。 SteD 9 更新标签集T—TU 。 steD1O 更新无标签集M—M一 。 steD 11 如果‘I,一垂降低r的值。 steD 12 判断循环是否结束。 Step13 利用T再次训练PSVM。 其中L为标签样本集,M为无标签样本集。首先利用模 糊聚类算法Gkclust对初始标签样本点L进行非监督聚类, 产生H个类别的聚类中心 ;然后以V为初始聚类中心,利 用Gkclust对无标签样本点M进行非监督聚类,产生H个类 簇和所有无标签样本点的模糊隶属度函数 ,在各个类簇中, 将距离聚类中心较近的点(模糊隶属度函数辘较高的点)作 为未标签样本的候选集合N;利用PSVM模型,同时设定一 个阈值r对候选集进行样本标注形成集合 ;接下来将 增 加到L中,并在M中将 删除,如此迭代,直至M为空。 2.2结论生成算法 2.2.1加权投票法 集成学习的主要思想是利用分类器的融合改善单个分类 器的不足,其性能一方面取决于多样性强的个体学习器,另一 方面依赖于成员分类器的有效组合。常用的组合方法有叠加 法、选择法、投票法。对于分类问题,通常采用投票法[ ,其 中包括多数投票和加权投票法。 加权投票法是将每个成员分类器均赋予一定的权重,权 重通常通过在训练集上测量每个成员分类器精度获得;且权 重与精度成正比,即分类能力好的基分类器被赋予较大的权 系数;而分类能力相对差的基分类器赋予较小的权系数,集成 ・208・ 的结果取决于加权和,而多数投票实际是加权投票的特例,即 权重值相等的加权投票法。设h (£一1,2,…,T)是第t个成 员分类器的决策函数,wt(£一1,2,…,T)是相应的权重,则最 后的决策如式(5)所示。 T 厂(z)一sign(∑wth (z)) (5) 2.2.2半监督集成分类算法(EPS3VM) PS3VM半监督方法利用未标记数据有效地应对训练样 本的不足,同时也产生若干性能差异的个体分类器。接下来 利用加权投票法将这些个体分类器集成,以进一步提高分类 模型的泛化能力。 假设利用自训练算法产生T个分类器个体S ,S ,…, ST,一幅遥感影像分类问题包含C个类别。 算法步骤见表2。 表2 EPS3VM算法 步骤 执行内容 Step 用户精度作为权值硼(|_1,2,…,T;j一1,2,…,c)l 各基分类器对未知像元X分类后,将分类结果相同的各基分类 SetD 2 器对该类别的权值相加,即得到像元X属于各类别的权值之和-r 善啊(j=1,2,…,H); st印3 羹 禁 和的大小’将最大值对应的类别作为像元x的最终 3 半监督集成SⅥ订模型在土地覆盖分类中的应用 为了测试EPS3VM分类模型的性能,将半监督集成模型 应用于多光谱遥感影像的土地覆盖分类实验,同时与PSVM, PS3VM进行对比。 3.1实验数据 本文选择20O6年9月22日获取的行列号为115—30的 多光谱Landsat-5 TM遥感影像(30米空间分辨率,UTM投 影)。根据植被的光谱特征和空间分布规律,本文提取了8个 特征,包括TM图像的6个波段(1-5,7)、K-T变换的第一主 分量、植被指数(NDVI)。热红外波段TM6的被排除,因为 它所包含的植被分类信息较少。 根据研究区实际情况并参考全国土地利用分类系统、东 北植被分布图,将实验区分为5个土地利用类型,即林地、水 体、农田、住宅、裸地。为了保证每个类别数据的变化性和代 表性,数字集采用随机像素的选择策略。土地覆盖类型及样 本数量如表3所列。 表3类别及样本数量 3.2结果与精度分析 当训练样本较少时,未标记样本参与的半监督分类方法 可有效提高分类精度,但随着己标记分类样本的增加,未标记 样本的作用越来越小。首先为了更好地体现小样本的特点, 将随机抽取的少部分样本作为训练样本(占每类样本的 3O%),整个数据集用于测试。分别采用PSVM,PS3VM, EPS3VM 3种分类模型进行对比实验,将分类精度、Kappa系 数及相应的参数值列于表4。实验结果表明,使用EPS3VM 方法分类得到的分类精度比PS3VM模型高出4.72 ,比 PSVM模型高出8.4 ,Kappa系数也要高于PS3VM模型0. 结束语本文针对SVM遥感分类中存在的参数选择和 小样本问题,提出基于半监督集成SVM分类方法。该方法 有如下特点:1)以PSVM模型作为基分类器,利用Self-trai- ning ̄¥法产生半监督分类器个体,其中在半监督学习过程中 为了避免错误样本的加入,引入GKclust模糊聚类算法;2)半 监督学习和集成学习两种范式的结合,一方面充分利用大量 0596,高于PSVM模型0.106。表5显示3种方法不同类别的 混淆矩阵,实验结果均证实EPS3VM能有效提高影像的分类 精度。 姒。 。。一§1 。。。 一 表4分类参数、分类精度和Kappa系数的比较 廉价的未标记样本来减少对有标记样本的需求量;另一方面, 未标记数据能够增加个体分类器之间的差异性,从而进一步 。 。 §1。 。。。。一旦。 0。。一§Il。拗。。。 提高学习系统的泛化能力;3)利用所提模型解决遥感土地覆 盖分类的实验表明,在相同样本数量条件下相比于其它分类 同时,本文算法亦存在一些待改进之处。例如,在个体分 表5 3种方法的混淆矩阵 撇 。一 。。踟 。一 。。撇 。 技术,该模型能获取更丰富、更准确的遥感类别信息。 ~0 0 3 胛~ ~0 0 4 m孔 c|,1 ‘l】2 (|l3 。∞ 0瑚一 。  ̄o4 w5 ‘l,l ‘lI2 ‘|】3 (04  ̄o5 cl,1 clI2 ‘屹 ct】5 上述实验利用遥感影像的数字集,有效地测试了 EPS3VM的性能。在本实验中,将3种分类模型应用于覆盖 研究区域115—30TM影像子集的分类并产生分类专题图,分 类结果如图2所示。由于研究区主要土地覆盖类型为植被, 因此图2(a)为研究区5,4,3波段合成图;图2(b)显示PSVM 的分类结果,其中1250个样本点作为训练集;图2(c)和图2 (d)以1250样本点作为已知样本点,并随机从影像上搜集 3000个未知标签点进行半监督分类和半监督集成分类。从 分类图中可以得出结论如下:首先,研究区域的主要土地覆盖 类型为林地,同时可以看出森林正面临着快速城市化的威胁, 为了有效地保护森林资源,有必要对此研究区进行动态监测。 其次,比较3种分类图,不难发现PSVM分类模型在林地和耕 地存在错分现象,PS3VM的主要问题在于耕地、裸地和住宅分 类错误,而EPS3VM在遥感影像数据上的分类明显优于其它 两种方法。 一■ ■■ (c)PS3VM分类 (d)EPS3VM分类 林地水体 耕地住宅裸地 图2 3种分类方法对TM影像子集产生的分类专题图 类器集成部分,对权系数产生的问题上,可采用更有效的策略。 黜一 。。。。m 参考文献 [1]林剑,钟迎春,彭顺喜,等.多光谱遥感图像土地利用分类区域多 中心方法[J].遥感学报,2010,14(1):173—179 [2]韩敏,林晓峰.一种基于Wedgelet变换的遥感图像分类算法 [J].红外与毫米波学报,2008,27(4):280-284 [3]Knorn J,Rabe A,Radeloff V C,et a1.Land cover mapping of large areas using chain classification of neighboring Landsat sate- llite images[J].Remote Sensign of Environment,2009,113(5): 957—964 [4]Heikkinen V,Tokola T,Parkkinen J,et a1.Simulated multispec- tral imagery for tree species classification usign support vector machines[J].IEEE Transactions on Geoscience and Remote eSnsing,2010,48(3):1355-1364 [5]Lardeux C,Frison P L,Tison C,et a1.Support vectormachine formultifrequency R oplarimetric data classification[J].IEEE Transactions on Geoscience and Remote Sensing,2009,47(12): 4143—4152 [6]Huang Xin,Zhang Lian-pei.Road centreline extraction from high-resolution imagery based on multiscale structural features and support vector machines[J].International Journal of Re— mote Sensing,2009,30(8):1977—1987 [7]冯晓毅,王西博,王雷,等.基于改进JsEG算法的高分辨率遥感 图像分割方法口].计算机科学,2012,39(8):284-287 [8]戴宏亮,戴道清.基于ETAFs、 vI的高光谱遥感图像自动波段 选择和分类口].计算机科学,2009,36(4):268-272 [9]LaValle S M,Branicky M s.On the relationship between classi— cla grid saerch and probabilistic roadmaps[J].International Journal of Robotics Research,2002,23(8):673—692 [1o]FrOhlich H,Chapelle Q Feature selection for support vector ITLII- chines by means of genetic algorithms[C]7f Proceedigns of the 15th IEEE international conference on tools with artificial intel— ligence.USA,Sacramento,C A,2003 El1]Huang Cheng-lung,Dun Jian-fan.A distributed PSO-SVM hy- brid system with feature selection and parameter optimization 口].Applide Soft Computing,2008,8:1381—1931 ’[12]Zhou Zhi—hua,Li Ming.Semi-supervised laerning by disgaree— ment[J].Knowledge and Information Systems,2010,24(3): 415—439 [13]Zhou Zhi—hu.山Ensemble laerning[M]∥Li S Z,ed.Encyclopedia of Biometrics,Berlin:Sprigner,2009,270—273 [14]邬俊,段晶,鲁明羽.基于偏袒性半监督集成的SVM主动反馈 方案口].模式识别与人工智能,2010,23(6):745—751 ・209・ E15]wu Jun,Ljn Zheng-kui,Lu Ming-yu.Asymmetric Semi-Super— cover classification[J].International Journal of Food,Agricul— ture&Environment,2012,10(2):132—138 vised Boosting for SVM Active Learning in CBmEC]}}Procee- dings of the ACM Internationa1 Conference on Image and Video Retrieva1.Xi’all,China,2010 [18]Maulik U,Chakraborty D.A self-trained ensemble with semisu— pervised SVM:An appliatcion to pixel classification of remote [16]Krgh nA,Vedelsby J.Neural network ensembles,cross valida- tion,and active learning EJ,1.Advances in Neural Information Processig Systems,1995(7):231—238 nsensig nimageryEJ1,.Pattern Recognition,2011,44:615-623 [19]黄金杰,李士勇,蔡云泽.一种建立粗糙数据模型的监督模糊聚 类方法[J].软件学报,2005,16(6):744-753 [17]Liu Ying,Zhang Bai,Huang Li-hua,et a1.A novel optimization parameters of support vector machines model for the 1nd use/ a[203单丹丹,杜培军,夏俊士.基于多分类器集成的“北京一号”小卫 星遥感影像分类研究口].遥感应用,2011,2:69—78 chine Learning.USA Corvasllis:ACM,2007:193-200 (上接第191页) 趋向于1(一般大于0.9),不同人的人脸数据的r( )都较小 并趋向于0。CCMEBTL通过迁移学习尽量多地利用原有信 [2]PanSJ,YangQ A surveyontransferlearning口].IEEETransa— ctions on Knowledge and Data Engineering,2009,22(1O):1345— 息实现了领域自适应,我们可以做到对人脸的有效识别。 同时通过CCMEBTL算法,在3.3节表1中可求得训练 集(源域空间D1)的最小包含球球心c的坐标和测试集(目标 域域空间D2)最小包含球球心C1的坐标,继而可求出不同人 脸图像的球间距离,如表7所列。球间距离越小,表示源域与 目标域相似度越高。 表7不同人脸图像的球间距离 通过表7观察可以发现,两大类数据内部子集的球心间 距明显小于不同类子集之间的球心间距,即同一人的人脸图 像球间距明显小于不同人的人脸图像球间距。结果显示算法 能较好地体现不同领域之间的相关性,具有较好的领域自适 应性。 结束语本文将MEB、CCMEB理论应用在迁移学习研 究上,提出了MEBTL算法和CCMEBTL算法。在求解目标 域球心位置时尽可能多地利用到源域数据完成知识传递,并 发现不同域之间的内部联系。最后通过比较不同域的概率统 计比可实现数据的修正和校正。为了满足大样本数据集运算 要求,引入了C、 、CCMEB理论。大量的实验内容验证了 本文算法的有效性和快速性。应当指出本文算法仍有可深入 研究之处,如何将其应用于数据分类和数据回归将是我们下 一步的研究重点。 参考文献 [1]Dai W,Yang Q,Xue G,et a1.Boostimg for trnaserfer learning [c]∥Proceedings of the 24 International Conference on Ma一 ・210・ 1359 [3]Blitzer J,McDonald R,Percira F oDmain adaptation with strut- tural correspondence learning[c]∥Processings of the 2006 oCnference on Empirical Methods in Natural Language Proces- sing.PA USA:SIAM,2006:120—128 [4]Hal Daum’e III.Daniel Mareu oDmain adaptation for statistical classifiers[J,1.Journal of Artificial Intelligence Research,2006, 26(4):101—126 [5]BIitzer J,Crammer K,Kulesza A,et a1.Leaming bounds for do— main adaptation[c]//Procedeings of the 21st Annual Confe- renae on Neural Information Processing Systems.Cambridge, MA;MIT,2008:129—136 [6]Dai W,Xue G,Yang Q,et a1.Co-clustering based classification for out-of-domain documents[C]∥Proceedings of 13th ACM SIGKDn New York:ACM,2007:210—219 [73 Tax D M J,Duin R P Support vector domain descirption[J]. Pattern Recognition Letters,1999,20(11):1191—1199 [8]TsangI,Kwok J,Zurada J.Generlized core vectormachines[J]. IEEE Transactions on Neural Networks,2006,17(5):1126— 1139 [9]Tsang I,Kwok J,Cheung P.Core vector machines:Fast SVM trainign on very large data sets[J].Journal of Machine Learning Research,2005,6(4):363—392 [1O]Fang S-H,Lin T_N.Indoor location system based on discrimi— nant-adaptive neura1 network in IEEE 802.1 1 environments 口].IEEE Transactions on Neural Networks,2008,19(11): 1 973-1978 Ell,l Yang Q,Pan S J,Zheng V Estimating location using Wi-Fi 口].Intelligent Systems,IEEE,2008,23(1):8-13 [12]Satpal S,Sarawagi&Domain Adaptation of oCnditional Proba— bility Models iva Feature Subsetting[c]∥Procedeings of PK— DD Heidelberg..Sprigner-Verlag Press,2007,4702:224—235 [13,l PanSJ,Kwok JT,YangQTransferlaernign viadimensionality reduction[C]∥Proe.23rd Assco.for the Advancement of Artifi— cial Intelligence(AAAI)Conf.Artificial Intelligence.Chiacgo, IL,July 2008:677—682 [14,l Pan S J,TsangIW,Kwok JT,et a1.DomainAdaptation via Transfer Component Analysis[J1.IEEE Transactions on Neu— ra1 Networks,2011,22(2):199—210 [15]Osuna E,Freund R,Giroal F.Training support vector machines: na application to face diction[C]}{Prceedings of IEEE Confe- rence on Computer Vision and Pattern Recognition.San Juan, l997:130—136