专利预警模型构建及实证研究
文/孙振嘉
杨肖
陈晓美
王民
摘
要:专利能够直接反映企业的技术创新程度,而
且,专利信息易于获取,因此,用专利指标体系来构建反映企业技术创新水平的预警模型是具有可操作性并能够比较准确地对企业的技术创新程度进行预警的。本文运用主成分分析法对专利信息相关指标进行分析,确定指标权重,借鉴阿德曼模型构建反映企业技术创新水平的专利预警模型,进一步利用电动汽车轮毂驱动技术的专利数据对模型进行实证,为企业提供一个简便准确的技术创新预警方法,以便制定符合其自身情况的发展战略。
关键词:专利分析;技术创新;预警模型1
引言
随着全球经济发展,能源和环境保护问题成为各国关注的重点,世界各国政府都出台相关政策来扶持新能源汽车的发展,由此可以看出新能源汽车是今后汽车行业发展的必然趋势。作为电动汽车核心技术的轮毅驱动技术,其发展程度可以反映出一个企业乃至一个国家的电动汽车发展水平,因此,对这一技术的相关信息,尤其是专利信息的分析显得尤为重要。专利预警分析是对专利信息分析一个非常有效的方法,无论从国家、行业或者企业层面来说,都是至关重要的。可以根据预警模型的结果设计专利战略,以期在技术竞争中占领制高点。
国内很多学者基于专利预警分析也进行了许多研究
[1-8]。本文以国内外电动汽车轮毂驱动技术的专利信
息作为数据来源,运用主成分分析方法进行数据处理,在此基础上构建电动汽车轮毂驱动技术专利预警模型,合理确定警度值,为技术研发主体确定自身在行业中的地位提供参考,并进一步据此结果建立有效的专利战略,保护并提升自己的行业地位。
2
专利预警指标的设计
2.12.1.1设[3]
专利预系计警统原指性则
标原体则
系是一个整体,理论上应当包含多个子系统,子系统的构建必须服务于专利预警的总体目标,保证指标体系的一贯性。
2.2.2独立性原则
74
独立性原则要求专利预警评价的指标之间要相互独立,尽可能减少相互之间的相关性,避免指标冗余,提高指标精准度,从而有利于提高专利预警的高效性。
2.3.3电动汽可车操轮作毂性驱原动则
技术专利预警指标体系是为了建立
预警模型而建立的,因此必须保证指标体系的可操作性,即指标计算所用到的数据必须是可以公开获取的,指标的计算必须是简单、清楚并且可以多次重复的,指标的计算结果必须是客观准确的,以便于实际操作。
2.2在电专动利汽预车警轮指毂标驱体动领系
域,整个大环境的影响因素众
多,比如市场环境、竞争对手、国家政策、经济发展情况等因素,这些都是外部环境因素。对于企业来讲,这些环境因素是客观的、不可控的,是企业通过自身努力无法改变的。为了使得企业能够制定具体可行的专利战略,本文从企业自身角度进行分析,考虑到创新能力是专利主体在行业中立于不败之地的决定性因素,本文主要从企业创新性方面出发建立专利预警指标体系。
由于创新能力、创新程度和创新人才可以反映出企业在电动汽车轮毂驱动技术领域的综合实力,创新发展潜力可以反映企业在电动汽车轮毂驱动技术领域未来的发展预期,同时结合专利预警系统的特殊性和目的性,结合现实获取数据的难易程度,从企业自身角度出发设立四个维度:创新能力、创新程度、创新人才和创新发展潜力,得到8种相关特征,如下表1所示:
表1:
专利预警指标体系专利申请量率X1创新能力
专利增长率X2技术生长率X3创新发展潜力
科学关联指数X4同族率X5创新人才发明人效率指数X6平均专利发明人X7创新程度
创新程度指数X82019.10下兰台内外
2.2.1企业的创创新新能能力
力可以通过专利申请数量和专利增长率来反映,创新关联度可通过科学关联度以及同族数来决定;创新人才可通过发明人效率指数、平均专利发明人特征来决定,创新程度则可由创新程度指数特征来表征。下面对各个特征进行详细说明:
(1)专利申请率X1
企业的专利申请率是企业创新能力最直观最基本的表征数据,反映出企业在专利发明方面的相对产出能力,反映其技术活动发生、发展的过程及发展趋势等。由于专利从申请到公告、授权需要较长时间,所以本文仅以专利申请率而非专利授权率作为反映指标。
专利申请率=某主体当年专利申请量所有主体当年专利申请量(2)专利增长率指数X2
专利主体专利申请量每年会发生变化,计算当前阶段较前阶段增减的幅度,可显示技术创新随时间的变化是增加还是迟缓,从每年的变化也可以看出一个主体持续创新的能力。本文以当年专利申请数量除以去年专利申请数量得到的值作为专利增长率指数,来表征专利主体的持续创新能力。
专利增长率指数当年专利申请数量去年专利申请数量(3)技术生长率X3
技术生长率可以用来表征专利主体长期创新发展能力,从而预估专利主体的发展潜力。
本文以当年专利申请量除以前五年累计专利申请量作为技术生长率。
技术生长率=
当年专利申请数量前五年累计专利申请数量(2.2.24)科创学新关潜联力
指数X4
该指标用发明专利所引用专利的数量与当年专利申请数量的比值表示,表明本主体发明专利与其他专利的相关情况,评估某专利技术创新和科学研究关系,用来考察企业的技术与最新科技发展的关联程度。该数值大,说明企业的研发活动和技术创新紧跟最新科技的发展。
科学关联指数=引用专利数量
当年专利申请数量(5)同族率X5
该指标反映主体就申请专利所产生的相关专利文献情况,反映专利权人申请的地域范围及其潜在的市场战略,该数越大,说明该专利申请范围广泛,潜在的发展能力和
2019.10下兰台内外
他山之石
竞争性越强。
同族率=
同族专利数量当年专利申请数量(2.2.36)发创明人新人效才
率指数X6
为了反映专利主体当年发明人的专利发明效率,用当年专利主体发明人的发明总次数除以当年专利主体的总发明人人数。发明人效率越高,说明该企业的创新人才效率较高、技术创新效率较高。
发明人效率指数=当年专利发明人发明总次数当年专利发明人总人数(7)平均专利发明人X7
以申请专利发明人总数除以申请专利总数,即平均每项专利参与的人数,可以得到专利主体活跃的发明人数。该指标越小,则越能说明该企业创新人才质量高,创新效率高。
平均专利发明人=申请专利发明人总数专利申请总数(2.2.48)创创新新程程度度
指数X8
专利的不同类型代表不同的创新程度,专利的创新程度越高说明该专利主体在此技术领域较强的技术创新能力。对于企业主体来说,发明专利数量占绝大多数,同时考虑到电动汽车轮毂驱动技术发展时间问题,用近五年专利主体申请的发明专利总数除以近五年专利主体申请的所有专利总数来表征创新程度。
创新程度指数=近五年申请发明专利总数
近五年专利申请专利总数3预警模型的建立3.1由于主本次成分分数据析主法要处是理年数据
度截面数据,样本小,信息少且没有显著的数学特征,加之专利预警指标较多,为了降低预警模型建立的复杂性,同时不影响专利水平的评价,本文采用主成分分析方法[10](PCA)对各因素的信息进行提炼,消除各因素间信息叠加造成的影响并确立新的指标。
主成分分析法(PCA)主要是把多个指标转化为少数的几个线性不相关的综合指标(主成分),而且每个综合指标都能反映出原始指标的大量信息。它能将高维空间的复杂问题转化为低维空间的简单直观问题,降低运算量的同时,去除冗余信息。其主要原理分析如下分析。
1)若输入m个样本,n项不同类别特征,采用特征组合,得到样本向量X=(xij)
mxn
:
75
他山之石
杉山山山山山山山山山山山山山山山删
x11x12…x1nx21x22…x…
X=
xm1xm2…x
煽衫衫衫衫衫衫2n衫
衫衫衫衫衫衫衫mn衫闪
5)确定主成分个数:贡献率(重要程度)以及累积方差贡献率分别为:
,
(1)
浊i=姿i/移姿i,
in
(4)(5)
2)对矩阵X按照标准化公式(2)处理得到标准化矩阵X*
X*=x-滋,滓=
滓浊
式中:μ表示矩阵元素的均值,σ表示矩阵元素的方差,x为原矩阵中的元素,x*为标准化矩阵中的元素。
3)根据公式(3)可以建立自相关矩阵。R=X*TX*/(M-1),示样本数量
以及特征值对应的特征向量u1,u2……un
4)根据相关矩阵求得其特征值,即姿1逸姿2逸……姿n
(3)
式中X*为标准处理后的矩阵;X*T表示X*的转置;M表
姨移(p)=移浊i,
i
p
1移(x-x)Ni=1i
N2
选取主成分的个数时需要依据累计方差贡献率,通常
(2)
情况下,如果前p个累积方差贡献率超过75%,则其对应的前p个主成分包含原始变量的绝大部分信息。
前个主成分对应的特征向量矩阵Unp=[u1,u2,……,up],则个样本构成的主成分矩阵为Fmp:
Fmp=[F1,F2,……,F]=X*Unp,p
(6)
本文以国家知识产权局专利数据库为数据来源,检索表2自2002年至2017年全球专利预警数据(),以及近五年表3排名前十的专利主体的预警数据()作为构建专利预警模型的样本数据,具体各指标取值如表2、3所示。
表2:2002—2017年全球专利预警样本数据
特征年份2002200320042005200620072008200920102011201220132014201520162017X10.1670.1110.0500.0420.0380.0230.0320.0230.0200.0110.0130.0160.0110.0130.0100.011X22.8001.2141.1761.7501.6001.2680.6061.4421.4681.9120.9540.8311.7900.8381.4060.725X30.7370.4720.3570.3850.3940.3570.1910.2320.2820.3950.3100.2190.3030.2220.2770.193X40.0710.7651.9002.3711.9462.3102.3492.4683.2532.6722.6271.5001.5671.0770.6910.156X51.0002.1182.9002.0003.7683.0702.6053.0974.0332.9023.2712.0361.8582.1451.3571.038X62.5831.3001.4001.6271.7181.5482.7591.5141.8461.9521.9901.5862.1202.2442.3442.029X70.8571.7651.7501.6861.2681.4651.3491.6941.4951.3051.1931.8191.4211.3091.4981.957X81.0001.0001.0001.0001.0001.0000.9870.9550.9160.8820.8640.8400.8390.8240.7710.803表3:近五年排名前十的专利主体的预警数据
特征年份20132014X10.0300.055X20.5533.262X30.1730.513X41.7622.321X52.4292.547X61.7113.771X70.9050.606X80.9630.9632019.10下
兰台内外
76
他山之石
续表
特征年份201520162017X10.0630.0380.017X20.9490.8460.327X30.3430.2390.073X41.8311.0730.611X52.6621.6091.278X63.4043.1961.902X70.7230.8362.278X80.9670.9490.956对表2、3中的样本数据按公式(2)进行统一标准化处理,得到如下表4的标准化矩阵。
其中黑色加粗为近五年排名前十的专利主体预警数据的标准化矩阵。
表4:统一标准化矩阵
特征年份2002X*13.384X*22.064X*32.945X*4-1.8290.2480.7830.7130.300X*5-1.6140.6281.6520.829X*60.684X*7-1.2330.8690.8350.686X*80.9610.9610.9610.9610.9610.9612003200520062008200720041.9240.1000.0150.319-0.147-0.2000.6000.3911.0870.4720.5400.2760.279-1.042-0.295-0.434-1.067-0.731-0.596-0.848-0.8980.943-1.2152011201320142016201720132014201520162015201220102009-0.707-0.565-0.700-0.743-0.693-0.1960.4620.655-0.654-0.667-0.470-0.384-0.148-0.384-0.9960.2060.170-0.073-0.281-0.0940.2430.7040.175-0.681-0.672-0.830-1.070-0.517-0.6612.7090.1200.656-0.5100.826-0.251-0.0540.541-0.598-0.8871.7841.0731.1250.8930.7570.8601.9651.0660.6310.2800.784-0.148-0.603-0.845-1.162-1.373-1.656-2.0820.4700.4700.5230.3770.284-1.1680.365-0.408-0.194-0.792-0.0020.3300.181-0.251-0.196-0.4550.9950.073-0.693-0.103-0.281-0.875-1.0141.3730.180-0.669-0.207-0.131-1.126-1.7330.0910.726-0.6920.169-0.687-0.391-0.601-1.192-1.5690.0720.212-0.8950.347-0.263-0.1860.2521.315-0.136-0.6072.4411.898-0.3241.590-1.122-1.814-1.543-1.2822.0582017-0.002-0.547-1.385-0.551-1.716-1.216-1.286根据公式(3)得出各个指标之间的相关性矩阵,如表5所示。从中可以看出指标和指标之间的相关性达到了0.865,这样会造成信息的重叠,如果直接用上述的8个指
标进行预警分析,会对预警结果的精确程度产生一定的影响,所以此处用主成分分析方法进行主成分的提取。
表5:相关性矩阵
特征特征X12019.10下
兰台内外
X11.000X20.460X30.792X4-0.366X5-0.241X60.171X7-0.325X80.56577
他山之石
续表
特征特征X2X3X4X5X6X7X8X10.460-0.366-0.241-0.3250.5650.1710.792X21.0000.8270.1380.053-0.4350.2020.308X30.827-0.0490.0120.1810.3961.000X40.1381.0000.865X50.0530.0120.865-0.2130.3031.000X60.308-0.084-0.213-0.713-0.0031.0000.181X7-0.435-0.448-0.177-0.158-0.713-0.2281.000X80.2020.3960.247-0.003-0.2281.0000.303-0.049-0.448-0.1770.247-0.084-0.158运用SPSS软件进行主成分分析后得出如下图1所示的碎石图和表6所示的总解释方差。
从碎石图(图1)和总解释方差表可以明显看出,前五个主成分的累计特征值即累计信息贡献量为96.93%,说明这五个主成分可以解释原来样本的绝大多数信息内容。
图1:
因子,其累计贡献率高达96.93%,可以很好地反映原始信息的绝大部分内容。表7表示5个主成分的得分系数矩阵
表7:主成分得分因子(特征向量矩阵)主成分特征X1X2X3X4X5X6X7X810.2570.2550.2900.0000.005-0.2260.1720.1582-0.149-0.0180.4520.4500.0383-0.020-0.083-0.5560.4110.3360.0350.1790.2954-0.2290.6600.3600.101-0.276-0.6770.2390.0135-0.441-0.375-0.6210.6720.9190.7800.3990.750-0.085-0.0770.161新提取的主成分因子组成的矩阵哉np与主成分矩阵F和标准化矩阵X*之间的关系如公式(6)所描述的一致。
式中哉np代表图中的成分得分系数矩阵,X*代表标准化矩阵。
)表6:方差累积表(总方差解释
主成分12345687初始特征值3.1152.1301.3910.8200.2990.1290.0790.037方差百分比38.93626.62117.39310.2483.7341.6160.9910.461累积%38.93665.55793.19896.93298.54899.53910082.953.2建立预警模型
在财务领域,进行财务风险预警分析时,阿德曼Z计
分模型被广泛应用,具有牢固的应用基础。应用于财务风险预警分析的阿德曼Z计分模型公式为:
杉山
山山山山山山山山山山山山山山山山山山山删
载1煽衫衫载载载
衫衫衫衫2衫衫衫衫3衫衫衫衫衫4衫衫衫衫衫5闪
Z=蓘1.2,1.4,3.3,0.6,0.99蓡载,
(7)
当Z<1.8时,企业属于破产企业之列;当1.8 通过上述分析,根据成分矩阵,提取五个新的主成分 78 2019.10下兰台内外 本文同为预警分析,基于上述样本数据,经过主成分分析方法提取出五个主成分。从这五个方面出发,在专利预警过程中借鉴了阿德曼Z计分模型。但是,为了适应电动汽车轮毂驱动技术专利领域的预警分析,本文在原阿德曼Z计分模型的基础上有一定改进,专利预警分析的Z模型的计算公式为: 杉山山山a衫煽山山山山b 衫衫 衫衫在越XW=[X山衫山衫1,X2,X3,X4,X5]山山c衫衫8)山衫山衫, (山山d衫衫山山删 e 衫衫衫衫闪 其中Z表示电动汽车轮毂驱动技术专利预警的警度值,a、b、c、d、e为在电动汽车轮毂驱动技术领域中各个变量所占的权重;X1、X2、X3、X4、X5分别表示上文中通过主成分分析法提取出来的电动汽车轮毂驱动技术领域的重要影响因子F1、F2、F3、F4、F5。 3.3确定模型变量权重 为了方便进行比较,剔除主观因素的影响,根据主成分分析法的基本原理,我们对主成分采取客观赋权法。用各个主成分贡献率占全部主成分的累计贡献率的比重作为权数,对各个主成分进行赋权。由表6可以确定F1、F2、F3、F4、F5五个主成分所占权重分别为0.389、0.266、0.174、0.102、0.037,得出: 杉 山山山山山0.389煽衫在越云W=[F山山1,F2,F3,F4,F5] 山山0.266衫衫衫衫衫衫山衫山衫(9) 山衫山衫山衫山衫山衫山0.1020.174, 衫删 0.037衫衫闪 结合公式(6)、(9),可以得出电动汽车轮毂驱动技术专利预警模型为: 杉山 山山山山0.389煽衫在越云W=载*哉* 山山mpW=载哉mp山山0.266衫衫衫衫0.174衫衫山衫山衫山衫山衫, (10) 山衫山衫山衫山0.102衫删 0.037 衫衫闪 其中,Ump为表7所示矩阵。3.4正常警在度进值行确专定 利预警分析时需要设立一个预警警限值作为比照的对象,这个预警警限值也叫作警限临界值。本文把电动汽车轮毂驱动技术专利预警分为优秀状态、正常状态和警戒状态[11]。电动汽车轮毂驱动技术全球近五年预警值的平均值可以代表该领域的目前的平均发展水平,如果企业预警值高于历史警度值的平均 2019.10下 兰台内外 他山之石 值,则说明该专利主体在电动汽车轮毂驱动技术领域发展态势向好,处于上升期,如果预警值低于临时警度值的平均值,则说明该专利主体遭遇了发展的瓶颈,可能由于自身战略等问题给自身技术发展带来了一定的不利影响。所以,本文以样本数据中全球近五年警度值的平均值作为预警警限临界值(Z1)。 另外,每个技术领域都会有技术水平发展比较强的领头性主体,本文以样本数据中电动汽车轮毂驱动技 术领域专利申请数量排名前十的专利主体的近五年预警值的平均值作为专利预警的另一个预警警限临界值(Z2),它代表了电动汽车轮毂驱动技术领域中较高的发展水平,不同的专利主体可以根据自身情况进行分析。如果预警值大于此临界值,说明该专利主体在该领域处于领先地位,这种优势要继续保持;如果预警值小于此临界值且大于全球近五年警度值的平均值,则说明该专利主体在该技术领域中处于中等水平,仍旧需要在发明专利方面继续努力。 综上分析,通过以下步骤计算得出平均警戒值Z1与Z2。1)将Z1与Z2的样本数据进行统一标准化处理,得到如表4中的标准化矩阵X*。 2)取出X*前16行作为X**1,后五行作为X2。 3)根据公式(11)以及除以样本数目便可计算出Z1 与Z2。(W与Ump已知) 最终计算结果,Z1=-0.887;Z2=0.378。该计算结果较好地验证了我们的预期。技术水平发展比较强的领头性主 体的Z值要高于平均水平。根据临界警戒值,画出如下图2所示的示意图。 图2: 当Z 利主体处于优秀状态。 4专利预警模型的实证分析 前文对电动汽车轮毂驱动技术专利预警模型进行了构建,并确定了预警警限值,为了评估专利预警模型的预警效果,验证该模型在电动汽车企业专利预警中的可行性与有效性,本文选取吉林大学为研究对象进行实证研究。由于2013年吉林大学专利数据不够全面,特选取如下表8中所示2014年至2017年四年的数据进行预警模型验证。 利用模型对上述测试数据进行标准化后,代入公式11)中计算出4年的Z值,如下表9所示。 79 (他山之石 表8:吉林大学测试数据 特征年份2014201520162017X1619114X20.0000.6674.7500.579X31.0000.4001.5830.355X42054X561682X61.6671.0001.8931.459X71.5002.2501.4743.364X80.5001.0000.2630.545表9吉林大学Z模型得分 模型得分年份Z20142015-0.7830.42320162017-0.4410.802结合我们的定义,从上表中可以看出,近四年来吉林大学在电动汽车轮毂驱动技术的研究上处于国际领先地位,其中2015和2017年处于正常状态,2014和2016年处于优秀状态。这与行业专家对吉林大学在这一技术领域的国际地位的评价是一致的,由此可以说明本文的预警模型是可行且有效的。 5 结束语 本文结合专利预警的特性,设计8个评价指标。运用主成分分析法进行预警模型评价、建立,最后以实证数据验证和评价模型的有效性,取得理想的效果。电动汽车轮毂驱动技术领域相关的企业可以基于此模型,计算自身的预警值。通过与本文给出的警限值进行比较,找到自身在电动汽车轮毂驱动技术领域的定位,并制定符合自身情况的专利发展战略。这一专利预警模型也可以进一步推广至国家主体对这一技术的预警分析。 本文建立的专利预警模型不仅可以用于对电动汽车轮毂驱动技术这一专利技术的预警分析,也可以推广至其他专利技术的预警分析,只要警限值选取合理,这一模型同样是可靠的。 虽然主成分分析法得出的预警模型较为客观,但是预警值的处理会有一些主观性;并且模型有效性的评价是一项基于多样本、长时间的过程,所以为了更为科学有效地评价预警模型的可行性和有效性,在数据采集方面可以扩大样本的选取范围,在模型验证环节可以多选取专利主体进行验证。 80 参考文献: [1]张世玉.面向医药企业的专利威胁预警模型构建及实证研究[D].长春:吉林大学,2018. [2]李臻洋,程旭辉,王洁.核电企业科研项目专利预警体系与分析评议模型研究.[C].2014年中华全国专利代理人协会年会第五届知识产权论坛,北京,2014. [3]王荣,汪张林.我国新能源汽车企业专利预警指标体系的构建研究[J].情报杂志,2016,35(11):81—[85. 4]涂文艳.基于专利计量的专利预警及实证研究 [D].武汉:武汉大学,2014. [5]李静,郭吉安.企业专利预警指标体系研究[J].图书情报工作,2009,53(4):69—74. [6]李静.基于指标体系的企业专利预警机制研究[D].重庆:重庆大学,2009. [7]陈志勋.专利预警评价体系构建及其实证研究[D].山西:山西财经大学,2010. [8]翟东升,张帆.企业专利预警指标体系研究及实例分析[J].现代情报,2011,31(5):37—40. [9]孙振嘉,张向先.面向技术创新的企业专利水平测度研究[J].情报杂志,2015,34(3):71—76. [10]赵蔷.主成分分析法综述[J].软件工程,2016[,1119](黄6)幼:陵1—,3. 代晶.企业专利预警警度评价的探讨[J].知识产权,2005,89(15):27—30. 基金项目:吉林省科技发展计划项目“电动汽车轮毂 驱动技术专利分析与预警”(项目编号:20180312038ZG) 作者简介:孙振嘉(1975—),女,副教授。研究方向:情报学理论及应用。杨肖(1993—),女,硕士,研究方向:情报学理论及应用。陈晓美(1973—),女,副教授。研究方向:情报学理论及应用。王民(1993—),男,硕士。研究方向:网络资源聚合。 (作者单位:吉林大学管理学院 )2019.10下兰台内外 因篇幅问题不能全部显示,请点此查看更多更全内容