评估企业投资潜力的方法及计算机系统与流程

文档序号:16267083发布日期:2018-12-14 21:59阅读:400来源:国知局
评估企业投资潜力的方法及计算机系统与流程

本发明是2014年06月23日申请的201410283508.7、发明创造名称『专利领先指标的建构方法及应用』的分案申请。

本发明涉及数位内容处理技术,特别指通过专利信息的运算而挖掘专利信息对企业财务信息的关连性,进而建立专利信息领先财务信息的预测方法与相关计算机系统。

【背景技术】

随着科技产业的快速发展与知识产权的倍受重视,专利已被视为产业或技术的重要指标。对权利人而言,专利已不仅仅是用来保护创新与产品的防御工具,更成为与竞争对手在产业舞台上竞争的最佳攻击武器。公司若能拥有越多的专利,在其竞争领域上就越具有代表性与影响性,因此专利便成为一项极为重要的竞争力信息。

世界知识产权组织(wipo)曾经报导,专利包含的技术内容,有80%未曾在其他论文、杂志、百科全书中揭露。专利,是研发创新的具体表现。专利数量与质量较具优势的单位,其研发创新的能量与质量亦较其他竞争者更具优势。由于专利具备法律上的排他权利,对市场具有寡占的效果。因此对于以技术研发为基础的科技型企业而言,专利数量与质量较具优势者,其产品销售及业绩亦具备相当程度的优势地位。

现有技术中,许多论文研究指出,专利的数量信息领先产品的销售额信息,对于解释市场发展状况具有领先性的效果,例如下列文献:

(1)griliches,z.(1990),patentstatisticsaseconomicindicators:asurvey,journalofeconomicliterature,28(4),pp.1661-1707.

(2)ernst,h.(1995),patentingstrategiesinthegermanmechanicalengineeringindustryandtheirrelationshiptofirmperformance,technovation,5(4),pp.225-240.

(3)adams,k.,d.kim,f.l.jolz,trost,r.p.andmastrogianis,g.(1997),modelingandforecastingu.s.patentapplicationfilings,journalofpolicymodeling,19(5),pp.491-535.

(4)ernsth.(1997),theuseofpatentdatafortechnologicalforecasting:thediffusionofcnc-technologyinmachinetoolindustry,smallbusinesseconomics,9(4),pp.361-381.

(5)ernsth.(2001),patentapplicationsandsubsequentchangesofperformance:evidencefromtime-seriescross-sectionanalysesonthefirmlevel,researchpolicy,30(1),pp.143-157.

上述现有技术指出专利信息相较于其他市场信息更显重要、更值得关注,因此以专利信息预测市场信息的方法,便逐渐成为投资与企业评价里一个重要的研究课题。

现有技术中,美国专利us6175824与us6832171首次提出以专利信息对上市公司财务表现进行评估。美国专利us6175824与us6832171针对上市公司专利数较多的科技股,通过多元回归分析模型,分析上市公司历年专利指标(pi)与历年财务指标(fi)的关连性,最后导出以专利指标(pi)为基础的评估方程式,以此评估方程式计算出其科技价值,再以此创新价值比较其市净率(market-to-bookratio),若科技价值大于市净率则视为有投资潜力,若科技价值小于市净率则视为无投资价值,藉此作为投资选股的工具。其专利权人chiresearch更将此基于专利信息的评估方程式推向大众,据此建立其专属的商业营利模式。

现有技术us6175824与us6832171有其独特性,但缺点在于其分析专利指标(pi)与财务指标(fi)的方程式是典型的多元回归分析模型,自变量是一个时间序列的专利指标(pi),因变量是相同时间序列的财务指标(fi)。因此建立的多元回归方程式,当输入某个时间点的专利指标(pi)时,得到的输出结果是该时间点相应的财务指标(fi),而不是”未来”的财务指标(fi)。

现有技术中,美国专利us6556992、us7657476与us7716226,以专利的维持率为基础,再搭配其他专利指标(pi),以多元回归分析模型发展出另一套对上市公司创新能力的评估方法,并依此挑选了300个美国上市公司做为样本股,经过加权计算后,发布全球第一个专利指数(ot300patentindex)。然而us6556992、us7657476与us7716226所使用的多元回归分析模型,其自变量专利指标(pi)与因变量财务指标(fi)都是属于相同时间序列,虽然其自变量不同于现有技术us6175824与us6832171,但其建立的多元回归方程式,当输入某个时间点的专利指标(pi)时,得到的输出结果仍然是该时间点相应的财务指标(fi),而不是”未来”的财务指标(fi)。

我们必须理解,投资选股的实务操作,投资机构在投资时,并非希望当下就获利,而是希望在未来的某个时间点套现时才获利。也就是说,投资机构在投资时,希望掌握的当下信息对”未来”的获利有”预测”的效果,才能降低投资风险,确保投资效益。上述现有技术us6175824、us6832171、us6556992、us7657476与us7716226在实质上起不到”预测”的效果。

另方面,上述现有技术us6175824、us6832171、us6556992、us7657476与us7716226都是基于美国发明授权专利信息所具有的信息与指标建立模型。其中us6175824与us6832171使用的最核心专利指标(pi)为新颖性(novely)审查与创造性/非显而易见性(nonobviousness)审查所使用的专利引文与非专利文献的引文,包括前引文(backwardcitation)与后引文(forwardcitation);us6556992、us7657476与us7716226使用的最核心专利指标(pi)为发明授权专利的维持率。然而,美国专利并没有实用新型制度,但对中国大陆的广大专利信息而言,无须实体审查程序的实用新型专利较多,发明专利较少;对发明专利而言,通过实体审查的授权专利较少,早期公开专利较多。又对发明授权专利而言,专利数据库所发布的引文信息是最近几年的授权专利才逐渐开始披露,并未充分回溯到先前的已授权专利;又对引文信息而言,目前仅有前引文,即专利实体(pe)审查时所采用的对比文件,但并未公开后引文,即专利授权后将其作为对比文件而审查的其他专利。所以现有技术us6175824、us6832171、us6556992、us7657476与us7716226其揭露的内容与方法,不适用中国大陆的专利信息,故无法对中国大陆的上市公司的财务信息进行评估。

缘此,针对中国大陆的上市公司的财务数据及其在中国大陆的专利信息,若有具备”预测”效果的关连性模型及实现此关连性模型的计算机系统,不但有助于专利信息分析与利用的技术实力发展,更能促进投资领域的投资方法的正面发展,且对产业技术的研发与创新起到积极的支持效果。



技术实现要素:

基于改善上述现有技术中的缺陷,本发明主要目的是提供一种专利领先指标的建构方法(100),专利领先指标(172)用以预测专利实体(pe)的财务信息,且专利领先指标(172)的信息领先专利实体(pe)的财务指标(fi)的信息有一个预先设定的时间领先期(l),专利领先指标的建构方法(100)包括:

(1)设定多个专利实体(pe)以及用以描述各专利实体(pe)的多个专利指标(pi)与财务指标(fi),各专利指标(pi)由各专利实体(pe)的专利信息运算而得。

(2)设定数据收集期(121),数据收集期(121)由时间区间(t)与时间期数(n)所构成,时间期数(n)为不小于二的整数;

(3)收集各专利实体(pe)在数据收集期(121)内,各时间区间(t)所相应的专利指标数据(131)与财务指标数据(132);

(4)将多个专利实体(pe)的多个专利指标数据(131)与多个财务指标数据(132)组成第一面板数据(141);

(5)将第一面板数据(141)通过转换运算程序(152)而形成正态分布化、且标准分数化的第二面板数据(151);

(6)设定时间领先期(l)及提供基于时间领先期(l)的第一时间序列运算程序(161),时间领先期(l)包含至少一个时间区间(t),第一时间序列运算程序(161)的自变量为第二面板数据(151)的一个专利指标数据(131),第一时间序列运算程序(161)的因变量为第二面板数据(151)的财务指标数据(132);

(7)设定第一阈值(171),通过第一时间序列运算程序(161)及时间领先期(l),运算第二面板数据(151),从多个专利指标(pi)中筛选得出符合第一阈值(171)的至少一个专利领先指标(172)。

本发明所提出的专利领先指标的建构方法(100)客观且严谨,不仅特别适合中国大陆专利信息,包括发明公开专利、发明授权专利、实用新型专利、及外观设计专利;亦同时适合针对其他各国专利信息,挖掘出具有领先企业财务信息的专利领先指标(172)。

本发明的又一目的是提供一种专利领先方程式的建构方法(500),专利领先方程式(501)用以预测专利实体(pe)的财务信息,专利领先方程式(501)生成一个专利领先分数(502),专利领先分数(502)领先专利实体(pe)的财务信息有一个预先设定的时间领先期(l)。专利领先方程式(501)的建构方法(500)包括:

(1)获取第二面板数据(151)与多个专利领先指标(172),第二面板数据(151)与多个专利领先指标(172)是由前述的专利领先指标的建构方法(100)所获得。

(2)基于多个专利领先指标(172),从第二面板数据(151)筛选形成第三面板数据(521);

(3)提供基于时间领先期(l)的第二时间序列运算程序(531),第二时间序列运算程序(531)的自变量为第三面板数据(521)的多个专利领先指标(172),第二时间序列运算程序(531)的因变量为第二面板数据(151)的财务指标(fi);

(4)设定第二阈值(541),通过第二时间序列运算程序(531)及时间领先期(l),运算第三面板数据(521),从多个专利领先指标(172)中筛选得出符合第二阈值(541)的多个专利核心指标(542)并生成专利领先方程式(501),专利领先方程式(501)实质上由多个专利核心指标(542)及其相应的权重系数(543)所组成。

本发明的另一目的是提供一种评估企业投资潜力的方法(600),包括:

(1)收集多个企业(611)的专利信息(612);

(2)提供一个专利领先方程式(501),专利领先方程式(501)由前述专利领先方程式的建构方法(500)所获得,专利领先方程式(501)实质上由多个专利核心指标(542)及其相应的权重系数(543)所组成;

(3)基于各企业(611)的专利信息(612)计算各企业相应的专利核心指标(542)的数据(631);

(4)基于各企业(611)的专利核心指标(542)的数据(631),通过领先方程式(501)计算而生成各企业(611)的专利领先分数(502);

(5)通过一个排序程序(651)将各企业(611)的专利领先分数(502)进行排序,排序结果(652)即代表企业(611)的投资潜力。

上述专利领先分数(502)愈高者,代表企业在时间领先期(l)以后所相应的财务指标(fi)的数据愈高;专利领先分数(502)愈低者,代表企业在时间领先期(l)以后所相应的财务指标(fi)的数值愈低。由于企业财务指标(fi)的数据高低直接表达其经营绩效的好坏,财务指标(fi)的数值愈高者,企业经营绩效愈好,愈具有投资价值。由于专利领先分数(502)代表企业在时间领先期(l)以后所相应的财务指标(fi)的数值,故由企业所具有的专利领先分数(502)的高低排名,便能够从其中挑选出具有投资潜力的对象。

本发明的再一目的是提供一种评估企业投资潜力的计算机系统(700),包括专利信息采集装置(710)、指标计算装置(720)、专利领先分数计算装置(730)、及分数排序装置(740)。其中,专利信息采集装置(710)收集多个企业的专利信息(612);指标计算装置(720)基于各企业的专利信息(612)计算,生成企业相应的专利核心指标(542)的数据(631);专利领先分数计算装置(730)根据各企业的专利核心指标(542)的数据(631),通过专利领先方程式(501)计算而生成各企业的专利领先分数(502),专利领先方程式(501)由前述的专利领先方程式的建构方法(500)所获得,专利领先方程式(501)实质上由多个专利核心指标(542)及其相应的权重系数(543)所组成;分数排序装置(740)将多个专利领先分数(502)进行排序,排序结果(652)即代表多个企业的投资潜力。

本发明所提出的评估企业投资潜力的方法(600)与计算机系统(700),是基于大数据、客观运算、严谨验证的成果,不但有助于专利信息分析与利用的技术实力发展,更能促进投资领域的投资方法的正面发展,且对产业技术的研发与创新起到积极的支持效果。

其他有关本发明的具体技术特徵与非显而易见的突出效果,将于以下章节详细说明。

【附图说明】

图1为本发明提出的第一较佳实施例,为一种专利领先指标的建构方法(100)的流程图;

图2为上海交易所上市公司分析母体的数量与产业分布;

图3为上海交易所上市公司分析样本的产业分布;

图4为第一面板数据(141)的示意图;

图5为领先期为一年的专利领先指标(172);

图6为领先期为二年的专利领先指标(172);

图7为领先期为三年的专利领先指标(172);

图8为领先期为四年的专利领先指标(172);

图9为本发明提出的第二较佳实施例,为一种专利领先方程式的建构方法(500)的流程图。

图10a、图10b、图10c为本发明提出的第二较佳实施例中,专利核心指标(542)的生成过程。

图11为本发明提出的第三较佳实施例,为一种评估企业投资潜力的方法(600)的流程图。

图12为本发明提出的第四较佳实施例,为一种评估企业投资潜力的计算机系统(700)的架构示意图。

【具体实施方式】

本发明主要披露一种专利领先指标的建构方法(100)及应用,其中所涉及的专利信息、专利指标(pi)、财务指标(fi)等的基本知识,已为相关技术领域具有通常知识者所能理解,故以下文中之说明,不再作完整描述。同时,以下文中所对照之图式,仅表达与本发明特征有关的示意,并未亦不需要依据实际尺寸完整绘制,在先说明。

请参考图1,为本发明提出之第一较佳实施例,为一种专利领先指标的建构方法(100),专利领先指标(172)用以预测专利实体(pe)的财务信息,且专利领先指标(172)的信息领先专利实体(pe)的财务指标(fi)的信息有一个预先设定的时间领先期(l),专利领先指标的建构方法(100)包括:

步骤110:设定多个专利实体(pe)以及用以描述各专利实体(pe)的多个专利指标(pi)与财务指标(fi),各专利指标(pi)由各专利实体(pe)的专利信息运算而得。

步骤120:设定数据收集期(121),数据收集期(121)由时间区间(t)与时间期数(n)所构成,时间期数(n)为不小于二的整数。

步骤130:收集各专利实体(pe)在数据收集期(121)内,各时间区间(t)所相应的专利指标数据(131)与财务指标数据(132)。

步骤140:将多个专利实体(pe)的多个专利指标数据(131)与多个财务指标数据(132)组成第一面板数据(141)。

步骤150:将第一面板数据(141)通过转换运算程序(152)而形成正态分布化、且标准分数化的第二面板数据(151)。

步骤160:设定时间领先期(l)及提供基于时间领先期(l)的第一时间序列运算程序(161),此时间领先期(l)包含至少一个时间区间(t),第一时间序列运算程序(161)的自变量为第二面板数据(151)的一个专利指标(pi)的专利指标数据(131),第一时间序列运算程序(161)的因变量为第二面板数据(151)的财务指标(fi)的财务指标数据(132)。

步骤170:设定第一阈值(171),逐次使用第一时间序列运算程序(161)及时间领先期(l),运算第二面板数据(151),从多个专利指标(pi)中筛选得出符合第一阈值(171)的至少一个专利领先指标(172)。

上述步骤110中,专利实体(pe)为拥有专利权、且能通过专利权运营获利的权利主体,优选为公开发行的上市公司,但并不以上市公司为限;本实施例亦适用于非上市公司,只要能接受外部资金进入,分享股权与股权收益的权利主体,皆属本实施例的适用范围。又,第一较佳实施例所针对的专利,并不限定是授权专利,只要是在专利数据库内公布的专利皆可,包括发明公开专利、发明授权专利、实用新型专利、外观设计专利等。同时,第一较佳实施例所提出的方法除了可以有效解决中国大陆专利的信息内容不同于美国专利的问题,其实更可以适用于全球各地区专利。

在专利指标(pi)方面,以中国大陆的专利为例,专利指标(pi)包括但不限于以下各项可以被计算机自动运算的数量指标,如:

p1:专利总数

p2:发明公开专利总数

p3:实用新型专利总数

p4:外观设计专利总数

p5:发明授权专利总数

p6:发明公开专利平均专利寿命

p7:实用新型专利平均专利寿命

p8:外观设计专利平均专利寿命

p9:发明授权专利平均专利寿命

p10:发明授权专利平均审查期

p11:当期的发明公开专利数

p12:当期的实用新型专利数

p13:当期的外观设计专利数

p14:当期的发明授权专利数

p15:当期的发明授权专利平均审查期,自申请日起至授权公告日止

p16:当期的发明公开专利ipc分类号总数

p17:当期的实用新型专利ipc分类号总数

p18:当期的发明授权专利ipc分类号总数

p19:当期的发明公开专利ipc分类号平均数

p20:当期的实用新型专利ipc分类号平均数

p21:当期的发明授权专利ipc分类号平均数

p22:当期的发明公开专利说明书总页数

p23:当期的实用新型专利说明书总页数

p24:当期的发明授权专利说明书总页数

p25:当期的发明公开专利说明书平均页数

p26:当期的实用新型专利说明书平均页数

p27:当期的发明授权专利说明书平均页数

p28:当期的发明公开专利的权利要求总数

p29:当期的实用新型专利的权利要求总数

p30:当期的发明授权专利的权利要求总数

p31:当期的发明公开专利的权利要求平均数

p32:当期的实用新型专利的权利要求平均数

p33:当期的发明授权专利的权利要求平均数

p34:当期的发明公开专利的独权总数

p35:当期的实用新型专利的独权总数

p36:当期的发明授权专利的独权总数

p37:当期的发明公开专利的独权平均数

p38:当期的实用新型专利的独权平均数

p39:当期的发明授权专利的独权平均数

p40:当期的发明公开专利说明书的附图张数

p41:当期的实用新型专利说明书的附图张数

p42:当期的发明授权专利说明书的附图张数

p43:当期的发明公开专利说明书的附图平均数

p44:当期的实用新型专利说明书的附图平均数

p45:当期的发明授权专利说明书的附图平均数

上述专利指标(pi)中,”当期”指的是把专利指标(pi)的数据运算限制在某个特定时间区间(t)内,举例,若时间区间(t)为年,p11(当期的发明公开专利数)则代表某个年度内1~12月之内所有公开的发明专利数;p15(当期的发明授权专利平均审查期,自申请日起至授权公告日止)则代表某个年度内1~12月之内所有公告的发明授权专利的平均审查期。若时间区间(t)为季,p11(当期的发明公开专利数)则代表某个季度内3个月之内所有公开的发明专利数;p15(当期的发明授权专利平均审查期,自申请日起至授权公告日止)则代表某个季度内3个月之内所有公告的发明授权专利的平均审查期。馀此类推。

上述45个专利指标(pi),可以再区分为发明公开专利类、发明授权专利类、实用新型专利类与外观设计专利类,其中用以描述发明公开专利的指标有:

p2:发明公开专利总数

p6:发明公开专利平均专利寿命

p11:当期的发明公开专利数

p16:当期的发明公开专利ipc分类号总数

p19:当期的发明公开专利ipc分类号平均数

p22:当期的发明公开专利说明书总页数

p25:当期的发明公开专利说明书平均页数

p28:当期的发明公开专利的权利要求总数

p31:当期的发明公开专利的权利要求平均数

p34:当期的发明公开专利的独权总数

p37:当期的发明公开专利的独权平均数

p40:当期的发明公开专利说明书的附图张数

p43:当期的发明公开专利说明书的附图平均数

用以描述发明授权专利的指标有:

p5:发明授权专利总数

p9:发明授权专利平均专利寿命

p10:发明授权专利平均审查期

p14:当期的发明授权专利数

p15:当期的发明授权专利平均审查期,自申请日起至授权公告日止

p18:当期的发明授权专利ipc分类号总数

p21:当期的发明授权专利ipc分类号平均数

p24:当期的发明授权专利说明书总页数

p27:当期的发明授权专利说明书平均页数

p30:当期的发明授权专利的权利要求总数

p33:当期的发明授权专利的权利要求平均数

p36:当期的发明授权专利的独权总数

p39:当期的发明授权专利的独权平均数

p42:当期的发明授权专利说明书的附图张数

p45:当期的发明授权专利说明书的附图平均数

其中用以描述实用新型专利的指标有

p3:实用新型专利总数

p7:实用新型专利平均专利寿命

p12:当期的实用新型专利数

p17:当期的实用新型专利ipc分类号总数

p20:当期的实用新型专利ipc分类号平均数

p23:当期的实用新型专利说明书总页数

p26:当期的实用新型专利说明书平均页数

p29:当期的实用新型专利的权利要求总数

p32:当期的实用新型专利的权利要求平均数

p35:当期的实用新型专利的独权总数

p38:当期的实用新型专利的独权平均数

p41:当期的实用新型专利说明书的附图张数

p44:当期的实用新型专利说明书的附图平均数

用以描述外观设计专利的指标有

p4:外观设计专利总数

p8:外观设计专利平均专利寿命

p13:当期的外观设计专利数

上述p1至p45的专利指标(pi)为描述中国大陆专利各项特质最充分的数量指标,至于其中哪些专利指标(pi)才具有预测财务信息的效果,需要通过严谨的分析与验证,其为本发明的核心所在,后续篇幅内会继续说明。

在财务指标(fi)方面,本发明所使用的是指表达企业经营绩效的指标,可以是偿债能力指标、运营能力指标、获利能力指标、发展能力指标、以及股价指标等,本发明并未加以设限。其中获利能力指标可以是净资产收益率roe(rateofreturnoncommonshareholder’sequity)、资产报酬率roa(rateofreturnonassets)、每股收益eps(earningspershare)、市净率mtb(market-to-bookratio)等。

上述步骤120中,时间区间(t)的单位可以是周、月、季、半年、或年等。设定时间期数(n)与时间区间(t)是为了收集足够的样本数据,以便建立模型与验证之用。假如时间期数(n)设定为5,时间区间(t)设定为年,数据收集期(121)即为5年,后续便需要收集5年的样本数据;假如时间期数(n)设定为6,时间区间(t)设定为月,数据收集期(121)即为6个月,后续便需要收集6个月的样本数据。由于本发明提出的是预测模型,亦即要以前一期的数据预测本期的数据,或是以本期的数据预测下一期的数据,因此,时间期数(n)至少需为2期,才能验证预测结果的显著性。

上述步骤130中:若数据收集期(121)为2008年至2012年这5年,时间区间(t)为一年,时间期数(n)为5,则必须收集各个专利实体(pe)在2008年至2012年这5年中,每个年份的所有专利指标(pi)的专利指标数据(131)与财务指标(fi)的财务指标数据(132)。

在步骤140中,所谓面板数据,又称为平行数据或综列数据,是时间序列数据与横截面数据的混合,指m个横截面被观测对象在时间期数(n)的数据集,一共有m×n个数据集。以本实施例为例,假如有375个专利实体(pe),数据收集期(121)为5年,即2008年至2012年,时间区间(t)为年,此时便形成375个横截面被观测对象,在5个时间年份(2008、2009、2010、2011、2012)的45个专利指标(pi)与财务指标(fi)的数据集。

传统的时间序列数据,是用来分析单一的被观测对象在多个时间的观测值(自变量与因变量)的关连。传统的横截面数据,是用来分析多个被观测对象在单一时点的观测值(自变量与因变量)的关连。这两种数据都不适用于本发明提出的方法,因为本发明有多个被观测对象、且有多个时间点,每个时间点又有多个自变量与因变量。而面板数据,是用来分析多个特定的横截面被观测对象在多个时间点的观测值的关连性,由于观测值的增多,可以增加估计量的抽样精度、得到更多的一致估计量与有效估计量、且获得更多的动态信息,故本发明采用面板数据进行分析。

本实施例中,步骤140与步骤150之间,可以进一步包含一个正态分布(normaldistribution)检验程序(145),对收集到的各个专利指标数据(131)与各个财务指标数据(132),检验其正态分布的状态。因为数据倘若未呈现正态分布,在建立分析模型的过程中,常因误差过高不收敛而导致模型崩溃。因此,对于未呈现正态分布的数据,必须施以适当的转换运算,先将其转换为正态分布的状态,再进行自变量与因变量的分析。

正态分布检验程序(145)常用的有下列几种:anderson-darling检验程序、ryan-joiner检验程序、kolmogorov-smirnov检验程序等,或是可以更简易的观察偏度系数与峰度系数即能推论数据的正态分布状况,本发明并不限制采用何种检验程序。对于不符合正态分布的数据,需要施以加工运算以生成正态分布的数据,其中,box-cox转换程序是常用的方式,本发明亦不以此为限。必须强调的是,倘若原始数据基本上已经大致呈现正态分布,就不需要再施以加工运算了。

上述步骤150进一步说明如下,正态分布的分布曲线基本上是一个中心线在期望值(平均值)而左右对称、以标准差为单位而向两侧延伸展开的曲线。当两种数据集的平均值与标准差都大不相同,即使这两种数据集都呈正态分布,但尺度差距会非常大,不利于分析比较。因此在建立模型的过程中,较佳地,要将正态分布的数据通过一个转换运算程序(152)再做一次处理,将数据做正规化(normalization)转换。其中较常使用的转换运算程序(152)为”z分数”运算。通过”z分数”运算后的数据集,其期望值(平均值)都为0,标准差都为1。若所有的自变量与因变量的数据集都转换成为正态分布且标准分数化的数据集后,更容易从其中挖掘出关连性。

本实施例的第一面板数据(141),在步骤150中,经过转换运算程序(152)后,转换为正态分布化且标准分数化的第二面板数据(151)。

在步骤160中,第一时间序列运算程序(161)优选为一元的格兰杰因果检验模型(grangercausalitytestmodel)。格兰杰因果检验模型是2003年诺贝尔经济学奖得主克莱夫格兰杰(clivew.j.granger)所开创,用于分析时间序列的经济变量间的领先与落后关系。其基本观念是,倘若有两个变量x与y,变量x发生在先,变量y发生在后,且通过格兰杰因果检验模型后,验证成立变量x对变量y的发生概率有显著性的影响,则称变量x领先于变量y,或称变量x为变量y的领先指标。格兰杰因果检验模型处理的经济变量中,其自变量与因变量都是时间序列的变量,其基础运算模型是回归分析模型,但是在回归分析之前,先对自变量或因变量设定一段时间的偏移量,即设定领先期或落后期,再检视具有领先期或落后期的回归分析模型配适度,以验证自变量的领先效果或落后效果。

格兰杰因果检验模型的模型配适度常用f检验所得到的p_value,一般p_value<0.1,为模型可接受;若p_value<0.05,为模型良好;若p_value<0.005,为模型极佳。简单说,若自变量为x,因变量为y,且经由格兰杰因果检验模型后得到的p_value<0.05,则表示在百分之九十五的置信区间内,自变量x对于因变量为y,具有领先效果。格兰杰因果检验模型另一个常用的模型配适度是r平方值,r平方值介于0至1之间,愈接近1愈好,愈接近0愈差;以1为最佳,表示模型完美,毫无误差;以0为最差,表示误差无限大。

格兰杰因果检验模型中,并不限定表示自变量的个数。亦即,格兰杰因果检验模型可以分析一个自变量对一个因变量的领先效果,此时称一元的格兰杰因果检验模型,如步骤160;也可以同时分析多个自变量对一个因变量的领先效果,此时称多元的格兰杰因果检验模型。但我们必须理解,若多个自变量间存在严重的共线性,或自变量的数据离散性过高,多元的格兰杰因果检验模型往往在运算过程中崩溃。是故,在步骤160中,较佳地,是先将个别的专利指标(pi)的专利指标数据(131)对个别的财务指标(fi)的财务指标数据(132)施以一元的格兰杰因果检验模型运算,才能在步骤170中,从45个专利指标(pi)中挖掘出领先效果具有显著性的个别的专利指标(pi),称为专利领先指标(172),而排除其他领先效果不具有显著性的专利指标(pi),此时挖掘出的每一个专利领先指标(172)对财务指标(fi)的领先效果都具有显著性。

在步骤170中,第一阈值(171)的设定是关键的,第一阈值(171)设定的太严格,可能无法挖掘出具有显著性的专利领先指标(172);第一阈值(171)设定的太宽松,可能太多显著性不足的专利指标(pi)也被误认为专利领先指标(172)而挖掘出来。如果第一时间序列运算程序(161)采取一元的格兰杰因果检验模型,如前述,模型配适度常用f检验所得到的p_value,一般p_value<0.1,为模型可接受,达到90%的置信区间;若p_value<0.05,为模型良好,达到95%的置信区间;若p_value<0.005,为模型极佳,达到99.5%的置信区间。此时我们可以便先设定第一阈值(171)为0.1,先初步了解能挖掘出多少专利领先指标(172)达到90%的置信区间,如果数量不多,设定第一阈值(171)为0.1即可;如果数量很多,可再设定第一阈值(171)为0.05或0.005,即可挖掘出关键的、领先效果具有极佳显著性的专利领先指标(172)。

在第一阈值(171)设定在0.05的情况下,当挖掘出专利领先指标(172)以后,假如步骤160中设定的时间领先期(l)是一年,观察每个专利实体(pe)其专利领先指标(172)在今年的数值,便可以作为专利实体(pe)在明年的财务指标数值的预测结果,且可以达到95%的置信区间。如果第一阈值(171)设定在0.005,而步骤160中设定的时间领先期(l)是三年,当挖掘出专利领先指标(172)以后,观察每个专利实体(pe)其专利领先指标(172)在今年的数值,便可以作为专利实体(pe)在三年后的财务指标数据的预测结果,且可以达到99.5%的置信区间。

以下将以上海交易所的上市公司为专利实体(pe),进一步详述第一较佳实施例的实施过程。

上海交易所截至2012年底止,共有951家上市公司,专利实体(pe)的母体为951个,其行业分布及所占比例如图2所示。

本发明是建立专利指标(pi)对财务指标(fi)的领先性的预测模型,因此必须考虑上市公司的子公司结构。倘若子公司的财务合并到母公司一并计算,子公司的专利指标(pi)亦必须合并到母公司一并计算。所以,951个上市公司都必须调查其子公司结构。经过调查后,我们发现,951个上市公司中,其子公司数量平均值为13.6,中位数为9.0。由子公司平均值与中位数的差异,便可得知大部分上市公司所拥有的子公司估计在10个以下,但其中有少数上市公司具有非常大量的子公司,因此拉高了平均值。经过调查,拥有最多子公司的上市公司,它有高达174个子公司。

在上市公司的财务指标(fi)方面,我们初步挑选净资产收益率roe(rateofreturnoncommonshareholder’sequity)作为代表,进行后续的分析。在专利指标(pi)方面,我们采用前述的p1~p45等45个专利指标(pi)。

在有效样本的挑选方面,我们设定从2008年到2012年这五年间的财务指标(fi)都必须有数据,且2012年底止具有至少50件专利总数(包括发明公开、发明授权、实用新型、外观设计等加总),951个上市公司经过筛选而符合条件的最后得到375个,即专利实体(pe)的样本为375个,其行业分布及所占比例如图3所示。

将375个专利实体(pe)收集其2008年至2012年的45个专利指标(pi)的数据(131)及财务指标(fi)的数据(132)后,组成第一面板数据(141),以便进行后续的分析。

请参考图4,为本发明375个专利实体(pe),在5个时间年份(2008、2009、2010、2011、2012)的45个专利指标(pi)的专利指标数据(131)与财务指标(fi)的财务指标数据(132)所构成第一面板数据(141)的一部分内容。

生成第一面板数据(141)后,必须对其中的数据,不论是作为自变量的数据或作为因变量的数据,分析其数据分布状况,检查是否符合正态分布。只有符合正态分布的数据,才容易建立自变量与因变量的关系模型,否则极可能因误差太大导致模型崩溃。

通过kolmogorov-smirnov检验程序,我们发现第一面板数据(141)中,财务指标(fi)的财务指标数据(132)基本上大致呈现正态分布,而每一个专利指标(pi)的专利指标数据(131)都不呈现正态分布。因此,我们对每一个专利指标(pi)的专利指标数据(131)又施以box-cox转换程序使其大致呈现正态分布。

接著,我们对所有常态分布化的专利指标(pi)的专利指标数据(131)与财务指标(fi)的财务指标数据(132),又再施以z分数转换运算程序(152),使各数据的期望值(平均值)都为0,标准差都为1。此时第一面板数据(141)都转换为正态分布化且标准分数化的第二面板数据(151)。

在第二面板数据(151)中,自变量为375个专利实体(pe)在5年度的45个专利指标(pi),因变量为375个专利实体(pe)在5年度的财务指标(fi):roe,接著我们使用一元格兰杰因果检验模型(grangercausalitytestmodel)依次来检验每个自变量对因变量的领先关系。

格兰杰因果检验模型(grangercausalitytestmodel)中很重要的一个参数是时间领先期(l)的设定。本实施例中,我们分别设定时间领先期(l)为1年、2年、3年、4年,来观察专利指标(pi)对财务指标(fi)的领先关系。

当设定的时间领先期(l)为1年时,使用的自变量为2008、2009、2010、2011这四年的专利指标(pi);相应的因变量为2009、2010、2011、2012这四年的财务指标(fi)。其中,2008年的专利指标(pi)是配对至2009的财务指标(fi),2009年的专利指标(pi)是配对至2010的财务指标(fi),2010年的专利指标(pi)是配对至2011的财务指标(fi),2011年的专利指标(pi)是配对至2012的财务指标(fi),如此才能验证专利指标(pi)对财务指标(fi)领先效果的显著性。此时第二面板数据(151)中,有375×4=1500个数据可以使用。

当设定的时间领先期(l)为2年时,使用的自变量为2008、2009、2010这三年的专利指标(pi);相应的因变量分别为2010、2011、2012这三年的财务指标(fi),此时第二面板数据(151)中,有375×3=1125个数据可以使用。

当设定的时间领先期(l)为3年时,使用的自变量为2008、2009这二年的专利指标(pi);相应的因变量分别为2011、2012这二年的财务指标(fi),此时第二面板数据(151)中,有375×2=750个数据可以使用。

当设定的时间领先期(l)为4年时,使用的自变量为2008年的专利指标(pi);相应的因变量为2012年的财务指标(fi),此时第二面板数据(151)中,仅有375个数据可以使用。

第一时间序列运算程序(161)我们使用一元的格兰杰因果检验模型(grangercausalitytestmodel),模型配适度我们使用f检验,模型配适度p_value采用三种第一阈值(171):

(1)p_value<0.1,自变量专利指标(pi)对因变量财务指标(fi)的领先关系具有可接受的显著性,达90%的置信区间;

(2)p_value<0.05,自变量专利指标(pi)对因变量财务指标(fi)的领先关系具有良好的显著性,达95%的置信区间;

(3)p_value<0.005,自变量专利指标(pi)对因变量财务指标(fi)的领先关系具有极佳的显著性,达99.5%的置信区间。

将第二面板数据(151)通过一元格兰杰因果检验模型的运算后,我们成功发现其中确实有某些专利指标(pi)对财务指标(fi)的领先性具有显著性,称为专利领先指标(172)。图5至图8分别为领先期为一年、二年、三年、四年且具有显著性的专利领先指标(172),图中*代表p-value<0.1;**代表p-value<0.05;***代表p-value<0.005。

图5至图8提供一个很好的预测功能,若我们比较关注一年以后的投资绩效,则观察图5所示领先期为一年的专利领先指标(172)的数值变化即可;若我们比较关注两年之后的投资绩效,则观察图6所示领先期为二年的专利领先指标(172)的数值变化;若关注三年或四年的投资绩效,则分别观察图7或图8所示的专利领先指标(172)的数值变化即可。

假如我们更关心其中最核心的、同时领先一年、二年、三年、四年的专利领先指标(172),则找出同时出现在图5至图8的专利领先指标(172)即可。如底下5个专利领先指标(172),就是同时在领先一年、领先二年、领先三年与领先四年都具有显著性者。

p12(当期的实用新型专利数)

p23(当期的实用新型专利说明书总页数)

p29(当期的实用新型专利的权利要求总数)

p35(当期的实用新型专利的独权总数)

p41(当期的实用新型专利说明书的附图张数)

p12、p23、p29、p35、p41这五个专利领先指标(172)都属于实用新型类的专利指标(pi),原因在于上海交易所的上市公司以制造业(行业代码c)为最多,而收录至本实施例的有效样本375个专利实体(pe)中亦以制造业为最多,而制造业的专利以往又以实用新型占大部分,因此实用新型类的专利指标(pi)的便自然容易在预测模型的建立过程中脱颖而出。而这个结果亦同时透露另一个信息:即使许多专家认为实用新型专利的创新程度较低、价值不高,但是对于上交所的上市公司而言,却是预测其财务指标(fi)的表现具有显著性的预测工具。

在此必须强调,当建立模型的有效样本,即专利实体(pe)改变时,最后脱颖而出的专利领先指标(172)就会根据样本特性而发生改变。例如,当建立模型的有效样本采用深圳交易所的上市公司,脱颖而出的专利领先指标(172)必然有部分不同于以上海交易所上市公司为样本所挖掘出的专利领先指标(172)。也就是因为专利领先指标(172)会根据样本特性而发生改变,本发明第一较佳实施例所提出的方法,更具有普适性,适用于各种样本群体。我们可以以信息产业上市公司为样本群体,挖掘适用于信息产业上市公司的专利领先指标(172);也可以针对生物医药产业上市公司为样本群体,挖掘适用于生物医药产业上市公司的专利领先指标(172);更可以针对材料化工产业上市公司,单独挖掘适用于材料化工产业上市公司的专利领先指标(172)。

上述以上海交易所的上市公司为专利实体(pe)所做的说明与验证,财务指标(fi)采用的是股东权益报酬率roe,然而我们必须强调,股东权益报酬率roe仅是为了方便说明,第一较佳实施例的方法适用各种现行的财务指标(fi)。

请参考图9,为本发明提出之第二较佳实施例,为一种专利领先方程式的建构方法(500),这个专利领先方程式(501)用以预测专利实体(pe)的财务信息。专利领先方程式(501)能够生成一个专利领先分数(502),专利领先分数(502)领先专利实体(pe)的财务信息有一个预先设定的时间领先期(l)。这个专利领先方程式的建构方法(500)的步骤包括:

步骤510:根据第一较佳实施例所述的专利领先指标的建构方法(100),获取第二面板数据(151)与多个专利领先指标(172)。

步骤520:基于多个专利领先指标(172),从第二面板数据(151)筛选形成第三面板数据(521)。

步骤530:提供基于时间领先期(l)的第二时间序列运算程序(531),第二时间序列运算程序(531)的自变量为第三面板数据(521)的所有专利领先指标(172),第二时间序列运算程序(531)的因变量为第三面板数据(521)的财务指标(fi)。

步骤540:设定第二阈值(541),通过第二时间序列运算程序(531)及时间领先期(l),运算第三面板数据(521),从多个专利领先指标(172)中筛选得出符合第二阈值(541)的多个专利核心指标(542)并生成专利领先方程式(501),专利领先方程式(501)实质上由多个专利核心指标(542)及其相应的权重系数(543)所组成。

第二较佳实施例的主要目的是针对有多个专利领先指标(172)的情况,将多个专利领先指标(172)组合为一条专利领先方程式(501),藉此用来预测企业的财务表现,将更为快速、便利。把专利实体(pe)的专利核心指标(542)所具有的数据值输入专利领先方程式(501),生成专利领先分数(502)。专利领先分数(502)愈高者,代表专利实体(pe)在时间领先期(l)以后所相应的财务指标(fi)的数值愈高;专利领先分数(502)愈低者,代表专利实体(pe)在时间领先期(l)以后所相应的财务指标(fi)的数值愈低。由于企业财务指标(fi)的高低直接表达其经营绩效的好坏,财务指标(fi)的数值愈高者,企业经营绩效愈好,愈具有投资价值。由于专利领先分数(502)代表专利实体(pe)在时间领先期(l)以后所相应的财务指标(fi)的数值,故观察专利领先分数(502)的高或低,便能够从专利实体(pe)中挑选出具有投资潜力的对象。

在步骤530中,第二时间序列运算程序(531)为多元格兰杰因果检验模型,其自变量是第一较佳实施例步骤170所得到的多个专利领先指标(172),目的是将多个专利领先指标(172)组合在一起,发掘多个专利领先指标(172)组合后对财务指标(fi)的领先效果。

但此时,我们必须理解另一个重要概念,多元格兰杰因果检验模型并不是多个一元格兰杰因果检验模型生成结果的简单加总,当组合多个专利领先指标(172)时,其个别的专利领先指标(172)对财务指标(fi)的领先效果的显著性会发生变化,甚至其中某些专利领先指标(172)的领先效果会反而变得不显著。因此在步骤530中,较佳的,可以进一步操作因变量逐项删除程序。亦即,先把所有的专利领先指标(172)纳入多元格兰杰因果检验模型中的因变量,观察检验后各个专利领先指标(172)的p_value,删除显著性最差甚至不具显著性的专利领先指标(172),然后重做多元格兰杰因果检验模型,再观察检验后各个专利领先指标(172)的p_value,再删除显著性最差甚至不具显著性的专利领先指标(172),重复此过程,最终留下显着性较高的专利领先指标(172)而称为专利核心指标(542)。此时,多元格兰杰因果检验模型会整合所有专利核心指标(542)而生成专利领先方程式(501),专利领先方程式(501)实质上由多个专利核心指标(542)及其相应的权重系数(543)所组成。

我们再以图5所示领先一年的专利领先指标(172)为例说明,这些专利领先指标(172)都是用来预测专利实体(pe)的财务表现。其中有部分的专利领先指标(172)还能用来评估单一专利,作为评估单一专利的强度指标,如:

p6:发明公开专利平均专利寿命

p7:实用新型专利平均专利寿命

p9:发明授权专利平均专利寿命

p10:发明授权专利平均审查期

p15:当期的发明授权专利平均审查期,自申请日起至授权公告日止

p38:当期的实用新型专利的独权平均数

假如我们想将领先一年的p6、p7、p9、p10、p15、p38等专利领先指标(172)组成专利领先方程式(501),首先,我们将第二面板数据(151)中,375个专利实体(pe)自2008年至2012年的财务指标(fi):roe与6个专利领先指标(172):p6、p7、p9、p10、p15、p38挑选出来,组成第三面板数据(521)。

接著我们使用多元格兰杰因果检验模型,设定第二阈值(541):p_value<0.05,第一次分析的自变量为6个专利领先指标(172):p6、p7、p9、p10、p15、p38,因变量为roe,分析结果如图10a。从中可发现,每个专利领先指标(172)的领先效果显著性都改变了,而p15变得最差,p_value=0.7833。

第二次分析时,我们将p_value最差的p15剔除,自变量使用p6、p7、p9、p10、p38等5个专利领先指标(172),分析结果如图10b为。其中p9为最差,p_value=0.4188。

第三次分析时,我们将p_value最差的p9剔除,自变量使用p6、p7、p10、p38等4个专利领先指标(172),分析结果如图10c,其中每一个专利领先指标(172)都符合第二阈值(541),其p_value都小于0.05,预测模型达到95%的置信区间。图10c所示的4个专利领先指标(172),此时我们定义为专利核心指标(542)。

多元格兰杰因果检验模型的基础运算模型是多元回归分析模型,因此上述第三次分析除了挖掘出专利核心指标(542)以外,同时生成了一条组合方程式,我们称之为专利领先方程式(501),其中

专利领先方程式(501)=w6×p6+w7×p7+w10×p10+w38×p38

其中w6、w7、w10、w38分别是对应至专利核心指标(542):p6、p7、p10、p38的权重系数(543),代表其相应的专利核心指标(542)对财务指标(fi)的领先性预测的敏感度。本实施例通过实际运算,w6=0.1236、w7=0.0236、w10=0.0596、w38=0.0247,此时专利领先方程式(501)的r平方值达到0.9065,调整后r平方值达到0.8750,是很好的模型。本实施例中,w6的值最高,几乎是w38的5倍,表示p6(发明公开专利平均专利寿命)对财务指标(fi)的预测最为敏感。当p6(发明公开专利平均专利寿命)与p38(当期的实用新型专利的独权平均数)的数值都只变动一个单位的情况,p6(发明公开专利平均专利寿命)对财务指标(fi)所造成的变动量,就是p38(当期的实用新型专利的独权平均数)对财务指标(fi)所造成的变动量的5倍。

请参考图11,为本发明提出之第三较佳实施例,为一种评估企业投资潜力的方法(600),包括以下步骤:

步骤610:收集多个企业(611)的专利信息(612);

步骤620:提供一个由前述第二较佳实施例所获得的专利领先方程式(501),专利领先方程式(501)实质上由多个专利核心指标(542)及其相应的权重系数(543)所组成;

步骤630:基于各企业(611)的专利信息(612)计算各企业相应的专利核心指标(542)的数据(631);

步骤640:基于各企业(611)的专利核心指标(542)的数据(631),通过专利领先方程式(501)的计算而生成各企业(611)的专利领先分数(502);

步骤650:通过一个排序程序(651)将各企业(611)的专利领先分数(502)进行排序,排序结果(652)即代表企业(611)的投资潜力。

上述专利领先分数(502)愈高者,代表企业(611)在时间领先期(l)以后所相应的财务指标(fi)的数值愈高;专利领先分数(502)愈低者,代表企业(611)在时间领先期(l)以后所相应的财务指标(fi)的数值愈低。由于企业(611)财务指标(fi)的数值高低直接表达其经营绩效的好坏,财务指标(fi)的数值愈高者,企业经营绩效愈好,愈具有投资价值;财务指标(fi)的数值愈低者,企业经营绩效愈差,愈不具有投资价值。由于专利领先分数(502)代表企业(611)在时间领先期(l)以后所相应的财务指标(fi)的数值,故由企业(611)所具有的专利领先分数(502)的高低排名,便能够从其中挑选出具有投资潜力的对象。

请参考图12,为本发明提出之第四较佳实施例,为一种评估企业投资潜力的计算机系统(700),包括专利信息采集装置(710)、指标计算装置(720)、专利领先分数计算装置(730)、及分数排序装置(740)。

其中,专利信息采集装置(710)收集多个企业的专利信息(612)。

指标计算装置(720)基于各企业的专利信息(612)计算、并生成企业相应的专利核心指标(542)的数据(631)。

专利领先分数计算装置(730)根据各企业的专利核心指标(542)的数据(631),通过前述第二较佳实施例所获得的专利领先方程式(501),计算而生成各企业的专利领先分数(502),此专利领先方程式(501)实质上由多个专利核心指标(542)及其相应的权重系数(543)所组成。

分数排序装置(740)将多个专利领先分数(502)进行排序,排序结果(652)即代表多个企业的投资潜力的排序。

本发明所提出的评估企业投资潜力的方法(600)与计算机系统(700),是基于大数据、客观运算、严谨验证的成果,不但有助于专利信息分析与利用的技术实力发展,更能促进投资领域的投资方法的正面发展,且对产业技术的研发与创新起到积极的支持效果。

以上说明,对于相关技术领域之专门人士应可理解及实施。同时以上所述仅为本发明之较佳实施例,并非用以限定本发明之权利范围。任何基于本发明所揭示内容所完成的等同改变或修饰,均应包含在权利要求书的涵盖范围中。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1