通过计算机实现的专利大数据预测选股方法及计算机系统与流程

文档序号:13217688阅读:185来源:国知局
【技术领域】本发明涉及数位内容处理技术,特别指通过计算机实现而基于专利巨量数据的运算而挖掘专利信息对企业财务信息的关连性,进而建立以专利为核心的选股方法与计算机系统。

背景技术:
随着科技产业的快速发展与知识产权的倍受重视,专利已被视为产业或技术的重要指标。对权利人而言,专利已不仅仅是用来保护创新与产品的防御工具,更成为与竞争对手在产业舞台上竞争的最佳攻击武器。公司若能拥有越多的专利,在其竞争领域上就越具有代表性与影响性,因此专利便成为一项极为重要的竞争力信息。世界知识产权组织(WIPO)曾经报导,专利包含的技术内容,有80%未曾在其他论文、杂志、百科全书中揭露。专利,是研发创新的具体表现。专利数量与质量较具优势的单位,其研发创新的能量与质量亦较其他竞争者更具优势。由于专利具备法律上的排他权利,对市场具有寡占的效果。因此对于以技术研发为基础的科技型企业而言,专利数量与质量较具优势者,其产品销售及业绩亦具备相当程度的优势地位。现有技术中,许多学术研究指出,专利的数量信息领先产品的销售额信息,对于解释市场发展状况具有领先性的效果。因此以专利信息预测市场信息的方法,便逐渐成为投资与企业评价里一个重要的研究课题。现有技术中,美国专利US6175824与US6832171首次提出以专利信息对上市公司财务表现进行评估。美国专利US6175824与US6832171针对上市公司专利数较多的科技股,通过多元回归分析模型,分析上市公司历年专利指标(PI)与历年财务指标(FI)的关连性,最后导出以专利指标(PI)为基础的评估方程式,以此评估方程式计算出其科技价值,再以此创新价值比较其市净率(Market-to-BookRatio),若科技价值大于市净率则视为有投资潜力,若科技价值小于市净率则视为无投资价值,藉此作为投资选股的工具。其专利权人CHIResearch更将此基于专利信息的评估方程式推向大众,据此建立其专属的商业营利模式。现有技术US6175824与US6832171有其独特性,但缺点在于其分析专利指标(PI)与财务指标(FI)的方程式是典型的多元回归分析模型,自变量是一个时间序列的专利指标(PI),因变量是相同时间序列的财务指标(FI)。因此建立的多元回归方程式,当输入某个时间点的专利指标(PI)时,得到的输出结果是该时间点相应的财务指标(FI),而不是”未来”的财务指标(FI)。现有技术中,美国专利US6556992、US7657476与US7716226,以专利的维持率为基础,再搭配其他专利指标(PI),以多元回归分析模型发展出另一套对上市公司创新能力的评估方法,并依此挑选了300个美国上市公司做为样本股,经过加权计算后,发布全球第一个专利指数(OT300PatentIndex)。然而US6556992、US7657476与US7716226所使用的多元回归分析模型,其自变量专利指标(PI)与因变量财务指标(FI)都是属于相同时间序列,虽然其自变量不同于现有技术US6175824与US6832171,但其建立的多元回归方程式,当输入某个时间点的专利指标(PI)时,得到的输出结果仍然是该时间点相应的财务指标(FI),而不是”未来”的财务指标(FI)。我们必须理解,投资选股的实务操作,投资机构在投资时,并非希望当下就获利,而是希望在未来的某个时间点套现时才获利。也就是说,投资机构在投资时,希望掌握的当下信息对”未来”的获利有”预测”的效果,才能降低投资风险,确保投资效益。上述现有技术US6175824、US6832171、US6556992、US7657476与US7716226在实质上起不到”预测”的效果。另方面,上述现有技术US6175824、US6832171、US6556992、US7657476与US7716226都是基于美国发明授权专利信息所具有的信息与指标建立模型。其中US6175824与US6832171使用的最核心专利指标(PI)为新颖性(NoveLy)审查与创造性/非显而易见性(Nonobviousness)审查所使用的专利引文与非专利文献的引文,包括前引文(BackwardCitation)与后引文(ForwardCitation);US6556992、US7657476与US7716226使用的最核心专利指标(PI)为发明授权专利的维持率。然而,美国专利并没有实用新型制度,但对中国大陆的广大专利信息而言,无须实体审查程序的实用新型专利较多,发明专利较少;对发明专利而言,通过实体审查的授权专利较少,早期公开专利较多。又对发明授权专利而言,专利数据库所发布的引文信息是最近几年的授权专利才逐渐开始披露,并未充分回溯到先前的已授权专利;又对引文信息而言,目前仅有前引文,即专利实体(PE)审查时所采用的对比档,但并未公开后引文,即专利授权后将其作为对比档而审查的其他专利。所以现有技术US6175824、US6832171、US6556992、US7657476与US7716226其揭露的内容与方法,不适用中国大陆的专利信息,故无法对中国大陆的上市公司的财务信息进行评估。中国大陆专利CN201410283508.7首次披露一种针对中国大陆上市公司的中国大陆专利信息与财务数据建构的财务指标预测模型与计算机系统,本发明基于此现有技术,提供更进一步的优化与改良。

技术实现要素:
基于改善上述的现有技术中,本发明提供一种通过计算机实现的专利大数据预测选股方法及计算机系统,不但有助于专利信息分析与利用的技术实力发展,更能促进投资领域的投资方法的正面发展,且对产业技术的研发与创新起到积极的支持效果。首先,本发明提出一种通过计算机实现的专利大数据预测选股方法(100),包含下列步骤:(110)设定参数:多个专利实体(PE)、一个时间长度(T0)、一个时间领先期(L)、一个第一时间期(T1)、一个第二时间期(T2)、用以描述各专利实体(PE)在时间长度(T0)内的多个专利指标(PI)与至少一个财务指标(FI)其中,第一时间期(T1)与第二时间期(T2)具有相同的时间长度(T0),第二时间期(T2)的结束日(T20)较第一时间期(T1)的结束日(T10)更落后一个时间领先期(L);(120)收集数据:各专利实体(PE)在第一时间期(T1)内,专利指标(PI)与财务指标(FI)所相应的多个第一专利指标数据(121P)与多个第一财务指标数据(121F),收集各专利实体(PE)在第二时间期(T2)内,专利指标(PI)与财务指标(FI)所相应的多个第二专利指标数据(122P)与多个第二财务指标数据(122F);(130)将第一专利指标数据(121P)、第一财务指标数据(121F)、第二专利指标数据(122P)、与第二财务指标数据(122F)组成一个第一面板数据(131);(140)提供一个正态分布转算程序(141),将第一面板数据(131)转换为一个第二面板数据(142);(150)提供基于时间领先期(L)的一个第一时间序列运算程序(151)、至少一个第一拟合系数(152)、及相应于第一拟合系数(152)的一个第一阈值(153),第一时间序列运算程序(151)的自变量为第二面板数据(142)的一个专利指标(PI),因变量为第二面板数据(142)的财务指标(FI);(160)逐次使用第一时间序列运算程序(151),运算第二面板数据(142),从多个专利指标(PI)中筛选得出第一拟合系数(152)符合第一阈值(153)的多个专利核心指标(PCI);(170)提供基于时间领先期(L)的一个第二时间序列运算程序(171)、至少一个第二拟合系数(172)、及相应于第二拟合系数(172)的一个第二阈值(173),第二时间序列运算程序(171)的自变量为第二面板数据(142)中的所有专利核心指标(PCI),因变量为第二面板数据(142)的财务指标(FI);(180)通过第二时间序列运算程序(171),演算生成一个专利领先方程式(181),专利领先方程式(181)由多个专利领先指标(PLI)及各专利领先指标(PLI)相应的权重系数(182)所组成,专利领先指标(PLI)由专利核心指标(PCI)所选出,在专利领先方程式(181)中,各专利领先指标(PLI)的第二拟合系数(172)皆符合第二阈值(173);(190)将第一专利指标数据(121P)导入专利领先方程式(181),生成各专利实体(PE)的一个专利领先分数(191);以及(200)基于专利领先分数(191)进行选股。本发明再一目的是提出一种通过计算机实现的专利大数据预测选股方法(600),包含下列步骤:(610)设定参数:多个专利实体(PE)、一个时间领先期(L)、一个第一年度(T1)、一个第二年度(T2)、用以描述各专利实体(PE)的在第一年度(T1)与第二年度(T2)的多个专利指标(PI)与一个财务指标(FI),专利指标(PI)包括描述发明公开专利的指标、描述发明授权专利的指标、描述实用新型专利的指标、描述外观设计专利的指标、与描述有效专利的指标,其中,专利实体(PE)为上市公司,财务指标(FI)为各专利实体(PE)在第一年度(T1)与第二年度(T2)内的最后一个交易日的复权收盘价(SP),第一年度(T1)与第二年度(T2)的时间长度均为一年,第二年度(T2)的结束日(T20)较第一年度(T1)的结束日(T10)更落后一个时间领先期(L),时间领先期(L)为一个季度;(620)收集数据:各专利实体(PE)在第一年度(T1)内,专利指标(PI)与财务指标(FI)所相应的多个第一专利指标数据(121P)与多个第一财务指标数据(121F),收集各专利实体(PE)在第二年度(T2)内,专利指标(PI)与财务指标(FI)所相应的多个第二专利指标数据(122P)与多个第二财务指标数据(122F);(630)将第一专利指标数据(121P)、第一财务指标数据(121F)、第二专利指标数据(122P)、与第二财务指标数据(122F)组成一个第一面板数据(131);(640)提供一个正态分布转算程序(141),将第一面板数据(131)转换为一个第二面板数据(142);(650)提供基于时间领先期(L)的一元格兰杰因果检验模型(151)、至少一个第一拟合系数(152)、及相应于第一拟合系数(152)的一个第一阈值(153),一元格兰杰因果检验模型(151)的自变量为第二面板数据(142)的一个专利指标(PI),因变量为第二面板数据(142)的财务指标(FI);(660)逐次使用一元格兰杰因果检验模型(151),运算第二面板数据(142),从多个专利指标(PI)中筛选得出多个专利核心指标(PCI),各专利核心指标(PCI)的第一拟合系数(152)符合第一阈值(153);(670)提供基于时间领先期(L)的多元格兰杰因果检验模型(171)、至少一个第二拟合系数(172)、及相应于第二拟合系数(172)的一个第二阈值(173),多元格兰杰因果检验模型(171)的自变量为第二面板数据(142)中的所有专利核心指标(PCI),因变量为第二面板数据(142)的财务指标(FI);(680)通过多元格兰杰因果检验模型(171),演算生成一个专利领先方程式(181),专利领先方程式(181)由多个专利领先指标(PLI)及各专利领先指标(PLI)相应的权重系数(182)所组成,专利领先指标(PLI)由专利核心指标(PCI)所选出,在专利领先方程式(181)中,各专利领先指标(PLI)的第二拟合系数(172)皆符合第二阈值(173);(690)通过专利领先方程式(181)与第一专利指标数据(121P),生成各专利实体(PE)的一个专利领先分数(191);以及(700)基于专利领先分数(191)与第一财务指标数据(121F),生成各专利实体(PE)的复权价收益率预测值(701);(710)将复权价收益率预测值(701)进行排序,作为选股依据。本发明另一目的是提出一种通过计算机实现的专利大数据预测选股方法(800),包含下列步骤:(810)设定参数:多个专利实体(PE)、一个时间领先期(L)、一个第一年度(T1)、一个第二年度(T2)、用以描述各专利实体(PE)的在第一年度(T1)与第二年度(T2)的多个专利指标(PI)与一个财务指标(FI),专利指标(PI)包括描述发明公开专利的指标、描述发明授权专利的指标、描述实用新型专利的指标、描述外观设计专利的指标、与描述有效专利的指标,其中,专利实体(PE)为上市公司,财务指标(FI)为各专利实体(PE)在第一年度(T1)与第二年度(T2)内的最后一个交易日的复权收盘价(SP),第一年度(T1)与第二年度(T2)的时间长度均为一年,第二年度(T2)的结束日(T20)较第一年度(T1)的结束日(T10)更落后一个时间领先期(L),时间领先期(L)为一个季度;(820)收集数据:各专利实体(PE)在第一年度(T1)内,专利指标(PI)与财务指标(FI)所相应的多个第一专利指标数据(121P)与多个第一财务指标数据(121F),收集各专利实体(PE)在第二年度(T2)内,专利指标(PI)与财务指标(FI)所相应的多个第二专利指标数据(122P)与多个第二财务指标数据(122F);(830)将第一专利指标数据(121P)、第一财务指标数据(121F)、第二专利指标数据(122P)、与第二财务指标数据(122F)组成一个第一面板数据(131);(840)提供一个正态分布转算程序(141),将第一面板数据(131)转换为一个第二面板数据(142);(850)提供基于时间领先期(L)的一元格兰杰因果检验模型(151)、至少一个第一拟合系数(152)、及相应于第一拟合系数(152)的一个第一阈值(153),一元格兰杰因果检验模型(151)的自变量为第二面板数据(142)的一个专利指标(PI),因变量为第二面板数据(142)的财务指标(FI);(860)逐次使用一元格兰杰因果检验模型(151),运算第二面板数据(142),从多个专利指标(PI)中筛选得出多个专利核心指标(PCI),各专利核心指标(PCI)的第一拟合系数(152)符合第一阈值(153);(870)提供基于时间领先期(L)的多元格兰杰因果检验模型(171)、至少一个第二拟合系数(172)、及相应于第二拟合系数(172)的一个第二阈值(173),多元格兰杰因果检验模型(171)的自变量为第二面板数据(142)中的所有专利核心指标(PCI),因变量为第二面板数据(142)的财务指标(FI);(880)通过多元格兰杰因果检验模型(171),演算生成一个专利领先方程式(181),专利领先方程式(181)由多个专利领先指标(PLI)及各专利领先指标(PLI)相应的权重系数(182)所组成,专利领先指标(PLI)由专利核心指标(PCI)所选出,在专利领先方程式(181)中,各专利领先指标(PLI)的第二拟合系数(172)皆符合第二阈值(173);(890)通过专利领先方程式(181)与第一专利指标数据(121P),生成各专利实体(PE)的一个专利领先分数(191),专利领先分数(191)为各专利实体(PE)的复权收盘价收益率(SPR)预测值;以及(900)将专利领先分数(191)进行排序,作为选股依据。本发明的又一目的是提供一种专利大数据预测选股的计算机系统(400),用于实现前述的通过计算机实现的专利大数据预测选股方法(100、600、800)。专利大数据预测选股的计算机系统(400)包括:一个指标演算单元(420),用于计算专利实体(PE)的专利指标(PI)与财务指标(FI)的数据,生成第一专利指标数据(121P)、第一财务指标数据(121F)、第二专利指标数据(122P)与第二财务指标数据(122F);一个数据库单元(430),用于储存专利实体(PE)的信息、第一专利指标数据(121P)、第一财务指标数据(121F)、第二专利指标数据(122P)与第二财务指标数据(122F);一个演算及预测单元(440),用于计算专利核心指标(PCI)、专利领先指标(PLI)、专利领先方程式(181)、以及专利领先分数(191);一个显示与导出单元(450),用于呈现专利实体(PE)与其相应的专利领先分数(191);以及一个核心控制单元(410),用于统整及操控上述单元(420、430、440、450)。本发明所提出的通过计算机实现的专利大数据预测选股方法与计算机系统,属于客观的量化模型,客观严谨,通过计算机演算,没有人为干预。不仅特别适合中国大陆的各项专利信息,包括发明公开专利、发明授权专利、实用新型专利、外观设计专利、与有效专利;亦同时适合针对其他各国专利信息,挖掘出具有领先企业财务信息的专利核心指标、专利领先指标、与专利领先方程式。对于科技类股的选股投资,能大幅减少评估时间,有效提高选股收益,更能促进投资领域的投资方法的正面发展,且对产业技术的研发与创新起到积极的支持效果。其他有关本发明的具体技术特征与非显而易见的突出效果,将于以下章节详细说明。【附图说明】图1为本发明提出的第一较佳实施例,为一种通过计算机实现的专利大数据预测选股方法(100)的流程图;图2为第一时间期(T1)、第二时间期(T2)与时间领先期(L)的示意图;图3为本发明提出的第二较佳实施例,为一种通过计算机实现的专利大数据预测选股方法(600)的流程图;图4为本发明提出的第三较佳实施例,为一种通过计算机实现的专利大数据预测选股方法(800)的流程图;图5为本发明提出的第四较佳实施例,为一种专利大数据预测选股的计算机系统(400)。【具体实施方式】本发明主要披露一种通过计算机实现的专利大数据预测选股方法及应用,其中所涉及的专利信息、专利指标、财务指标等的基本知识,已为相关技术领域具有通常知识者所能理解,故以下文中之说明,不再作完整描述。同时,以下文中所对照之附图,仅表达与本发明特征有关的示意,并未亦不需要依据实际尺寸完整绘制,在先说明。请参考图1,本发明提出之第一较佳实施例,为一种通过计算机实现的专利大数据预测选股方法(100),包含下列步骤:步骤110,设定参数,包括:多个专利实体(PE)、一个时间长度(T0)、一个时间领先期(L)、一个第一时间期(T1)、一个第二时间期(T2)、用以描述各专利实体(PE)在时间长度(T0)内的多个专利指标(PI)与至少一个财务指标(FI),其中,第一时间期(T1)与第二时间期(T2)具有相同的时间长度(T0),第二时间期(T2)的结束日(T20)较第一时间期(T1)的结束日(T10)更落后一个时间领先期(L)。步骤120,收集数据,包括:各专利实体(PE)在第一时间期(T1)内,专利指标(PI)与财务指标(FI)所相应的多个第一专利指标数据(121P)与多个第一财务指标数据(121F),收集各专利实体(PE)在第二时间期(T2)内,专利指标(PI)与财务指标(FI)所相应的多个第二专利指标数据(122P)与多个第二财务指标数据(122F)。步骤130,将第一专利指标数据(121P)、第一财务指标数据(121F)、第二专利指标数据(122P)、与第二财务指标数据(122F)组成一个第一面板数据(131)。步骤140,提供一个正态分布转算程序(141),将第一面板数据(131)通过正态分布转算程序(141)而形成一个第二面板数据(142)。步骤150,提供基于时间领先期(L)的一个第一时间序列运算程序(151)、至少一个第一拟合系数(152)、及相应于第一拟合系数(152)的一个第一阈值(153),第一时间序列运算程序(151)的自变量为第二面板数据(142)的一个专利指标(PI),因变量为第二面板数据(142)的财务指标(FI)。步骤160,逐次使用第一时间序列运算程序(151),运算第二面板数据(142),从多个专利指标(PI)中筛选得出第一拟合系数(152)符合第一阈值(153)的多个专利核心指标(PCI)。步骤170,提供基于时间领先期(L)的一个第二时间序列运算程序(171)、至少一个第二拟合系数(172)、及相应于第二拟合系数(172)的一个第二阈值(173),第二时间序列运算程序(171)的自变量为第二面板数据(142)中的所有专利核心指标(PCI),因变量为第二面板数据(142)的财务指标(FI);步骤180,通过第二时间序列运算程序(171),演算生成一个专利领先方程式(181),专利领先方程式(181)由多个专利领先指标(PLI)及各专利领先指标(PLI)相应的权重系数(182)所组成,专利领先指标(PLI)由专利核心指标(PCI)所选出,在专利领先方程式(181)中,各专利领先指标(PLI)的第二拟合系数(172)皆符合第二阈值(173)。步骤190,将第一专利指标数据(121P)导入专利领先方程式(181),生成各专利实体(PE)的一个专利领先分数(191)。步骤200,基于专利领先分数(191)进行选股。上述步骤110中,专利实体(PE)为拥有专利权、且能通过专利权运营获利的权利主体,优选为公开发行的上市公司,例如上海主板公司、深圳主板公司、深圳中小板公司、深圳创业板公司、但并不以上市公司为限;本实施例亦适用于非上市公司,例如:全国中小企业股份转让系统(简称新三板)内的公司,只要能接受外部资金进入,分享股权与股权收益的权利主体,皆属本实施例的适用范围。又,步骤110中所针对的专利,并不限定是授权专利,只要是在专利数据库内公布的专利皆可,包括发明公开专利、发明授权专利、实用新型专利、外观设计专利、专利权有效专利、专利权无效专利等。同时,本实施例所提出的方法除了可以有效解决中国大陆专利的信息内容不同于美国专利的问题,其实更可以适用于全球各地区专利。本实施例中,专利指标(PI)优选为以年度为计算单位的各项可以被计算机自动运算的专利数量指标,包括时间期结束日前1年内所有专利的专利指标、时间期结束日前2年内所有专利的专利指标、时间期结束日前3年内所有专利的专利指标、、、馀此类推;还有时间期结束日前1年内所有有效专利的专利指标、时间期结束日前2年内所有有效专利的专利指标、时间期结束日前3年内所有有效专利的专利指标、、、馀此类推。时间期结束日包括第一时间期(T1)的结束日(T10)与第二时间期(T2)的结束日(T20)。以中国大陆的专利为例,时间期结束日前1年内所有专利的专利指标,包括:P101:当期时间期结束日前1年公开的发明公开专利数P102:当期时间期结束日前1年公开的实用新型专利数P103:当期时间期结束日前1年公开的外观设计专利数P104:当期时间期结束日前1年公开的发明授权专利数P105:当期时间期结束日前1年公开的发明授权专利审查期平均数,审查期定义:专利申请日至专利授权日,单位:年P106:当期时间期结束日前1年发明公开专利IPC分类号总数P107:当期时间期结束日前1年实用新型专利IPC分类号总数P108:当期时间期结束日前1年发明授权专利IPC分类号总数P109:当期时间期结束日前1年发明公开专利IPC分类号数量平均值P110:当期时间期结束日前1年实用新型专利IPC分类号数量平均值P111:当期时间期结束日前1年发明授权专利IPC分类号数量平均值P112:当期时间期结束日前1年发明公开专利说明书总字数P113:当期时间期结束日前1年实用新型专利说明书总字数P114:当期时间期结束日前1年发明授权专利说明书总字数P115:当期时间期结束日前1年发明公开专利说明书字数平均值P116:当期时间期结束日前1年实用新型专利说明书字数平均值P117:当期时间期结束日前1年发明授权专利说明书字数平均值P118:当期时间期结束日前1年发明公开专利的权利要求总项数P119:当期时间期结束日前1年实用新型专利的权利要求总项数P120:当期时间期结束日前1年发明授权专利的权利要求总项数P121:当期时间期结束日前1年发明公开专利的权利要求平均项数P122:当期时间期结束日前1年实用新型专利的权利要求平均项数P123:当期时间期结束日前1年发明授权专利的权利要求平均项数P124:当期时间期结束日前1年发明公开专利的独权总项数P125:当期时间期结束日前1年实用新型专利的独权总项数P126:当期时间期结束日前1年发明授权专利的独权总项数P127:当期时间期结束日前1年发明公开专利的独权项数量平均值P128:当期时间期结束日前1年实用新型专利的独权项数量平均值P129:当期时间期结束日前1年发明授权专利的独权项数量平均值P130:当期时间期结束日前1年发明公开专利说明书的附图总数P131:当期时间期结束日前1年实用新型专利说明书的附图总数P132:当期时间期结束日前1年发明授权专利说明书的附图总数P133:当期时间期结束日前1年发明公开专利说明书的附图数平均值P134:当期时间期结束日前1年实用新型专利说明书的附图数平均值P135:当期时间期结束日前1年发明授权专利说明书的附图数平均值P136:当期时间期结束日前1年发明公开摘要总字数P137:当期时间期结束日前1年实用新型摘要总字数P138:当期时间期结束日前1年发明授权摘要总字数P139:当期时间期结束日前1年发明公开摘要字数平均值P140:当期时间期结束日前1年实用新型摘要字数平均值P141:当期时间期结束日前1年发明授权摘要字数平均值P145:当期时间期结束日前1年专利总数=P101+P102+P103+P104P146:当期时间期结束日前1年发明公开专利比例=P101/P105P147:当期时间期结束日前1年实用新型专利比例=P102/P105P148:当期时间期结束日前1年外观设计专利比例=P103/P105P149:当期时间期结束日前1年发明授权专利比例=P104/P105P150:当期时间期结束日前1年发明公开专利寿命平均数P151:当期时间期结束日前1年实用新型专利寿命平均数P152:当期时间期结束日前1年外观设计专利寿命平均数P153:当期时间期结束日前1年发明授权专利寿命平均数以有效专利为例,时间期结束日前1年内所有有效专利的专利指标,包括:PA101:当期时间期结束日前1年公开的发明公开有效专利数PA102:当期时间期结束日前1年公开的实用新型有效专利数PA103:当期时间期结束日前1年公开的外观设计有效专利数PA104:当期时间期结束日前1年公开的发明授权有效专利数PA105:当期时间期结束日前1年公开的发明授权有效专利审查期平均数PA106:当期时间期结束日前1年发明公开有效专利IPC分类号总数PA107:当期时间期结束日前1年实用新型有效专利IPC分类号总数PA108:当期时间期结束日前1年发明授权有效专利IPC分类号总数PA109:当期时间期结束日前1年发明公开有效专利IPC分类号数量平均值PA110:当期时间期结束日前1年实用新型有效专利IPC分类号数量平均值PA111:当期时间期结束日前1年发明授权有效专利IPC分类号数量平均值PA112:当期时间期结束日前1年发明公开有效专利说明书总字数PA113:当期时间期结束日前1年实用新型有效专利说明书总字数PA114:当期时间期结束日前1年发明授权有效专利说明书总字数PA115:当期时间期结束日前1年发明公开有效专利说明书字数平均值PA116:当期时间期结束日前1年实用新型有效专利说明书字数平均值PA117:当期时间期结束日前1年发明授权有效专利说明书字数平均值PA118:当期时间期结束日前1年发明公开有效专利的权利要求总项数PA119:当期时间期结束日前1年实用新型有效专利的权利要求总项数PA120:当期时间期结束日前1年发明授权有效专利的权利要求总项数PA121:当期时间期结束日前1年发明公开有效专利的权利要求平均项数PA122:当期时间期结束日前1年实用新型有效专利的权利要求平均项数PA123:当期时间期结束日前1年发明授权有效专利的权利要求平均项数PA124:当期时间期结束日前1年发明公开有效专利的独权总项数PA125:当期时间期结束日前1年实用新型有效专利的独权总项数PA126:当期时间期结束日前1年发明授权有效专利的独权总项数PA127:当期时间期结束日前1年发明公开有效专利的独权项数量平均值PA128:当期时间期结束日前1年实用新型有效专利的独权项数量平均值PA129:当期时间期结束日前1年发明授权有效专利的独权项数量平均值PA130:当期时间期结束日前1年发明公开有效专利说明书的附图总数PA131:当期时间期结束日前1年实用新型有效专利说明书的附图总数PA132:当期时间期结束日前1年发明授权有效专利说明书的附图总数PA133:当期时间期结束日前1年发明公开有效专利说明书的附图数平均值PA134:当期时间期结束日前1年实用新型有效专利说明书的附图数平均值PA135:当期时间期结束日前1年发明授权有效专利说明书的附图数平均值PA136:当期时间期结束日前1年发明公开摘要总字数PA137:当期时间期结束日前1年实用新型摘要总字数PA138:当期时间期结束日前1年发明授权摘要总字数PA139:当期时间期结束日前1年发明公开摘要字数平均值PA140:当期时间期结束日前1年实用新型摘要字数平均值PA141:当期时间期结束日前1年发明授权摘要字数平均值PA145:当期时间期结束日前1年有效专利总数PA146:当期时间期结束日前1年发明公开有效专利比例PA147:当期时间期结束日前1年实用新型有效专利比例PA148:当期时间期结束日前1年外观设计有效专利比例PA149:当期时间期结束日前1年发明授权有效专利比例PA150:当期时间期结束日前1年发明公开有效专利寿命平均数PA151:当期时间期结束日前1年实用新型有效专利寿命平均数PA152:当期时间期结束日前1年外观设计有效专利寿命平均数PA153:当期时间期结束日前1年发明授权有效专利寿命平均数PA154:当期时间期结束日前1年发明授权有效专利审查期平均数PA155:有效专利中发明公开占比=PA101/PA145PA156:有效专利中实用新型占比=PA102/PA145PA157:有效专利中外观设计占比=PA103/PA145PA158:有效专利中发明授权占比=PA104/PA145至于时间期结束日前2年内、前3年内、前4年内、前5年内、、、等所有专利的专利指标;以及时间期结束日前2年内、前3年内、前4年内、前5年内、、、等所有有效专利的专利指标,只要把时间长度拉长,计算公式相同。较佳的,本实施例采用时间期结束日前1年内至前10年内,合计1040个专利指标(PI),其中包括540个有效专利指标。并不是每一个专利指标(PI)都能有效预测财务指标(FI),只有专利核心指标(PCI)与专利领先指标(PLI)能有效预测财务指标(FI),这需要通过严谨的统计分析、验证与误差检定,其为本实施例的核心所在,后续篇幅内会继续说明。在财务指标(FI)方面,本实施例所使用的是指表达企业经营绩效的指标,可以是偿债能力指标、运营能力指标、净资产收益率ROE(RateofReturnonCommonShareholder’sEquity)、资产报酬率ROA(RateofReturnonAsses)、每股收益EPS(EarningsPerShare)、市净率MTB(Market-to-BookRatio)、股价相关指标等,本实施例并未加以设限,但优选为股价相关指标,例如:收盘价、复权收盘价(SP)、复权收盘价收益率(SPR)。上述步骤110中,第一时间期(T1)与第二时间期(T2)的单位可以是月度、季度、半年、或年度等,但优选为一年。因为实务中,一年内的专利公开数量并不是每个月均匀的,而是有季节性的规律变化,有的月份多、有的月份少。若采取季度或月度为单位,需要耗费更多的演算以消除季节性规律变化因素;采用年度,能将季节性规律变化因素的影响降至最低。设定第一时间期(T1)与第二时间期(T2)是为了收集足够的样本数据,以便建立模型与验证之用。由于本实施例提出的是预测模型,亦即要以前一期的数据预测本期的数据,或是以本期的数据预测下一期的数据,因此至少需2期的数据,才能建立模型并验证预测结果的显著性。请见图2,本实施例中,第一时间期(T1)与第二时间期(T2)具有相同的时间长度(T0),第一时间期(T1)的结束日(T10)为截止日(D),第二时间期(T2)的结束日(T20)较第一时间期(T1)的结束日更落后一个时间领先期(L)。时间领先期(L)可以是一个月、一个季度、半年、或一年等;考虑专利数据的发布频率与投资机构的投资习惯,本实施例的时间领先期(L)优选为一个季度。从图2可以看出,第一时间期(T1)与第二时间期(T2)的时间跨度具有部分的重叠。举例说明,若时间领先期(L)为一个季度,第一时间期(T1)为2014年10月1日至2015年9月30日,第一时间期(T1)的结束日(T10)则第二时间期(T2)为2014年7月1日至2015年6月30日,第二时间期(T2)的结束日(T20)为2015年6月30日。上述步骤120中,根据已经设定好的时间领先期(L)、第一时间期(T1)与第二时间期(T2),通过计算机开始收集并计算专利实体(PE)在第一时间期(T1)内的第一专利指标数据(121P)与第一财务指标数据(121F)、以及专利实体(PE)在第二时间期(T2)内的第二专利指标数据(122P)与第二财务指标数据(122F)。在步骤130中,第一面板数据(131)中的面板数据,又称为平行数据或综列数据,是时间序列数据与横截面数据的混合,指M个横截面被观测对象在时间期数(N)的数据集,一共有M×N个数据集。以本实施例为例,有第一时间期(T1)与第二时间期(T2),即N=2,有2个数据收集期;假如有1000个专利实体(PE),即M=1000,即此时便形成1000个横截面被观测对象,在2个时间期内的财务指标(FI)与1040个专利指标(PI)的数据集。传统的时间序列数据,是用来分析单一的被观测对象在多个时间的观测值(自变量与因变量)的关连。传统的横截面数据,是用来分析多个被观测对象在单一时点的观测值(自变量与因变量)的关连。这两种数据都不适用于本实施例提出的方法,因为本实施例有多个被观测对象、且有多个时间点,每个时间点又有多个自变量与因变量。而面板数据,是用来分析多个特定的横截面被观测对象在多个时间点的观测值的关连性,由于观测值的增多,可以增加估计量的抽样精度、得到更多的一致估计量与有效估计量、且获得更多的动态信息,故本实施例采用面板数据进行分析。上述步骤130与步骤140之间,可以进一步(但非必要)包含一个正态分布(NormalDistribution)检验程序(135),对第一面板数据(131)中的各个专利指标数据与各个财务指标数据,检验其正态分布的状态。因为数据倘若未呈现正态分布,直接的影响就是建模困难,在建模演算过程中,常因误差过高、无法通过统计检定的要求而导致模型崩溃。因此在建模之前,对第一面板数据(131)预先施行正态分布检验程序(135)检测其数据分布状态,能有助于后续步骤140的正态分布转算程序(141)。正态分布的分布曲线基本上是一个中心线在期望值(平均值)而左右对称、以标准差为单位而向两侧延伸展开的曲线。正态分布检验程序(135)常用的有下列几种:Anderson-Darling检验程序、Ryan-Joiner检验程序、Kolmogorov-Smirnov检验程序等,或是可以更简易的观察偏度系数(Skewness)与峰度系数(Kurtosis)即能推论数据的正态分布状况,本实施例并不限制采用何种检验程序。上述步骤140中,Box-Cox转换程序是常用的正态分布转算程序(141),但本实施例不以此为限。本实施例的第一面板数据(131),通过正态分布转算程序(141)后,转换为正态分布化的第二面板数据(142)。在步骤150中,第一时间序列运算程序(151)优选为一元的格兰杰因果检验模型(GrangerCausalityTestModel)。格兰杰因果检验模型是2003年诺贝尔经济学奖得主克莱夫格兰杰(CliveW.J.Granger)所开创,用于分析时间序列的经济变量间的领先与落后关系。其基本观念是,倘若有两个变量X与Y,变量X发生在先,变量Y发生在后,且通过格兰杰因果检验模型后,验证成立变量X对变量Y的发生概率有显著性的影响,则称变量X领先于变量Y,或称变量X为变量Y的领先指标。格兰杰因果检验模型处理的经济变量中,其自变量与因变量都是时间序列的变量,其基础运算模型是回归分析模型,但是在回归分析之前,先对自变量及因变量设定一段时间的偏移量,即设定时间领先期(L)或时间落后期,再检视具有领先期或落后期的回归分析模型配适度,以验证自变量的领先效果或落后效果。设定适当的时间领先期(L)后,衡量格兰杰因果检验模型的预测效果优劣,必须考虑模型配适度,即本实施例的第一拟合系数(152)及其相应的第一阈值(153)。第一拟合系数(152)可以采用F检验所得到的p值,一般p值<0.1,为模型可接受;若p值<0.05,为模型良好;若p值<0.005,则为极佳的模型;此时第一阈值(153)可以设定为不大于0.1。简单说,若自变量为X,因变量为Y,且经由格兰杰因果检验模型后得到的p值<0.05,则表示在百分之九十五的置信区间内,自变量X对于因变量为Y,具有领先效果。本实施例中的第一拟合系数(152)也可以使用t检验值的绝对值,t检验值的绝对值越大越好,通常的理想情况,t检验值的绝对值应不小于2,故第一阈值(153)可以设定为不小于2。在步骤150中,第一阈值(153)的设定是关键的,第一阈值(153)设定的太严格,可能在步骤160中便无法挖掘出具有显著性的专利核心指标(PCI);若第一阈值(153)设定的太宽松,可能太多显著性不足的专利指标(PI)也可能在步骤160中被误认为专利核心指标(PCI)而挖掘出来。如果第一时间序列运算程序(151)采取一元的格兰杰因果检验模型,如前述,若第一拟合系数(152)使用F检验所得到的p值,此时我们可以便先设定第一阈值(153)为0.1,先初步了解能挖掘出多少专利核心指标(PCI)达到90%的置信区间,如果专利核心指标(PCI)数量不多,设定第一阈值(153)为0.1即可;如果专利核心指标(PCI)数量很多,可再设定第一阈值(153)为0.05或0.005,即可挖掘出更关键的、领先效果更加显著的专利核心指标(PCI)。格兰杰因果检验模型中,并不限定表示自变量的个数。亦即,格兰杰因果检验模型可以分析一个自变量对一个因变量的领先效果,此时称一元的格兰杰因果检验模型,如步骤160;也可以同时分析多个自变量对一个因变量的领先效果,此时称多元的格兰杰因果检验模型。但我们必须理解,若多个自变量间存在严重的共线性,或自变量的数据离散性过高,多元的格兰杰因果检验模型往往容易在运算过程中崩溃。是故,在步骤160中,较佳地,是先将个别的专利指标(PI)的专利指标数据(121P、122P)对个别的财务指标(FI)的财务指标数据(121F、122F)施以一元的格兰杰因果检验模型运算,藉此从1040个专利指标(PI)中挖掘出具有显著性的领先效果的个别的专利指标(PI),称为专利核心指标(PCI),而排除其他领先效果不具有显著性的专利指标(PI),此时挖掘出的每一个专利核心指标(PCI)对财务指标(FI)的领先效果都具有显著性。所谓具有显著性,意指第一拟合系数(152)符合第一阈值(153)。在步骤170中,本实施例使用第二时间序列运算程序(171)及时间领先期(L),优选为多元的格兰杰因果检验模型,分析多个专利核心指标(PCI)同时对财务指标(FI)的领先效果。在步骤180中,本实施例的第二时间序列运算程序(171)为多元格兰杰因果检验模型,其自变量是步骤160中生成的多个专利核心指标(PCI),因变量是财务指标(FI)。通过步骤180,能从多个专利核心指标(PCI)中提取出专利领先指标(PLI),并将专利领先指标(PLI)演算生成一个专利领先方程式(181)。专利领先方程式(181)中包含了多个专利领先指标(PLI)以及各专利领先指标(PLI)以其相应的权重系数构成的线性组合,如下所示,即为n个专利领先指标构成的专利领先方程式(181):w1xPLI_1+w2xPLI_2+w3xPLI_3+...........+wnxPLI_n其中,PLI_1、PLI_2、PLI_3、PLI_n为专利领先指标(PLI);w1、w2、w3、wn为各专利领先指标(PLI)相应的权重系数。通过专利领先方程式(181),会比单纯用专利核心指标(PCI)或专利领先指标(PLI),来预测企业的财务表现,将更为快速、便利。因为在步骤160中得到的专利核心指标(PCI),每一个专利核心指标(PCI)对于领先财务财务指标(FI),都具有显著性,到底采用哪一个专利核心指标(PCI)较佳?是个难题。如果要组合这些专利核心指标(PCI),该如何设定组合时各专利核心指标(PCI)的权重系数?步骤180在解决这些问题。因为通过多元的格兰杰因果检验模型、时间领先期(L)、第二拟合系数(172)符合第二阈值(173)的演算以后,便能生成专利领先指标(PLI)与其各自相应的权重系数(182)。第二拟合系数(172)如同前述的第一拟合系数(152)可以使用F检验的p值也可以使用t检验值。若第一拟合系数(152)使用F检验的p值此时第二阈值(173)可以设定为不大于0.1;若第一拟合系数(152)使用t检验值的绝对值,此时第二阈值(173)可以设定为不小于2。在步骤180中,我们更必须理解另一个重要概念,多元格兰杰因果检验模型并不是多个一元格兰杰因果检验模型生成结果的简单加总,当多个专利核心指标(PCI)组合在一起时,其个别的专利核心指标(PCI)对财务指标(FI)的领先效果的显著性会发生变化,甚至某些专利核心指标(PCI)的领先效果会反而变得不显著。因此在步骤180中,较佳的,可以进一步操作自变量逐项删除程序。亦即,先把所有的专利核心指标(PCI)纳入多元格兰杰因果检验模型中的自变量,设定第二拟合系数(172)与第二阈值(173),观察演算后各个专利核心指标(PCI)的第二拟合系数(172),删除显著性最差甚至不具显著性的专利核心指标(PCI),然后把剩下的专利核心指标(PCI)重做多元格兰杰因果检验模型,再删除显著性最差的专利核心指标(PCI),重复此过程,最终留下第二拟合系数(172)都符合第二阈值(173)、具有显著性的专利核心指标(PCI)而称为专利领先指标(PLI)。此时,多元格兰杰因果检验模型会整合所有专利领先指标(PLI)而生成专利领先方程式(181),专利领先方程式(181)实质上由多个专利领先指标(PLI)及其相应的权重系数(182)所组成。在步骤190中,把专利实体(PE)的第一专利指标数据(121P)输入专利领先方程式(181),即能生成各专利实体(PE)的专利领先分数(191),此专利领先分数(191)是个预测值代表专利实体(PE)在第一时间期(T1)结束日(T10)的下一个时间领先期(L)以后的财务指标(FI)预测值。在步骤200中,专利领先分数(191)愈高者,代表专利实体(PE)在第一时间期(T1)结束日(T10)起再经过时间领先期(L)以后所相应的财务指标(FI)预测值愈高;专利领先分数(191)愈低者,代表专利实体(PE)的财务指标(FI)预测值愈低。由于企业财务指标(FI)预测值的高低直接表达其未来的经营绩效的好坏,企业未来的经营绩效愈好,愈具有投资价值。故观察专利领先分数(191)的高或低,便能够从专利实体(PE)中挑选出具有投资潜力的对象。请参考图4,为本发明提出之第二较佳实施例,为一种通过计算机实现的专利大数据预测选股方法(600),包括以下步骤:步骤610,设定参数,包括:多个专利实体(PE)、一个时间领先期(L)、一个第一年度(T1)、一个第二年度(T2)、用以描述各专利实体(PE)的在第一年度(T1)与第二年度(T2)的多个专利指标(PI)与一个财务指标(FI),其中,专利实体(PE)为上市公司,第一年度(T1)与第二年度(T2)的时间长度均为一年,第二年度(T2)的结束日(T20)较第一年度(T1)的结束日(T10)更落后一个时间领先期(L),其中,财务指标(FI)为各专利实体(PE)在第一年度(T1)与第二年度(T2)内的最后一个交易日的复权收盘价(SP),时间领先期(L)为一个季度,专利指标(PI)包括描述发明公开专利的指标、描述发明授权专利的指标、描述实用新型专利的指标、描述外观设计专利的指标、与描述有效专利的指标。所谓复权,就是对股价和成交量进行权息修复,把成交量调整为相同的股本口径。举例说明,一档股票原来是每股20块,10股送10股,除权后变成每股10块,股价折半,但是股本增加一倍,这时复权价就是回复每股20块。如果现在现在股价变成13块,复权价就是每股26块。通过复权,可以消除由于除权除息造成的股价走势畸变,更能观察专利实体(PE)的绩效。步骤620,收集数据,包括:各专利实体(PE)在第一年度(T1)内,专利指标(PI)与财务指标(FI)所相应的多个第一专利指标数据(121P)与多个第一财务指标数据(121F),收集各专利实体(PE)在第二年度(T2)内,专利指标(PI)与财务指标(FI)所相应的多个第二专利指标数据(122P)与多个第二财务指标数据(122F)。步骤630,将第一专利指标数据(121P)、第一财务指标数据(121F)、第二专利指标数据(122P)、与第二财务指标数据(122F)组成一个第一面板数据(131);步骤640,提供一个正态分布转算程序(141),将第一面板数据(131)转换为一个第二面板数据(142)。步骤650,提供基于时间领先期(L)的一元格兰杰因果检验模型(151)、至少一个第一拟合系数(152)、及相应于第一拟合系数(152)的一个第一阈值(153),一元格兰杰因果检验模型(151)的自变量为第二面板数据(142)的一个专利指标(PI),因变量为第二面板数据(142)的财务指标(FI)。步骤660,逐次使用一元格兰杰因果检验模型(151),运算第二面板数据(142),从多个专利指标(PI)中筛选得出多个专利核心指标(PCI),各专利核心指标(PCI)的第一拟合系数(152)符合第一阈值(153)。步骤670,提供基于时间领先期(L)的多元格兰杰因果检验模型(171)、至少标(PCI),因变量为第二面板数据(142)的财务指标(FI)。步骤680,通过多元格兰杰因果检验模型(171),演算生成一个专利领先方程式(181),专利领先方程式(181)由多个专利领先指标(PLI)及各专利领先指标(PLI)相应的权重系数(182)所组成,专利领先指标(PLI)由专利核心指标(PCI)所选出,在专利领先方程式(181)中,各专利领先指标(PLI)的第二拟合系数(172)皆符合第二阈值(173)。步骤690,通过专利领先方程式(181)与第一专利指标数据(121P),生成各专利实体(PE)的一个专利领先分数(191)。此专利领先分数(191)是个预测值,代表专利实体(PE)在第一年度(T1)结束日(T10)的下一个时间领先期(L)以后的复权收盘价(SP)预测值。步骤700,基于专利领先分数(191)与第一财务指标数据(121F),生成各专利实体(PE)的复权价收益率预测值(701);步骤710,将复权价收益率预测值(701)进行排序,作为选股依据。第二较佳实施例与第一较佳实施例的差别主要在于进一步限定,如下:(1)限定专利实体(PE)为上市公司;(2)限定第一年度(T1)与第二年度(T2)的时间长度均为一年,便于第一专利指标数据(121P)与第二专利指标数据(122P)的收集;(3)限定时间领先期(L)为一个季度,较为符合投资预测习惯;(4)限定财务指标(FI)为专利实体(PE)在该第一年度(T1)与该第二年度(T2)内的最后一个交易日的复权收盘价(SP);复权收盘价(SP)对于投资决策具有更为直观的效果。(5)通过专利领先分数(191)进一步计算复权价收益率预测值(701),限定选股依据为复权价收益率预测值(701)。本实施例中,并不直接通过专利领先分数(191)进行选股,而是以复权价收益率预测值(701)进行选股。因为专利领先分数(191)代表的是复权收盘价(SP)预测值,专利领先分数(191)较高,代表预测的复权收盘价(SP)较高;专利领先分数(191)较低,代表预测的复权收盘价(SP)较低。而投资选股的绩效,关键是收益,跟复权收盘价(SP)并没有直接关系。举例,有两档股票的预测股价分别是11块与101块,且分别都上涨1块钱,看似后者的预测股价较高,但前者是从10块上涨到11块,收益率是10%;后者是从100块涨到101块,收益率只有1%。以投资而言,选前者的投资绩效较好,选后者的投资绩效较差。所以,本实施例中,并不直接通过专利领先分数(191)进行选股,而是以复权价收益率预测值(701)进行选股。请参考图5,为本发明提出之第三较佳实施例,为一种通过计算机实现的专利大数据预测选股方法(800),包括以下步骤:步骤810,设定参数,包括:多个专利实体(PE)、一个时间领先期(L)、一个第一年度(T1)、一个第二年度(T2)、用以描述各专利实体(PE)的在第一年度(T1)与第二年度(T2)的多个专利指标(PI)与一个财务指标(FI),其中,专利实体(PE)为上市公司,第一年度(T1)与第二年度(T2)的时间长度均为一年,第二年度(T2)的结束日(T20)较第一年度(T1)的结束日(T10)更落后一个时间领先期(L),其中,财务指标(FI)为各专利实体(PE)在第一年度(T1)与第二年度(T2)内的最后一个交易日的复权收盘价收益率(SPR),时间领先期(L)为一个季度,专利指标(PI)包括描述发明公开专利的指标、描述发明授权专利的指标、描述实用新型专利的指标、描述外观设计专利的指标、与描述有效专利的指标。步骤820,收集数据:各专利实体(PE)在第一年度(T1)内,专利指标(PI)与财务指标(FI)所相应的多个第一专利指标数据(121P)与多个第一财务指标数据(121F),收集各专利实体(PE)在第二年度(T2)内,专利指标(PI)与财务指标(FI)所相应的多个第二专利指标数据(122P)与多个第二财务指标数据(122F);步骤830,将第一专利指标数据(121P)、第一财务指标数据(121F)、第二专利指标数据(122P)、与第二财务指标数据(122F)组成一个第一面板数据(131);步骤840,提供一个正态分布转算程序(141),将第一面板数据(131)转换为一个第二面板数据(142)。步骤850,提供基于时间领先期(L)的一元格兰杰因果检验模型(151)、至少一个第一拟合系数(152)、及相应于第一拟合系数(152)的一个第一阈值(153),一元格兰杰因果检验模型(151)的自变量为第二面板数据(142)的一个专利指标(PI),因变量为第二面板数据(142)的财务指标(FI)。步骤860,逐次使用一元格兰杰因果检验模型(151),运算第二面板数据(142),从多个专利指标(PI)中筛选得出多个专利核心指标(PCI),各专利核心指标(PCI)的第一拟合系数(152)符合第一阈值(153)。步骤870,提供基于时间领先期(L)的多元格兰杰因果检验模型(171)、至少一个第二拟合系数(172)、及相应于第二拟合系数(172)的一个第二阈值(173),多元格兰杰因果检验模型(171)的自变量为第二面板数据(142)中的所有专利核心指标(PCI),因变量为第二面板数据(142)的财务指标(FI)。步骤880,通过多元格兰杰因果检验模型(171),演算生成一个专利领先方程式(181),专利领先方程式(181)由多个专利领先指标(PLI)及各专利领先指标(PLI)相应的权重系数(182)所组成,专利领先指标(PLI)由专利核心指标(PCI)所选出,在专利领先方程式(181)中,各专利领先指标(PLI)的第二拟合系数(172)皆符合第二阈值(173)。步骤890,通过专利领先方程式(181)与第一专利指标数据(121P),生成各专利实体(PE)的专利领先分数(191),专利领先分数(191)为各专利实体(PE)的复权收盘价收益率(SPR)预测值。步骤900,将专利领先分数(191)进行排序,作为选股依据。第三较佳实施例与第二较佳实施例的差别主要在于进一步限定,如下:(1)限定财务指标(FI)为专利实体(PE)在该第一年度(T1)与该第二年度(T2)内的最后一个交易日的复权收盘价收益率(SPR);此复权收盘价收益率(SPR)可以是年度收益率、半年度收益率、或季度收益率均可,并不需要设限,但优选为年度收益率。(2)通过专利领先分数(191)直接进行选股,因为专利领先分数(191)代表的是复权收盘价收益率(SPR)的预测值,专利领先分数(191)较高,代表预测的复权收盘价收益率(SPR)较高;专利领先分数(191)较低,代表预测的复权收盘价收益率(SPR)较低。以专利领先分数(191)进行选股,对于投资选股的操作,更为直观方便。以下将以中国大陆A股的上市公司为专利实体(PE),进一步详述第一较佳实施例至第三较佳实施例的实施过程。中国大陆A股的上市公司包括上海交易所与深圳交易所,以市场板块区分,可以分为上海主板、深圳主板、中小板、创业板。截至2015年底止,共超过2820家上市公司,专利实体(PE)的母体为2820个。本发明是建立专利指标(PI)对财务指标(FI)的领先性的预测模型,因此必须考虑上市公司的子公司结构。倘若子公司的财务合并到母公司一并计算,子公司的专利指标(PI)亦必须合并到母公司一并计算。所以,2820个上市公司都必须调查其子公司结构。在财务指标(FI)方面,我们限定为财务指标(FI),且进一步限定为复权收盘价收益率(SPR),且为年度收益率。在专利指标(PI)方面,我们采用时间期结束日前1年内至前10年内,合计1040个专利指标(PI),其中包括540个有效专利指标。时间领先期(L)设定为一个季度,第一年度(T1)为2014年10月1日至2015年9月30日,其结束日(T10)为2015年9月30日。第二年度(T2)为2014年7月1日至2015年6月30日,其结束日(T20)为2015年6月30日。在有效样本的挑选方面,我们设定第一年度(T1)与第二年度(T2)这两个年度的最后一个交易日都必须有财务指标(FI),即复权收盘价收益率(SPR)不为0,且第一年度(T1)内必须至少公开10件专利,包括发明公开、发明授权、实用新型、外观设计等加总。2820个专利实体(PE)经过上述筛选而符合条件的最后得到1161个,即专利实体(PE)的有效样本为1161个。将1161个专利实体(PE)收集其第一年度(T1)的1040个第一专利指标数据(121P)及第一财务指标数据(121F)、与第二年度(T2)的1040个第二专利指标数据(122P)与第二财务指标数据(122F)后,组成第一面板数据(131),以便进行后续的分析。接著我们使用Box-Cox转换程序作为正态分布转算程序(141),将第一面板数据(131)转换为第二面板数据(142)。表1为第二面板数据(142)的部分内容。表1第二面板数据(142)在第二面板数据(142)中,自变量为1161个专利实体(PE)在第一年度(T1)与第二年度(T2)的1040个专利指标(PI),因变量为1161个专利实体(PE)在第一年度(T1)与第二年度(T2)的财务指标(FI):复权收盘价收益率(SPR)。接着我们使用时间领先期(L)为1个季度的一元格兰杰因果检验模型作为第一时间序列运算程序(151),依次检验每个自变量对因变量的领先关系。模型配适度我们使用F检验的p值,作为第一拟合系数(152),第一阈值(153)我们设定<0.1,亦即,专利指标(PI)对复权收盘价收益率(SPR)的领先关系具有可接受的显著性,达到90%的置信区间。将第二面板数据(142)通过一元格兰杰因果检验模型的运算后,我们成功发现其中确实有某些专利指标(PI)对复权收盘价收益率(SPR)的领先性具有显著性,称为专利核心指标(PCI)。藉此,我们从1040个专利指标(PI)中提取出124个专利核心指标(PCI),部分如下表2所列:表2专利核心指标(PCI)上述专利核心指标(PCI)都能个别用来预测专利实体(PE)的复权收盘价收益率(SPR)。接著我们使用多元格兰杰因果检验模型作为第二时间序列运算程序(171),将上述专利核心指标(PCI)提取出专利领先指标(PLI)并组成专利领先方程式(181)。在多元格兰杰因果检验模型操作过程中,设定p值为第二拟合系数(172),第二阈值(173)为p值<0.1,操作自变量逐项删除程序,最后得到专利领先指标(PLI),如表3所示:表3专利领先指标(PLI)及相应的权重系数专利领先指标(PLI)权重系数T检验值p值C5.2470133.97360.0000P1450.05732.67470.0076P246-0.1331-2.09820.0361P4070.03632.89980.0038P511-0.6610-1.87170.0615P9450.17334.78910.0000PA107-0.0221-1.77770.0757PA1480.40422.64430.0083PA152-0.0878-2.14740.0320PA203-0.0192-2.22810.0261PA2110.05292.15810.0311PA5110.62591.76520.0778PA545-0.2232-4.86110.0000专利领先方程式(181)也同时藉此生成,整体p值达到0.00004,具有极佳的显著性。其中,专利领先方程式(181)=C+∑权重系数x专利领先指标我们可以先验证专利领先方程式(181)是否具有预测效果,在第一面板数据(131)中,第一年度(T1)的第一财务指标数据(121F)为专利实体(PE)实际的复权收盘价收益率(SPR),我们求得其平均值为0.1171,即11.71%。这时我们使用专利领先方程式(181),将第二年度(T2)的第二专利指标数据(122P)导入专利领先方程式(181),便可得出第一年度(T1)的复权收盘价收益率(SPR)的预测值。根据此复权收盘价收益率(SPR)的预测值的排序,挑出前100个较佳的专利实体(PE),即为投资标的。然后我们找出这100个专利实体(PE)在第一年度(T1)的实际的复权收盘价收益率(SPR),求出平均值为0.2667,即26.67%,远高于全体专利实体(PE)平均值11.71%,为全体专利实体(PE)平均值的两倍以上,说明生成的专利领先方程式(181)具体可行。预测模型建立完成,接著要对未发生的未来,进行选股。我们操作专利领先方程式(181)与第一专利指标数据(121P),生成各专利实体(PE)的专利领先分数(191),其部分内容如表4所示。专利领先分数(191)为各专利实体(PE)的复权收盘价收益率(SPR)预测值。表4专利领先分数(191)表4中,复权收盘价收益率(SPR)与专利领先分数(191)均通过正态分布正态分布转算程序(141)的转换。接著,我们将专利领先分数(191)进行排序,如表5所示,作为选股依据。表5中所列出的20个专利实体(PE),即为深圳交易所发布的专利领先指数(股票代码399427)在2016年1月3日正式更新100个样本股中的20个样本股。表5以专利领先分数(191)进行选股专利实体(PE)股票代码复权收盘价收益率(SPR)专利领先分数(191)江西铜业6003625.18575.5457上海龙头(集团)6006305.57525.5280上海梅林正广和6000735.50345.4928安徽全柴动力6002185.16565.4870中国国际海运集装箱(集团)0000395.24925.4816浙江富润6000705.17685.4753金发科技6001435.44705.4725上海海立(集团)6006195.26625.4722方正科技集团6006015.41915.4633上海家化联合6003155.27935.4558中路6008185.69335.4517上海复星医药(集团)6001965.36265.4470江苏亨通光电6004875.45895.4463浙江万丰奥威汽轮0020855.80475.4461河南瑞贝卡发制品6004395.36315.4442郑州华晶金刚石3000645.36265.4435上海大屯能源6005085.30615.4435上海电气集团6017275.61295.4434上海隧道工程6008205.64065.4433广东梅雁吉祥水电6008685.64065.4412本发明进一步提出第四较佳实施例,为一种专利大数据预测选股的计算机系统(400),用于实现前述第一较佳实施例、第二较佳实施例与第三较佳实施例的通过计算机实现的专利大数据预测选股方法(100、600、800)。请见图5,专利大数据预测选股的计算机系统(400)包括:一个指标演算单元(420),用于计算专利实体(PE)的专利指标(PI)与财务指标(FI)的数据,生成第一专利指标数据(121P)、第一财务指标数据(121F)、第二专利指标数据(122P)与第二财务指标数据(122F);一个数据库单元(430),用于储存专利实体(PE)的信息、第一专利指标数据(121P)、第一财务指标数据(121F)、第二专利指标数据(122P)与第二财务指标数据(122F);一个演算及预测单元(440),用于计算专利核心指标(PCI)、专利领先指标(PLI)、专利领先方程式(181)、以及专利领先分数(191);一个显示与导出单元(450),用于呈现专利实体(PE)与其相应的专利领先分数(191);以及一个核心控制单元(410),用于统整及操控上述单元(420、430、440、450)。本发明所提出的通过计算机实现的专利大数据预测选股方法(100、600、800)与专利大数据预测选股的计算机系统(400),是基于大数据、客观运算、严谨验证的成果,不但有助于专利信息分析与利用的技术实力发展,更能促进投资领域的投资方法的正面发展,且对产业技术的研发与创新起到积极的支持效果。以上说明,对于相关技术领域之专门人士应可理解及实施。同时以上所述仅为本发明之较佳实施例,并非用以限定本发明之权利范围。任何基于本发明所揭示内容所完成的等同改变或修饰,均应包含在权利要求书的涵盖范围中。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1