一种客观量化的中国发明专利评估系统及方法
【技术领域】
[0001] 本发明设及知识产权评估技术,是一种基于统计学及数据挖掘模型评估知识产权 的客观量化的中国发明专利评估系统及方法。
【背景技术】
[0002] 目前专利权在当今商业活动中起着至关重要的作用。在投资领域,它鼓励投资者 进入新兴产业,并在竞争者行动前率先抢占市场。在市场竞争中,它能够有效保护自身的创 新技术,避免不必要的纠纷,并提升在业内的竞争优势;在战略布局方面,专利权对认清行 业发展方向和经济走向,制定合适的专利战略布局也起着重要作用。
[0003] 无论是专利权的自身价值和专利权在公司的经验和发展中的衍生价值都非常重 要。但是,专利的评估却比较复杂和困难,当前国内普遍的专利评估方法(无论是检索评估, 还是专利定价)均不同程度存在人为的干预,由于主观因素过多、评估者的经验和直觉作用 明显,其科学合理性较难得到验证。如表1所示,检索评估,即通过专利检索方法,对比分析 相关专利并判断专利的含金量、新颖性和创造性,W判定研发的意义或专利侵权的可能性, 常用于专利研发布局及律师的专利诉讼分析等。专利价值评估是专利评估中最直观的价格 体现,即W会计学中对无形资产评估的方法为基础(如收益法、成本法、市场法)实现估价, W解决专利交易中专利值多少钱的问题,常见于会计师和资产评估师的专利(无形资产)评 估报告,然而运用Ξ种基础估价方法都无法精确为专利定价。本专利专注于客观量化的专 利评估方法的研究,其人为干扰因素较少、说服力更强。它是对专利优劣的判断,通过模型 构建,找出目标专利优劣与其可W量化的专利的内部特征和外部特征指标之间的关系。
[0004]
[0005] 表 1
[0006] 上图的表1为专利评估方法分类表。
【发明内容】
[0007] 本发明的目的在于克服现有技术之缺陷,提供了一种客观量化的中国发明专利评 估系统及方法,其具有客观量化、自动化评估专利优劣的特性。
[0008] 本发明是运样实现的:一种客观量化的中国发明专利评估系统及方法,其包括:
[0009] -专利信息数据库
[0010] -专利算法程序
[0011] -功能模块(包括专利检索、专利信息展示、专利分析、评估报告展示及导出等)
[0012] 其中专利评估方法集中体现于算法程序中,其包括:
[0013] -数据预处理模块,其包括数据清洗、数据信息提取、数据重新规划,数据清洗用 W把存在缺失的数据补全或移出、把重复数据统一、把格式错误的字段转换;数据信息提取 用W提取关键时间信息并计算时间间隔,对摘要、说明书等文本的数量化处理、提取离散有 序字段和无序分类型字段信息;数据重新规划用W对提取出的信息重新赋予新的值,W达 到每一个值所对应的样本数量充足且整体呈现一定的分布结构;
[0014] -模型建立模块,其包括变量选择、模型寻优;
[0015] -专利评估模块,其包括IPV分数、百分比等级、专利评级、生存年限估计、对专利 主体的评级
[0016] -种利用客观量化的中国发明专利评估系统进行评估的方法,其包括W下步骤:
[0017] a、数据预处理;
[001引 b、模型建立;
[0019] C、专利评估。
[0020] 进一步地,在步骤(a)中,所述数据预处理进一步包括:
[0021] (1)数据清洗,把存在缺失的数据补全或移出、把重复数据统一、把格式错误的字 段转换;
[0022] (2)数据信息提取,提取关键时间信息并计算时间间隔,对摘要、说明书文本信息 的数量化处理、提取离散有序字段和无序分类型字段信息;
[0023] (3)数据重新规划,对提取出的信息重新赋予新的值,W达到每一个值所对应的样 本数量充足且整体呈现一定的分布结构。
[0024] 进一步地,在步骤(b)中,所述模型建立进一步包括:
[0025] (1)通过专利法规,剔除与评估专利好坏无关的字段;
[0026] (2)选择衡量专利优劣的字段作为建模目标字段,进一步规划目标字段,W达到分 布结构更适合建模要求;
[0027] (3)通过统计学意义选择与目标字段有显著相关性的字段并检查其意义;
[0028] (4)根据对统计图形分布有分类特征的关键字段对建模数据分类;
[0029] (5)通过似然比指标,计算机自动进行建模前地降维处理;
[0030] (6)模型参数寻优,建模完成;
[0031] (7)模型部署上线。
[0032] 进一步地,在步骤(C)中,
[0033] (1)使用所获得的模型对专利评出粗糖分数;
[0034] (2)把粗糖分数映射到0到200之间,给出IPV分数;
[0035] (3)基于IPV分数计算出百分比等级,并给出专利评级;
[0036] (4)基于IPV分数对专利生存年限进行预测,把IPV分数重新规划成几个等级,分别 统计每个等级的专利在进入下一续费周期时的生存率和平均生存年限,进一步计算整个专 利生存年限预测表;
[0037] (5)系统自动生成专利在线评估报告,其中包括专利的基本属性、评估得分、星级 排名及专利生存年限预测。
[0038] 进一步地,在步骤(C)中,专利评估选择多元回归模型作为评估模型,参数寻优方 式选择通常的最小二乘法,Υ =防+ε,Υ为因变量矩阵,X为自变量矩阵,β为系数矩阵,ε为残 差矩阵。参数计算,β=(χ/χΓ?(χ/γ),χ'为X矩阵的转置。
[0039] 进一步地,在步骤(C )中,引入似然比值进行事后维度选择,定义:
其中LR1为无约束方程的似然函数,Τ为点的个数,3为无约 束方程的方差估计;LR2为约束方程的似然函数,S;为有约束方程的方差估计,LRULR2服从 X2分布,每次尝试剔除一个自变量对原方程的影响,如果影响超过X2临界值,证明剔除此自 变量对方程影响过大,如果在方程中有相关性很强的两个自变量,当一个被剔除时,由于另 一个的存在,不会对方程产生重大影响,达到了对原多元回归模型进行了维度选择的效果。
[0040] 本发明公开的评估系统将无形的知识产权量化,客观化,排除了人为因素的干扰, 针对每一部分给出相应的评估结果,操作简单,容易为市场所接受,且理论扎实,精湛,统计 范围广,差异小。
[0041] 另本发明公开的评估方法完全基于对专利固有属性的客观量化,评估过程由计算 机独立完成无需人工,能够高效地对每一个专利给出有参考意义的评估分数,进一步基于 此评估分数估计专利的生存年限、专利等级,填补了程序化评估专利的空白,真实,可靠,符 合目前的发展潮流。
【附图说明】
[0042] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本 发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可 W根据运些附图获得其他的附图。
[0043] 图1为本发明实施例提供的评估系统结构图;
[0044] 图2为本发明实施例提供的流程图。
【具体实施方式】
[0045] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完 整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于 本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他 实施例,都属于本发明保护的范围。
[0046] 如图1-2,本发明实施例提供一种客观量化的中国发明专利评估系统及方法,详见 W下说明。
[0047] -种客观量化的中国发明专利评估系统,其包括:一数据预处理模块,其包括数据 清洗、数据信息提取、数据重新规划,数据清洗用W把存在缺失的数据补全或移出、把重复 数据统一、把格式错误的字段转换;数据信息提取用w提取关键时间信息并计算时间间隔, 对摘要、说明书等文本信息的数量化处理、提取离散有序字段和无序分类型字段信息,当 然,不能局限于W上列举的摘要、说明书信息,甚至也可W考虑从专利附图中提取信息;数 据重新规划用W对提取出的信息重新赋予新的值,W达到每一个值所对应的样本数量充足 且整体呈现一定的分布结构;一模型建立模块,其包括变量选择、模型寻优;一专利评估模 块,其包括IPV分数、百分比等级、专利评级、生存年限估计、对专利主体的评级。
[0048] -种客观量化的中国发明专利评估系统进行评估的方法,其包括W下步骤:
[0049] a、数据预处理;在步骤(a)中,所述数据预处理进一步包括:
[0050] (1)数据清洗,把存在缺失的数据补全或移出、把重复数据统一、把格式错误的字 段转换;
[0051] (2)数据信息提取,提取关键时间信息并计算时间间隔,对摘要、说明书等文本的 数量化处理、提取离散有序字段和无序分类型字段信息;
[0052] (3)数据重新规划,对提取出的信息重新赋予新的值,W达到每一个值所对