一种基于模糊推理的法律大数据管理系统的制作方法

文档序号:11953223阅读:286来源:国知局
一种基于模糊推理的法律大数据管理系统的制作方法与工艺
本发明属于法律信息管理领域和法律量化评估领域,具体说是一种基于模糊推理的法律大数据管理系统。
背景技术
:随着计算机和互联网技术的飞速发展,信息化智能化的法律大数据管理系统层出不穷,大大提高了人类使用法律的便捷性和准确性。法律信息数据库能够对文本、图形、图像、音频、视频等各种格式的法律信息进行存储和分类,方便人们查询和案情分析,用户在检索接口输入检索信息,能够轻便地关联到法律信息数据库进行查找操作;通过与法律信息数据库相关联,用户可以方便地查询、新增或者修改相关的法律信息;用户还能利用法律大数据管理系统完成报告的输出和打印,以便查看,并可生成的法律文书和评估结果;更进一步地,能够与其他相关法律、案例进行对比分析,利于对案情作深入对比分析。现在的法律大数据管理系统已经成为现代法律业务中重要的组成部分。目前的法律管理方法和系统缺点也很明显,因为法律大数据管理系统所面对的对象不同于经济、科技、生产、环境的数值化数据,多是文字、图片、图形、音频、视频、DNA、指纹等,以非数值化、非结构化的数据为主,此类数据具有很强的模糊性。关于法律的模糊性,几十年来的讨论一直没有停止过,主要包括几个方面:法律用语的模糊性,法律条文的理解、法律后果的模糊性、行为严重程度的界定往往是模糊的;语境的模糊性,法律数据与语境是密切相关的,不能割立出来孤立地判断;案发环境的模糊性,案发环境往往是不可控,很多时候甚至没有第三者在场;涉案人员的模糊性,涉案人员的教育背景、家庭背景、工作经历、感情经历、社会关系往往非常复杂;诉讼代理人尤其是法官的模糊性,同类案例的代理和审判,不同的代理人和法官处理的效果不同,这与代理人的背景、经验、掌握信息的程度以及法官的思想、自由裁量权等息息相关。而目前的法律系统对于上述法律上的模糊性问题还没有提出切实可行的方法;此外,法律问题的处理要求严密的推理,目前的法律数据库的数据收集、处理和深度挖掘还不够,主要是手工处理和分析,效率较低;从系统为用户服务的角度,现在的系统还不能自动过滤掉一个案件的无效信息,大量的无效信息无疑给用户增加了沉重的阅读、推理工作量,不利于提高办案效率和办案质量;现有的法律大数据管理系统难以为用户提供量化的分析工具,也无法为用户提供相关法律、相关案例的自动匹配和挖掘。法律是一个国家文明的体现,随着国家经济和法治化进程的迅速发展,对于法律管理提出了更高的要求。在国内,随着大数据、模糊推理在法律管理中的应用,为利用大数据技术和模糊推理分析法律管理方法和系统提供了条件,但是,目前市场上很少有基于模糊推理的法律大数据管理系统和方法。技术实现要素:为了克服上述现有技术的缺陷,本发明提供了一种基于模糊推理的法律大数据管理系统,通过模糊数学算法来挖掘法律管理中相关的法律系统、法律从业人员系统、案例系统、监控系统、社会系统的数据,分析法律推理的规律和机制,为司法提供更为准确的支持。本发明所采取的技术方案为:一种基于模糊推理的法律大数据管理系统,把相关的数据库整合为一个法律大数据系统,以模糊集合论为基础描述工具,通过模糊数学来推理相关的法律法规、案例、法律从业人员、社会关系之间的复杂因素,对以一般集合论为基础描述工具的数理逻辑进行扩展,从而完成法律案例的模糊推理;该方法通过模糊数学算法挖掘与法律相关的各类数据系统,深度挖掘大数据潜在的法律价值,提供量化的、精准的法律分析和结果评估。一种基于模糊推理的法律大数据管理系统,包括数据采集模块、数据预处理模块、数据库模块、模糊推理模块、信息推送模块、移动终端。所述数据采集模块,安装于司法、案例、监控、社会数据库管理部门,与相应的数据库相联,用于收集法律法规、案例、监控、法律从业人员、社会数据,并存入相应的法律、案例、法律从业人员、监控、社会数据库系统;所采集的数据信息必须是由国家权力机关、司法机关、行政机关等主体授权监测和录入信息,保证信息来源准确性和可靠性。所述数据预处理模块,将存放于分布式数据库的不同格式的数据进行处理、以及必要的清洗后,存放于中心数据库;所述数据库模块,安装于法律大数据管理系统中心,与法律法规、案例、监控、法律从业人员、社会数据库相联,用于将采集到的文本、图片、图形、音频、视频、DNA、指纹等种类繁多的数据处理成统一的数据格式,并进一步传输给模糊推理模块进行处理;所述数据库模块,根据立法部门的要求,实时对法律和司法解释条文进行数据的更新,对案例、法律从业人员、监控、社会数据库进行数据整理,将采集的文本、图片、图形、音频、视频、DNA、指纹等与案例有关的信息形成证据分类;所述模糊推理模块,安装于法律大数据管理系统中心服务器,与中心数据库相联,用于完成大数据的模糊挖掘和数据分析,并响应合法用户的查询、检索、修改、删除、输出、打印、推送操作;所述中心服务器,根据数据库的信息,对案例进行定性,确定当事人的证明责任和证明标准,完成法律分析和后果评估;所述信息推送模块,将模糊推理模块输出结果进行分类总结,并提供推荐的案情分析和评估结果,供相关用户参考;所述移动终端,用于相关用户接收信息推送模块实时提供的法律服务信息。所述数据库模块,为分布式数据库,包括法律法规、案例、法律从业人员、监控、社会数据库,安装和分布于不同的地区或组织机构,用于保存采集的相关数据,只有相关的权力部门才有权限进行输入、修改、查询、更新,并正式发布数据。所述中心数据库,安装于管理中心,与服务器联接在一起,可以处理、保存法律大数据管理系统所需的预处理数据、模糊推理中间计算结果。所述模糊推理模块,安装于法律大数据管理系统中心服务器,通过接近于人类语言的模糊语言对法律法规、案例、法律从业人员、监控、社会数据进行模糊推理,并运用大数据的可视化分析技术和数据挖掘技术,包括假设检验、显著性检验、差异分析图表工具形成演化分析报表,图形化显示案例的演化过程,并推荐案情分析报告和评估结果。本发明一种基于模糊推理的法律大数据管理系统,优点在于:1、具有较高的可信性,减少判决结果的歧义。采用该大数据管理系统后,法律法规、案例、法律从业人员、监控、社会数据等,通过数据采集模块进行比较全面的收集、整理、分类,并存储在相应的数据库,能够形成比较完整、可信的基础数据;然后采用模糊推理方法进行大数据挖掘和推理,便于得到较为完整的证据链和较全面的对比分析,生成准确的案情分析和相关法律分析报告,为用户提供较精准的法律服务。2、减少用户的工作量,提高办案效率。该大数据管理系统,能够使用模糊推理对案件有用信息进行自动识别,并自动过滤掉无用的信息,并将有用信息提供给用户,大大减少用户的阅读量;本发明还能够对相关的案例和相关的法律条文自动进行相似度比对和模糊推理,根据系统后台数据自动比对形成的相似度结果比对矩阵,用户可以根据筛选出来的案例和法律条文进行参考,深度挖掘疑难案件、关联案件和疑似线索;根据找到匹配的法律条文作为案件审理依据,减少用户查阅条文引用案例的工作。3、提供量化评估,规范自由裁量权的使用。在现代司法中,自由裁量权呈现扩大趋势,法官自由裁量权贯穿司法的全过程,经常出现“同案不同判”的现象;本发明采用模糊推理方法为司法人员提供了一个量化评估的工具,将法律方面的各种模糊因素量化为较为清晰的数学模型和更精确的数据范围,规范法官的自由裁量权的使用,保护当事人的权益;使得推理过程和判决结果更加严密,有据可查,可信度高,既不会使罪轻的人枉受处罚,也不会使罪重的人侥幸逃脱处罚。4、服务对象广泛。本发明能够对涉案的海量信息进行深度挖掘和对比、自动删繁就简减少阅读量、以及深度挖掘人工识别难以发现的可疑线索和关联信息,并提供尽可以详实的数据报告。既可以为司法机构及法律从业人员提供服务,也可以为涉案的亲属、朋友,以及对该案件感兴趣的人士提供服务。同时,本发明还有助于提高公众法治意识,对于有社会重大影响的案件,本发明可以使公众对案件的基本情况和法律后果有较为准确的把握,正确引导社会舆论。附图说明图1为本发明的系统结构示意图。图2为本发明的数据库模块的结构示意图。图3为本发明的模糊推理方法流程图。具体实施方式如图1所示,一种基于模糊推理的法律大数据管理系统,包括数据采集模块100、数据预处理模块101、数据库模块102、中心服务器103、信息推送模块104、移动终端105。所述数据采集模块100,安装于各地的司法、案例、监控、社会数据库管理部门,与相应的数据库相联,用于收集法律法规、案例、法律从业人员、监控、社会数据,并存入相应的法律、案例、法律从业人员、监控、社会数据库系统;所述数据采集模块100,用于采集文本、图片、图形、音频、视频、DNA、指纹等种类繁多的数据;文本数据可以采用数字化扫描仪,配合光学字符识别软件OCR(OpticCharacterRecognize)能将扫描的法律法规文书等文稿转换成计算机的文本形式;优选地,使用手持或台式光学扫描仪,分辨率为300PPI甚至更高,扫描幅面通常有A4、A4加长、A3、A1、A0等规格;优选的,使用36位和42位等标准的色彩位数;图片、图形和视频数据可以采用数码相机或摄像机,使用CCD或者CMOS成像元件转化为数字信号供计算机处理,常用的设备包括现手机摄像机、单反相机、卡片式相机等;优选地,使用高精度的数码相机或摄像机为案件提供清晰的图像或视频,包括AVI、JPG、MP4、MOV、ASF、GIF等格式;音频数据的获取,包括录音笔、手机、电脑、麦克风等,可将现场内部或外部声音20~20000Hz的频率(如麦克风、线路输入、INTERNET广播或视频中的声音)进行录制、保存为WAV、MP3、WMA等数码音频格式;DNA和指纹鉴定利用法医学、生物学和遗传学的理论和技术,分析涉案人员形态构造或生理机能方面的相似特点和遗传特征,是法医物证鉴定的重要组成部分,DNA鉴定常用人的血液、毛发、唾液、口腔细胞及骨头进行,可以生成DNA鉴定分型图谱和DNA或指纹鉴定报告。所述数据预处理模块101,为安装于各机构的分布式服务器,优选地,使用CPU为2×E5-24201.9GHz6-core机架式X86架构服务器,不少于48GBRAM,用于将存放于分布式数据库的不同格式的数据进行处理、以及必要的清洗后,存放于中心数据库。中心数据库通过预处理算法完成分布式数据的整理和分类工作,包括数据清理、数据集成、数据变换、数据归约等;这些数据预处理算法在数据挖掘和模糊推理之前使用,大大提高了数据库模块102数据挖掘模式的质量,降低中心服务器103实际挖掘所需要的时间。所述数据库模块102,为分布式数据库,其中中心数据库安装于法律大数据管理系统中心,与各地分布式法律法规、法律从业人员、案例、监控、社会数据库相联,用于将采集到的文本、图片、图形、音频、视频、DNA、指纹种类繁多的数据处理成统一的数据格式;中心数据库可以处理、保存法律大数据管理系统所需的预处理数据、模糊推理中间计算结果;并进一步传输给中心服务器103进行处理;所述数据库模块102,其中的分布式数据库安装和分布于不同的地区或组织机构,为网络数据存储系统,优选地,使用高容量3.5”HDD磁盘柜,具体容量视各机构使用情况配置,网络Dual-port10GbE(data)/Dual-port1GbE(mgmt),能够存储包括法律法规、案例、法律从业人员、监控、社会数据库,只有相关的权力部门才有权限进行修改,并正式发布数据;分布式数据库能够与中心数据库进行通讯,保持数据的一致性和有效性。所述中心服务器103,安装于法律大数据管理系统中心服务器,优选地,使用两片CPU为2×E5-24502.1GHz8-core机架式X86架构服务器,128GBRAM,和高容量3.5寸HDD磁盘,用于通过大数据的可视化分析技术和数据挖掘技术,包括假设检验、显著性检验、差异分析图表工具形成演化分析报表,图形化显示案例的演化过程,并推荐案情分析报告和评估结果。所述中心服务器103,安装于法律大数据管理系统中心服务器,与中心数据库相联,用于完成大数据的模糊挖掘和数据分析,并响应合法用户的查询、检索、修改、删除、输出、打印、推送操作。所述中心服务器103的模糊推理模块使用模糊数学算法,将模糊数学应用于法律分析中,根据案例的查询请求和相关的数据库信息,对案例进行定性,确定当事人的证明责任和证明标准,完成法律分析和后果评估;可以使用接近于人类语言习惯的模糊语言数学公式把法律条款和案情中的模糊概念清晰化,从而实现法律问题的量化分析和评估;中心服务器103的模糊推理模块建立在模糊集合理论、模糊推理等概念基础上进行合理计算,并输出推理结果数据。所述中心服务器103的模糊推理模块,优选地,使用Mamdani模糊推理法,也是最常用的一种推理方法,容易在计算机上实现,其模糊蕴涵关系定义简单,可以通过模糊集合和的笛卡尔积(取小)求得,即μR~M(x,y)=μA~(x)ΛμB~(y)]]>模糊推理的结论主要取决于模糊蕴含关系及模糊关系与模糊集合之间的合成运算法则。(i)具有单个前件的单一推理规则设和论域X上的模糊集合,是论域Y上的模糊集合,和间的模糊关系是有当时,有μB~*(y)=Vx∈X{μA~*(x)Λ[μA~(x)ΛμB~(y)]}=Vx∈X{[μA~*(x)ΛμA~(x)]ΛμB~(y)}=ωΛμB~(y)]]>其中称为和的适配度。对于单前件单规则(即若x是则y是)的模糊推理,当给定事实x是精确量x0时,欲求应先求出适配度ω(即的最大值);然后用适配度ω去切割的MF,即可获得推论结果(ii)具有多个前件的单一规则设和分别是论域X、Y和Z上的模糊集合,已知和间的模糊关系为根据此模糊关系和论域X、Y上的模糊集合推出论域Z上新的模糊集合。即根据Mamdani模糊关系的定义,有笛卡尔积取小此时μC~*(z)=Vx∈Xy∈Y[μA~*(x)ΛμB~*(y)]Λ[μA~(x)ΛμB~(y)ΛμC~(z)]=Vx∈Xy∈Y{[μA~*(x)ΛμB~*(y)]Λ[μA~(x)ΛμB~(y)]}ΛμC~(z)={Vx∈X[μA~*(x)ΛμA~(y)]ΛVy∈Y[ΛμB~*(y)ΛμB~(y)]}ΛμC~(z)=(ωAΛωB)ΛμC~(z)]]>其中是隶属函数的最大值,表示对的适配度;是隶属函数的最大值,表示对的匹配度;由于模糊规则的前件部分由连词“与”连接而成,因此称ωAΛωB为模糊规则的激励强度或满足度,它表示规则的前件部分被满足的程度。(iii)具有多个前件多条规则的模糊推理设和分别是论域X、Y和Z上的模糊集合,是和间的模糊蕴含关系,是和间的模糊蕴含关系。已知论域X、Y上的模糊集合推出论域Z上新的模糊集合即对于多个前件多条规则的模糊推理问题,通常将多条规则处理为相应于每条模糊规则的模糊关系的并集。上述的模糊推理问题可以表示为μC~*(x)=Vx∈Xy∈Y[μA~*(x)ΛμB~*(y)]Λ[μR~M1(x,y,z)VμR~M2(x,y,z)]={Vx∈Xy∈Y[μA~*(x)ΛμB~*(y)]ΛμR~M1(x,y,z)}V{Vx∈Xy∈Y[μA~*(x)ΛμB~*(y)]ΛμR~M2(x,y,z)}=μC~1*(z)VμC~2*(z)]]>其中:μR~M2(x,y,z)=μA~2(x)AμB~2(x)VμC~2(z);]]>和分别是在规则1和规则2下所得到的模糊集合。综上所述,多个前件多条规则的模糊推理过程可以分为四步:⑴计算适配度把事实与模糊规则的前件进行比较,求出事实对每个前件MF的适配度。⑵求激励强度用模糊与、或算子,把规则中各前件MF的适配度合并,求得激励强度。⑶求有效的后件MF。用激励强度去切割相应规则的后件MF,获得有效的后件MF。⑷计算总输出MF。将所有的有效后件MF进行综合,求得总输出MF。所述信息推送模块104,为安装于各法律从业人员所属机构的PC机、笔记本电脑、移动智能终端,能够根据用户的不同需求和习惯将中心服务器103输出结果进行分类总结,并提供推荐的案情分析结果和推荐的判决策略,以供相关用户参考;所述移动终端105,为安装于各法律从业人员和合法用户使用的手机终端,以及移动智能终端,用于执法人员和合法用户接收信息推送模块104实时提供的法律服务信息。一种基于模糊推理的法律大数据管理系统,能够通过数据采集模块100采集分布于各地的法律法规、案例、法律从业人员、监控、社会数据等,并存入相应的数据库,经过数据预处理模块后保存到数据库模块102中心数据库,由中心服务器103使用模糊推理和判断规则对法律条文和案情数据进行大数据分析,并生成准确的案情分析和相关法律分析报告,再由信息推送模块104推送至移动终端105,给用户提供较精准的法律服务。如图2所示,为本发明实例提供的一种基于模糊推理的法律大数据管理系统的数据库模块的结构示意图,包括中心数据库、法律法规数据库、案例数据库、监控数据库、法律从业人员数据库、社会数据库、嫌疑人数据库、其他数据库等。所述中心数据库,安装于法律大数据管理中心,优选地,使用多组高容量3.5”HDD/2.5”SATA混合磁盘柜,存储容量大于324TB,可扩展容量不少于684TB,管理节点/数据节点不少于1Mgmt/19Data,网络Dual-port10GbE(data)/Dual-port1GbE(mgmt);优选地,通过FDDI光纤与中心服务器联接在一起,使用两片CPU为2×E5-24502.1GHz8-core机架式X86架构服务器,128GBRAM,可以处理、保存法律大数据管理系统所需的预处理数据、模糊推理中间计算结果。法律法规数据库安装于各地的分布式数据库,为已经构建起来的数据库系统,主要用于存储相关的法律法规信息,只有授权的国家法律机构才能够修改;进一步地,根据与中国甚至国外法律条款、案例的对比,提供相关的法律条款和成功/失败的裁判先例,以供参考;进一步地,为法律从业人员和用户提供对相关的案例和相关的法律条文自动进行相似度比对和模糊推理,根据系统后台数据自动比对形成的相似度结果比对矩阵,用户可以根据筛选出来的案例和法律条文进行参考,深度挖掘疑难案件和疑似线索;根据找到匹配的法律条文作为案件审理依据,减少用户查阅条文引用案例的工作。所述法律从业人员数据库,为安装于全国各地法律从业机构的管理数据库,为已经构建起来的数据库系统,存储了本机构及相关机构的人员数据,包括从业人员法律背景、业务经历、案例信息、社会关系等;进一步地,根据所存储的律师数据,为用户提供该不同律师的相关信息。所述案例数据库,为安装于全国各地法律从业机构的管理数据库,为已经构建起来的数据库系统,存储了本机构及相关机构的案例数据;进一步地,根据所存储的案例数据,为用户提供相关案例问题的参考和解决方法;能够对涉案的海量信息进行深度挖掘和对比、自动删繁就简减少阅读量、以及深度挖掘人工识别难以发现的可疑线索,并提供尽可以详实的案例报告。所述监控数据库,为安装于全国各地监控机构的管理数据库,为已经构建起来的数据库系统,存储了本机构及相关机构的监控数据,为案例判决提供参数信息。社会数据库,为安装于全国各地监控机构的管理数据库,为已经构建起来的数据库系统,存储了本机构及相关机构的监控数据,为案例判决提供参数信息。嫌疑人数据库,为安装于全国各地司法机构的管理数据库,为已经构建起来的数据库系统,存储了本机构及相关机构的嫌疑人数据,为案例判决提供参数信息;进一步地,根据所存储的嫌疑人数据,为法律从业人员和用户提供相关案例和潜在联系。其他数据库,为安装于全国各地机构的信息处理数据库,为已经构建起来的数据库系统,如银行、工商、税务、医院、学校、旅馆、饭店、小区等机构,存储了本机构及相关机构的业务数据,为案例判决提供参考信息;进一步地,根据所存储的嫌疑人数据,为法律从业人员和合法用户挖掘相关案例和潜在联系。如图3所示,为本发明实例提供的一种基于模糊推理的法律大数据管理系统的模糊推理方法流程图。本发明系统能够自动对法律文本数据和案例文本数据进行模糊相似度比对,包括前缀词库对比和后缀词库对比,以便进行模糊推理,根据对比位置查找系统后台数据自动比对形成的相似度结果比对矩阵,能够利用临时结果表进行量化判断,确认某些数据为比对成功或失败。如与后台数据比对存在相似度大于一定可信比例(比如80%,此参数可根据需要调整)的数据,针对这部分数据选取其他字段(如保险公司、幼儿园)进行比较,如果存在相同记录,可自动判定该数据为比对成功;使用比对结果中间表存储系统后台自动比对不成功数据。进一步地,本发明能够使用模糊推理对案件有用信息进行自动识别,并自动过滤掉无用的信息,并将有用信息提供给用户,大大减少用户的阅读量;进一步地,本发明能够对相关的案例和相关的法律条文自动进行相似度比对和模糊推理,根据系统后台数据自动比对形成的相似度结果比对矩阵,用户可以根据筛选出来的案例和法律条文进行参考,深度挖掘疑难案件和疑似线索;进一步地,根据模糊推理找到匹配的法律条文作为案件审理依据,减少用户查阅条文引用案例的工作;进一步地,采用模糊推理方法为司法人员提供了一个量化评估的工具,将法律方面的各种模糊因素量化为较为清晰的数学模型和更精确的数据范围,规范法官的自由裁量权的使用;进一步地,既可以为司法机构及法律从业人员提供服务,也可以为涉案的亲属、朋友,以及对本案感兴趣的人士提供服务,正确引导社会舆论。以上实施方式仅适用于说明本公开,而并非对公开的限制,有关
技术领域
的普通技术人员,在不脱离本公开的精度和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本公开的范畴,本公开的专利保护范畴应自权利要求限定。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1