基于文本数据的即席关系分析系统及方法与流程

文档序号:20839032发布日期:2020-05-22 17:15阅读:252来源:国知局
基于文本数据的即席关系分析系统及方法与流程
本发明涉及文本数据规则处理、数据关系模型定义、以及处理数据即席可视化展示的关系分析系统,尤其涉及一种对文本数据进行即席可视化展示及二次关系分析的即席关系分析系统及方法。
背景技术
:随着人类社会科学技术的不断进步,互联网技术、计算机技术的快速发展,在各个行业、不同业务部门都积累了大量、多种类文本数据,这些文本数据分散存储且关联性差。如何能够对这些文本数据进行有效整合,按规则进行处理,通过可视化方式展示处理后数据关系,进而发现数据之间的隐性关系以及数据内部深层次的价值,是当前急需解决的问题。为了解决这些问题,当市场上出现了多种文本数据分析系统,比如文本数据管理系统(主要实现文本数据分类上传管理)、文本数据存储系统(主要实现文本数据分类存储并检索)、文本数据全文搜索系统(主要实现文本数据的全文索引并按关键词搜索)等,但其主要原理都基于文本数据进行分类存储、按条件进行查询、全文检索文本数据;对于最后获取的数据还是一个或多个文本文件,很难发现文件内容之间的关联关系,尤其难以发现多个文件之间的数据关联关系;因此这些文本数据应用分析系统不能很好满足业务的实际需求,不能获知文本数据之间的关联性,尤其难以发现多个文本数据之间隐藏的深层次关联关系。由于上述问题的存在,本发明人对现有的文本数据简便设置处理规则和灵活定义数据关系模型等相关技术进行研究和分析,以期待研制出可以简便的接入多种文本数据源、可以灵活的设置数据关系模型同时又可以对处理的数据进行可视化关系展示并进行二次关系分析,从而发现数据深层次关联关系的基于文本数据的即席关系分析系统及方法。技术实现要素:为了克服上述问题,本发明人进行了锐意研究,设计出一种基于文本数据的即席关系分析系统及方法,通过文本数据接入模块对多种不同类型的业务文本数据进行解析规则定义,以使得可以对多种文本数据来源进行灵活使用/调用;通过关系模型配置模块建立数据关系模型,使得使用者可以根据自己的业务需求灵活的设置关系模型;通过设置的数据关系模型对接入的文本数据进行即席关系映射,以可视化的方式进行数据关系直观呈现,进一步地,还可以对展现的数据关系进行二次数据关系分析,进而发现数据之间深层次的隐形关系,为业务分析提供更多有价值的数据信息,从而完成本发明。本发明的目的在于提供以下技术方案:(1)一种基于文本数据的即席关系分析系统,该系统包括应用体系1、展现体系2和数据体系3;其中,应用体系1包括:文本数据接入模块11,其作为数据来源模块与业务文本库31的文本数据链接,将文本数据传送至即席关系映射模块12和关系模型配置模块13;关系模型配置模块13,其接收文本数据接入模块11传送的文本数据,基于文本数据和业务需求,设置数据关系模型,并将设置的数据关系模型传送至即席关系映射模块12;即席关系映射模块12,其接收文本数据接入模块11传送的文本数据,以及关系模型配置模块13传送的数据关系模型信息,将文本数据与数据关系模型进行映射,映射关系传递至即席任务管理模块14;即席任务管理模块14,控制数据关系模型对接入的文本数据进行关系分析,并将运行数据关系模型过程中产生的分析结果数据信息传送到数据关系可视化展示模块21;展现体系2包括:数据关系可视化展示模块21,其接收即席任务管理模块14传送的分析结果数据信息,将其以关系图形的方式进行直观显示。优选地,展现体系(2)还包括二次数据关系分析模块(22),其对数据关系可视化展示模块(21)展示的数据信息进行二次数据分析,发现数据之间深层次的隐形关系;优选二次分析方式包括对象聚类分析、关系路径分析、图表内容模糊检索。在一种优选的实施方式中,文本数据接入模块11包括:数据源配置子模块,其用于建立访问业务文本库(31)的数据库链接,以及配置接入文本数据的信息;数据接入子模块,其对文本数据进行接入,接入方式包括导入方式;该数据接入子模块可以进行全文本数据信息接入或部分文本数据信息接入;数据解析子模块,其根据设定的解析规则对接入的文本数据进行格式化处理;数据预览子模块,其对解析后的文本数据进行呈现,用于业务人员判断解析后数据格式是否符合要求;数据输出子模块,将解析后文本数据传送至相应的数据接收模块。在一种优选的实施方式中,关系模型配置模块13包括:数据关系模型名称子模块,其用以存储数据关系模型的名称;实体配置子模块,其配置两个待关联的实体,并存储实体信息;链接配置子模块,其用以存储数据关系模型的数据关系信息;数据关系模型类别子模块,其用以设定数据关系模型的分类。在一种优选的实施方式中,数据体系3包括:业务文本库31,包括话单记录文本库、资金交易文本库和其他常规文本数据;系统配置库32,其用以存储系统内部产生的数据信息,包括文本接入规则信息、即席关系映射信息、即席任务管理信息。关系模型库33,其用以存储关系模型配置模块13在进行关系模型定义时存储的关系模型基本信息、实体属性信息、链接属性信息。(2)一种基于文本数据的即席关系分析方法,该方法包括以下步骤:步骤1),接入文本数据步骤:对需要接入的业务文本库31的数据源信息进行配置,接入业务文本库31的文本数据;步骤2),定义数据关系模型步骤:根据步骤1)中接入的文本数据定义数据关系模型,数据关系模型中包括两个待关联的实体;步骤3),即席关系映射步骤:将数据关系模型中的实体属性与接入的文本数据的相应字段名进行映射,获得映射关系;步骤4),数据关系模型运行步骤:对步骤3)中设置后的数据关系模型的关联任务进行执行和监控,数据关系模型运行过程中产生分析结果数据信息;步骤5),结果信息展示步骤:对步骤4)中产生的分析结果数据信息进行可视化展现操作;优选展现方式包括网络布局、圆形分析、扇形布局、弓形布局。优选地,所述方法还包括在数据关系可视化展现完成后,对可视化图表数据进行二次操作,所述二次操作包括对象聚类分析、关系路径分析、图表内容模糊检索。根据本发明提供的基于文本数据的即席关系分析系统及方法,具有以下有益效果:(1)本发明提供的基于文本数据的即席关系分析系统及方法,通过设置文本接入规则,可以灵活定义接入文本类型和文本内容处理规则,使得接入和处理文本数据种类更加广泛,操作更加便捷,提高了该系统的实用性;(2)本发明提供的基于文本数据的即席关系分析系统及方法,通过基于接入的文本数据配置实体,以实体为媒介,可以灵活的配置数据关系分析模型,使得文本数据处理过程中,数据映射方式多样,提高了系统的灵活性和人的主观能动性;(3)本发明提供的基于文本数据的即席关系分析系统及方法,通过设置即席任务管理模块,能够多方式定义文本处理任务的执行方式,并且能够实时监控文本处理任务的执行状态、执行进度;(4)本发明提供的基于文本数据的即席关系分析系统及方法,通过设置数据关系可视化展示模块,可以直观的展示数据之间的关系;(5)本发明提供的基于文本数据的即席关系分析系统及方法,具有二次数据关系分析功能,能够进一步发现数据之间深层次的隐形关系,便于使用者进行综合数据分析和数据挖掘工作。附图说明图1示出根据本发明一种优选实施方式的基于文本数据的即席关系分析系统的结构示意图;图2示出根据本发明中一种优选实施方式的应用体系和展现体系中各模块间数据流示意图;图3示出根据本发明中一种优选实施方式的系统配置库的数据表示意图;图4示出根据本发明一种优选实施方式的关系模型库的数据表示意图;图5示出根据本发明一种优选实施方式的即席任务管理模块的功能结构流程图;图6示出根据本发明一种优选实施方式的可视化关系分析的流程图;图7示出根据本发明一种优选实施方式的基于文本数据的即席关系分析系统的业务操作流程图;图8示出本发明实施例1的网络形式的可视化展示结果。附图标号说明:1-应用体系;11-文本数据接入模块;12-即席关系映射模块;13-关系模型配置模块;14-即席任务管理模块;2-展现体系;21-数据关系可视化展示模块;22-二次数据关系分析模块;3-数据体系;31-业务文本库;32-系统配置库;33-关系模型库。具体实施方式下面通过附图和实施例对本发明进一步详细说明。通过这些说明,本发明的特点和优点将变得更为清楚明确。在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。为将大规模效应的数据,从数据存储、管理以及数据分析的角度进行有效的开发,以获取数据间的有效整合,发现数据之间的隐性关系以及数据内部深层次的价值,以清晰、量化的方式展现出来,本发明提供了一种基于文本数据的即席关系分析系统如图1和图2所示,该系统包括应用体系1、展现体系2和数据体系3;其中,应用体系1包括:文本数据接入模块11,其作为数据来源模块与业务文本库31的文本数据链接,将文本数据传送至即席关系映射模块12和关系模型配置模块13;关系模型配置模块13,其接收文本数据接入模块11传送的文本数据,基于文本数据和业务需求,设置数据关系模型,并将设置的数据关系模型传送至即席关系映射模块12;即席关系映射模块12,其接收文本数据接入模块11传送的文本数据,以及关系模型配置模块13传送的数据关系模型信息,将文本数据与数据关系模型进行映射,映射关系传递至即席任务管理模块14;即席任务管理模块14,控制数据关系模型对接入的文本数据进行关系分析,并将运行数据关系模型过程中产生的分析结果数据信息传送到数据关系可视化展示模块21;展现体系2包括:数据关系可视化展示模块21,其接收即席任务管理模块14传送的分析结果数据信息,将其以关系图形的方式进行直观显示。在本发明中,文本数据接入模块11接收的是来自业务文本库31的文本数据,包括结构化数据和半结构化数据(semi-structured),存储文件格式包括txt文档、excel文档、xml文档、csv文档等。其中,结构化数据是指能够用数据或统一的结构加以表示的数据,可存储于二维表结构中;半结构化数据介于结构化数据(如关系型数据库)和无结构的数据(如声音、图像文件等)之间的数据,其结构和内容混在一起,没有明显的区分。文本数据接入模块11包括两个文本数据接入过程,第一个文本数据接入过程接入的文本数据,用于通过即席关系映射模块12将其与数据关系模型进行映射;该映射是指将文本数据的字段名与数据关系模型中的实体属性进行建立链接的过程。基于该过程的目的,优选第一个文本数据接入过程接入包括字段名的部分文本信息即可,如excel文档的包括字段名的前十行数据信息。第二个文本数据接入过程用于通过数据关系模型进行数据关系分析。此时,接入的文本数据为文本中的全部数据信息。在一种优选的实施方式中,文本数据接入模块11包括:数据源配置子模块,其用于建立访问业务文本库31的数据库链接,以及配置接入文本数据的信息;业务文本库中可以包括多个数据库,每个数据库中又包含多个文本文档,数据源配置子模块首先建立和维护由其中抽取文本数据信息的数据库接入信息(如数据库描述、数据库存储路径等),再建立和维护数据库下文本文档的接入信息(文本文档名称、文本文档注释、文本文档存储路径等),此时,数据源配置子模块直接连接至待抽取数据信息的文本文档。如图3所示,数据源配置子模块通过对文本数据接入规则的添加、修改和删除完成对文本数据源接入管理,“文本接入规则表”的主键为“规则标识”,每建立一个文本数据源会生成唯一的数据源标识,该表示是按照设置的规则自动生成,设置的生成规则为新建数据源批次加系统时间戳;“规则名称”是对该数据源接入用户自定义输入的描述;“文本存储路径”为接入文本数据的路径;“文本类型标识”对应“文本类型表”的主键“类型标识”,以字符串表示;“分割规则标识”对应“分割规则表”的主键“规则标识”,以字符串表示。“文本类型表”为根据常用文本文件的格式预先归纳总结而成,“类型名称”示出txt文档、excel文档、xml文档、csv文档等;“类型描述”分别对上述存储文件格式进行描述。“分割规则表”为根据数据常用存储格式预先归纳总结而成,“规则名称”包括“,”、“;”或“||”等;“规则定义”只对txt文件进行格式化方法选择(txt文档中字段常以“,”、“;”或“||”分割),对于excel文档、xml文档、csv文档等具有标准的规则格式不需要选择。数据接入子模块,其对文本数据进行接入,接入方式包括导入方式;该数据接入子模块可进行全文本数据信息接入或部分文本数据信息接入;如图3所示,数据接入子模块通过对接入文本信息的添加、删除和修改工作实施对“文本接入规则表”信息的管理。数据解析子模块,其根据设定的解析规则对接入的文本数据进行格式化处理;解析规则针对不同存储格式的数据,用于指导原始文本数据的调用:(a)对于存储在txt文档中的数据,其解析规则为:按照文本内容分割的规则进行处理,解析技术使用文本按行读取后按规则分割判断获取;(b)对于存储在excel文档中的数据,其解析规则为:按照其单元格规则进行数据获取,解析技术使用poi组件;(c)对于存储在xml文档中的数据,其解析规则为:按照其文档结构标记进行数据获取,解析技术使用jdom、dom4j等;(d)对于存储在csv文档中的数据,其解析规则为:按照其文本具有的默认分割规则进行处理,解析技术使用文本按行读取后按规则分割判断获取。数据预览子模块,其对解析后的文本数据进行呈现,用于业务人员判断解析后数据格式是否满足要求;若不满足要求,则更换解析规则重新格式化处理,若满足要求,允许数据输出子模块的数据输出;数据输出子模块,将解析后文本数据传送至相应的数据接收模块(在建立模型阶段,传送至即席关系映射模块12和关系模型配置模块13;在文本数据关联阶段,传送至即席关系映射模块12)。在本发明中,关系模型配置模块13包括数据关系模型名称子模块、实体配置子模块、链接配置子模块、和数据关系模型类别子模块共四个子模块;数据关系模型名称子模块,其用以存储数据关系模型的名称;实体配置子模块,其配置两个待关联的实体,并存储实体信息;一个文本能够至少产生两个实体,组成数据关系模型的两个待关联的实体的属性信息源于相同类型的文本中数据字段,如两个待关联的实体的数据信息均来源于通话记录文件。将原始数据按照两个实体(如实体a、实体b)进行分开封装,通过链接将a、b两个实体联系起来,目的是用于分析结果的可视化呈现,更直观的展现数据之间的关系。链接配置子模块,其用以存储数据关系模型的数据关系信息;数据关系模型类别子模块,其用以设定数据关系模型的分类。在本发明中,实体的信息,包括实体a名称、实体a类型、实体a的属性、实体b名称、实体b类型和实体b的属性;其中实体的属性(实体a的属性或者实体b的属性)可以根据业务需要添加多个,该实体属性后续将与对应文本数据中的字段名建立映射,用于不同实体间数据关系分析。在本发明中,数据关系信息包括两个实体间的链接名称、以及两个实体间的链接属性。如图4所示,通过关系模型配置模块13对“关系模型表”的数据信息的添加、修改和查询以达到对关系模型进行配置的目的;所述关系模型表存储在关系模型库33中。其中,“关系模型表”中的“模型名称”指建立的模型的名称,如通话记录关系模型;“模型类别标识”字段与“模型类别表”中“类别标识”字段相对应,其以字符串表示,对应模型的类别信息,模型类别指人物类别、组织类别、通讯类别、地址类别等;“实体a名称”和“实体b名称”字段与“实体属性表”中“实体名称”字段相对应,其以字符串表示,对应配置的实体的名称;“实体a类别标识”和“实体b类别标识”字段与“实体类别表”的主键“类别标识”相对应,其以字符串表示,对应配置的实体的类别信息;“关系名称”与“关系属性表”的“关系名称”字段对应,表示通话关系、交易关系等。如图4所示,“实体属性表”中,“属性标识”是指给属性定义唯一英文编码,属性名称是指给属性定义的中文描述。“关系属性表”中,“属性标识”是指给属性定义唯一英文编码,属性名称是指给属性定义的中文描述。“实体属性表”和“关系属性表”为根据需要建立的数据关系模型而配置产生的。“实体类别表”中主键为“类别标识”,“类别名称”是指给类别定义的中文描述,“类别标识”是指给类别定义的唯英文编码。“模型类别表”中主键为“类别标识”,“类别描述”是指对数据关系模型的定义。“实体类别表”和“模型类别表”为根据常规业务需求预先归纳总结而成。在本发明中,该系统通过关系模型配置模块13对关系模型进行配置,使得该系统可以灵活的进行数据关系分析,可以根据使用者的需求灵活的定义分析模型,增加了该系统的实用性和灵活性;同时也提高了该系统的使用范围,使得该系统适用于更多的文本数据即席分析领域。在本发明中,即席关系映射模块12建立文本数据与数据关系模型间的映射,如图3所示,映射关系存储于“文本接入规则表”的“模型映射规则”中。在本发明中,如图3和图5所示,即席任务管理模块14通过对“即席任务管理表”进行添加、修改和删除以完成文本处理任务的监控。即席任务管理表的主键为“任务名称”;即席任务管理表中的“执行方式”为定时执行、即时执行中的一种;“任务状态”是指任务是否处于启动或停止状态;“执行状态”是指任务是否处于处理过程中;“执行进度”指当前数据处理完成的进度。该模块能够灵活定义处理任务的执行方式、能够实时监控处理任务的执行状态与执行进度。在本发明中,如图6中所示,数据关系可视化展示模块21主要将即席任务分析结果数据信息按照不同的展现方式信息关系可视化呈现,例如网络布局、圆形分析、扇形布局、弓形布局。对于每个数据源分析后的每条数据都会形成实体a、实体b,链接,然后链接里包含实体a、b的标识信息(标识信息源于实体信息中的实体属性信息);如果新的数据源分析后的结果融合在一起展示,其中链接中包含的a、b实体标识已经在已加载数据源中的实体a、b存在,那么新加入的数据源链接就自动和已存在的实体链接,这样不同的多个数据源分析后的数据就可以将相同的实体a、b通过实体标识相同合并,最后通过链接将实体a、b链接起来形成一个关系网络。在本发明一种优选的实施方式中,为了进一步发现数据之间深层次的隐形关系,将分析结果进行二次分析,该二次分析过程通过二次数据关系分析模块22实施。二次分析方式包括将对象聚类分析、关系路径分析、图表内容模糊检索等等,通过该操作可以对展现的数据信息进行多角度分析,使得使用者可以做出归纳性的推理,从中挖掘出潜在的数据关系,帮助使用者找出有价值的数据支撑,做出正确的决策分析。其中,对象聚类分析是指将关系网络图中只有一个链接关系的实体去除,只保留具有两个以上关系链接的实体重新布局,其可以分析出具有多个链接实体之间关联关系;关系路径分析是指对关系网络图中选择的两个实体之间的所有链接路径进行分析并对链接上的实体高亮显示,,其可以分析出选择关注的两个实体之间的所有链接路径上的实体;图表内容模糊检索是指对分析界面实体的属性信息模糊检索,通过输入检索关键词操作实施,其可以分析出关键词命中的实体信息并高亮显示。在本发明中,数据体系3包括三个库,分别是业务文本库31、系统配置库32、关系模型库33;业务文本库31,包括话单记录文本库、资金交易文本库和其他常规文本数据;其中,业务文本库31为企业的文本数据库,所述分析系统可以通过文本数据接入模块11接入需要分析的文本数据,业务文本库31中存储各单位业务文本信息数据,例如话单记录信息、资金交易信息等;同时业务文本库所属的领域也并无特殊限制,业务文本库可以为话单记录文本库、资金交易文本库和其他常规文本数据,即所述业务文本库可以包括所有记载文本数据的库;由于应用业务文本库,使得该系统的应用范围广泛,提高了该系统的实用性。如上所述,文本数据信息包括结构化数据和半结构化数据(semi-structured),存储文件格式包括txt文档、excel文档、xml文档、csv文档等。系统配置库32,其用以存储系统内部产生的数据信息,其中,包括文本接入规则信息、即席关系映射信息、即席任务管理信息。系统配置库32是所述基于文本数据的即席关系分析系统的核心库,用以存储该系统配置产生的数据信息,如图3所示:包括文本类型表、分割规则表、文本接入规则表、即席任务管理表这四张数据表;这四张数据表在该系统运行时为系统提供数据支持。关系模型库33,其用以存储关系模型配置模块13在进行关系模型定义时存储的关系模型基本信息、实体属性信息、链接属性信息。如图4所示:关系模型库33包括实体属性表、实体类别表、关系模型表、关系属性表、模型类别表。如图7所示,本发明的另一方面在于提供一种基于文本数据的即席关系分析方法,优选该方法通过上文中所述的基于文本数据的即席关系分析系统实现的,该方法包括以下步骤:(1)s1,接入文本数据步骤:对需要接入的业务文本库31的数据源信息进行配置,接入业务文本库31的文本数据,并进行数据格式化处理;对业务文本库31中的文本数据完成调取,即实施了格式化处理。(2)s2,定义数据关系模型步骤:根据步骤s1中接入的文本数据信息定义数据关系模型,数据关系模型中包括两个待关联的实体;一个文本中能够至少产生两个实体,两个待关联实体的属性信息源于相同类型的文本数据字段。(3)s3,即席关系映射步骤:将数据关系模型中的实体属性与接入的文本数据的相应字段名进行映射,获得映射关系;(4)s4,数据关系模型运行步骤:对步骤s3中设置后的数据关系模型的关联任务进行执行和监控,数据关系模型运行过程中产生处理结果数据信息;(5)s5,结果信息展现步骤:对步骤s4中产生的处理结果数据信息进行可视化展现操作;例如网络布局、圆形分析、扇形布局、弓形布局。优选地,在数据关系可视化展现完成后,对可视化图表数据进行二次操作s6,进一步分析数据之间深层次关联关系。所述二次操作包括对象聚类分析、关系路径分析(图表链接路径分析)、图表内容模糊检索等。在一种优选的实施方式中,步骤s2包括以下子步骤:输入关系模型名称信息;进行实体信息配置,配置实体a信息,配置实体b信息;输入实体a名称;输入实体a类型;输入实体a的属性,可以根据业务需求添加多个;输入实体b名称;输入实体b类型;输入实体b的属性,可以根据业务需求添加多个;进行链接信息配置;输入链接名称;输入链接属性,可以根据业务需求添加多个;输入关系模型类型。实施例实施例11、业务文本库:通话记录文本库、资金交易文本库、人员信息文本库,其中,通话记录文本库中包括多个通话记录文本(文件1);资金交易文本库包括多个资金交易文本(文件2);人员信息文本库包括多个人员信息文本(文件3);2、文本数据接入模块11通过导入方式将业务文本库与文本数据接入模块11相连;3、文本数据接入模块11分别接入通话记录文件、资金交易文件、人员信息文件并将三个数据文件信息传送到关系模型配置模块13;4、通过关系模型配置模块13设置关系模型:具体地:(1)通话记录关系模型:(a)通话记录关系模型的定义:通话记录信息为通话记录文件,(b)定义关系模型名称:通话记录关系模型,(c)定义关系模型类别:选择通联关系类型;(d)定义实体a名称:己方号码;定义实体a属性:己方号码;定义实体a类型:电话;(e)定义实体b名称:对方电话;定义实体b属性:对方号码;定义实体b类型:电话;(f)定义链接名称:通话关系;定义链接属性:通话时间、呼叫类型(2)资金交易关系模型:(a)资金交易关系模型的定义:资金交易信息为交易记录文件;(b)定义关系模型名称:资金交易关系模型;(c)定义关系模型类别:选择交易关系类型;(d)定义实体a名称:本方账号;定义实体a属性:本方账号;定义实体a类型:账号;(e)定义实体b名称:对方账号;定义实体b属性:对方账号;定义实体b类型:账号(f)定义链接名称:交易关系;定义链接属性:交易时间、交易类型;(3)人员信息通话关系模型:(a)人员信息通话关系模型的定义:人员信息为人员信息文件;(b)定义关系模型名称:人员信息通话关系模型;(c)定义关系模型类别:选择人员通话关系类型;(d)定义实体a名称:人员信息;定义实体a属性:姓名、证件号码;定义实体a类型:人员;(e)定义实体b名称:电话号码;定义实体b属性:联系方式;定义实体b类型:电话;(f)定义链接名称:通讯方式;定义链接属性:无(4)人员信息交易关系模型:(a)人员信息交易关系模型的定义:人员信息为人员信息文件;(b)定义关系模型名称:人员信息交易关系模型(c)定义关系模型类别:选择人员交易关系类型;(d)定义实体a名称:人员信息;定义实体a属性:姓名、证件号码;定义实体a类型:人员;(e)定义实体b名称:银行账号;定义实体b属性:银行卡号;定义实体b类型:账号;(f)定义链接名称:资金账号;定义链接属性:无。5、即席任务管理模块14执行数据关系模型:产生的处理结果数据信息为己方号码实体(表1)、对方号码实体(表2)、通话关系链接(表3),本方账号实体(表4)、对方账号实体(表5)、交易关系链接(表6),人员信息实体(表7)、电话号码实体(表8)、通讯方式链接(表9),银行账号实体(表10)、资金账号链接(表11);6、数据关系可视化展示模块21进行数据关系可视化分析,基于可视化分析结果还可以进行实体聚类分析、链接路径分析、图标模糊检索,具体可视化展示如图8所示。可视化数据通过以下方法形成:对于每个数据源分析后的每条数据都会形成实体a、实体b,链接,然后链接里包含实体a、b的标识信息;如果新的数据源分析后的结果融合在一起展示,其中链接中包含的a、b实体标识已经在已加载数据源中的实体a、b存在,那么新加入的数据源链接就自动和已存在的实体链接,这样不同的多个数据源分析后的数据就可以将相同的实体a、b通过实体标识相同合并,最后通过链接将实体a、b链接起来形成一个关系网络。7、文件及数据信息如下:(a)通话记录文件(文件1)己方号码,通话时间,呼叫类型,对方号码1362634xxxx,2018-06-0612:01:02,主叫,1386649xxxx1362634xxxx,2018-08-0816:05:08,被叫,1392637xxxx……通话记录文件(文件1)的原始文件为txt文件,经解析规则对每行数据按逗号解析后,获得文件1对应的数据字段为己方号码,通话时间,呼叫类型,对方号码四个。(b)交易记录文件(文件2)本方账号,交易时间,交易类型,对方账号52189909abcd4406,2018-04-0810:01:02,转出,52189909abcd860652189909abcd4406,2018-07-0914:05:08,转入,52189909abcd6789……交易记录文件(文件2)的原始文件为txt文件,经解析规则对每行数据按逗号解析后,获得文件2对应的数据字段为本方账号,交易时间,交易类型,对方账号四个字段。(c)人员信息文件(文件3)证件号码,姓名,银行卡号,联系方式11018219750120abcd,张三,52189909abcd4406,1362634xxxx11018219760118abcd,李四,52189909abcd8606,1386649xxxx11018219780125abcd,王五,52189909abcd6789,1392637xxxx……人员信息文件(文件3)的原始文件为txt文件,经解析规则对每行数据按逗号解析后,获得文件3对应的数据字段为证件号码,姓名,银行卡号,联系方式四个字段。已方号码实体(表1)实体名称实体属性实体类型己方号码1362634xxxx电话……对方号码实体(表2)实体名称实体属性实体类型对方号码1386649xxxx电话对方号码1392637xxxx电话……通话关系链接(表3)链接名称实体a标识实体b标识链接属性通话关系1362634xxxx1386649xxxx2018-06-0612:01:02,主叫通话关系1362634xxxx1392637xxxx2018-08-0816:05:08,被叫……本方账号实体(表4)实体名称实体属性实体类型本方账号52189909abcd4406账号……对方账号实体(表5)实体名称实体属性实体类型对方账号52189909abcd8606账号对方账号52189909abcd6789账号……交易关系链接(表6)链接名称实体a标识实体b标识链接属性交易关系52189909abcd440652189909abcd86062018-04-0810:01:02,转出交易关系52189909abcd440652189909abcd67892018-07-0914:05:08,转入……人员信息实体(表7)实体名称实体属性实体类型人员信息11018219750120abcd,张三人员人员信息11018219760118abcd,李四人员人员信息11018219780125abcd,王五人员……电话号码实体(表8)实体名称实体属性实体类型联系方式1362634xxxx电话联系方式1386649xxxx电话联系方式1392637xxxx电话……通讯方式链接(表9)链接名称实体a标识实体b标识链接属性通讯方式11018219750120abcd1362634xxxx通讯方式11018219760118abcd1386649xxxx通讯方式11018219780125abcd1392637xxxx……银行行号实体(表10)实体名称实体属性实体类型银行账号52189909abcd4406账号银行账号52189909abcd8606账号银行账号52189909abcd6789账号……资金账号链接(表11)链接名称实体a标识实体b标识链接属性资金账号11018219750120abcd52189909abcd4406资金账号11018219760118abcd52189909abcd8606资金账号11018219780125abcd52189909abcd6789……以上结合了优选的实施方式对本发明进行了说明,不过这些实施方式仅是范例性的,仅起到说明性的作用。在此基础上,可以对本发明进行多种替换和改进,这些均落入本发明的保护范围内。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1