数据挖掘方法、平台和系统的制作方法

文档序号:6465854阅读:211来源:国知局
专利名称:数据挖掘方法、平台和系统的制作方法
技术领域
本发明涉及数据挖掘技术,尤其涉及一种数据挖掘方法、平台和系统。
背景技术
随着信息服务内容的不断丰富,数据挖掘技术的应用越来越广泛, 并成为研究的热点问题。但在实际应用中,数据挖掘存在专业性强、对 技术人员要求高、研究时间周期长、人员投入多等问题。这些问题成为 制约数据挖掘技术推广应用的主要瓶颈。因此,非常希望能够找到一种 迅速、方便地应用数据挖掘技术的方法。发明内容本发明要解决的 一个技术问题是提供一种方便应用的数据挖掘方法。本发明提供的一种数据挖掘方法,包^^舌步骤在数据挖掘平台提供 预置的数据挖掘模型的参数配置接口 ;通过参数配置接口接收来自分支 机构用户的参数设定并生成任务项;在数据挖掘平台执行任务项以进行 数据挖掘。进一步,数据挖掘平台中提供数据挖掘模型的说明文档,为分支机 构用户的参数设定提供帮助。根据本发明的数据挖掘方法的一个实施例,上述任务项由多个流文 件按照逻辑次序组成,该流文件用于完成数据准备、模型建立、模型评 估、或发布的流程操作。根据本发明的数据挖掘方法的一个实施例,数据挖掘平台还提供半 开放的流文件,该数据挖掘方法还包括步骤接收分支机构用户对流文件中指定参数的修改并生成对应的任务项。进一步,本发明的数据挖掘方法还包括步骤数据挖掘平台根据分 支机构用户提供的任务项运行脚本自动运4亍所述任务项。进一步,本发明的数据挖掘方法还包括步骤对数据挖掘平台中预 置的数据挖掘模型进行分类管理;数据挖掘平台对分支机构的用户进行 分级管理,设置不同级别的分支机构用户的访问和操作权限。本发明提供的数据挖掘方法,通过在数据挖掘平台预置数据挖掘模 型并提供参数配置接口 ,分支机构的用户可以直接通过设置参数来生成 本地化的数据挖掘模型,进行数据挖掘,使得数据挖掘技术的应用更加 迅速、方便。本发明要解决的另 一个技术问题是提供一种方便、迅速的数据挖掘 平台。本发明提供一种数据挖掘平台,包括信息存储装置,用于存储数 据挖掘模型的属性信息和任务项;信息管理装置,用于提供数据挖掘模 型的参数配置接口,接收来自分支机构用户的参数设定,生成任务项, 调度任务项的执行;数据挖掘集市,用于存储应用于数据挖掘过程的海 量数据;数据挖掘装置,用于根据任务项利用数据挖掘集市的海量数据 进行数据挖掘。进一步,信息存储装置还用于存储数据挖掘模型的说明文档;该信 息管理装置响应于分支机构用户的请求将所述说明文档提供给分支机构 用户。进一步,上述任务项由多个流文件按照逻辑次序组成,所述流文件 用于完成数据准备、模型建立、模型评估、或发布的流程操作。信息管 理装置还用于响应于分支机构用户的请求将所述流文件提供给分支机构 用户,接收对指定参数修改后的流文件并生成对应的任务项。根据本发明的数据挖掘平台一个实施例,信息管理装置还用于接收 来自分支机构用户的任务项运行脚本,^f艮据所述任务项运行脚本自动调 度所述任务项的执行。根据本发明的数据挖掘平台的一个实施例,信息存储装置对数据挖掘模型的属性信息进行分类存储。信息存储装置还用于存储用户信息, 并对用户进行分级管理,为不同级别的用户设置对应的访问和操作权限属性;信息管理装置还用于根据用户的访问和操作权限属性控制用户的 访问和操作。本发明提供的数据挖掘平台,在信息存储模块预置数据挖掘模型, 通过信息管理模块提供参数配置接口 ,分支机构的用户可以直接通过设 置参数来生成本地化的数据挖掘模型,并通过数据挖掘模块进行数据挖 掘,使得数据挖掘技术的应用更加迅速、方<更。本发明还提供一种数据挖掘系统,包括数据挖掘平台,用于提供 预置的数据挖掘模型的参数配置接口 ,通过所述参数配置接口接收参数 设定,生成任务项,根据所述任务项利用存储的海量数据进行数据挖 掘;分支机构终端,用于连接所述数据挖掘平台,接收用户的参数设 定,通过所述数据挖掘平台提供的参数配置接口将用户的参数设定发送 给所述数据挖掘平台。


图l为根据本发明的数据挖掘系统的示意图; 图2为根据本发明的数据挖掘方法的一个实施例的流程图; 图3为根据本发明的数据挖掘方法的另一实施例的流程图; 图4为根据本发明的数据挖掘方法的一个应用例的流程图; 图5为根据本发明的数据挖掘平台的一个实施例的结构图。
具体实施方式
下面参照附图对本发明进行更全面的描述,其中说明本发明的示例 性实施例。本发明的基本构思是,将在实现数据挖掘过程的各个阶段所产生的 代码封装成各个黑匣子,然后在程序代码中^:置参数接口,并将其部署 在数据挖掘平台上。分支机构连接到数据挖掘平台之后,通过预置的参 数配置接口 (例如可视化的界面)设置相应的参数,从而可快速应用挖掘模型,得到本地化的结果。此外,分支才几构还可通过设置数据挖掘任 务的运行时间使得任务在指定的时间自动运行,无需人工参与即可完成 数据挖掘过程。为了保证数据挖掘平台的有效运作,本发明还提供对挖 掘模型的分类管理和用户的分级管理,将挖掘模型按具体的应用范畴分 门别类,同时设置不同级别的用户对不同的挖掘模型、数据挖掘任务的 访问和操作权限,从而提高对数据挖掘成果进行管理的集中性和可控 性。图1为根据本发明的数据挖掘系统的示意图。如图1所示,数据挖掘系统包括终端11和数据挖掘平台12,终端11通过网络和数据挖掘平 台12连接,用于连接数据挖掘平台12,接收用户的参数设定,通过数 据挖掘平台12提供的参数配置接口将用户的参数设定发送给数据挖掘 平台12。数据挖掘平台12包括信息管理才莫块121、数据挖掘模块122、 信息存储模块123和数据挖掘集市124。其中,信息存储模块123用于 存储登陆用户、数据挖掘项目、任务项及模板的属性信息。信息存储模 块123可以是数据库,例如可采用Sybase ASE 12.5以获得较好的性 能。数据挖掘集市124用于存储海量的数据以提供给数据挖掘过程使 用。信息管理模块121和数据挖掘模块122作为平台对外的接口 。信息 管理模块121和数据挖掘模块122可以是单独的服务器。信息管理模块 121用于提供数据挖掘模型的参数配置接口,接收来自分支机构用户的 参数设定,生成任务项,调度任务项的执行。数据挖掘模块122用于根 据任务项利用数据挖掘集市的海量数据进行数据挖掘。在数据挖掘模块 122上装备有专业的数据挖掘工具软件(例如Clementine Server8.5 ), 用来运行数据挖掘任务。模板研发人员在信息管理模块121上部署数据 挖掘模型模板并对其集中管理,分支机构人员使用终端11 (例如PC) 连接信息管理^^莫块121,下载数据挖掘才莫型^t板建立本地化^t型,然后 重新部署本地化模型到信息管理模块121,最后执行数据挖掘任务时由 信息管理模块121调用数据挖掘模块122上的数据挖掘工具软件(例如 Clementine Server8.5 )得到符合用户自身需求的数据挖掘结果。需要注意的是,上述的信息管理模块和数据挖掘模块也可以处于同一个服务器上。下面介绍可应用于本发明的在数据挖掘平台预置的数据挖掘模型的 一种实现方式。数据挖掘模型的研发人员使用专业的数据挖掘软件建立数据挖掘模 型及其相关应用,然后将这些数据挖掘才莫型上传到数据挖掘平台上,设 置模型被其他人员调用的接口 ,并上传关于模型的相关说明文档到数据挖掘平台。具体来说,该实现过程包括(1) 开发模型。研发人员在对具体的问题如客户细分、客户流失 预警、市场预测等进行深入细致的商业理解和数据理解后,设定挖掘模 型所需的输入数据变量和研发挖掘模型的算法,并建立评估模型的方 法。研发人员主要通过专业的数据挖掘软件来完成这些步骤,工作成果 表现为多个流文件。(2) 设置参数。为便于推广模型,使分支机构可以方便地利用模 型,让流文件具备了供外部调用的接口。在流文件中设定参数接口,这 些参数接口是灵活多变的,例如,可以是数据源连接属性,数据的选择 条件,数据的输出路径、本地化的参数、才莫型评估结果输出路径等等。(3) 上传模型。研发人员将数据挖掘流程中数据准备、建立挖掘 模型、模型评估等几个阶段开发的流文件,通过网络上传到数据挖掘平台的信息管理服务器上。(4) 组成任务项并设置模型调用参数接口。把多个完成某个单一 操作的流文件按照一定的逻辑次序组合成一个运行任务项。任务项可以 完成一个较为完整的数据准备,或者建立才莫型,或者模型评估,或者发 布等阶段的流程操作。任务项中的流文件包含有参数,这些参数需要在 数据挖掘平台上进行配置以形成对外的调用接口。对每个建立的任务 项,根据任务项的流文件内所包含的参数为其在信息管理服务器上设置 一一对应且同名的参数配置接口,为这些参数设置初值。(5) 把数据挖掘应用中所产生的各类文档,包括需求说明文档、 数据说明文档、流文件说明文档、参数说明文档、数据挖掘结果文档等 上传到数据挖掘平台。图2为根据本发明的数据挖掘方法的一个实施例的流程图。 如图2所示,在步骤202,在数据挖掘平台提供预置的数据挖掘模 型的参数配置接口。在步骤204,数据挖掘平台通过参数配置接口接收来自分支机构用 户的参数设定并生成任务项。分支机构的用户通过网络登录到数据挖掘 平台,进入到任务项属性界面,看到任务项中所含的参数及其含义和初 始值,通过查阅模型说明文档,用户可以快速了解参数的包含意义,然 后根据自身的需求修改参数的值,即可将任务项改为适合自身需求的数 据挖掘过程,从而达到高效推广数据挖掘模型成果的目的。在步骤206,在数据挖掘平台执行生成的任务项以进行数据挖掘。 数据挖掘平台上集中部署了数据挖掘才莫型并将其共享,分支机构可 以连接到数据挖掘平台运用模型建立本地化的结果,而无需重复投入人 员和资金去研发模型。根据本发明的数据挖掘方法的一个实施例,数据挖掘平台还提供半 开放的流文件,此类流文件中的提供了诸如模型中的专家参数、聚类个 数等高级的参数接口以供挖掘技术水平比较高的用户使用。该方法还包 括步骤接收分支机构用户对流文件中指定参数的修改并生成对应的任 务项。指定的参数是指开放的诸如模型中的专家参数、聚类个数的高级 参数接口。数据挖掘过程涉及的数据量往往非常庞大,运行的时间也比较长。 根据本发明的一个优选实施例,本发明的数据挖掘方法还包括步骤数用户只需设定任务项计划运行的时间,即可使得任务项在指定的时间执 行。当用户提交任务项时,首先,客户端将形成对每个任务项中的数据 流都建立一个运行脚本,每个运行脚本含有如下信息连接到数据挖掘 工具软件的帐号和密码,所执行流文件在服务器上的路径,流文件中含 有的参数和参数值,流文件执行结果日志存放路径。然后,客户端依次 将流文件的运行脚本发到服务器。服务器在接收完所有的运行脚本后, 依次将它们以命令行的方式提交到数据挖掘工具软件。数据挖掘工具软件连接到数据挖掘集市,依次运行任务项中的流文件,并保存运行日志 文件到项目文件夹内,以便用户查看任务项运行的结果状态。如果其中 某个流文件运行失败,系统则会中止任务项的运行,即任务项中该流文 件之后的其他流文件都不会被运行,从而节省了系统资源。通过在挖掘 过程中提高自动化程度,减少人工参与的环节,大大节省了用户的时 间。根据本发明的数据挖掘方法的一个实施例,还包括步骤对数据挖 掘平台中预置的数据挖掘模型进行分类管理。数据挖掘模型按具体的应 用范畴以项目为单位进行分类,项目又按项目类别这个层次进行分类管 理。模型研发人员按具体的应用范畴如客户细分、商业客户流失预警和 商业客户签约管理等应用建立相应的项目,将与应用相关的挖掘模型、 任务项和说明文档都置于对应的项目中。在建立项目时,信息管理服务 器会建立一个与项目名称同名的文件夹,之后,与项目有关的流文件、 文档和任务项中的日志文件都会放置于此文件夹内。通过对数据挖掘模型的分层分类管理,使得对模型的管理不会随着模型的不断增多而混 乱。根据本发明的数据挖掘方法的一个实施例,还包括步骤数据挖掘 平台对分支机构的用户进行分级管理,设置不同级别的分支机构用户的 访问和操作权限。根据用户的工作职能,界定可使用数据挖掘平台的用 户名录,给予不同类型的用户以不同的权限设置,确保整个系统的应用 范围在可控中。用户被划分为以下四类角色管理员、研发人员、分析 人员或运作人员。运作人员的权限最低,负责监测数据挖掘任务项的运 行情况,他仅有执行任务项的权限。分析人员是具有一定数据挖掘技术 的人员,他能够在学习模型说明文档后理解模型的运作流程,因而可参 考原有的任务项,通过增加或删减操作流程,又或者修改操作流文件的 逻辑次序来建立一个新的数据挖掘任务项,实现模型更高层次的重用。 研发人员一般是具有较强数据挖掘研发力量的部门里面的技术人员,他 们负责研发数据挖掘模型并将其部署到数据挖掘平台上,进行项目管 理、任务管理和模型管理。管理员具有最高权限,除了具有其他三个角色的权限外,还负责对用户进行管理。图3为根据本发明的数据挖掘方法的另一实施例的流程图。 如图3所示,在步骤302,在数据挖掘平台进行模型模板封装,并 设置参数接口。在步骤304,分支机构用户通过本地的客户端登录数据挖掘平台, 从数据挖掘平台下载模型文档说明到分支才几构客户端。在步骤306,分支机构用户从数据挖掘平台下载数据挖掘模型到分 支机构客户端。在步骤308,分支机构用户在客户端对数据挖掘模型进行修改。 在步骤310,分支机构用户将修改后的数据挖掘模型上传到数据挖 掘平台。在步骤312,根据从客户端上传的修改的数据挖掘模型在数据挖掘 平台构建对应的任务项。可以预设参数值。在步骤314,分支机构客户端从数据挖掘平台查看任务项。在步骤316,在分支机构客户端通过参数设置接口设定数据挖掘模 型的运行参数,生成执行任务项。在步骤318,将执行任务项提交到数据挖掘平台。在步骤320,数据挖掘平台执行任务项进行数据挖掘,并生成执行 曰志。在步骤322,分支机构用户从数据挖掘平台查看执行日志,获得数 据挖掘结果。需要指出的是,步骤306至310是可选步骤。 图4为根据本发明的数据挖掘方法的一个应用例的流程图。 如图4所示,步骤402,部署数据挖掘模型。模板研发人员登录信 息管理服务器,建立数据挖掘项目。每个数据挖掘项目按数据挖掘的过 程共分商业理解、数据理解与准备、模型建立与评估、模型发布四个阶 段。模板研发人员把用数据挖掘工具软件所开发的遵循数据规范的数据 挖掘模型模板(如客户细分模型、商业客户流失预警模型和商业客户签 约管理模型等)部署到项目的四个阶段中,然后在各个阶段建立数据挖掘任务项。步骤404,数据准备。用户登录到信息管理服务器后,执行模板研 发人员所部署的数据理解与准备阶段的任务项,生成建模所需的数据宽 表。步骤406,定制模型。用户下载模型模板到本地的机器上,根据自 己的需求更改模型模板里的参数后在本地机器上运行模板来探索建模的 结果,然后依据结果再修正模型模板中的参数。如此反复,直到建模的 结果符合用户要求。然后,用户将修改的模型模板另存为一个用户定制 的模型,把此定制的模型部署到原来的项目中,并建立包含此定制模型 的数据挖掘任务项,这样,用户便利用模板建立了本地化的模型。步骤408,运用模型。用户运行信息管理服务器中的任务项,信息 管理服务器自动地依次按照任务项中的模型调用数据挖掘服务器上的数 据挖掘程序,连接后台的数据挖掘集市进行挖掘过程,最后运行出数据 挖掘结果。下面对上述的四个步骤进行更加详细的说明。 其中,部署模型模板的具体步骤为(11) 模板研发人员为每一个数据挖掘应用建立一个与之对应的项 目区,用于存储与该数据挖掘应用有关的模型、文档和任务项。服务器 上会建立一个与项目名称同名的文件夹,此后,与该数据挖掘应用有关 的模型、文档和任务项中的日志文件都会放置于此文件夹内。(12) 模板研发人员针对每个数据挖掘应用,分别将数据理解与准 备阶段和建立模型与评估阶段的数据流文件(数据流文件内连接数据挖 掘集市的连接属性信息和预设参数值也已经由才莫板研发人员设置好)上 传到对应的项目区,并设置其属性信息。数据流文件的属性信息系统保 存到数据库中,数据流文件则由系统通过FTP协议接收至服务器上的 项目文件夹内。数据流文件的属性信息包括名称、在数据挖掘过程中 所处的阶段、版本号、创建者、创建时间、用途描述、结点参数属性信 息。对于结点参数属性信息包括参数名称、参数类型、参数描述、参 数预设可选值。(13 )模板研发人员通过把数据挖掘应用项目中的数据流文件按照 项目实施执行的先后顺序进行整合,专门形成得出某特定结果的任务 项,该任务项通过组合多个数据流(这些数据流在该任务项中按顺序执 行),完成一定的结果输出,极大地提高了数据挖掘过程的自动化。例 如,可以按顺序组合用于数据准备的数据流,从而得到一个专门用来准 备挖掘所需的数据、形成数据宽表的任务项。当保存任务项时,系统将 任务项所包含的数据流中的结点参数属性信息、数据流执行顺序保存到 数据库中。(14)模板研发人员把数据挖掘应用中所产生的各类文档,包括需 求说明文档、数据说明文档、数据流文件说明文档、参数说明文档、数 据挖掘结果文档等等进行上传,供用户浏览、下载。 数据准备的具体步骤为(21) 用户打开数据准备与准备阶段任务项的运行窗口,设置好数 据流中参数的值,然后将任务提交给服务器。当提交任务项时,首先, 客户端将形成对每个任务项中的数据流都建立一个运行脚本,每个运行 脚本含有如下信息连接到数据挖掘工具软件的帐号和密码,所执行数据流在服务器上的路径,数据流中含有的参数和参数值,数据流执行结 果日志存放路径。然后,客户端依次将数据流的运行脚本发到服务器。 服务器在接收完所有的运行脚本后,依次将它们以命令行的方式提交到 数据挖掘工具软件。数据挖掘工具软件连接到数据挖掘集市,依次运行 任务项中的数据流文件,并保存运行日志文件到项目文件夹内,以便用 户查看任务项运行的结果状态。(22) 用户打开任务项运行结果日志窗口,查询任务项运行结果的 状态。日志中会列出各数据流的名称、参数信息、运行结束的时间以及 是否运行成功的标识。如果其中某个数据流运行失败,系统则会中止任 务项的运行,即任务项中该数据流之后的其他数据流都不会被运行,从 而节省了系统资源。定制模型的具体步骤为(31)用户下载建立模型与评估阶段和模型发布阶段的数据流模板(如商业客户细分模型、商业客户流失预警模型和商业客户签约管理模型等)到用户的本地机器上。系统采用FTP的方式传送用户指定的数 据流模板到用户的本地机器上。(32) 用户在本地机器上打开建立模型与评估阶段的数据流模板, 修改数据流中的建模结点的参数值,运行建模数据流,这时数据流会产 生一个新的建模结点。用户可查看建模的结果,然后依据结果修改数据 流模板中的参数再运行数据流来查看结果,如此反复,直到建模的结果 符合用户要求为止。(33) 用户将步骤(32)里建立模型与评估阶段的数据流模板所产 生的建模结点替换从服务器下载的模型发布阶段的数据流模板中的建模 结点,然后另存为一个用户修改后的模型发布阶段的数据流文件,然后 把此定制的数据流文件按步骤(12)所说的那样上传回服务器。(34) 用户复制服务器上模型发布阶段的任务项,并为复制生成的 任务项命名。然后,把步骤(33)中上传的数据流替换任务项中具有同 样功能的数据流,并保存任务项。系统将保存用户复制的任务项的信息 到数据库。运用模型的具体步骤为(41) 用户打开模型发布阶段任务项的运行窗口,设置好数据流中 参数的值,然后将任务提交给服务器。(42) 用户打开任务项运行结果日志窗口,查询任务项运行结果的状态。图5示出了根据本发明的数据挖掘平台的一个实施例的结构图。如 图5所示,该数据挖掘平台包括信息存储装置51、信息管理装置52、 数据挖掘装置53和数据挖掘集市54。其中,信息存储装置51,用于存 储数据挖掘模型的属性信息和任务项。信息管理装置52,用于提供数据 挖掘模型的参数配置接口,接收来自分支机构用户的参数设定,生成任 务项,调度任务项的执行。数据挖掘集市54,用于存储应用于数据挖掘 过程的海量数据。数据挖掘装置53,用于4艮据任务项利用数据挖掘集市 54的海量数据进行数据挖掘。根据本发明的数据挖掘平台的一个实施例,信息存储装置还用于存储数据挖掘模型的说明文档;所述信息管理装置响应于分支机构用户的 请求将所述说明文档提供给分支机构用户。根据本发明的数据挖掘平台的一个实施例,任务项由多个流文件按 照逻辑次序组成,流文件用于完成数据准备、模型建立、模型评估、或 发布的流程操作。信息管理装置还用于响应于分支机构用户的请求将所 述流文件提供给分支机构用户,接收对指定参数修改后的流文件并生成 对应的任务项。根据本发明的数据挖掘平台的一个实施例,信息管理装置还用于接 收来自分支机构用户的任务项运行脚本,根据任务项运行脚本自动调度 任务项的执行。根据本发明的数据挖掘平台的一个实施例,信息存储装置对数据挖 掘模型的属性信息进行分类存储。根据本发明的数据挖掘平台的一个实施例,信息存储装置还用于存 储用户信息,并对用户进行分级管理,为不同级别的用户设置对应的访问和操作权限属性;所述信息管理装置还用于根据用户的访问和操作权 限属性控制用户的访问和操作。本发明提供的数据挖掘方法、平台和系统,基于数据挖掘集市和互 联网技术提出的,由数据挖掘研发人员对数据挖掘模型的研究成果总结 成模板,对模板集中管理并共享在平台上,其他分支机构可以通过网络 连接到平台,应用模板建立本地化模型,实现本地化的数据挖掘过程。 该方法、平台和系统实现了将数据挖掘模型成果进行集中管理以及向分 支机构高效推广应用,有效地解决了数据挖掘技术专业性强、对技术人 员要求高、研究时间周期长、人员投入多的缺点,使分支机构在即使不 熟悉数据挖掘工具软件的情况下,也能调用数据挖掘模型模板建立本地 化^^型,实现数据挖掘的本地化。本发明结合互联网、数据挖掘集市、数据挖掘软件等技术和工具, 提供了 一种在具有多分支机构的群体中对数据挖掘模型进行集中管理和 推广的方法,有效解决当前数据挖掘技术推广应用困难的情况。首先,实现了数据挖掘过程的自动化,节省了数据准备、挖掘模型研发和推广的时间,提高数椐挖掘分析工作的效率。通过将CRISP-DM 数据挖掘流程中的数据准备、建立模型、模型评估、模型发布四个步骤 进行封装,形成数据挖掘流程黑匣子(即任务项),在任务项内集中设 置步骤中的参数接口,简化了用户应用数据挖掘模型的操作步骤。用户 应用数据挖掘模型时,面对的不再是数目众多、操作繁瑣的操作步骤, 而是已经封装好操作流程的界面简单、友好的任务项。用户只需通过设 置任务项内的参数值即可得到本地化模型并运用本地化模型计算结果; 如果有需要,用户还可以对任务项中的原子操作流程可以进行调整,以使挖掘过程适应自身的需求。这种设计,不但使得数据挖掘过程流水 化,挖掘模型应用方便快捷,而且过程中的操作也可具有弹性、可以灵 活调整。其次,本发明将分析的主机构统一部署与分支机构本地化需求相结 合。采取集中部署数据挖掘模型的模式,由主机构专业研究队伍统一研 发模型模板,既解决了绝大部分分支机构挖掘建模能力不足的问题,也 避免了各分支机构重复研发挖掘模型的资源浪费。模型模板和分支机构 应用模型模板生成的本地化模型都保存于服务器上集中管理,方便推广 和重用。同时,通过集中建立虚拟的数据挖掘集市和搭建数据挖掘运行 环境,实现数据的集中与分支机构的应用的统一,节省软硬件的投入成 本。本发明的描述是为了示例和描述起见而给出的,而并不是无遗漏的 或者将本发明限于所公开的形式。很多修改和变化对于本领域的普通技 术人员而言是显然的。选择和描述实施例是为了更好说明本发明的原理 和实际应用,并且使本领域的普通技术人员能够理解本发明从而设计适 于特定用途的带有各种修改的各种实施例。
权利要求
1.一种数据挖掘方法,其特征在于,包括步骤在数据挖掘平台提供预置的数据挖掘模型的参数配置接口;通过所述参数配置接口接收来自分支机构用户的参数设定并生成任务项;在数据挖掘平台执行所述任务项以进行数据挖掘。
2. 根据权利要求1所述的数据挖掘方法,其特征在于,数据挖掘 平台中提供数据挖掘模型的说明文档,为分支机构用户的参数设定提供 帮助。
3. 根据权利要求1所述的数据挖掘方法,其特征在于,所述任务 项由多个流文件按照逻辑次序组成,所述流文件用于完成数据准备、模 型建立、模型评估、或发布的流程操作。
4. 根据权利要求3所述的数据挖掘方法,其特征在于,所述数据 挖掘平台还提供半开放的流文件,所述方法还包括步骤接收分支机构用户对流文件中指定参数的修改并生成对应的任务项。
5. 根据权利要求1所述的数据挖掘方法,其特征在于,还包括步骤数据挖掘平台根据分支机构用户提供的任务项运行脚本自动运行所 述任务项。
6. 根据权利要求1所述的数据挖掘方法,其特征在于,还包括步骤对数据挖掘平台中预置的数据挖掘^=莫型进行分类管理。
7. 根据权利要求1所述的数据挖掘方法,其特征在于,还包括步数据挖掘平台对分支机构的用户进行分级管理,设置不同级别的分 支机构用户的访问和操作权限。
8. —种数据挖掘平台,其特征在于,包括信息存储装置,用于存储数据挖掘模型的属性信息和任务项; 信息管理装置,用于提供数据挖掘才莫型的参数配置接口,接收来自分支机构用户的参数设定,生成任务项,调度任务项的执行; 数据挖掘集市,用于存储应用于数据"^掘过程的海量数据; 数据挖掘装置,用于根据任务项利用所述数据挖掘集市的海量数据进行数据挖掘。
9. 根据权利要求8所述的数据挖掘平台,其特征在于,所述信息 存储装置还用于存储数据挖掘模型的说明文档;所述信息管理装置响应 于分支机构用户的请求将所述说明文档提供给分支机构用户。
10. 根据权利要求8所述的数据挖掘平台,其特征在于,其特征在 于,所述任务项由多个流文件按照逻辑次序组成,所述流文件用于完成 数据准备、模型建立、模型评估、或发布的流程操作。
11. 根据权利要求10所述的数据挖掘平台,其特征在于,所述信 息管理装置还用于响应于分支机构用户的请求将所述流文件提供给分支 机构用户,接收对指定参数修改后的流文件并生成对应的任务项。
12. 根据权利要求8所述的数据挖掘平台,其特征在于,所述信息 管理装置还用于接收来自分支机构用户的任务项运行脚本,根据所述任 务项运行脚本自动调度所述任务项的执行。
13. 根据权利要求8所述的数据挖掘平台,其特征在于,所述信息 存储装置对数据挖掘模型的属性信息进行分类存储。
14. 根据权利要求8所述的数据挖掘平台,其特征在于,所述信息 存储装置还用于存储用户信息,并对用户进行分级管理,为不同级别的 用户设置对应的访问和操作权限属性;所述信息管理装置还用于根据用 户的访问和操作权限属性控制用户的访问和操作。
15. —种数据挖掘系统,其特征在于,包括数据挖掘平台,用于提供预置的数据挖掘模型的参数配置接口;通 过所述参数配置接口接收参数设定,生成任务项,根据所述任务项利用 存储的海量数据进行数据挖掘;分支机构终端,用于连接所述数据挖掘平台,接收用户的参数设定,通过所述数据挖掘平台提供的参数配置接口将用户的参数设定发送 给所述数据挖掘平台。
16. 根据权利要求15所述的数据挖掘系统,其特征在于,所述数 据挖掘平台包括信息存储装置,用于存储数据挖掘模型的属性信息和任务项; 信息管理装置,用于提供数据挖掘模型的参数配置接口,接收来自分支机构用户的参数设定,生成任务项,调度任务项的执行; 数据挖掘集市,用于存储应用于数据挖掘过程的海量数据; 数据挖掘装置,用于根据任务项利用所述数据挖掘集市的海量数据进行数据挖掘。
17. 根据权利要求16所述的数据挖掘系统,其特征在于,所述信 息存储装置还用于存储数据挖掘模型的"i兌明文档;所述信息管理装置响 应于分支机构用户的请求将所述说明文档提供给分支机构用户。
18. 根据权利要求16所述的数据挖掘系统,其特征在于,其特征 在于,所述任务项由多个流文件按照逻辑次序组成,所述流文件用于完 成数据准备、模型建立、模型评估、或发布的流程操作。
19. 根据权利要求18所述的数据挖掘系统,其特征在于,所述信 息管理装置还用于响应于分支机构用户的请求将所述流文件提供给分支 机构用户,接收对指定参数修改后的流文件并生成对应的任务项。
20. 根据权利要求16所述的数据挖掘平台,其特征在于,所述信 息管理装置还用于接收来自分支机构用户的任务项运行脚本,根据所述 任务项运行脚本自动调度所述任务项的执行。
全文摘要
本发明公开一种数据挖掘方法、平台和系统。该数据挖掘方法包括步骤在数据挖掘平台提供预置的数据挖掘模型的参数配置接口;通过参数配置接口接收来自分支机构用户的参数设定并生成任务项;在数据挖掘平台执行任务项以进行数据挖掘。本发明提供的数据挖掘方法、平台和系统,分支机构用户连接到数据挖掘平台之后,通过预置的参数配置接口设置相应的参数,从而可快速应用挖掘模型,得到本地化的结果,方便了数据挖掘技术的推广应用。
文档编号G06F17/30GK101324901SQ200810134899
公开日2008年12月17日 申请日期2008年8月6日 优先权日2008年8月6日
发明者斌 刘, 亮 张, 曾宪伟, 柯晓燕, 漆晨曦, 敏 辜 申请人:中国电信股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1