本发明实施例涉及数据处理技术,尤其涉及一种数据处理方法、装置及设备。
背景技术:
用户在软件使用过程中的数据,能够帮助数据分析师发现在当前业务目标下提升软件竞争力的要素,如提高操作效率、发现软件内部存在问题。因此,获取当前业务目标下全面、准确的用户行为数据,能够为后续的数据分析提供便利性,且使得数据分析更准确。
在数据分析过程中,数据分析师通常会基于业务目标提出需采集数据,交由开发人员根据该待采集数据进行软件埋点以采集数据,而后数据分析师利用采集到的数据进行分析。那么,数据分析师的个人经验、视角、对业务领域的熟悉程度等因素,决定了该采集数据的准确性,并且开发人员对待采集数据的理解程度等因素,也决定埋点位置的准确性。也就是说,在当前的数据分析过程中,埋点控件信息是由开发人员基于该待采集数据确定的,而待采集数据又是数据分析师提出的。
因此,由于数据分析师及开发人员的一些人为主观因素,使得采集到的数据的准确性不高,因而,基于该待采集数据进行数据分析的效果较差。
技术实现要素:
本发明实施例提供一种数据处理方法、装置及设备,以提高采集的数据的准确性,提高数据分析的准确性。
一方面,本发明实施例提供一种数据处理方法,包括:
根据业务目标确定完成业务目标所涉及的业务对象,并确定完成业务目标所涉及的业务对象相关的数据表,继而根据数据表确定待埋点控件的信息;
根据上述确定的待埋点控件的信息对软件进行埋点,采集埋点对应的数据。
该方法中,由于该待埋点控件的信息是根据完成该业务目标所涉及的业务对象相关对应的数据表确定的,而完成该业务目标所涉及的业务对象,以及,业务对象相关的数据表均是由软件本身的客观特性决定的,因而该待埋点控件的信息不受开发人员和/或数据分析师的主观因素的影响,因而,对于实现该业务目标来说,该待埋点控件的信息准确度较高,可使得采集到的埋点对应的数据更准确,从而保证数据分析的准确性。
在一种可实现方式中,在上述根据业务目标确定目标对应的埋点控件信息之前,该方法中,还可根据接收到的用户输入的信息的关键词确定业务目标。
在另一种可实现方式中,根据业务目标确定完成业务目标所涉及的业务对象,可以包括:
根据业务目标从预先获取的软件的逻辑模型中,查找出完成业务目标所涉及的业务对象,其中,逻辑模型中定义有完成软件的每个软件功能所涉及的业务对象和业务对象之间的关系。
该方法中可根据该业务目标从该软件的逻辑模型中,查找出完成该业务目标所涉及的业务对象,可使得完成该业务目标所涉及的业务对象与该业务目标更相关,该软件的逻辑模型是该软件的客观特性,因可保证业务对象相关的数据表的准确度,保证了待埋点控件的信息不受开发人员和/或数据分析师的主观因素的影响,其待埋点控件的信息的准确度更高,提高了采集到的埋点对应的数据的准确度,提高数据分析的准确度。
在又一种可实现方式中,根据业务目标从软件的逻辑模型中,查找出完成业务目标所涉及的业务对象,可以包括:
根据业务目标及逻辑模型中的业务对象信息,确定业务目标与每个业务对象的相似度,并根据业务目标与每个业务对象的相似度,从上述逻辑模型中确定相似度最高的业务对象为完成业务目标所涉及的业务对象。
在再一种可实现方式中,业务对象信息包括:业务对象名称和/或属性。
在再一种可实现方式中,确定完成业务目标所涉及的业务对象相关的数据表,可以包括:
从预先获取的软件的物理模型中,获取完成业务目标所涉及的业务对象相关的数据表,其中,物理模型在数据库内定义了与逻辑模型中的每个业务对象相关的数据表以及数据表之间的关系。
该方法中可根据该业务目标从该软件的物理模型中,获取完成该业务目标所涉及的业务对象相关的数据表,该软件的物理模型也是该软件的客观特性,因而可保证完成该业务目标所涉及的业务对象相关的数据表的准确度,保证了待埋点控件的信息不受开发人员和/或数据分析师的主观因素的影响,其待埋点控件的信息的准确度更高,提高了采集到的埋点对应的数据的准确度,提高数据分析的准确度
在再一种可实现方式中,从软件的物理模型中,获取与完成业务目标所涉及的业务对象相关的数据表可以包括:
对完成业务目标所涉及的业务对象进行聚类,生成每一类业务对象对应的任务;以任务为单位,从上述该软件的物理模型中,获取完成业务目标所涉及的业务对象相关的数据表。
该方法通过对完成该业务目标所涉及的业务对象进行聚类,生成每一类业务对象对应的任务,可实现对业务目标的分解,将该业务目标划分为至少一个任务,使得完成该业务目标所涉及的业务对象可包括:该业务目标的各任务所涉及的业务对象;以每个任务为单位,从该软件的物理模型中获取完成该业务目标的每个任务所涉及的业务对象相关的数据表,可使得对于其他业务目标中与该业务目标存在的相同任务,无需再次从物理模型中确定该相同任务所涉及的业务对象相关的数据表,而只需从预先存储的信息中获取该相同任务所涉及的业务对象相关的数据表以及使用该数据表的控件,从而简化了针对存在相同任务的业务目标的数据处理过程,提高数据处理效率。
在再一种可实现方式中,对完成业务目标所涉及的业务对象进行聚类,生成每一类业务对象对应的任务,可以包括:
根据完成业务目标所涉及的业务对象之间的相似度,对完成业务目标所涉及的业务对象进行聚类,生成每一类业务对象对应的任务;其中,每一类业务对象之间的相似度最高。
在再一种可实现方式中,根据数据表确定待埋点控件的信息可以包括:
根据数据表和软件的当前页面代码,从当前页面中确定使用数据表的控件为待埋点控件,并获取待埋点控件的信息。
该方法中根据该数据表和该软件的当前页面代码,从该当前页面中确定使用该数据表的控件为待埋点控件,该数据表及该软件的当前页面代码均是由软件的客观特性决定的,因此确定的该待埋点控件的信息的准确度更高,使得采集到的埋点对应的数据更准确,提高数据分析的准确度。
在再一种可实现方式中,待埋点控件的信息包括待埋点控件的标识、名称和路径中的至少一个。
在再一种可实现方式中,该方法还包括:
根据使用数据表的控件相关的系统信息确定业务目标对应的系统数据。
在再一种可实现方式中,采集埋点对应的数据包括:采集埋点对应的用户行为数据和业务目标对应的系统数据的至少一个。
该方法在上述任一所述的数据处理方法的基础上,可采集该埋点对应的用户行为数据,和/或,该业务目标对应的系统数据,使得采集到的埋点对应的数据更完善,更完整,而不局限于页面对应的用户数据,保证数据分析的准确度。
另一方面,本发明还提供一种数据处理装置,该装置具有实现上述方法实施例中服务器的功能。所述功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块(比如,第一确定模块、第二确定模块、第三确定模块、埋点模块和采集模块等)。
在一种可能的设计中,该装置的硬件结构中包括处理器和存储器,所述存储器用于存储支持该装置执行上述方法的应用程序代码,所述处理器被配置为用于执行所述存储器中存储的应用程序,使得处理器执行上述任一所述的数据处理方法。所述装置还可以包括通信接口,用于该装置与其他设备或通信网络通信。
再一方面,本发明实施例提供了一种计算机存储介质,用于储存为上述服务器所用的计算机软件指令,其包含用于执行上述方面为服务器所设计的程序。
本发明实施例提供的数据处理方法、装置及设备,可以通过对软件本身的数据(软件中的业务对象以及业务对象对应的数据表等)进行分析,来确定完成业务目标所涉及的控件,即待埋点控件。由于完成该业务目标所涉及的业务对象,以及,业务对象相关的数据表均是由软件本身的客观特性决定的,因而待埋点控件的信息不受开发人员和/或数据分析师的主观因素的影响,对于实现该业务目标来说,该待埋点控件的信息准确度较高,可使得采集到的埋点对应的数据更准确,从而保证数据分析的准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明所适用的一种数据采集系统的结构示意图;
图2为本发明实施例一提供的一种数据处理方法的流程图;
图3为本发明实施例二提供的一种数据处理方法中确定业务目标的方法流程图;
图4为本发明实施例二提供的一种数据处理方法中确定业务对象的方法流程图;
图5为本发明实施例二提供的一种数据处理方法中确定业务对象对应的数据表的方法流程图;
图6为本发明实施例二提供的一种数据处理方法中确定埋点控件信息的方法流程图;
图7为本发明实施例三提供的一种数据处理方法的流程图;
图8A为本发明实施例三提供的数据处理方法中业务目标中“产品”涉及的第一业务对象集的业务对象关系示意图;
图8B为本发明实施例三提供的数据处理方法中业务目标中“产品”涉及的第二业务对象集的业务对象关系示意图;
图8C为本发明实施例三提供的数据处理方法中业务目标中“产品”涉及的第三业务对象集的业务对象示意图;
图9为本发明实施例三提供的数据处理方法中业务目标中“销售品”涉及的业务对象集的业务对象关系示意图;
图10为本发明实施例三提供的一种数据处理方法中任务“业务办理”所涉及的业务对象的关系示意图;
图11A为本发明实施例三提供的一种数据处理方法中任务“业务办理”所涉及的业务对象相关的一种数据表的关系示意图;
图11B为本发明实施例三提供的一种数据处理方法中任务“业务办理”所涉及的业务对象相关的另一种数据表的关系示意图;
图12为本发明实施例三提供的数据处理方法中当前界面中控件的结构示意图;
图13为本发明实施例四提供的一种数据处理装置的结构示意图;
图14为本发明实施例五提供的一种数据处理设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明各实施例提供的数据处理方法、装置及设备,可适用于数据采集系统中。图1为本发明所适用的一种数据采集系统的结构示意图。如图1所示,该数据采集系统100可包括数据采集服务器101和应用服务器102。该数据采集服务器101与应用服务器102可通过有线或无线的方式建立通信连接,以相互传输信息。应用服务器102可以为待采集软件对应的应用服务器。需要说明的是,数据采集系统100中还可包括与数据采集服务器101和/或应用服务器102连接的其他设备如终端设备,可接收用户输入的信息,并传输至数据采集服务器101和/或应用服务器102中。本发明下述各实施例提供的数据处理方法可由图1所示的数据采集系统100中的数据采集服务器101或应用服务器102实现。
本发明实施例一提供一种数据处理方法。图2为本发明实施例一提供的一种数据处理方法的流程图。如图2所示,该数据处理方法可包括:
S201、服务器根据业务目标确定完成该业务目标所涉及的业务对象。
具体地,该服务器可以为上述如1中的数据采集系统100中的数据采集服务器101或应用服务器102。待采集的软件中可包括实现该软件的各功能所涉及的业务对象。该业务目标可通过该软件的功能来实现,为实现该业务目标,需涉及到该软件功能所涉及的业务对象。
S202、服务器确定完成该业务目标所涉及的业务对象相关的数据表。
具体地,该业务对象相关的数据表和/数据项可用于存储与该业务对象相关的数据。
S203、服务器根据该数据表确定待埋点控件的信息。
具体地,该S203中可以是根据该数据表和该软件的界面代码,从该软件的界面中确定使用该数据表的控件,确定使用该数据表的控件为待埋点控件,获取该待埋点控件的信息。
S204、服务器根据该待埋点控件的信息对软件进行埋点。
具体地,S204中可以是根据该待埋点控件的信息生成埋点代码,并将该埋点代码植入该软件中,实现对该软件的埋点。
S205、服务器采集该埋点对应的数据。
具体地,S205中可以是通过该埋点对该埋点对应的控件进行监控,检测该埋点对应的控件的用户行为操作,继而采集与该用户行为操作相关的数据。其中,该用户行为操作可以包括用户在界面上的该埋点对应的控件处的操作,如点击(onclick)、输入(input)及触摸(ontouch)等。
本发明实施例一提供的数据处理方法,可以通过对软件本身的数据(如,软件中的业务对象以及业务对象对应的数据表等)进行分析,来确定完成业务目标所涉及的控件。由于完成该业务目标所涉及的业务对象,以及,业务对象相关的数据表均是由软件本身的客观特性决定的,因而待埋点控件的信息不受开发人员和/或数据分析师的主观因素的影响,对于实现该业务目标来说,该待埋点控件的信息准确度较高,可使得采集到的埋点对应的数据更准确,从而保证数据分析的准确性。
并且,由于该待埋点控件的信息准确度较高,可使得采集到的埋点对应的数据更准确,因而为保证准确的数据分析结果,该方法还可避免由于该待埋点控件的信息准确度较低带来的多次的埋点及多次数据分析,减小数据分析过程中的埋点及数据分析次数,提高数据分析的效率。
可选的,本发明实施例二还可提供一种数据处理方法。图3为本发明实施例二提供的一种数据处理方法中确定业务目标的方法流程图。如图3所示,该方法在上述实施例中S201中服务器根据业务目标确定完成该业务目标所涉及的业务对象之前,该方法可包括:
S301、服务器接收用户输入的信息。
具体地,该S301中可以是通过用户接口接收该用户输入的信息。
S302、服务器根据该用户输入的信息的关键词确定该业务目标。
具体地,S302中可以是根据自然语言处理(Natural Language Processing,简称NLP)技术对该输入的信息进行关键词的提取,从而获得该输入的信息的关键词,并根据该输入的信息的关键词确定该业务目标。若该输入的信息的关键词包括至少一个关键词,则该方法中可以是根据每个关键词确定一个业务目标,也就是说,根据该输入的信息的关键词确定的业务目标可包括至少一个业务目标。举例来说,若该输入的信息为“缩短用户开户办理的时间”,采用NLP技术对该输入的信息进行关键词的提取,可得到至少一个关键词,如“用户”、“开户”、“开户办理”及“时间”。该方法中,例如可以该业务目标包括:“用户”、“开户”、“开户办理”及“时间”等至少一个关键词。
如上所述的S302中还可以根据该输入的信息的关键词和该软件所在技术领域的词汇库进行关键词扩展,从而获得各关键词对应的词汇集合,继而根据各关键词对应的词汇集合中的词汇确定该业务目标。其中,该软件所在技术领域的词汇库可包括:至少一个关键词在该软件所在技术领域中所对应的词汇。每个关键词对应的词汇集合可包括:该每个关键词在该软件所在技术领域中的至少一个词汇。
举例来说,若该输入的信息的关键词包括:“用户”、“开户”、“开户办理”及“时间”,该软件所在技术领域为客户关系管理(Customer Relationship Management,简称CRM)系统的领域。根据该关键词“开户”及该CRM领域的词汇库,可获得该关键词“开户”对应的词汇集合,其中,该关键词“开户”对应的词汇集合例如可包括:“服务”“产品”“销售品”等词汇。
可选的,本发明实施例二还提供一种数据处理方法。图4为本发明实施例二提供的一种数据处理方法中确定业务对象的方法流程图。如图4所示,在如上所述的实施例中S201中服务器根据业务目标确定完成该业务目标所涉及的业务对象可以包括:
S401、服务器获取该软件的逻辑模型,该逻辑模型中定义有完成该软件的每个软件功能所涉及的业务对象和该业务对象之间的关系。
该方法中,可以是根据该软件的配置文件导出确定该配置文件对应的超文本标记语言(HyperText Mark-up Language,简称HTML)文件,并从该配置文件对应的HTML文件中获取该软件的逻辑模型。该软件的配置文件例如可以为该软件设计开发过程中的生成的配置文件。
该每个软件功能所涉及的业务对象可包括至少一个业务对象,每个业务对象并非孤立的存在,该业务对象之间的关系可以为实现该每个软件功能的过程中,各业务对象之间所需的关系。该每个软件功能所涉及的业务对象,以及该业务对象之间的关系,缺一不可,缺少其中任一,该每个软件功能便难以得以实现。
S402、服务器根据该业务目标从该软件的逻辑模型中,查找出完成该业务目标所涉及的业务对象。
具体地,S402中可以是根据该业务目标分别与该软件的逻辑模型中各业务对象进行匹配,从而查找出完成该业务目标所涉及的业务对象。
可选的,S402中服务器根据该业务目标从该软件的逻辑模型中,查找出完成该业务目标所涉及的业务对象可包括:
服务器根据该业务目标及该逻辑模型中的业务对象信息,确定该业务目标与每个业务对象的相似度;
服务器根据该业务目标与该每个业务对象的相似度,从该逻辑模型中确定相似度最高的业务对象为完成该业务目标所涉及的业务对象。
可选的,该业务对象信息包括:业务对象名称和/或属性。
该方法中可以是根据该业务目标分别与该逻辑模型中的各业务对象的信息进行匹配,从而确定该业务目标与每个业务对象的信息的匹配度,并根据匹配度确定该业务目标与该每个业务对象的相似度。该逻辑模型中确定相似度最高的业务对象可包括:该逻辑模型中业务对象信息与该业务目标相同的业务对象。该方法中还可将相似度最高的业务对象所关联的业务对象确定为完成该业务目标所涉及的业务对象。也就是说,完成该业务目标所涉及的业务对象可以包括:相似度最高的业务对象;或者,完成该业务目标所涉及的业务对象也可以包括:相似度最高的业务对象,以及,相似度最高的业务对象所关联的业务对象。
举例来说,若输入的信息中的关键词“开户”对应的拓展词汇库包括:“服务”“产品”“销售品”等词汇,则该业务目标可以包括“服务”“产品”“销售品”等词汇。完成该业务目标所涉及的业务对象则可包括:与该业务目标的各词汇相似度最高的业务对象,以及,与每个词汇相似度最高的业务对象所关联的业务对象。以词汇“产品”为例,该方法可从该软件的逻辑模型中得到与词汇“产品”相似度最高的业务对象为业务对象“产品”,并且还可得到与该业务对象“产品”相关联的业务对象如“组合产品选择规则”、“产品识别码”、“产品库存项映射关系”、“产品服务映射关系”及“组合产品选择规则”等。针对该业务目标中的其他词汇,可以是采用上述与词汇“产品”类似的方式从该软件的逻辑模型中得到与该其他词汇的相似度最高的业务对象,以及,该其他词汇的相似度最高的业务对象所关联的业务对象,具体的实现过程在此不再赘述。
该方法中可根据该业务目标从该软件的逻辑模型中,查找出完成该业务目标所涉及的业务对象,可使得完成该业务目标所涉及的业务对象与该业务目标更相关,该软件的逻辑模型是该软件的客观特性,因可保证业务对象相关的数据表的准确度,保证了待埋点控件的信息不受开发人员和/或数据分析师的主观因素的影响,该待埋点控件的信息的准确度更高,提高了采集到的埋点对应的数据的准确度,提高数据分析的准确度。
可选的,本发明实施例二还提供一种数据处理方法。图5为本发明实施例二提供的一种数据处理方法中确定业务对象对应的数据表的方法流程图。如图5所示,在如上所述的实施例中S202服务器确定完成该业务目标所涉及的业务对象相关的数据表可以包括:
S501、服务器获取该软件的物理模型,该物理模型在数据库内定义了与该逻辑模型中的每个业务对象相关的数据表以及该数据表之间的关系。
该方法中,可以是根据该软件的配置文件导出确定该配置文件对应的HTML文件,并从该配置文件对应的HTML文件中获取该软件的物理模型。
S502、服务器从该软件的物理模型中,获取完成该业务目标所涉及的业务对象相关的数据表。
具体地,S502中可以是将完成该业务目标所涉及的每个业务对象,分别与该软件的物理模型中的各数据表进行匹配,获得完成该业务目标所涉及的每个业务对象相关的数据表。
该方法中可根据该业务目标从该软件的物理模型中,获取完成该业务目标所涉及的业务对象相关的数据表,该软件的物理模型也是该软件的客观特性,因而可保证完成该业务目标所涉及的业务对象相关的数据表的准确度,保证了待埋点控件的信息不受开发人员和/或数据分析师的主观因素的影响,其待埋点控件的信息的准确度更高,提高了采集到的埋点对应的数据的准确度,提高数据分析的准确度。
可选的,如上所述的S502中服务器从该软件的物理模型中,获取完成该业务目标所涉及的业务对象相关的数据表可以包括:
服务器对完成该业务目标所涉及的业务对象进行聚类,生成每一类业务对象对应的任务;
服务器以任务为单位,从该软件的物理模型中,获取完成该业务目标所涉及的业务对象相关的数据表。
具体地,该方法中可通过对完成该业务目标所涉及的业务对象进行聚类,生成每一类业务对象对应的任务,实现对业务目标的分解,将该业务目标划分为至少一个任务,完成该业务目标所涉及的业务对象则可包括:该业务目标的各任务所涉及的业务对象。该方法中以每个任务为单位,从该软件的物理模型中,获取完成该业务目标的每个任务所涉及的业务对象相关的数据表,还可对该每个任务所涉及的业务对象相关的数据表,以及,使用该数据表的控件的信息进行存储,可使得对于其他业务目标中与该业务目标存在的相同任务,无需再次从物理模型中确定该相同任务所涉及的业务对象相关的数据表,而只需从预先存储的信息中获取该相同任务所涉及的业务对象相关的数据表以及使用该数据表的控件,从而简化了针对存在相同任务的业务目标的数据处理过程,提高数据处理效率。
可选的,本发明实施例二还提供一种数据处理方法。图6为本发明实施例二提供的一种数据处理方法中确定埋点控件信息的方法流程图。如图6所示,在如上所述的实施例中S203中服务器根据该数据表确定该待埋点控件的信息可以包括:
S601、服务器根据该数据表和该软件的当前页面代码,从该当前页面中确定使用该数据表的控件为该待埋点控件。
具体地,该软件的当前页面代码,可以为该软件的界面代码中当前页面的代码。该当前页面可以为用户输入信息对应的页面,如开户页面。该S601中可以是根据该软件的当前页面代码确定该当前页面的各控件,根据该数据表分别与该各控件进行匹配,确定与该数据表相似度最高的控件为使用该数据表的控件。举例来说,若该数据表包括:数据项“客户标识”,该数据表中的数据项“客户标识”与该当前页面中的控件“证件号码”相似度最高,其相互匹配,则使用该数据表的控件可以为该当前页面中的控件“证件号码”。
S602、服务器获取该待埋点控件的信息。
可选的,该待埋点控件的信息包括如下至少一个:该待埋点控件的标识(Identity)、名称(name)和路径。其中,该该待埋点控件的名称可以为该该待埋点控件在直译式脚本语言中的唯一标识,该直译式脚本语言例如可以为java script。
该方法中根据该数据表和该软件的当前页面代码,从该当前页面中确定使用该数据表的控件为待埋点控件,该数据表及该软件的当前页面代码均是由软件的客观特性决定的,因此获取的该待埋点控件的信息的准确度更高,使得采集到的埋点对应的数据更准确,提高数据分析的准确度。
可选的,该方法还包括:
服务器根据使用该数据表的控件相关的系统信息确定该业务目标对应的系统数据。
其中,使用该数据表的控件相关的系统信息包括:使用该数据表的控件对应的该软件所在客户端设备与应用服务器间的交互信息。
可选的,如上所述的S205中服务器采集该埋点对应的数据可以包括:
服务器采集该埋点对应的用户行为数据,和/或,该业务目标对应的系统数据。
该方法在上述任一所述的数据处理方法的基础上,可采集该埋点对应的用户行为数据,和/或,该业务目标对应的系统数据,使得采集到的埋点对应的数据更完善,更完整,而不局限于页面对应的用户数据,保证数据分析的准确度。
本发明实施例三还可提供一种数据处理方法。该方法可通过具体的实例对上述实施例所述的任一数据处理方法进行实施说明。图7为本发明实施例三提供的一种数据处理方法的流程图。如图7所示,该方法可包括:
S701、服务器确定该用户输入的信息的关键词。
举例来说,若该输入的信息为“缩短用户开户办理的时间”,采用NLP技术对该输入的信息进行关键词的提取,可得到输入的信息的关键词如“用户”、“开户”、“开户办理”及“时间”。
S702、服务器对该输入的信息的关键词进行拓展,获得该输入的信息的关键词对应的词汇集合,并根据该词汇集合中的各词汇确定业务目标。
若软件为CRM软件,则该S702中可以是根据该输入的信息的关键词,采用该CRM软件的领域词汇库,对该输入的信息的各关键词进行拓展,获得该各关键词对应的词汇集合。举例来说,以关键词“开户”为例,关键词“开户”对应的词汇集合可包括:“服务”“产品”“销售品”等词汇。
S703、服务器根据该业务目标,从预先获取的软件的逻辑模型中,获得完成该业务目标所涉及的业务对象。
该业务目标可包括上述各关键词对应的词汇集合中的各词汇。该软件的逻辑模型可包括至少一个域的逻辑模型。该S703中可以是根据该业务目标,分别在该软件的每个域的逻辑模型中确定该每个域中完成该业务目标所涉及的业务对象,并对不同域中完成该业务目标所涉及的业务对象进行关联。
以CRM软件系统为例,该CRM软件的逻辑模型例如可包括:产品域逻辑模型、促销域逻辑模型、合作伙伴域逻辑模型、客户域逻辑模型及客户资料公共域逻辑模型。以该业务目标中“产品”为例,该方法中可从该软件的产品域逻辑模型中得到该业务目标中“产品”涉及的第一业务对象集。图8A为本发明实施例三提供的数据处理方法中业务目标中“产品”涉及的第一业务对象集的业务对象关系示意图。如图8A所示,该第一业务对象集可包括:业务对象“产品”、以及与业务对象“产品”相关联的业务对象如“组合产品选择规则”、“产品识别码”、“产品库存项映射关系”、“产品服务映射关系”及“组合产品选择规则”等。在该图8A中,业务对象“产品”分别与业务对象“组合产品选择规则”、业务对象“产品库存项映射关系”、业务对象“产品服务映射关系”及业务对象“产品内容映射关系”为一一对应的关系。业务对象“产品”与业务对象“产品识别码”为一对多的关系,也就是说,一个业务对象“产品”可对应多个业务对象“产品识别码”。
继续以该业务目标中“产品”为例,该方法中还可从该软件的促销域逻辑模型中得到该业务目标中“产品”涉及的第二业务对象集。图8B为本发明实施例三提供的数据处理方法中业务目标中“产品”涉及的第二业务对象集的业务对象关系示意图。如8B所示,该第二业务对象集可包括业务对象“产品”、以及与业务对象“产品”相关联的业务对象如“销售品与产品关系”等。在该图8B中,业务对象“产品”与业务对象“销售品与产品关系”为一对多的关系,也就是说,一个业务对象“产品”可对应多个业务对象“销售品与产品关系”。
采用上述类似的方法,可获得业务目标中其他词汇所涉及的业务对象,在此不再赘述。
也就是说,业务目标中“产品”所涉及的业务对象例如可包括如上图8A所示的第一业务对象集,以及如图8B所示的第二业务对象集中的各业务对象。
由于该业务目标中“产品”所涉及的业务对象可包括多个业务对象集,因而,该方法还可以该第一业务对象集和该第二业务对象集中的重叠业务对象为中心,对该第一业务对象集和该第二业务对象集进行关联,从而得到该业务目标中“产品”涉及的第三业务对象集。图8C为本发明实施例三提供的数据处理方法中业务目标中“产品”涉及的第三业务对象集的业务对象关系示意图。根据图8A所示的第一对象集和图8B所示的第二对象集可知,该第一对象集和该第二对象集中的重叠业务对象可以为业务对象“产品”,该方法中,可以是以业务对象“产品”为中心,对该第一业务对象集和该第二业务对象集进行关联,获得图8C所示的该业务目标中“产品”涉及的第三业务对象集,该第三业务对象集可包括:该业务目标中“产品”所涉及的所有业务对象。
以该业务目标中“销售品”为例,该方法可从该软件的产品域逻辑模型中得到该业务目标中“销售品”涉及的业务对象集。图9为本发明实施例三提供的数据处理方法中业务目标中“销售品”涉及的业务对象集的业务对象关系示意图。如图9所示,该业务目标中“销售品”涉及的业务对象集可包括:业务对象“销售品”、以及与业务对象“销售品结构”相关联的业务对象如“销售品结构”、“销售品包选择规则”等。在该图9中,业务对象“销售品”分别与业务对象“销售品结构”、业务对象“销售品包选择规则”为一对多的关系,也就是说,一个业务对象“销售品”可对应多个业务对象“销售品结构”及多个业务对象“销售品包选择规则”。
S704、服务器对完成该业务目标所涉及的业务对象进行聚类,确定每一类业务对象的任务。
具体地,S704中可以是根据完成该业务目标所涉及的业务对象的名称和/或属性,对完成该业务目标所涉及的业务对象进行聚类,确定每一类业务对象的任务。
结合上述实例,由于业务目标“产品”与业务目标“销售品”涉及的业务对象的名称及属性的相似度高,因而,可将完成该业务目标所涉及的业务对象中业务目标“产品”与业务目标“销售品”涉及的业务对象确定为一类业务对象。该一类业务对象可对应一个任务。
对上述输入信息的关键词“用户”、“开户办理”及“时间”等分别执行与关键词“开户”类似的方式,确定该关键词的拓展词汇库,继而根据该各关键词的拓展词汇库中的词汇确定业务目标,继而执行S704对完成该业务目标所涉及的业务对象进行聚类,获得完成该业务目标的至少一个任务如“客户信息”、“产品/销售品/服务”及“业务办理”。
举例来说,以任务“业务办理”为例进行说明,该任务“业务办理”所涉及的业务对象为同一类的业务对象,该同一类的业务对象间的相似度最高。图10为本发明实施例三提供的一种数据处理方法中任务“业务办理”所涉及的业务对象的关系示意图。图10所示该任务“业务办理”所涉及的业务对象可包括:业务对象“业务交互日志关系表”及业务对象“业务交互日志信息”。其中,业务对象“业务交互日志关系表”与业务对象“业务交互日志信息”为同一类的业务对象。该业务对象“业务交互日志关系表”及业务对象“业务交互日志信息”为多对一的关系,也就是说,多个业务对象“业务交互日志关系表”可对应一个业务对象“业务交互日志信息”。
S705、服务器以任务为单位,从预先获取的物理模型中,确定完成该业务目标所涉及的业务对象相关的数据表。
执行S705之前,该方法还可提示用户该业务目标的至少一个任务。在接收到用户输入的针对该业务目标的至少一个任务的确认消息后,方可执行S705。如接收到用户输入的针对该业务目标的至少一个任务的修改消息,可在将该修改消息作为用户输入的信息依次执行上述S701至S704的各步骤。
该S705中可以根据每个任务所涉及的业务对象,在该物理模型中进行子图查询,从而获得该每个任务所涉及的业务对象相关的数据表。
继续以任务“业务办理”为例,该方法中可以是以根据任务“业务办理”所涉及的业务对象,在该物理模型中进行子图查询,从而获得任务“业务办理”所涉及的业务对象相关的数据表。图11A为本发明实施例三提供的一种数据处理方法中任务“业务办理”所涉及的业务对象相关的一种数据表的关系示意图。根据图10中所示的任务“业务办理”所涉及业务对象中业务对象“业务交互日志关系表”的名称及属性在物理模型中查询得到图11A所示的数据表“业务交互关系表”;根据图10中的任务“业务办理”所涉及业务对象中业务对象“业务交互日志日志信息”的名称及属性在物理模型中查询得到图11A所示的数据表“业务交互日志信息”。图11A中数据表“业务交互关系表”可以为主表,该数据表“业务交互日志信息”可以为该数据表“业务交互关系表”的子表。其中,业务对象的属性可以包括该业务对象中的数据项。
该方法还可根据图11A中各数据表的节点及属性从该物理模型中查找得到任务“业务办理”所涉及的业务对象相关的另一种数据表。其中,数据表的属性可以包括该数据表的各数据项。图11B为本发明实施例三提供的一种数据处理方法中任务“业务办理”所涉及的业务对象相关的另一种数据表的关系示意图。以图11A中的数据表“业务交互日志信息”为例,该方法还可根据图11A中的数据表“业务交互日志信息”的名称及其属性,从该物理模型中查找得到任务“业务办理”所涉及的业务对象相关的另一种数据表。其中,数据表“业务交互日志信息”的名称例如可以为“业务交互日志信息”。数据表“业务交互日志信息”的属性例如可以包括:数据项“业务交互记录标识”及“归属参与人角色类型”等。
该任务“业务办理”所涉及的业务对象相关的另一种数据表例如可包括如图11B所示的数据表“业务受理表”、数据表“业务受理详情”、数据表“业务受理记录”、数据表“代办人信息”、数据表“受理日志离线查询表”、数据表“受理费用支付表”、数据表“小区宽带接入能力勘查”、数据表“业务办理资料变更日志表”等。
由于每个任务所涉及的业务对象相关的数据表包括多个数据表,因而,该方法中,还可对该多个数据表进行合并,得到该每个任务所涉及的业务对象相关的所有数据表。
需要说明的是,对于其他的任务,该方法中可以是采用与任务“业务办理”类似的方式获得其他任务所涉及的业务对象相关的数据表,在此不再赘述。
S706、服务器根据该数据表和软件的当前页面代码,从该当前页面中确定使用该数据表的控件。
具体地,S706中可以是根据该软件的当前页面代码可获得该当前页面中各控件,根据该数据表和该当前页面中的各控件的名称或属性进行匹配,将与该数据表的相似度最高的控件确定为使用该数据表的控件。
若该当前页面为开户页面,根据该软件的当前页面代码可获得该当前页面中各控件。图12为本发明实施例三提供的数据处理方法中当前界面中控件的结构示意图。如图12所示,该开户页面例如可包括:入网控件、客户信息控件、选择套餐控件、选择号码控件、客户识别模块(Subscriber Identification Module,简称SIM)卡信息控件、用户信息控件、增值商品控件、个性设置控件及结算控件。
为减小该当前页面中控件的匹配范围,可将该页面中的各控件划分为多个类型,如“客户信息”类控件、“产品选择”类控件、“用户设置”类控件及“确认”类控件。其中,“客户信息”类控件例如可包括:入网控件、客户信息控件;“产品选择”类控件例如可包括:选择套餐控件、选择号码控件、SIM卡信息控件、用户信息控件、增值商品控件等;“用户设置”类控件例如可包括:个性设置控件;“确认”类控件例如可包括:结算控件。
该方法可根据前述每个任务所涉及的业务对象相关的数据表,分别与每类控件的名称及属性进行匹配,确定使用数据表的控件,以减小控件与数据表的匹配范围。
S707、服务器获取该待埋点控件的信息,并根据使用该数据表的控件相关的系统信息确定该业务目标对应的系统数据。
若使用该数据表的控件为上述图12中“产品选择”类控件中的选择套餐控件,则该方法可以是将上述图12中“产品选择”类控件中的选择套餐控件为待埋点的控件,可根据图12中“产品选择”类控件中的选择套餐控件的标识、名称及路径等至少一个确定该待埋点控件的信息,并将图12中“产品选择”类控件中的选择套餐控件相关的系统信息确定为系统数据。
该业务目标的每个任务均采用上述方式,得到每个任务对应的待埋点控件的信息及系统数据,对各任务对应的待埋点控件的信息及系统数据进行去重操作后,便可获得该业务目标的所有任务对应的待埋点控件的信息及系统数据。
S708、服务器根据该待埋点控件的信息对软件进行埋点。
具体地,S708中可以是根据该待埋点控件的信息和该业务目标对应的系统数据,生成埋点代码,将该埋点代码植入该软件中,实现对该软件的埋点,以采集数据。
S709、服务器采集该埋点对应的用户行为数据和该业务目标对应的系统数据。
本发明实施例三提供的该数据处理方法,可通过具体的实例对上述实施例进行说明,其有益效果与上述实施例类似,在此不再赘述。
本发明实施例四还提供一种数据处理装置。图13为本发明实施例四提供的一种数据处理装置的结构示意图。数据处理装置1300可通过软件和/或硬件的方式集成在服务器中,以使得服务器执行上述实施例一至实施例三中任一所述的服务器执行的数据处理方法。如图13所示,数据处理装置1300可包括:第一确定模块1301、第二确定模块1302、第三确定模块1303、埋点模块1304和采集模块1305。
其中,第一确定模块1301,用于根据业务目标确定完成该业务目标所涉及的业务对象。
第二确定模块1302,用于确定完成该业务目标所涉及的业务对象相关的数据表。
第三确定模块1303,用于根据该数据表确定待埋点控件的信息。
埋点模块1304,用于根据该埋点控件的信息对软件进行埋点。
采集模块1305,用于采集该埋点对应的数据。
可选的,数据处理装置1300还包括:
接收模块,用于接收用户输入的信息。
第四确定模块,用于根据该用户输入的信息的关键词确定该业务目标。
可选的,第一确定模块1301,可包括:
第一获取单元,用于获取该软件的逻辑模型,该逻辑模型中定义有完成该软件的每个软件功能所涉及的业务对象和该业务对象之间的关系。
第一查找单元,用于根据该业务目标从该软件的逻辑模型中,查找出完成该业务目标所涉及的业务对象。
可选的,第一查找单元,具体用于根据该业务目标及该逻辑模型中的业务对象信息,确定该业务目标与每个业务对象的相似度;根据该业务目标与该每个业务对象的相似度,从该逻辑模型中确定相似度最高的业务对象为完成该业务目标所涉及的业务对象。
可选的,第二确定模块1302,可包括:
第二获取单元,用于获取该软件的物理模型,该物理模型在数据库内定义了与该逻辑模型中的每个业务对象相关的数据表以及该数据表之间的关系。
第二查找单元,用于从该软件的物理模型中,查找出完成该业务目标所涉及的业务对象相关的数据表。
可选的,第二查找单元,具体用于对完成业务目标所涉及的业务对象进行聚类,生成每一类业务对象对应的任务;以任务为单位,从该软件的物理模型中,获取完成该业务目标所涉及的业务对象相关的数据表。
可选的,第二查找单元,具体用于根据完成该业务目标所涉及的业务对象之间的相似度,对完成该业务目标所涉及的业务对象进行聚类,生成该每一类业务对象对应的任务;其中,该每一类业务对象之间的相似度最高。
可选的,第三确定模块1303,具体用于根据数据表和软件的当前页面代码,从当前页面中确定使用数据表的控件为待埋点控件;获取该待埋点控件的信息。
可选的,第三确定模块1303,还用于根据使用该数据表的控件相关的系统信息确定该业务目标对应的系统数据。
可选的,采集模块1305,具体用于采集该埋点对应的用户行为数据,和/或,该业务目标对应的系统数据。
本发明实施例四提供的数据处理装置,可用于执行上述实施例一至三中任一所述的数据处理方法,具体实现过程及有益效果与上述实施例类似,在此不再赘述。
本发明实施例五还提供一种数据处理设备。图14为本发明实施例五提供的一种数据处理设备的结构示意图。数据处理设备1400可以为服务器,该服务器可以为上述图1中的数据采集系统的数据采集服务器101或者应用服务器102。如图14所示,该数据处理设备1400可包括:处理器1401、存储器1402、通信接口1403和总线1404;其中,处理器1401与存储器1402、通信接口1403通过总线1404连接。
存储器1402用于存储指令。
处理器1401用于执行指令,当处理器1401执行存储器1402存储的指令时,使得处理器1401执行上述图2至图7中任一所示的服务器执行的数据处理方法。具体的数据处理方法可参见上述如图2-图7任一所示的实施例中的相关描述,此处不再赘述。
其中,处理器1401,可以为中央处理器(Central Processing Unit,简称CPU)。处理器1401还可以为其他通用处理器、数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application Specific Integrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器1402可以包括易失性存储器(volatile memory),例如随机存取存储器(Random-Access Memory,简称RAM);存储器1402也可以包括非易失性存储器(non-volatile memory),例如只读存储器(Read-Only Memory,简称ROM),快闪存储器(flash memory),硬盘(Hard Disk Drive,简称HDD)或固态硬盘(Solid-State Drive,简称SSD);存储器1402还可以包括上述种类的存储器的组合。
通信接口1403具体可以为接口电路,用于在收发信息过程中,信号的接收和发送,通信接口1403接收外部设备发送的信息后,给处理器1401处理;另外,通信接口1403还可以通过无线通信与网络和其他设备通信。
总线1404可以包括数据总线、电源总线、控制总线和信号状态总线等。本实施例中为了清楚说明,在图14中将各种总线都示意为一条直线。
本发明实施例五提供的数据处理设备,可用于执行上述实施例一至三中任一所述的数据处理方法,具体实现过程及有益效果与上述实施例类似,在此不再赘述。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。