本技术涉及人工智能,具体而言,涉及一种基于人工智能和大数据分析的网络数据匹配方法和平台。
背景技术:
1、人工智能(artificial intelligence,缩写为ai)亦称智械、机器智能,指由人制造出来的机器所表现出来的智能,通常人工智能是指通过普通计算机程序来呈现人类智能的技术。人工智能技术的应用场景较多,例如,可以应用于互联网领域中,如对互联网数据进行分析处理等。在现有技术中,基于一些需求,需要对互联网行为数据进行匹配查找等(如基于查找到的互联网行为数据进行互联网用户的相关性分析或关联处理等),但是,存在着互联网行为数据匹配的可靠度不高的问题。
技术实现思路
1、有鉴于此,本技术的目的在于提供一种基于人工智能和大数据分析的网络数据匹配方法和平台,以提高网络数据匹配的可靠度。
2、为实现上述目的,本技术实施例采用如下技术方案:
3、一种基于人工智能和大数据分析的网络数据匹配方法,所述网络数据匹配方法包括:
4、提取目标网络行为描述文本,并利用更新描述文本挖掘神经网络,将所述目标网络行为描述文本进行关键信息挖掘操作,以挖掘出所述目标网络行为描述文本对应的映射行为描述文本特征表示,以及,将所述目标网络行为描述文本对应的映射行为描述文本特征表示进行参数抽选操作,并将参数抽选操作形成的所述目标网络行为描述文本对应的抽选行为描述文本特征表示进行标记,以形成所述目标网络行为描述文本对应的第一行为描述文本特征表示;
5、基于所述更新描述文本挖掘神经网络对应的映射关系集合,确定出所述第一行为描述文本特征表示对应的映射第一行为描述文本特征表示,以及,对所述映射第一行为描述文本特征表示对应的代表参数进行标记,以得到对应的第一代表参数,以及,对所述第一代表参数对应的相关网络行为描述文本进行标记,以得到所述目标网络行为描述文本对应的待确认网络行为描述文本;
6、分析出所述目标网络行为描述文本对应的映射行为描述文本特征表示和所述待确认网络行为描述文本对应的映射行为描述文本特征表示之间的特征表示差异度,以及,在分析出的特征表示差异度中筛选出第一特征表示差异度,以及,对所述第一特征表示差异度对应的待确认网络行为描述文本进行标记处理,以形成所述目标网络行为描述文本对应的匹配网络行为描述文本。
7、在一种可能的实施例中,在上述基于人工智能和大数据分析的网络数据匹配方法中,所述映射关系集合依据网络行为描述文本集合中的历史网络行为描述文本对应的映射行为描述文本特征表示构建形成;
8、所述基于人工智能和大数据分析的网络数据匹配方法还包括:
9、利用所述更新描述文本挖掘神经网络,将所述历史网络行为描述文本进行关键信息挖掘操作,以挖掘出所述历史网络行为描述文本对应的映射行为描述文本特征表示,以及,将所述历史网络行为描述文本对应的映射行为描述文本特征表示进行分类操作,以形成所述历史网络行为描述文本对应的第一数量个特征表示分类集合,每一个所述特征表示分类集合具有一个分类中心特征表示;
10、对所述第一数量个特征表示分类集合中的每一个特征表示分类集合具有的分类中心特征表示进行标记,以标记为每一个所述特征表示分类集合对应的代表参数,以及,依据每一个所述特征表示分类集合对应的代表参数确定出所述映射关系集合;
11、构建出所述映射关系集合中的代表参数与所述网络行为描述文本集合中的历史网络行为描述文本之间的相对映射信息,依据所述相对映射信息,对每一个所述特征表示分类集合中的历史网络行为描述文本进行标记,以标记为对应特征表示分类集合的代表参数对应的相关网络行为描述文本。
12、在一种可能的实施例中,在上述基于人工智能和大数据分析的网络数据匹配方法中,所述网络数据匹配方法还包括:
13、采集对第一描述文本挖掘神经网络进行更新的阶段示例性数据,以及,对所述阶段示例性数据中的示例性数据组合进行标记,以标记为更新用示例性数据组合,所述更新用示例性数据组合包括第一示例性网络行为描述文本、第二示例性网络行为描述文本和第三示例性网络行为描述文本,所述第一示例性网络行为描述文本和第二示例性网络行为描述文本所在的相似网络行为描述文本集合一样,所述第一示例性网络行为描述文本和第三示例性网络行为描述文本所在的相似网络行为描述文本集合不一样;
14、利用所述第一描述文本挖掘神经网络,挖掘到所述更新用示例性数据组合对应的组合文本特征表示,以及,对所述更新用示例性数据组合对应的组合文本特征表示加载到所述第一描述文本挖掘神经网络对应的数据干扰识别神经网络,利用所述数据干扰识别神经网络,基于所述第一描述文本挖掘神经网络的更新阶段数目和所述数据干扰识别神经网络对应的参考相似文本集合偏离系数,将所述更新用示例性数据组合进行数据干扰识别,以输出所述更新用示例性数据组合对应的数据干扰识别信息;
15、将所述更新用示例性数据组合对应的组合文本特征表示进行参数二元化操作,以输出所述更新用示例性数据组合对应的更新组合文本特征表示,以及,基于所述更新用示例性数据组合对应的更新组合文本特征表示和所述数据干扰识别信息,将所述阶段示例性数据进行学习代价值的确定,输出所述阶段示例性数据对应的总学习代价值;
16、基于所述总学习代价值,对所述第一描述文本挖掘神经网络的网络参数进行更新,以及,依据更新后的第一描述文本挖掘神经网络,形成用于对所述目标网络行为描述文本进行关键信息挖掘操作的更新描述文本挖掘神经网络。
17、在一种可能的实施例中,在上述基于人工智能和大数据分析的网络数据匹配方法中,所述采集对第一描述文本挖掘神经网络进行更新的阶段示例性数据的步骤,包括:
18、采集到目标网络行为描述文本集合,以及,确定出与目标网络行为描述文本集合中的每一个相似网络行为描述文本集合对应的非相似数据集;
19、依据所述目标网络行为描述文本集合中的每一个相似网络行为描述文本集合和每一个所述相似网络行为描述文本集合对应的非相似数据集,确定出对第一描述文本挖掘神经网络进行更新的整体示例性数据组合;
20、基于所述非相似数据集的数据集文本数量,将所述整体示例性数据组合中的示例性数据组合进行阶段化处理,以形成所述目标网络行为描述文本集合对应的阶段示例性数据。
21、在一种可能的实施例中,在上述基于人工智能和大数据分析的网络数据匹配方法中,所述采集到目标网络行为描述文本集合,以及,确定出与目标网络行为描述文本集合中的每一个相似网络行为描述文本集合对应的非相似数据集的步骤,包括:
22、采集到目标网络行为描述文本集合,以及,依据所述目标网络行为描述文本集合包括的第二数量个相似网络行为描述文本集合的文本标识数据,将所述第二数量个相似网络行为描述文本集合进行分类操作,以形成所述目标网络行为描述文本集合对应的第三数量个文本集合分类组,一个文本集合分类组与一个文本标识数据对应;
23、在所述目标网络行为描述文本集合中,提取到任意一个相似网络行为描述文本集合,以及,从所述第三数量个文本集合分类组中,对在所述任意一个相似网络行为描述文本集合相关的文本集合分类组中筛选出的第四数量个文本集合分类组进行标记,以标记为第一文本集合分类组;
24、在第四数量个所述第一文本集合分类组对应的数据子集中,确定出第五数量个示例性网络行为描述文本,以标记为第一非相似示例性网络行为描述文本,以及,依据确定出的第五数量个第一非相似示例性网络行为描述文本,组合形成所述任意一个相似网络行为描述文本集合对应的第一非相似数据子集,以及,在所述第三数量个文本集合分类组对应的数据子集中,确定出第五数量个示例性网络行为描述文本,以标记为第二非相似示例性网络行为描述文本,以及,依据确定出的第五数量个第二非相似示例性网络行为描述文本,组合形成所述任意一个相似网络行为描述文本集合对应的第二非相似数据子集,所述第一非相似数据子集中的第一非相似示例性网络行为描述文本与所述任意一个相似网络行为描述文本集合中的示例性网络行为描述文本具有一样的文本标识数据,所述第二非相似数据子集中的示例性网络行为描述文本与所述任意一个相似网络行为描述文本集合中的示例性网络行为描述文本具有不一样的文本标识数据;
25、对所述第一非相似数据子集和所述第二非相似数据子集进标记,以标记为所述任意一个相似网络行为描述文本集合对应的非相似数据集。
26、在一种可能的实施例中,在上述基于人工智能和大数据分析的网络数据匹配方法中,所述依据所述目标网络行为描述文本集合包括的第二数量个相似网络行为描述文本集合的文本标识数据,将所述第二数量个相似网络行为描述文本集合进行分类操作,以形成所述目标网络行为描述文本集合对应的第三数量个文本集合分类组的步骤,包括:
27、对所述目标网络行为描述文本集合包括的所述第二数量个相似网络行为描述文本集合加载到标识数据分析神经网络中,利用所述标识数据分析神经网络分析得到所述第二数量个相似网络行为描述文本集合中的每一个相似网络行为描述文本集合的文本标识数据,每一个所述相似网络行为描述文本集合的文本标识数据在基于所述相似网络行为描述文本集合中的示例性网络行为描述文本的文本标识数据的标识数据统计数量大于参考标识数据统计数量的情况下得到;所述参考标识数据统计数量基于所述相似网络行为描述文本集合中的示例性网络行为描述文本的数量得到;
28、从所述第二数量个相似网络行为描述文本集合中,依据每一个所述相似网络行为描述文本集合的文本标识数据,对具有一样的文本标识数据的相似网络行为描述文本集合分配到一个文本集合分类组中,形成所述目标网络行为描述文本集合对应的第三数量个文本集合分类组。
29、在一种可能的实施例中,在上述基于人工智能和大数据分析的网络数据匹配方法中,所述目标网络行为描述文本集合包括第二数量个相似网络行为描述文本集合,一个相似网络行为描述文本集合包括第七数量个示例性网络行为描述文本,每一个所述相似网络行为描述文本集合对应的非相似数据集包括第一非相似数据子集和第二非相似数据子集;
30、所述依据所述目标网络行为描述文本集合中的每一个相似网络行为描述文本集合和每一个所述相似网络行为描述文本集合对应的非相似数据集,确定出对第一描述文本挖掘神经网络进行更新的整体示例性数据组合的步骤,包括:
31、从所述目标网络行为描述文本集合包括的每一个相似网络行为描述文本集合中,确定出第一相似网络行为描述文本集合;
32、从所述第一相似网络行为描述文本集合包括的第七数量个示例性网络行为描述文本中,确定出一个示例性网络行为描述文本,以标记为所述第一相似网络行为描述文本集合的第一示例性网络行为描述文本,以及,对所述第一相似网络行为描述文本集合包括的第七数量个示例性网络行为描述文本中所述第一示例性网络行为描述文本以外的示例性网络行为描述文本进行标记,以标记为所述第一相似网络行为描述文本集合的第二示例性网络行为描述文本,以及,依据所述第一相似网络行为描述文本集合的第一示例性网络行为描述文本和所述第一相似网络行为描述文本集合的第二示例性网络行为描述文本,形成所述第一相似网络行为描述文本集合的相似示例性网络行为描述文本组合;
33、从所述第一相似网络行为描述文本集合对应的非相似数据集中,确定出第八数量个示例性网络行为描述文本,以标记为所述第一相似网络行为描述文本集合的第三示例性网络行为描述文本,所述第一相似网络行为描述文本集合的第三示例性网络行为描述文本中包括第八数量/2个复杂第三示例性网络行为描述文本和第八数量/2个简单第三示例性网络行为描述文本,所述第八数量/2个复杂第三示例性网络行为描述文本在所述第一相似网络行为描述文本集合对应的第一非相似数据子集中选择出,所述第八数量/2个简单第三示例性网络行为描述文本在所述第一相似网络行为描述文本集合对应的第二非相似数据子集中选择出;
34、基于所述第一相似网络行为描述文本集合的相似示例性网络行为描述文本组合和所述第一相似网络行为描述文本集合的第三示例性网络行为描述文本,组合形成所述第一相似网络行为描述文本集合的示例性数据组合,以及,在所述目标网络行为描述文本集合中的每一个相似网络行为描述文本集合确定为所述第一相似网络行为描述文本集合的情况下,形成每一个所述相似网络行为描述文本集合的示例性数据组合;
35、对每一个相似网络行为描述文本集合的示例性数据组合进行标记,以标记为对第一描述文本挖掘神经网络进行更新的整体示例性数据组合。
36、在一种可能的实施例中,在上述基于人工智能和大数据分析的网络数据匹配方法中,所述利用所述第一描述文本挖掘神经网络,挖掘到所述更新用示例性数据组合对应的组合文本特征表示,以及,对所述更新用示例性数据组合对应的组合文本特征表示加载到所述第一描述文本挖掘神经网络对应的数据干扰识别神经网络,利用所述数据干扰识别神经网络,基于所述第一描述文本挖掘神经网络的更新阶段数目和所述数据干扰识别神经网络对应的参考相似文本集合偏离系数,将所述更新用示例性数据组合进行数据干扰识别,以输出所述更新用示例性数据组合对应的数据干扰识别信息的步骤,包括:
37、对所述更新用示例性数据组合进行加载处理,利用所述第一描述文本挖掘神经网络对所述更新用示例性数据组合进行关键信息挖掘操作和线性操作,以及,对所述第一描述文本挖掘神经网络输出的所述更新用示例性数据组合的组合文本特征表示进行标记,以标记为第一阶段组合文本特征表示;
38、倘若所述第一描述文本挖掘神经网络的更新阶段数目大于或等于预先配置的第一参考更新阶段数目,则对所述第一阶段组合文本特征表示加载到所述第一描述文本挖掘神经网络对应的数据干扰识别神经网络中,利用所述数据干扰识别神经网络,基于所述阶段示例性数据对应的原始数据标记簇,分析出所述数据干扰识别神经网络对应的第一参考相似文本集合偏离系数;
39、依据所述原始数据标记簇,分析出所述阶段示例性数据对应的原始总学习代价值,以及,依据所述原始总学习代价值,对所述第一描述文本挖掘神经网络的网络参数进行更新,以及,对更新后的第一描述文本挖掘神经网络进行标记,以标记为中间描述文本挖掘神经网络,以及,更新所述第一描述文本挖掘神经网络的更新阶段数目;
40、对所述中间描述文本挖掘神经网络挖掘到的所述更新用示例性数据组合的组合文本特征表示进行标记,以标记为第二阶段组合文本特征表示,以及,在更新后的更新阶段数目大于或等于预先配置的第二参考更新阶段数目的情况下,对所述第二阶段组合文本特征表示加载到所述数据干扰识别神经网络中,利用所述数据干扰识别神经网络,基于所述数据干扰识别神经网络对应的第一参考相似文本集合偏离系数,将所述更新用示例性数据组合进行数据干扰识别,以输出所述更新用示例性数据组合对应的数据干扰识别信息。
41、在一种可能的实施例中,在上述基于人工智能和大数据分析的网络数据匹配方法中,所述更新用示例性数据组合的数据干扰识别信息包括第一数据标记簇对应的示例性数据组合的第一干扰识别信息、第二数据标记簇对应的示例性数据组合的第二干扰识别信息和第三数据标记簇对应的示例性数据组合的第三干扰识别信息,所述第一数据标记簇的置信度参数大于所述第二数据标记簇的置信度参数,所述第二数据标记簇的置信度参数大于所述第三数据标记簇的置信度参数;
42、所述将所述更新用示例性数据组合对应的组合文本特征表示进行参数二元化操作,以输出所述更新用示例性数据组合对应的更新组合文本特征表示,以及,基于所述更新用示例性数据组合对应的更新组合文本特征表示和所述数据干扰识别信息,将所述阶段示例性数据进行学习代价值的确定,输出所述阶段示例性数据对应的总学习代价值的步骤,包括:
43、将所述更新用示例性数据组合的组合文本特征表示进行参数二元化操作,以形成所述更新用示例性数据组合对应的更新组合文本特征表示,以及,将所述更新用示例性数据组合对应的更新组合文本特征表示进行参数抽选操作,以形成所述更新用示例性数据组合对应的抽选行为描述文本特征表示;
44、基于所述第一描述文本挖掘神经网络的更新阶段数目,分析出所述第一数据标记簇对应的第一阶段性加权系数、所述第二数据标记簇对应的第二阶段性加权系数和所述第三数据标记簇对应的第三阶段性加权系数;
45、基于所述第一数据标记簇对应的示例性数据组合的第一干扰识别信息,分析出所述第一数据标记簇对应的示例性数据组合的第一干扰维度学习代价值,以及,基于所述第二数据标记簇对应的示例性数据组合的第二干扰识别信息,分析出所述第二数据标记簇对应的示例性数据组合的第二干扰维度学习代价值,以及,基于所述第三数据标记簇对应的示例性数据组合的第三干扰识别信息,分析出所述第三数据标记簇对应的示例性数据组合的第三干扰维度学习代价值;
46、基于所述第一干扰维度学习代价值和所述第一阶段性加权系数、所述第二干扰维度学习代价值和所述第二阶段性加权系数以及所述第三干扰维度学习代价值和所述第三阶段性加权系数,计算出所述阶段示例性数据在所述更新阶段数目时的目标干扰维度学习代价值;
47、依据所述更新用示例性数据组合的更新组合文本特征表示和所述更新用示例性数据组合的抽选行为描述文本特征表示之间的差异,确定出对应的目标抽选维度学习代价值;
48、基于所述目标干扰维度学习代价值和所述目标抽选维度学习代价值,计算得到所述阶段示例性数据对应的总学习代价值。
49、本技术还提供一种基于人工智能和大数据分析的网络数据匹配平台,包括处理器和存储器,所述存储器用于存储计算机程序,所述处理器用于执行所述计算机程序,以实现上述的方法。
50、本技术提供的一种基于人工智能和大数据分析的网络数据匹配方法和平台,可以将目标网络行为描述文本进行关键信息挖掘操作,以挖掘出映射行为描述文本特征表示,以形成目标网络行为描述文本对应的第一行为描述文本特征表示;确定出第一行为描述文本特征表示对应的映射第一行为描述文本特征表示,以得到目标网络行为描述文本对应的待确认网络行为描述文本;分析出目标网络行为描述文本对应的映射行为描述文本特征表示和待确认网络行为描述文本对应的映射行为描述文本特征表示之间的特征表示差异度,以确定匹配网络行为描述文本。基于前述的内容,通过映射关系集合和特征表示差异度的两次筛选确认,可以使得确定出的匹配网络行为描述文本的可靠度较高,从而提高网络数据匹配的可靠度。
51、为使本技术的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。