技术特征:
1.一种数据处理方法,包括:获取待处理页面中的页面元素集合;基于预设搜索策略在所述页面元素集合中确定待处理页面元素;根据所述待处理页面元素的交互信息确定初始目标页面,并判断所述初始目标页面是否为目标页面;若是,则确定所述初始目标页面为目标页面;若否,则将所述初始目标页面作为新的待处理页面,并执行获取待处理页面中的页面元素集合的步骤。2.如权利要求1所述的数据处理方法,所述获取待处理页面中的页面元素集合,包括:解析所述待处理页面,获得所述待处理页面中的待处理元素集合;根据预设合并规则在所述待处理元素集合中确定页面元素集合。3.如权利要求2所述的数据处理方法,所述解析所述待处理页面,获得所述待处理页面中的待处理元素集合,包括:获取所述待处理页面中的元素集合;识别所述元素集合中包含交互信息的元素作为待处理元素,并组成待处理元素集合。4.如权利要求3所述的数据处理方法,在获取所述待处理页面中的元素集合之后,还包括:基于预设处理规则对所述元素集合中的元素进行筛选和矫正。5.如权利要求3所述的数据处理方法,所述根据预设合并规则在所述待处理元素集合中确定页面元素集合,包括:确定所述待处理元素集合中包含相同交互信息的待处理元素;合并所述包含相同交互信息的待处理元素,获得页面元素集合。6.如权利要求1所述的数据处理方法,所述基于预设搜索策略在所述页面元素集合中确定待处理页面元素,包括:基于预设搜索策略确定预设关键词;判断所述页面元素集合中是否包含与所述预设关键词匹配的页面元素;若是,则将所述页面元素集合中与所述预设关键词匹配的页面元素作为待处理页面元素;若否,则基于预设元素排序确定所述页面元素集合中的待处理页面元素。7.如权利要求1所述的数据处理方法,所述基于预设搜索策略在所述页面元素集合中确定待处理页面元素,包括:基于预设搜索策略确定预设页面位置;判断所述页面元素集合中是否包含与所述预设页面位置匹配的页面元素;若是,则将所述页面元素集合中与所述预设页面位置匹配的页面元素作为待处理页面元素;若否,则基于预设元素排序确定所述页面元素集合中的待处理页面元素。8.如权利要求1所述的数据处理方法,所述根据所述待处理页面元素的交互信息确定初始目标页面,包括:解析所述待处理页面元素,获得所述待处理页面元素的交互信息,其中,交互信息包括
初始目标页面链接;基于所述初始目标页面链接确定初始目标页面。9.如权利要求1所述的数据处理方法,所述方法还包括:判断所述待处理页面中是否包含异常页面;在所述待处理页面中包含异常页面的情况下,获取所述异常页面中的异常页面元素,并基于所述异常页面元素关闭所述异常页面。10.如权利要求1所述的数据处理方法,所述方法还包括:获取所述待处理页面中每个待处理页面元素的交互信息;在确定每个所述交互信息的页面信息中均不包含下一级页面信息的情况下,基于预设路径确定新的待处理页面。11.一种数据处理装置,包括:获取模块,被配置为获取待处理页面中的页面元素集合;第一确定模块,被配置为基于预设搜索策略在所述页面元素集合中确定待处理页面元素;判断模块,被配置为根据所述待处理页面元素的交互信息确定初始目标页面,并判断所述初始目标页面是否为目标页面;在所述判断模块输出的判断结果为是的情况下,运行第二确定模块,所述第二确定模块被配置为确定所述初始目标页面为目标页面;在所述判断模块输出的判断结果为否的情况下,运行执行模块,所述执行模块被配置为将所述初始目标页面作为新的待处理页面,并继续运行所述获取模块。12.一种计算设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机指令,所述处理器执行所述计算机指令时实现权利要求1-10任意一项所述方法的步骤。13.一种计算机可读存储介质,其存储有计算机可执行指令,该计算机指令被处理器执行时实现权利要求1-10任意一项所述方法的步骤。
技术总结
本说明书实施例提供数据处理方法及装置,其中所述数据处理方法包括:获取待处理页面中的页面元素集合;基于预设搜索策略在所述页面元素集合中确定待处理页面元素;根据所述待处理页面元素的交互信息确定初始目标页面,并判断所述初始目标页面是否为目标页面;若是,则确定所述初始目标页面为目标页面;若否,则将所述初始目标页面作为新的待处理页面,并执行获取待处理页面中的页面元素集合的步骤。本说明书的数据处理方法,确定待处理页面中的页面元素,基于页面元素的交互信息确定待处理页面元素的下一级页面,在确定下一级页面为目标页面的情况下,确定了到达目标页面的路径,便于后续基于路径进入应用的目标页面并截图。后续基于路径进入应用的目标页面并截图。后续基于路径进入应用的目标页面并截图。
技术研发人员:霍向阳
受保护的技术使用者:支付宝(杭州)信息技术有限公司
技术研发日:2021.10.13
技术公布日:2022/1/14