一种页面分析方法及装置与流程

文档序号:33321188发布日期:2023-03-03 20:44阅读:来源:国知局

技术特征:
1.一种页面分析方法,其特征在于,包括:获取目标页面中各个控件的属性信息;根据各个控件的属性信息获取各个控件的控件特征;通过全局特征提取函数,对所述各个控件的控件特征进行融合,得到所述目标页面的结构特征;其中,所述全局特征提取函数支持对任意数量的控件进行控件特征融合,且,在所述全局特征提取函数中所述任意数量控件的控件特征采用不同的输入位置的情况下,所述全局特征提取函数输出的页面结构特征均相同;基于所述目标页面的结构特征对所述目标页面进行分析。2.根据权利要求1所述的方法,其特征在于,所述基于所述目标页面的结构特征对所述目标页面进行分析,包括:根据所述目标页面的结构特征获取所述目标页面的类别。3.根据权利要求1所述的方法,其特征在于,所述基于所述目标页面的结构特征对所述目标页面进行分析,包括:根据所述目标页面的结构特征和第一页面的结构特征,获取所述目标页面与所述第一页面的相似度。4.根据权利要求1所述的方法,其特征在于,所述根据各个控件的属性信息获取各个控件的控件特征,包括:分别在以各个控件的属性信息为第一函数的自变量时,获取所述第一函数的因变量作为各个控件的控件特征;其中,所述第一函数为非线性函数。5.根据权利要求1所述的方法,其特征在于,所述根据各个控件的属性信息获取各个控件的控件特征,包括:分别根据各个控件的属性信息和特征提取模型获取各个控件的控件特征;其中,所述特征提取模型为基于第一样本数据对第一神经网络模型进行训练获取的模型,所述第一样本数据包括:多个控件的属性信息和所述多个控件的控件特征。6.根据权利要求1所述的方法,其特征在于,所述根据所述目标页面的结构特征对所述目标页面进行分析,包括:分别根据各个控件的控件特征和所述目标页面的结构特征,获取各个控件的比重;根据各个控件的比重和sigmoid函数获取各个控件的执行概率。7.根据权利要求1所述的方法,其特征在于,所述根据所述目标页面的结构特征对所述目标页面进行分析,包括:分别根据各个控件的控件特征和所述目标页面的结构特征,获取各个控件的比重;根据各个控件的比重和softmax函数获取各个控件的执行动作的类型。8.根据权利要求6或7所述的方法,其特征在于,所述分别根据各个控件的控件特征和所述目标页面的结构特征,获取各个控件的比重,包括:分别在以各个控件的控件特征和所述目标页面的结构特征为第二函数的自变量时,获取所述第二函数的因变量作为各个控件的比重;其中,所述第二函数为非线性函数。9.根据权利要求6或7所述的方法,其特征在于,所述分别根据各个控件的控件特征和
所述目标页面的结构特征,获取各个控件的比重,包括:分别根据各个控件的控件特征、所述目标页面的结构特征以及比重提取模型获取各个控件的比重;其中,所述比重提取模型为基于第二样本数据对第二神经网络模型进行训练获取的模型,所述第二样本数据包括:多个页面中各个控件的控件特征、所述多个页面的结构特征以及所述多个页面中各个控件的比重。10.一种页面分析装置,其特征在于,包括:获取单元,用于获取目标页面中各个控件的属性信息;第一特征提取单元,用于根据各个控件的属性信息获取各个控件的控件特征;第二特征提取单元,用于通过全局特征提取函数,对所述各个控件的控件特征进行融合,得到所述目标页面的结构特征;其中,所述全局特征提取函数支持对任意数量的控件进行控件特征融合,且,在所述全局特征提取函数中所述任意数量控件的控件特征采用不同的输入位置的情况下,所述全局特征提取函数输出的页面结构特征均相同;分析单元,用于基于所述目标页面的结构特征对所述目标页面进行分析。11.一种电子设备,其特征在于,包括:存储器和处理器,所述存储器用于存储计算机程序;所述处理器用于在执行计算机程序时,使得所述电子设备实现权利要求1-9任一项所述的页面分析方法。12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,当所述计算机程序被计算设备执行时,使得所述计算设备实现权利要求1-9任一项所述的页面分析方法。13.一种计算机程序产品,其特征在于,当所述计算机程序产品在计算机上运行时,使得所述计算机实现权利要求1-9任一项所述的页面分析方法。

技术总结
本发明实施例提供了一种页面分析方法及装置,涉及数据处理技术领域。该方法包括:获取目标页面中各个控件的属性信息;根据各个控件的属性信息获取各个控件的控件特征;通过全局特征提取函数,对所述各个控件的控件特征进行融合,得到所述目标页面的结构特征;其中,所述全局特征提取函数支持对任意数量的控件进行控件特征融合,且,在所述全局特征提取函数中所述任意数量控件的控件特征采用不同的输入位置的情况下,所述全局特征提取函数输出的页面结构特征均相同;基于所述目标页面的结构特征对所述目标页面进行分析。本发明实施例用于解决基于页面结构树表示的页面结构难以数据化,无法应用于页面分析的问题。无法应用于页面分析的问题。无法应用于页面分析的问题。


技术研发人员:丁光磊 杨睿智 张钊
受保护的技术使用者:北京字节跳动网络技术有限公司
技术研发日:2021.08.30
技术公布日:2023/3/2
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1