内容处理方法以及相关设备与流程

文档序号:31675931发布日期:2022-09-28 02:03阅读:54来源:国知局
内容处理方法以及相关设备与流程

1.本技术涉及计算机技术领域,具体涉及一种内容处理方法以及相关设备。


背景技术:

2.随着互联网技术的发展,网络信息飞速增长,网络上充斥着大量的冗余信息,用户为了在网络上搜索到所需要的信息,需要借助搜索引擎。搜索引擎是一种在网络上应用的软件系统,其以一定的策略在网络上搜集和发现信息,并在对信息进行处理后,为用户提供互联网上的信息搜索服务。搜索引擎通常提供一个网页界面,让用户在客户端提交搜索内容,然后搜索应用获取和用户输入的搜索内容相匹配的搜索结果,并对搜索结果进行排序,将这些排序后的搜索结果返回给用户。
3.但是,目前的相关技术中,搜索应用对搜索结果的排序较为随意,在搜索结果排序中,通常只考虑搜索结果与用户输入的搜索内容的相关性,这种仅基于相似度来进行排序的方法存在召回结果排序质量较低的问题,容易出现搜索结果列表中靠前的搜索结果不是用户满意的结果的情况,使得搜索结果列表中靠前的搜索结果的点击率较低。


技术实现要素:

4.本技术实施例提供一种内容处理方法以及相关设备,相关设备可以包括内容处理装置、电子设备、计算机可读存储介质和计算机程序产品,可以提高搜索结果排序的准确性。
5.本技术实施例提供一种内容处理方法,包括:
6.获取目标对象当前待搜索的目标搜索内容、以及所述目标对象对应的异质搜索图,所述异质搜索图表征关联对象和历史搜索结果之间的交互关系,所述历史搜索结果为所述关联对象针对历史搜索内容的搜索结果;
7.根据所述异质搜索图,对所述关联对象和所述历史搜索结果进行特征信息传递处理,得到所述目标对象的搜索兴趣特征信息、以及所述目标对象对应的历史搜索结果的交互特征信息;
8.获取针对所述目标搜索内容的至少一个目标搜索结果,并基于所述交互特征信息,计算所述目标对象的历史搜索结果对于各目标搜索结果的关联强度;
9.根据所述目标搜索内容、所述关联强度以及所述搜索兴趣特征信息,对所述各目标搜索结果进行排序处理,输出排序后的搜索结果。
10.相应的,本技术实施例提供一种内容处理装置,包括:
11.获取单元,用于获取目标对象当前待搜索的目标搜索内容、以及所述目标对象对应的异质搜索图,所述异质搜索图表征关联对象和历史搜索结果之间的交互关系,所述历史搜索结果为所述关联对象针对历史搜索内容的搜索结果;
12.信息传递单元,用于根据所述异质搜索图,对所述关联对象和所述历史搜索结果进行特征信息传递处理,得到所述目标对象的搜索兴趣特征信息、以及所述目标对象对应
的历史搜索结果的交互特征信息;
13.计算单元,用于获取针对所述目标搜索内容的至少一个目标搜索结果,并基于所述交互特征信息,计算所述目标对象的历史搜索结果对于各目标搜索结果的关联强度;
14.排序单元,用于根据所述目标搜索内容、所述关联强度以及所述搜索兴趣特征信息,对所述各目标搜索结果进行排序处理,输出排序后的搜索结果。
15.可选的,在本技术的一些实施例中,所述异质搜索图包括至少一个节点、以及节点间的边,所述节点包括所述关联对象对应的对象类型节点、以及所述历史搜索结果对应的结果类型节点,所述边表征所述关联对象和所述历史搜索结果之间的交互关系;
16.所述信息传递单元具体可以用于在所述异质搜索图中通过对节点之间的边进行特征信息传递处理,以对所述关联对象和所述历史搜索结果进行特征信息传递处理,得到所述目标对象的搜索兴趣特征信息、以及所述目标对象对应的历史搜索结果的交互特征信息。
17.可选的,在本技术的一些实施例中,所述内容处理装置还可以包括搜索图构建单元,所述搜索图构建单元用于构建所述目标对象的异质搜索图;所述搜索图构建单元可以包括获取子单元、构建子单元、选取子单元和删除子单元,如下:
18.所述获取子单元,用于获取参考对象针对历史搜索内容的历史搜索结果;
19.构建子单元,用于根据所述参考对象和所述参考对象对应的历史搜索结果之间的交互关系,构建所述目标对象的初始异质搜索图;
20.选取子单元,用于基于所述参考对象和所述目标对象之间的相似度,从所述参考对象中选取所述目标对象对应的关联对象;
21.删除子单元,用于根据所述关联对象对所述初始异质搜索图进行节点删除处理,得到所述目标对象对应的异质搜索图。
22.可选的,在本技术的一些实施例中,所述选取子单元具体可以用于针对每个参考对象,根据所述初始异质搜索图,确定所述参考对象对应的对象类型节点和所述目标对象对应的对象类型节点之间满足预设元路径条件的路径数量;根据所述路径数量,确定所述参考对象和所述目标对象之间的相似度;基于所述相似度,从所述参考对象中选取所述目标对象对应的关联对象。
23.可选的,在本技术的一些实施例中,所述删除子单元具体可以用于根据所述关联对象在所述初始异质搜索图中进行节点搜索,以从所述初始异质搜索图中确定待删除节点,所述待删除节点不属于所述关联对象的对象类型节点、以及所述关联对象的历史搜索结果对应的结果类型节点;对所述初始异质搜索图中的所述待删除节点进行删除处理,得到所述目标对象对应的异质搜索图。
24.可选的,在本技术的一些实施例中,所述信息传递单元可以包括第一提取子单元、搜索子单元、传递子单元和第一确定子单元,如下:
25.所述第一提取子单元,用于针对所述异质搜索图中各个节点进行特征提取,得到各个节点对应的节点特征信息,所述节点特征信息包括各对象类型节点对应的节点特征信息、以及各结果类型节点对应的节点特征信息;
26.搜索子单元,用于针对所述异质搜索图中各个节点,根据所述节点在所述异质搜索图中进行节点搜索,以确定所述节点对应的邻居节点;
27.传递子单元,用于根据所述邻居节点的节点特征信息、对所述节点的节点特征信息进行特征信息传递处理,得到所述节点的目标节点特征信息;
28.第一确定子单元,用于基于所述目标对象对应的对象类型节点的目标节点特征信息,确定所述目标对象的搜索兴趣特征信息、以及所述目标对象对应的历史搜索结果的交互特征信息。
29.可选的,在本技术的一些实施例中,所述传递子单元具体可以用于根据所述节点与其相应邻居节点之间的边对应的边类型特征信息、以及所述节点的节点特征信息,对所述邻居节点的节点特征信息进行注意力处理,得到所述邻居节点对应的注意力权重;基于所述注意力权重和所述邻居节点的节点特征信息,对所述节点的节点特征信息进行更新,得到所述节点的目标节点特征信息。
30.可选的,在本技术的一些实施例中,步骤“基于所述注意力权重和所述邻居节点的节点特征信息,对所述节点的节点特征信息进行更新,得到所述节点的目标节点特征信息”,可以包括:
31.基于所述注意力权重和所述邻居节点的节点特征信息,对所述节点的节点特征信息进行更新;
32.返回执行所述根据所述节点与其相应邻居节点之间的边对应的边类型特征信息、以及所述节点的节点特征信息,对所述邻居节点的节点特征信息进行注意力处理的步骤,直到得到满足预设信息传递条件的节点对应的目标节点特征信息。
33.可选的,在本技术的一些实施例中,所述计算单元可以包括第二确定子单元和第一计算子单元,如下:
34.所述第二确定子单元,用于基于所述目标对象的历史搜索结果对应的搜索时间和当前时间,确定所述目标对象的历史搜索结果对应的时间权重信息;
35.第一计算子单元,用于针对每个目标搜索结果,基于所述交互特征信息和所述时间权重信息,计算所述目标对象的历史搜索结果对于所述目标搜索结果的关联强度。
36.可选的,在本技术的一些实施例中,所述第一计算子单元具体可以用于针对每个目标搜索结果,基于所述目标对象的搜索兴趣特征信息和所述目标搜索结果之间的相似度,确定所述目标搜索结果的基础关联强度;基于所述交互特征信息和所述目标搜索结果之间的相关度、以及所述交互特征信息和所述目标搜索内容之间的相关度,确定所述目标对象的历史搜索结果与所述目标搜索结果的内容相关度;基于所述基础关联强度、所述内容相关度和所述时间权重信息,计算所述目标对象的历史搜索结果对于所述目标搜索结果的关联强度。
37.可选的,在本技术的一些实施例中,所述排序单元可以包括第二提取子单元、第二计算子单元和排序子单元,如下:
38.所述第二提取子单元,用于对所述目标搜索内容和所述目标对象的历史搜索结果进行注意力特征提取,得到所述目标对象对应的当前搜索意图特征;
39.第二计算子单元,用于计算各目标搜索结果与所述当前搜索意图特征之间的相似度,得到各目标搜索结果对应的意图相关度;
40.排序子单元,用于基于所述意图相关度、所述关联强度以及所述搜索兴趣特征信息,对所述各目标搜索结果进行排序处理,输出排序后的搜索结果。
41.本技术实施例提供的一种电子设备,包括处理器和存储器,所述存储器存储有多条指令,所述处理器加载所述指令,以执行本技术实施例提供的内容处理方法中的步骤。
42.本技术实施例还提供一种计算机可读存储介质,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现本技术实施例提供的内容处理方法中的步骤。
43.此外,本技术实施例还提供一种计算机程序产品,包括计算机程序或指令,该计算机程序或指令被处理器执行时实现本技术实施例提供的内容处理方法中的步骤。
44.本技术实施例提供了一种内容处理方法以及相关设备,可以获取目标对象当前待搜索的目标搜索内容、以及所述目标对象对应的异质搜索图,所述异质搜索图表征关联对象和历史搜索结果之间的交互关系,所述历史搜索结果为所述关联对象针对历史搜索内容的搜索结果;根据所述异质搜索图,对所述关联对象和所述历史搜索结果进行特征信息传递处理,得到所述目标对象的搜索兴趣特征信息、以及所述目标对象对应的历史搜索结果的交互特征信息;获取针对所述目标搜索内容的至少一个目标搜索结果,并基于所述交互特征信息,计算所述目标对象的历史搜索结果对于各目标搜索结果的关联强度;根据所述目标搜索内容、所述关联强度以及所述搜索兴趣特征信息,对所述各目标搜索结果进行排序处理,输出排序后的搜索结果。本技术可以通过对目标对象的异质搜索图进行深层挖掘,来对搜索结果进行排序,有利于提高搜索结果排序的准确性,从而方便目标对象快速查找所需结果,提高查找效率。
附图说明
45.为了更清楚地说明本技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
46.图1a是本技术实施例提供的内容处理方法的场景示意图;
47.图1b是本技术实施例提供的内容处理方法的流程图;
48.图1c是本技术实施例提供的内容处理方法的说明图;
49.图1d是本技术实施例提供的内容处理方法的模型结构图;
50.图2是本技术实施例提供的内容处理方法的另一流程图;
51.图3是本技术实施例提供的内容处理装置的结构示意图;
52.图4是本技术实施例提供的电子设备的结构示意图。
具体实施方式
53.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
54.本技术实施例提供一种内容处理方法以及相关设备,相关设备可以包括内容处理装置、电子设备、计算机可读存储介质和计算机程序产品。该内容处理装置具体可以集成在电子设备中,该电子设备可以是终端或服务器等设备。
55.可以理解的是,本实施例的内容处理方法可以是在终端上执行的,也可以是在服务器上执行,还可以由终端和服务器共同执行的。以上举例不应理解为对本技术的限制。
56.如图1a所示,以终端和服务器共同执行内容处理方法为例。本技术实施例提供的内容处理系统包括终端10和服务器11等;终端10与服务器11之间通过网络连接,比如,通过有线或无线网络连接等,其中,内容处理装置可以集成在服务器中。
57.其中,服务器11,可以用于:获取目标对象当前待搜索的目标搜索内容、以及所述目标对象对应的异质搜索图,所述异质搜索图表征关联对象和历史搜索结果之间的交互关系,所述历史搜索结果为所述关联对象针对历史搜索内容的搜索结果;根据所述异质搜索图,对所述关联对象和所述历史搜索结果进行特征信息传递处理,得到所述目标对象的搜索兴趣特征信息、以及所述目标对象对应的历史搜索结果的交互特征信息;获取针对所述目标搜索内容的至少一个目标搜索结果,并基于所述交互特征信息,计算所述目标对象的历史搜索结果对于各目标搜索结果的关联强度;根据所述目标搜索内容、所述关联强度以及所述搜索兴趣特征信息,对所述各目标搜索结果进行排序处理,向终端10输出排序后的搜索结果。其中,服务器11可以是单台服务器,也可以是由多个服务器组成的服务器集群或云服务器。本技术所公开的内容处理方法或装置,其中多个服务器可组成为一区块链,而服务器为区块链上的节点。
58.其中,终端10,可以用于:接收服务器11发送的排序后的搜索结果,并在相应的搜索结果页面上向目标对象展示该排序后的搜索结果。其中,终端10可以包括手机、智能电视、平板电脑、笔记本电脑、或个人计算机(pc,personal computer)等。终端10上还可以设置客户端,该客户端可以是应用程序客户端或浏览器客户端等等。
59.上述服务器11获取排序后的搜索结果的步骤,也可以由终端10执行。
60.本技术实施例提供的内容处理方法涉及人工智能领域中的计算机视觉技术和自然语言处理。
61.其中,人工智能(ai,artificial intelligence)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。其中,人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习、自动驾驶、智慧交通等几大方向。
62.其中,计算机视觉技术(computer vision,cv)计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取信息的人工智能系统。计算机视觉技术通常包括图像处理、图像识别、图像语义理解、图像检索、ocr、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3d技术、虚拟现实、增强现实、同步定位与地图构建、自动驾驶、智慧交通等技术,还包括常见的人脸识别、指纹识别等生物特征识别技术。
63.其中,自然语言处理(nature language processing,nlp)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。
64.以下分别进行详细说明。需说明的是,以下实施例的描述顺序不作为对实施例优选顺序的限定。
65.本实施例将从内容处理装置的角度进行描述,该内容处理装置具体可以集成在电子设备中,该电子设备可以是服务器或终端等设备。
66.可以理解的是,在本技术的具体实施方式中,涉及到用户信息,如用户的历史搜索内容等相关的数据,当本技术以上实施例运用到具体产品或技术中时,需要获得用户许可或者同意,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
67.本技术实施例的内容处理方法可以应用于各种内容搜索的场景中。本实施例可应用于云技术、人工智能、智慧交通、辅助驾驶等各种场景。
68.如图1b所示,该内容处理方法的具体流程可以如下:
69.101、获取目标对象当前待搜索的目标搜索内容、以及所述目标对象对应的异质搜索图,所述异质搜索图表征关联对象和历史搜索结果之间的交互关系,所述历史搜索结果为所述关联对象针对历史搜索内容的搜索结果。
70.其中,目标对象为当前进行内容查询的对象,具体地,目标对象可以通过目标应用进行内容查询,目标应用可以是一个内容搜索平台,目标对象可以通过目标应用提供的搜索入口和内置的搜索引擎来实现信息搜索,例如,目标应用可以是浏览器。
71.其中,目标搜索内容具体为当前待搜索的内容,也即当前目标对象所查询的检索内容;在具体搜索场景中,目标搜索内容可以是当前目标对象在目标应用的检索内容输入框中输入的内容。
72.本实施例中,关联对象可以是在内容交互上与目标对象相关的对象。需要说明的是,这里的关联对象还可以包含目标对象本身。关联对象的历史搜索结果可以是关联对象在历史时间段内针对历史搜索内容进行查询,得到的搜索结果,具体可以是关联对象点击过的搜索结果。这里的搜索结果可以包括视频、音频、文本、图像等各种模态下的信息,同样,搜索内容也可以包括视频、音频、文本、图像等各种模态下的信息,本实施例对此不作限制。
73.可选地,本实施例中,所述异质搜索图包括至少一个节点、以及节点间的边,所述节点包括所述关联对象对应的对象类型节点、以及所述历史搜索结果对应的结果类型节点,所述边表征所述关联对象和所述历史搜索结果之间的交互关系。
74.其中,边也即两个节点之间的连线,具体地,边可以用于连接对象类型节点和结果类型节点,也就是说,连线两端的节点类型是不同的。
75.在一具体实施例中,异质搜索图还可以包括关联对象的历史搜索内容对应的查询类型节点,根据边两端连接的节点类型,异质搜索图中边可以分为三种类型,分别是:连接
对象类型节点和结果类型节点的边、连接对象类型节点和查询类型节点的边、以及连接查询类型节点和结果类型节点的边。
76.可选地,本实施例可以根据各关联对象、各关联对象的历史搜索内容、以及针对历史搜索内容的历史搜索结果,生成各个关联对象对应的对象类型节点、各历史搜索内容对应的查询类型节点、以及各历史搜索结果对应的结果类型节点,再根据各对象类型节点对应的关联对象、各查询类型节点对应的历史搜索内容、以及各结果类型节点对应的历史搜索结果之间的交互关系,对各节点进行连线,从而得到异质搜索图。比如,当某个历史搜索结果为某个关联对象在历史时间段内点击的搜索结果,则该历史搜索结果与该关联对象具有交互关系,可以将该关联对象的对象类型节点和该历史搜索结果对应的结果类型节点进行连线。又比如,当某个历史搜索内容为某个关联对象在历史时间段内的查询内容,则该历史搜索内容与该关联对象具有交互关系,可以将该关联对象的对象类型节点和该历史搜索内容对应的查询类型节点进行连线。又比如,若某个历史搜索结果为某个历史搜索内容对应的搜索结果,则该历史搜索结果和该历史搜索内容具有交互关系,可以将该历史搜索结果对应的结果类型节点和该历史搜索内容对应的查询内容节点进行连线。
77.在一具体场景中,参考图1c,展示的是上述实施例的异质搜索图,它包含了各关联对象、历史搜索内容、历史搜索结果之间的交互关系,这里的关联对象可以包括目标对象本身和目标对象对应的相似对象。其中,u2表示目标对象,u1和u3表示相似对象,q2为目标对象u2的历史搜索内容,q1为相似对象u1的历史搜索内容,q3为相似对象u3的历史搜索内容,目标对象u2针对历史搜索内容q2的历史搜索结果可以包括d2和d3,相似对象u1针对历史搜索内容q1的历史搜索结果可以包括d1和d2,相似对象u3针对历史搜索内容q3的历史搜索结果可以包括d3和d4。图1c中的异质搜索图包括对象类型节点、查询类型节点和结果类型节点,对象类型节点和查询类型节点之间的边表示该对象类型节点对应的对象检索过该查询类型节点对应的历史搜索内容,对象类型节点和结果类型节点之间的边表示该对象类型节点对应的对象点击过该结果类型节点对应的历史搜索结果,查询类型节点和结果类型节点之间的边表示该结果类型节点对应的历史搜索结果与该查询类型节点对应的历史搜索内容相匹配。具体地,历史搜索结果可以是文档,用d表示。
78.可选地,本实施例中,该内容处理方法还可以包括:
79.获取参考对象针对历史搜索内容的历史搜索结果;
80.根据所述参考对象和所述参考对象对应的历史搜索结果之间的交互关系,构建所述目标对象的初始异质搜索图;
81.基于所述参考对象和所述目标对象之间的相似度,从所述参考对象中选取所述目标对象对应的关联对象;
82.根据所述关联对象对所述初始异质搜索图进行节点删除处理,得到所述目标对象对应的异质搜索图。
83.其中,具体地,参考对象可以是与目标对象点击过相同搜索结果的对象。参考对象和目标对象之间的相似度可以基于参考对象的历史搜索内容和点击过的历史搜索结果、与目标对象的历史搜索内容和点击过的历史搜索结果之间的相似度确定得到。
84.例如,目标对象可以记为user1,目标对象点击过的历史搜索结果包括item1,除了user1,还有对象user2与item1存在交互关系,也就是说,user2也点击过item1,这样user2
可以视作目标对象user1的参考对象。
85.本实施例可以通过目标对象的搜索日志建立异质搜索图,并筛选出与目标对象的搜索行为相似的参考对象加入到异质搜索图中,以对目标对象的搜索历史进行补充。具体地,考虑到与当前目标对象点击过相同文档的其他对象可能具有一定的相似性,但全部将这些对象加入到异质搜索图中可能会导致图的规模过大而难以计算,本实施例可以对这些参考对象再次进行筛选。
86.可选地,本实施例中,步骤“基于所述参考对象和所述目标对象之间的相似度,从所述参考对象中选取所述目标对象对应的关联对象”,可以包括:
87.针对每个参考对象,根据所述初始异质搜索图,确定所述参考对象对应的对象类型节点和所述目标对象对应的对象类型节点之间满足预设元路径条件的路径数量;
88.根据所述路径数量,确定所述参考对象和所述目标对象之间的相似度;
89.基于所述相似度,从所述参考对象中选取所述目标对象对应的关联对象。
90.其中,元路径为定义在异质图g中的一条路径,其形式为a1,a2,
…ak
,其中a1,a2,
…ak
∈a。元路径表示了一种a1ak之间的复合关系,一个满足某个元路径定义的节点序列称为该元路径的实例。
91.其中,异质图可以是给定有向图g={v,e,a,r},其中v为节点的集合,e为边的集合,a为节点类型的集合,r为边的类型的集合。存在一个节点关系映射函数τ(v):v

a、以及边关系映射函数其中v∈v,且e∈e。具体地,一个异质图g={v,e,a,r}为一个异质搜索图当且仅当它满足如下条件:a={u,q,d}且e={i,c,r},其中u,q,d分别代表对象类型节点、查询类型节点、结果类型节点。i,c,r分别代表边的类型:对象类型节点-查询类型节点,对象类型节点-结果类型节点,查询类型节点-结果类型节点。
92.其中,预设元路径条件可以根据实际情况进行设置,比如,预设元路径条件可以是对象-搜索结果-对象(udu)的元路径,则参考对象对应的对象类型节点和目标对象对应的对象类型节点之间满足预设元路径条件的路径数量可以是:参考对象和目标对象点击过相同搜索结果的数量。
93.可选地,本实施例中,步骤“根据所述关联对象对所述初始异质搜索图进行节点删除处理,得到所述目标对象对应的异质搜索图”,可以包括:
94.根据所述关联对象在所述初始异质搜索图中进行节点搜索,以从所述初始异质搜索图中确定待删除节点,所述待删除节点不属于所述关联对象的对象类型节点、以及所述关联对象的历史搜索结果对应的结果类型节点;
95.对所述初始异质搜索图中的所述待删除节点进行删除处理,得到所述目标对象对应的异质搜索图。
96.其中,待删除节点可以是非关联对象的对象类型节点、或者非关联对象点击过的历史搜索结果对应的结果类型节点,或者非关联对象的历史搜索内容对应的查询类型节点。
97.在一具体实施例中,构建目标对象的异质搜索图的具体步骤如下:
98.获取目标对象i的历史搜索集合hi,其中,历史搜索集合可以包括目标对象i的历史搜索内容以及点击过的历史搜索结果。然后,基于hi进行如下建图:将目标对象的对象类型节点加入图中,并将目标对象查询过的历史搜索内容以及每一次查询中点击的搜索结果
分别作为查询类型节点和结果类型节点加入到图中,并添加对象和历史搜索内容、对象和历史搜索结果、以及历史搜索内容和历史搜索结果之间的边。
99.由于具有相似搜索行为的对象对于推测目标对象的搜索兴趣具有重要作用,本实施例可以在图中添加与目标对象ui具有相似搜索行为的参考对象以及其行为作为补充。考虑到与当前目标对象点击过相同文档的其他对象可能具有一定的相似性,但全部将这些对象加入到异质搜索图中可能会导致图的规模过大而难以计算,本实施例可以对这些参考对象再次进行筛选,具体可以计算参考对象与目标对象基于pathsim的相似度,并依据相似度从参考对象中筛选关联对象。
100.具体地,本实施例可以先筛选出所有与目标对象ui点击过相同搜索结果(如文档)的参考对象ui={u1,u2,

,um},并将目标对象、所有参考对象及其历史搜索集合加入到图中,得到初始异质搜索图。然后,对于ui中的每一个参考对象uk∈ui,计算ui与uk基于元路径对象-文档-对象(udu)的pathsim相似度sk,如式子(1)所示:
[0101][0102]
其中,sk可以表示参考对象uk和目标对象ui之间的相似度,p
ik
:p
ik
∈p是所有连接节点ui和uk、且满足元路径p的元路径实例,具体地,p
ik
:p
ik
∈p表示参考对象uk和目标对象ui点击过相同文档的文档数量,也即参考对象对应的对象类型节点和目标对象对应的对象类型节点之间满足预设元路径条件的路径数量。p
ii
:p
ii
∈p表示从节点ui出发连接到其自身、且满足元路径p的元路径实例,p
kk
:p
kk
∈p表示从节点uk出发连接到其自身、且满足元路径p的元路径实例。
[0103]
在计算得到参考对象uk和目标对象ui之间的相似度后,可以根据相似度,从参考对象中筛选关联对象。具体地,可以对参考对象按照相似度大小从大到小进行排序,将前n个参考对象确定为关联对象,或者也可以将大于预设相似度的参考对象确定为关联对象,预设相似度可以根据实际情况进行设置。
[0104]
102、根据所述异质搜索图,对所述关联对象和所述历史搜索结果进行特征信息传递处理,得到所述目标对象的搜索兴趣特征信息、以及所述目标对象对应的历史搜索结果的交互特征信息。
[0105]
可选地,本实施例中,所述异质搜索图包括至少一个节点、以及节点间的边,所述节点包括所述关联对象对应的对象类型节点、以及所述历史搜索结果对应的结果类型节点,所述边表征所述关联对象和所述历史搜索结果之间的交互关系;
[0106]
步骤“根据所述异质搜索图,对所述关联对象和所述历史搜索结果进行特征信息传递处理,得到所述目标对象的搜索兴趣特征信息、以及所述目标对象对应的历史搜索结果的交互特征信息”,可以包括:
[0107]
在所述异质搜索图中通过对节点之间的边进行特征信息传递处理,以对所述关联对象和所述历史搜索结果进行特征信息传递处理,得到所述目标对象的搜索兴趣特征信息、以及所述目标对象对应的历史搜索结果的交互特征信息。
[0108]
其中,该异质搜索图具体可以是异质图神经网络,本实施例可以基于构建的异质搜索图,使用异质图神经网络来学习各节点的表示;具体可以利用异质图神经网络作为主要架构,将对象和搜索结果之间的交互关系集成到特征嵌入(embedding)的过程中。
[0109]
这里使用的异质图神经网络可以包括han(heterogeneous graph attention network,基于注意力机制的异质图神经网络)、magnn(用于异构图嵌入的元路径聚合图神经网络)、hgt(heterogeneous graph transformer,异质图转换架构)、gtn(graph transformer network,图变换网络)、以及基于图注意力网络及其在异质图上的改进版本simplehgn(simpleheterogeneous graph neural,简单的异构图神经网络)。
[0110]
可选地,本实施例中,步骤“在所述异质搜索图中通过对节点之间的边进行特征信息传递处理,以对所述关联对象和所述历史搜索结果进行特征信息传递处理,得到所述目标对象的搜索兴趣特征信息、以及所述目标对象对应的历史搜索结果的交互特征信息”,可以包括:
[0111]
针对所述异质搜索图中各个节点进行特征提取,得到各个节点对应的节点特征信息,所述节点特征信息包括各对象类型节点对应的节点特征信息、以及各结果类型节点对应的节点特征信息;
[0112]
针对所述异质搜索图中各个节点,根据所述节点在所述异质搜索图中进行节点搜索,以确定所述节点对应的邻居节点;
[0113]
根据所述邻居节点的节点特征信息、对所述节点的节点特征信息进行特征信息传递处理,得到所述节点的目标节点特征信息;
[0114]
基于所述目标对象对应的对象类型节点的目标节点特征信息,确定所述目标对象的搜索兴趣特征信息、以及所述目标对象对应的历史搜索结果的交互特征信息。
[0115]
其中,对各个节点进行特征提取,具体可以包括对对象类型节点进行特征提取,以及对结果类型节点进行特征提取;其中,对对象类型节点进行特征提取,具体可以是对对象类型节点对应的关联对象进行特征提取;对结果类型节点进行特征提取,具体可以是对结果类型节点对应的历史搜索结果进行特征提取。
[0116]
其中,在一些实施例中,异质搜索图还可以包括关联对象的历史搜索内容对应的查询类型节点,则在异质搜索图中通过对节点之间的边进行特征信息传递处理,可以对关联对象、历史搜索结果、历史搜索内容进行特征信息传递处理。
[0117]
具体地,一些实施例中,可以通过语义模型生成异质搜索图中各节点初始的节点特征信息。对于查询类型节点,若历史搜索内容为文本,可以对查询类型节点对应的历史搜索内容中所有词的平均词向量作为该查询类型节点初始的节点特征信息;对于结果类型节点,若历史搜索结果为文本,可以取结果类型节点对应的历史搜索结果文本中所有词的平均词向量作为该结果类型节点初始的节点特征信息;对于对象类型节点,取其对应对象所有查询过的历史搜索内容和点击过历史搜索结果的向量平均作为该对象类型节点初始的节点特征信息。其中,该语义模型可以是word2vec(word to vector,单词转换成向量)词向量模型。
[0118]
其中,步骤“针对所述异质搜索图中各个节点进行特征提取,得到各个节点对应的节点特征信息”,可以包括:
[0119]
针对异质搜索图中的每个节点,对所述查询类型节点对应的历史搜索内容进行特征提取,得到所述查询类型节点对应的节点特征信息;
[0120]
对所述结果类型节点对应的历史搜索结果进行特征提取,得到所述结果类型节点对应的节点特征信息;
[0121]
对所述对象类型节点对应的关联对象的历史搜索内容和历史搜索结果进行特征提取,得到所述对象类型节点对应的节点特征信息。
[0122]
一些实施例中,对象类型节点对应的节点特征信息可以是通过对该对象类型节点对应对象的对象属性信息进行特征提取得到的,其中,对象属性信息可以包括至少一个维度上的属性子信息,比如可以包括对象自身属性、短期特征以及长期特征等属性子信息,本实施例对此不作限制。其中,短期特征具体可以是距离当前时间较近的历史搜索内容和历史搜索结果对应的特征,如短期特征可以是对最近一周内的历史搜索内容和历史搜索结果进行特征提取得到的;长期特征可以包括距离当前时间较远的历史搜索内容和历史搜索结果对应的特征,如长期特征可以是对半年内的历史搜索内容和历史搜索结果进行特征提取得到。
[0123]
本实施例中,针对异质搜索图中的每个节点,在异质搜索图中搜索该节点对应的邻居节点,具体可以是将异质搜索图中,将直接与该节点连接的节点确定为邻居节点。
[0124]
可选地,本实施例中,步骤“根据所述邻居节点的节点特征信息、对所述节点的节点特征信息进行特征信息传递处理,得到所述节点的目标节点特征信息”,可以包括:
[0125]
根据所述节点与其相应邻居节点之间的边对应的边类型特征信息、以及所述节点的节点特征信息,对所述邻居节点的节点特征信息进行注意力处理,得到所述邻居节点对应的注意力权重;
[0126]
基于所述注意力权重和所述邻居节点的节点特征信息,对所述节点的节点特征信息进行更新,得到所述节点的目标节点特征信息。
[0127]
其中,本实施例在计算注意力权重时,增加了表示边类型特征信息,这样可以考虑到边的类型,因而能够更好地建模异质图。具体地,边类型可以包括:连接对象类型节点和结果类型节点的边、连接对象类型节点和查询类型节点的边、以及连接查询类型节点和结果类型节点的边。不同类型的边对应的边类型特征信息可以不同,边类型特征信息具体可以是通过训练得到的参数向量。
[0128]
其中,步骤“根据所述节点与其相应邻居节点之间的边对应的边类型特征信息、以及所述节点的节点特征信息,对所述邻居节点的节点特征信息进行注意力处理,得到所述邻居节点对应的注意力权重”,可以包括:
[0129]
将所述节点与其相应邻居节点之间的边对应的边类型特征信息、以及所述节点的节点特征信息,对所述邻居节点的节点特征信息进行拼接处理,得到所述邻居节点对应的处理后特征信息;
[0130]
根据所述邻居节点对应的处理后特征信息,对所述邻居节点的节点特征信息进行注意力处理,得到所述邻居节点对应的注意力权重。
[0131]
具体地,对邻居节点的节点特征信息进行注意力处理的过程可以用下述式子(2)、式子(3)和式子(4)表示:
[0132][0133]
zi=whiꢀꢀ
(3)
[0134]
[0135]
其中,a
ij
为节点i和节点j之间的边对应的注意力权重,也可以看作针对节点i,节点j作为其邻居节点的注意力权重,neighbor(i)表示节点i的邻居节点,leakyrelu为激活函数,a
t
是可训练参数向量。e
τ(i,k)
表示节点i和节点k之间的边对应的边类型特征信息,wr是对e
τ(i,k)
进行线性变换的参数矩阵,hi是节点i的上一层向量表示,具体也即节点i的当前节点特征信息。
[0136]
计算完边对应的注意力权重后,可以根据注意力权重和邻居节点的节点特征信息,来对节点的节点特征信息进行更新,其更新如式子(5)所示:
[0137][0138]
其中,w为对节点特征的线性变换矩阵,j∈neighbor(i)表示节点i的邻居节点j,hj表示邻居节点j当前的节点特征信息,表示节点i更新后的节点特征信息,σ是非线性激活函数。由于残差连接可以避免层数过深导致训练变得困难,因此本实施例还可以在节点特征信息和边的注意力权重上增加残差连接,分别如式子(6)和式子(7)所示:
[0139][0140][0141]
其中,为节点i和节点j之间的边对应的注意力权重,为节点i和节点j之间的边对应的更新后注意力权重,θ为可训练参数。
[0142]
一些实施例中,由于多头注意力机制可以增加训练的稳定性,因此可以在节点特征信息的计算中使用多头注意力机制后,其具体计算如式子(8)所示:
[0143][0144]
其中,||表示拼接处理,k=8为多头注意力的头数,式子(8)可以表示将每个头输出的向量拼接起来,来得到更新后的节点特征信息,需要说明的是,为了保证维度的一致,最后一层需要对每个头输出的向量取平均。另外为了简便,上面的公式省略了部分表示层数的上标。
[0145]
其中,l和l+1表示异质神经网络的层数,也可以视为异质搜索图中节点的节点特征信息的更新次数。具体地,可以将异质神经网络的层数设为2,这样只需对节点特征信息进行两轮更新,即可得到满足预设信息传递条件的目标节点特征信息,最终获取网络输出的所有节点的目标节点特征信息组成的矩阵。
[0146]
可选地,本实施例中,步骤“基于所述注意力权重和所述邻居节点的节点特征信息,对所述节点的节点特征信息进行更新,得到所述节点的目标节点特征信息”,可以包括:
[0147]
基于所述注意力权重和所述邻居节点的节点特征信息,对所述节点的节点特征信息进行更新;
[0148]
返回执行所述根据所述节点与其相应邻居节点之间的边对应的边类型特征信息、以及所述节点的节点特征信息,对所述邻居节点的节点特征信息进行注意力处理的步骤,直到得到满足预设信息传递条件的节点对应的目标节点特征信息。
[0149]
其中,步骤“基于所述注意力权重和所述邻居节点的节点特征信息,对所述节点的
节点特征信息进行更新”,可以包括:将各邻居节点对应的注意力权重和各邻居节点的节点特征信息进行融合,得到融合后特征信息,基于融合后特征信息对节点的节点特征信息进行更新,具体可以将融合后特征信息确定为节点对应的更新后节点特征信息。其中,融合方式有多种,本实施例对此不作限制。比如该融合方式可以是加权融合等。
[0150]
其中,本实施例可以根据更新后的节点特征信息进行新一轮的注意力处理,直到得到满足预设信息传递条件的节点对应的节点特征信息,并基于满足预设信息传递条件的节点对应的节点特征信息,确定节点对应的目标节点特征信息。
[0151]
其中,预设信息传递条件可以根据实际情况进行设置,本实施例对此不作限制。比如,该预设信息传递条件可以是注意力处理的次数不超过预设次数,例如,预设次数为2,则只进行2轮注意力处理。
[0152]
可选地,本实施例中,步骤“基于所述目标对象对应的对象类型节点的目标节点特征信息,确定所述目标对象的搜索兴趣特征信息、以及所述目标对象对应的历史搜索结果的交互特征信息”,可以包括:
[0153]
基于所述目标对象对应的对象类型节点的目标节点特征信息,确定所述目标对象的搜索兴趣特征信息;
[0154]
针对目标对象的每个历史搜索结果,基于所述历史搜索结果对应的结果类型节点的目标节点特征信息、所述目标对象对应的对象类型节点的目标节点特征信息、以及所述对象类型节点和所述结果类型节点之间的边对应的边类型特征信息,确定所述历史搜索结果对应的交互特征信息。
[0155]
其中,本实施例可以取目标对象对应节点的最终向量作为用户的搜索兴趣特征信息,具体也即将目标对象对应的对象类型节点的目标节点特征信息确定为目标对象的搜索兴趣特征信息,其可以记为长期对象兴趣表示
[0156]
在一些实施例中,异质搜索图包括查询类型节点,则对于目标对象的每个历史搜索内容,可以基于所述历史搜索内容对应的查询类型节点的目标节点特征信息、所述目标对象对应的对象类型节点的目标节点特征信息、以及所述对象类型节点和所述查询类型节点之间的边对应的边类型特征信息,确定所述历史搜索内容对应的交互特征信息。
[0157]
在一具体实施例中,可以使用特征信息来表示目标对象的搜索行为,对于目标对象在历史时间段检索某一内容(即历史搜索内容)这一操作对应的交互特征信息,也即历史搜索内容对应的交互特征信息,可以通过将目标对象对应的目标节点特征信息、该历史搜索内容对应的节点的目标节点特征信息、以及对象-检索内容这一边类型特征信息相加并取平均得到。对于目标对象在历史时间段点击某一搜索结果(即历史搜索结果)这一操作对应的交互特征信息,也即历史搜索结果对应的交互特征信息,可以通过将目标对象对应的目标节点特征信息、该历史搜索结果对应的节点的目标节点特征信息、以及对象-搜索结果这一边类型特征信息相加并取平均得到。这样可以得到目标对象对应的历史搜索集合的交互特征信息,其中,历史搜索集合可以包括目标对象i的历史搜索内容以及点击过的历史搜索结果。
[0158]
103、获取针对所述目标搜索内容的至少一个目标搜索结果,并基于所述交互特征信息,计算所述目标对象的历史搜索结果对于各目标搜索结果的关联强度。
[0159]
其中,目标搜索结果可以是针对当前检索的目标搜索内容所召回的搜索结果。在具体场景中,每个目标搜索结果可以是针对目标搜索内容召回的搜索结果列表中的一个候选文档。
[0160]
可选地,本实施例中,步骤“基于所述交互特征信息,计算所述目标对象的历史搜索结果对于各目标搜索结果的关联强度”,可以包括:
[0161]
基于所述目标对象的历史搜索结果对应的搜索时间和当前时间,确定所述目标对象的历史搜索结果对应的时间权重信息;
[0162]
针对每个目标搜索结果,基于所述交互特征信息和所述时间权重信息,计算所述目标对象的历史搜索结果对于所述目标搜索结果的关联强度。
[0163]
其中,这里历史搜索结果对应的时间权重信息可以作为对当前搜索场景的影响因子。历史搜索结果对于目标搜索结果的关联强度,也可以看作历史搜索结果对于目标搜索结果的激励强度。
[0164]
其中,具体可以基于历史搜索结果对应的搜索时间和当前时间之间的时间差,来确定历史搜索结果对应的时间权重信息;时间差越大,时间权重信息越小,反之,时间差越小,时间权重信息越大。
[0165]
在一具体实施例中,可以获取目标对象ui对应的历史搜索集合历史搜索集合包括至少一个历史交互内容,这里的历史交互内容可以指目标对象检索过的历史搜索内容、或者点击过的历史搜索结果;本实施例可以基于每个历史交互内容的交互特征信息对应的交互时间(具体即检索时间或搜索时间)和当前时间,确定每个历史交互内容对应的时间权重信息;再针对每个目标搜索结果,基于各个历史交互内容对应的交互特征信息和时间权重信息,计算目标搜索结果的关联强度。
[0166]
具体地,本实施例可以使用霍克斯过程(hawkesprocess)来建模目标对象的历史行为对当前搜索意图的影响。
[0167]
霍克斯过程是时序点过程中的一种自激励点过程,其条件强度函数定义如式子(9)所示:
[0168][0169]
其中,λ(e)表示历史事件对当前事件的条件强度,μ为基础强度,eh为当前时间t以前发生的历史事件,th为历史事件发生时的历史时间点,κ为一个随时间衰减的核函数。在具体的搜索场景中,历史事件可以理解为用户在历史时间段内检索过的历史搜索内容以及点击过的历史搜索结果。
[0170]
可选地,本实施例中,步骤“针对每个目标搜索结果,基于所述交互特征信息和所述时间权重信息,计算所述目标对象的历史搜索结果对于所述目标搜索结果的关联强度”,可以包括:
[0171]
针对每个目标搜索结果,基于所述目标对象的搜索兴趣特征信息和所述目标搜索结果之间的相似度,确定所述目标搜索结果的基础关联强度;
[0172]
基于所述交互特征信息和所述目标搜索结果之间的相关度、以及所述交互特征信息和所述目标搜索内容之间的相关度,确定所述目标对象的历史搜索结果与所述目标搜索结果的内容相关度;
[0173]
基于所述基础关联强度、所述内容相关度和所述时间权重信息,计算所述目标对象的历史搜索结果对于所述目标搜索结果的关联强度。
[0174]
其中,目标对象的搜索兴趣特征信息和目标搜索结果之间相似度的计算,可以采用余弦相似度等,本实施例对此不作限制。
[0175]
其中,交互特征信息和目标搜索结果之间的相关度、以及交互特征信息和目标搜索内容之间的相关度也可采用余弦相似度来进行确定。具体地,在计算得到交互特征信息和目标搜索结果之间的相关度、以及交互特征信息和目标搜索内容之间的相关度后,可以对这两个相关度进行融合处理,得到目标对象的历史搜索结果与目标搜索结果的内容相关度,该融合处理方法具体可以是相乘,也可以是加权运算等。
[0176]
其中,可以将基础关联强度、内容相关度和时间权重信息进行融合,来得到目标搜索结果的关联强度。具体地,可以将各个历史搜索结果与目标搜索结果的内容相关度、与各个历史搜索结果对应的时间权重信息进行加权融合,得到融合后关联强度,再将融合后关联强度和基础关联强度相加,得到目标搜索结果的关联强度。
[0177]
在一具体实施例中,目标对象对目标搜索内容进行查询,召回针对目标搜索内容的搜索结果列表,对于搜索结果列表中的每一个候选文档d(也即目标搜索结果),该目标对象的所有历史行为对于其激励强度的计算过程可以如式子(10)所示:
[0178][0179]
其中,λ
d|u
(t)表示目标对象u的历史搜索行为对当前搜索返回的搜索结果列表中候选文档d的激励强度(也即上述实施例中的关联强度)。μ
u,d
表示目标对象u的历史搜索行为对于候选文档d的基础激励强度,为目标对象对应的历史搜索集合,h表示目标对象的历史交互内容,α
h,d
表示目标对象的历史交互内容与候选文档d的内容相关度,t表示当前时间,th表示历史交互内容的交互时间。
[0180]
其中,本实施例中的基础激励强度具体可以定义为长期对象兴趣表示与候选文档d的余弦相似度,其计算过程参考式子(11):
[0181][0182]
其中,μ
u,d
表示目标对象u的历史搜索行为对于候选文档d的基础激励强度,也即上述实施例中的基础关联强度。
[0183]
其中,本实施例中α
h,d
可以为历史交互内容h与候选文档d的相关度以及历史交互内容h和当前查询的目标搜索内容的相关度q的乘积,如式子(12)所示:
[0184]
α
h,d
=cos(h,d)
·
cos(h,q)
ꢀꢀ
(12)
[0185]
本实施例中,核函数κ可以使用指数核函数,参考式子(13):
[0186]
k(t)=e-γt
ꢀꢀ
(13)
[0187]
其中,γ为可学习的参数。计算出所有候选文档集合d中所有候选文档的激励强度λ
k|u
(t)后,由于激励强度有可能为负值,本实施例可以使用softmax(归一化指数函数)将其转化为概率分布,如式子(14)所示:
[0188]
[0189]
104、根据所述目标搜索内容、所述关联强度以及所述搜索兴趣特征信息,对所述各目标搜索结果进行排序处理,输出排序后的搜索结果。
[0190]
一些实施例中,可以对目标搜索内容、关联强度以及搜索兴趣特征信息进行融合,可以得到各目标搜索结果对应的推荐相关度,其中,该融合方式可以是加权运算,也可以是拼接处理等,本实施例对此不作限制;基于所述推荐相关度对所述各目标搜索结果进行排序处理,输出排序后的搜索结果。
[0191]
可选地,本实施例中,步骤“根据所述目标搜索内容、所述关联强度以及所述搜索兴趣特征信息,对所述各目标搜索结果进行排序处理,输出排序后的搜索结果”,可以包括:
[0192]
对所述目标搜索内容和所述目标对象的历史搜索结果进行注意力特征提取,得到所述目标对象对应的当前搜索意图特征;
[0193]
计算各目标搜索结果与所述当前搜索意图特征之间的相似度,得到各目标搜索结果对应的意图相关度;
[0194]
基于所述意图相关度、所述关联强度以及所述搜索兴趣特征信息,对所述各目标搜索结果进行排序处理,输出排序后的搜索结果。
[0195]
其中,可以根据所述意图相关度、所述关联强度以及所述搜索兴趣特征信息,计算各目标搜索结果的推荐相关度,基于所述推荐相关度对所述各目标搜索结果进行排序处理,输出排序后的搜索结果。具体地,可以对各目标搜索结果按照推荐相关度的大小从大到小进行排序,得到排序后的搜索结果,可选地,还可以将排序后的搜索结果中前n个目标搜索结果返回给目标对象。
[0196]
可选地,本实施例中,还可以从所述目标对象的历史交互内容中选取交互时间满足预设时间条件的目标历史交互内容;然后对所述目标搜索内容、和所述目标历史交互内容进行注意力特征提取,得到所述目标对象对应的当前搜索意图特征。其中,预设时间条件可以根据实际情况进行设置,具体地,预设时间条件可以是交互时间与当前时间的时间差不大于预设值。
[0197]
具体地,一些实施例中,可以结合近期搜索和当前检索的目标搜索内容得到一个当前查询意图表示,即上述实施例中的当前搜索意图特征。首先可以从目标对象i的历史搜索集合hi(具体可以只包括目标对象点击过的历史搜索结果)中截取最近的m条历史搜索结果组成近期历史搜索结果序列再将当前检索的目标搜索内容q和近期的历史搜索结果输入到transformer(变换器)中计算出当前查询结合近期搜索结果的搜索意图表示如式子(15)所示:
[0198][0199]
其中,表示目标对象对应的当前搜索意图特征。
[0200]
然后,计算出每个候选文档d和当前搜索意图表示之间的相似度p(d,q),如式子(16)所示:
[0201][0202]
其中,p(d,q)表示目标搜索结果(具体即候选文档d)对应的意图相关度。
[0203]
一些实施例中,还可以基于传统统计方法计算出的目标对象的搜索历史的特征,包括目标对象查询的多样性、兴趣的多样性等,记为pr;每个目标搜索结果(也即候选文档)最终的推荐相关度可以通过在拼接层拼接这些特征,并将它们输入到多层感知机(评分层)中计算得到,其计算过程如式子(17)所示:
[0204][0205]
其中,p表示候选文档d的推荐相关度。tanh是一种激活函数,mlp表示多层感知机(multilayer perceptron),表示候选文档d的关联强度,为目标对象的搜索兴趣特征信息。
[0206]
在计算得到各目标搜索结果的推荐相关度后,可以依据该推荐相关度对各目标搜索结果进行排序,得到最终重排序过的文档列表并返回给目标对象。
[0207]
可选的,本实施例中,步骤“根据所述异质搜索图,对所述关联对象和所述历史搜索结果进行特征信息传递处理,得到所述目标对象的搜索兴趣特征信息、以及所述目标对象对应的历史搜索结果的交互特征信息”,可以包括:
[0208]
通过内容处理模型,根据所述异质搜索图,对所述关联对象和所述历史搜索结果进行特征信息传递处理,得到所述目标对象的搜索兴趣特征信息、以及所述目标对象对应的历史搜索结果的交互特征信息。
[0209]
其中,该内容处理模型可以是神经网络模型。本实施例还可以通过lambdarank(一种排序算法)对整个模型进行训练,训练数据由包括正例(样本对象点击过的历史搜索结果)和负例(样本对象未点击的历史搜索结果)的文档对组成,δ是交换两文档的顺序时平均精度(map,mean average precision)的变化。代表文档i排名比文档j高是否为真,p
ij
表示预测文档i比文档j排名高的概率,表示文档j排名比文档i高是否为真,p
ji
表示预测文档j比文档i排名高的概率,损失函数定义如式子(18)所示:
[0210][0211]
定义了损失函数后,本实施例可以使用adam(adaptive moment estimation,自适应矩估计)sgd(stochastic gradient descent,随机梯度下降)优化器根据损失函数对模型的参数进行优化,经过迭代后模型最终收敛,在验证集上进行参数调整后,表现最优的模型被用来进行实际搜索场景中的排序。
[0212]
如图1d所示,基于本技术提供的内容处理方法,可以按照下述步骤进行搜索结果的排序,具体描述如下:
[0213]
1.根据关联对象针对历史搜索内容的历史搜索结果,建立异质搜索图;
[0214]
2.使用异质图神经网络学习目标对象的搜索兴趣特征信息p
l
,并得到各节点对应的目标节点特征信息,从而获取目标对象对应的历史搜索结果的交互特征信息;其中,一些实施例中,搜索兴趣特征信息p
l
具体可以根据异质搜索图中的边类型特征信息eu和目标搜索结果d的余弦相似度(cos)确定得到;
[0215]
3.通过霍克斯处理层(hawkesprocess layer)使用时序点过程建模目标对象对应的各历史搜索结果(h1、h2、

、hn)对当前搜索行为的激励强度λ
d|u
;其中,历史搜索结果h1、
h2、

、hn对应的搜索时间分别为t1、t2、

、tn;
[0216]
4.利用余弦相似度基于当前查询的目标搜索内容q计算候选文档d的意图相关度pq,并通过多层感知器获取目标对象的搜索历史的其他特征,如目标对象查询的多样性、兴趣的多样性等,记为pr;从而根据p
l
、pr、λ
d|u
和pq对各候选文档进行重排序,返回重排序后的文档列表。
[0217]
本实施例提供了一种基于异质图神经网络和时序点过程的搜索技术,可以利用搜索场景中对象和查询内容、对象和搜索结果以及查询内容和搜索结果之间的关系,构建异质搜索图;在建立的异质搜索图基础之上,使用异质图神经网络学习节点对应的节点特征信息。并将其中查询类型节点和结果类型节点对应的特征信息表示为搜索序列的交互特征信息,再利用霍克斯过程建模搜索序列中的时序信息;最后将异质图神经网络学习所得目标对象对应的目标节点特征信息作为目标对象的长期对象兴趣表示,霍克斯过程所得条件强度作为短期兴趣,从而计算得到目标对象对于每个候选文档的偏好,以此对候选文档进行个性化重排序。
[0218]
具体地,本技术提供的内容处理方法可以对搜索场景中对象和查询内容、对象和搜索结果以及对象和对象之间的关系进行深度挖掘,使用异质图建模搜索场景中各实体的关系,能够挖掘到用户检索信息、阅读文档等数据;且本技术能够通过搜索行为相似的对象实现协同过滤,缓解了部分对象搜索记录不足的问题。另外,使用时序点过程结合异质图神经网络建模对象历史搜索操作对当前搜索操作的影响,能够动态捕捉对象的搜索兴趣,从而提高搜索结果排序的准确性。
[0219]
由上可知,本实施例可以获取目标对象当前待搜索的目标搜索内容、以及所述目标对象对应的异质搜索图,所述异质搜索图表征关联对象和历史搜索结果之间的交互关系,所述历史搜索结果为所述关联对象针对历史搜索内容的搜索结果;根据所述异质搜索图,对所述关联对象和所述历史搜索结果进行特征信息传递处理,得到所述目标对象的搜索兴趣特征信息、以及所述目标对象对应的历史搜索结果的交互特征信息;获取针对所述目标搜索内容的至少一个目标搜索结果,并基于所述交互特征信息,计算所述目标对象的历史搜索结果对于各目标搜索结果的关联强度;根据所述目标搜索内容、所述关联强度以及所述搜索兴趣特征信息,对所述各目标搜索结果进行排序处理,输出排序后的搜索结果。本技术可以通过对目标对象的异质搜索图进行深层挖掘,来对搜索结果进行排序,有利于提高搜索结果排序的准确性,从而方便目标对象快速查找所需结果,提高查找效率。
[0220]
根据前面实施例所描述的方法,以下将以该内容处理装置具体集成在服务器举例作进一步详细说明。
[0221]
本技术实施例提供一种内容处理方法,如图2所示,该内容处理方法的具体流程可以如下:
[0222]
201、服务器获取目标对象当前待搜索的目标搜索内容、以及所述目标对象对应的异质搜索图,所述异质搜索图表征关联对象和历史搜索结果之间的交互关系,所述历史搜索结果为所述关联对象针对历史搜索内容的搜索结果。
[0223]
其中,目标搜索内容具体为当前待搜索的内容,也即当前目标对象所查询的检索内容;在具体搜索场景中,目标搜索内容可以是当前目标对象在目标应用的检索内容输入框中输入的内容。
[0224]
本实施例中,关联对象可以是在内容交互上与目标对象相关的对象。需要说明的是,这里的关联对象还可以包含目标对象本身。关联对象的历史搜索结果可以是关联对象在历史时间段内针对历史搜索内容进行查询,得到的搜索结果,具体可以是关联对象点击过的搜索结果。这里的搜索结果可以包括视频、音频、文本、图像等各种模态下的信息,同样,搜索内容也可以包括视频、音频、文本、图像等各种模态下的信息,本实施例对此不作限制。
[0225]
可选地,本实施例中,所述异质搜索图包括至少一个节点、以及节点间的边,所述节点包括所述关联对象对应的对象类型节点、以及所述历史搜索结果对应的结果类型节点,所述边表征所述关联对象和所述历史搜索结果之间的交互关系。
[0226]
其中,边也即两个节点之间的连线,具体地,边可以用于连接对象类型节点和结果类型节点,也就是说,连线两端的节点类型是不同的。
[0227]
在一具体实施例中,异质搜索图还可以包括关联对象的历史搜索内容对应的查询类型节点,根据边两端连接的节点类型,异质搜索图中边可以分为三种类型,分别是:连接对象类型节点和结果类型节点的边、连接对象类型节点和查询类型节点的边、以及连接查询类型节点和结果类型节点的边。
[0228]
可选地,本实施例可以根据各关联对象、各关联对象的历史搜索内容、以及针对历史搜索内容的历史搜索结果,生成各个关联对象对应的对象类型节点、各历史搜索内容对应的查询类型节点、以及各历史搜索结果对应的结果类型节点,再根据各对象类型节点对应的关联对象、各查询类型节点对应的历史搜索内容、以及各结果类型节点对应的历史搜索结果之间的交互关系,对各节点进行连线,从而得到异质搜索图。
[0229]
可选地,本实施例中,该内容处理方法还可以包括:
[0230]
获取参考对象针对历史搜索内容的历史搜索结果;
[0231]
根据所述参考对象和所述参考对象对应的历史搜索结果之间的交互关系,构建所述目标对象的初始异质搜索图;
[0232]
基于所述参考对象和所述目标对象之间的相似度,从所述参考对象中选取所述目标对象对应的关联对象;
[0233]
根据所述关联对象对所述初始异质搜索图进行节点删除处理,得到所述目标对象对应的异质搜索图。
[0234]
其中,具体地,参考对象可以是与目标对象点击过相同搜索结果的对象。参考对象和目标对象之间的相似度可以基于参考对象的历史搜索内容和点击过的历史搜索结果、与目标对象的历史搜索内容和点击过的历史搜索结果之间的相似度确定得到。
[0235]
可选地,本实施例中,步骤“基于所述参考对象和所述目标对象之间的相似度,从所述参考对象中选取所述目标对象对应的关联对象”,可以包括:
[0236]
针对每个参考对象,根据所述初始异质搜索图,确定所述参考对象对应的对象类型节点和所述目标对象对应的对象类型节点之间满足预设元路径条件的路径数量;
[0237]
根据所述路径数量,确定所述参考对象和所述目标对象之间的相似度;
[0238]
基于所述相似度,从所述参考对象中选取所述目标对象对应的关联对象。
[0239]
其中,预设元路径条件可以根据实际情况进行设置,比如,预设元路径条件可以是对象-搜索结果-对象(udu)的元路径,则参考对象对应的对象类型节点和目标对象对应的
对象类型节点之间满足预设元路径条件的路径数量可以是:参考对象和目标对象点击过相同搜索结果的数量。
[0240]
可选地,本实施例中,步骤“根据所述关联对象对所述初始异质搜索图进行节点删除处理,得到所述目标对象对应的异质搜索图”,可以包括:
[0241]
根据所述关联对象在所述初始异质搜索图中进行节点搜索,以从所述初始异质搜索图中确定待删除节点,所述待删除节点不属于所述关联对象的对象类型节点、以及所述关联对象的历史搜索结果对应的结果类型节点;
[0242]
对所述初始异质搜索图中的所述待删除节点进行删除处理,得到所述目标对象对应的异质搜索图。
[0243]
其中,待删除节点可以是非关联对象的对象类型节点、或者非关联对象点击过的历史搜索结果对应的结果类型节点,或者非关联对象的历史搜索内容对应的查询类型节点。
[0244]
202、服务器根据所述异质搜索图,对所述关联对象和所述历史搜索结果进行特征信息传递处理,得到所述目标对象的搜索兴趣特征信息、以及所述目标对象对应的历史搜索结果的交互特征信息。
[0245]
可选地,本实施例中,所述异质搜索图包括至少一个节点、以及节点间的边,所述节点包括所述关联对象对应的对象类型节点、以及所述历史搜索结果对应的结果类型节点,所述边表征所述关联对象和所述历史搜索结果之间的交互关系;
[0246]
步骤“根据所述异质搜索图,对所述关联对象和所述历史搜索结果进行特征信息传递处理,得到所述目标对象的搜索兴趣特征信息、以及所述目标对象对应的历史搜索结果的交互特征信息”,可以包括:
[0247]
在所述异质搜索图中通过对节点之间的边进行特征信息传递处理,以对所述关联对象和所述历史搜索结果进行特征信息传递处理,得到所述目标对象的搜索兴趣特征信息、以及所述目标对象对应的历史搜索结果的交互特征信息。
[0248]
可选地,本实施例中,步骤“在所述异质搜索图中通过对节点之间的边进行特征信息传递处理,以对所述关联对象和所述历史搜索结果进行特征信息传递处理,得到所述目标对象的搜索兴趣特征信息、以及所述目标对象对应的历史搜索结果的交互特征信息”,可以包括:
[0249]
针对所述异质搜索图中各个节点进行特征提取,得到各个节点对应的节点特征信息,所述节点特征信息包括各对象类型节点对应的节点特征信息、以及各结果类型节点对应的节点特征信息;
[0250]
针对所述异质搜索图中各个节点,根据所述节点在所述异质搜索图中进行节点搜索,以确定所述节点对应的邻居节点;
[0251]
根据所述邻居节点的节点特征信息、对所述节点的节点特征信息进行特征信息传递处理,得到所述节点的目标节点特征信息;
[0252]
基于所述目标对象对应的对象类型节点的目标节点特征信息,确定所述目标对象的搜索兴趣特征信息、以及所述目标对象对应的历史搜索结果的交互特征信息。
[0253]
其中,在一些实施例中,异质搜索图还可以包括关联对象的历史搜索内容对应的查询类型节点,则在异质搜索图中通过对节点之间的边进行特征信息传递处理,可以对关
联对象、历史搜索结果、历史搜索内容进行特征信息传递处理。
[0254]
本实施例中,针对异质搜索图中的每个节点,在异质搜索图中搜索该节点对应的邻居节点,具体可以是将异质搜索图中,将直接与该节点连接的节点确定为邻居节点。
[0255]
可选地,本实施例中,步骤“根据所述邻居节点的节点特征信息、对所述节点的节点特征信息进行特征信息传递处理,得到所述节点的目标节点特征信息”,可以包括:
[0256]
根据所述节点与其相应邻居节点之间的边对应的边类型特征信息、以及所述节点的节点特征信息,对所述邻居节点的节点特征信息进行注意力处理,得到所述邻居节点对应的注意力权重;
[0257]
基于所述注意力权重和所述邻居节点的节点特征信息,对所述节点的节点特征信息进行更新,得到所述节点的目标节点特征信息。
[0258]
其中,本实施例在计算注意力权重时,增加了表示边类型特征信息,这样可以考虑到边的类型,因而能够更好地建模异质图。具体地,边类型可以包括:连接对象类型节点和结果类型节点的边、连接对象类型节点和查询类型节点的边、以及连接查询类型节点和结果类型节点的边。不同类型的边对应的边类型特征信息可以不同,边类型特征信息具体可以是通过训练得到的参数向量。
[0259]
其中,步骤“根据所述节点与其相应邻居节点之间的边对应的边类型特征信息、以及所述节点的节点特征信息,对所述邻居节点的节点特征信息进行注意力处理,得到所述邻居节点对应的注意力权重”,可以包括:
[0260]
将所述节点与其相应邻居节点之间的边对应的边类型特征信息、以及所述节点的节点特征信息,对所述邻居节点的节点特征信息进行拼接处理,得到所述邻居节点对应的处理后特征信息;
[0261]
根据所述邻居节点对应的处理后特征信息,对所述邻居节点的节点特征信息进行注意力处理,得到所述邻居节点对应的注意力权重。
[0262]
可选地,本实施例中,步骤“基于所述注意力权重和所述邻居节点的节点特征信息,对所述节点的节点特征信息进行更新,得到所述节点的目标节点特征信息”,可以包括:
[0263]
基于所述注意力权重和所述邻居节点的节点特征信息,对所述节点的节点特征信息进行更新;
[0264]
返回执行所述根据所述节点与其相应邻居节点之间的边对应的边类型特征信息、以及所述节点的节点特征信息,对所述邻居节点的节点特征信息进行注意力处理的步骤,直到得到满足预设信息传递条件的节点对应的目标节点特征信息。
[0265]
其中,步骤“基于所述注意力权重和所述邻居节点的节点特征信息,对所述节点的节点特征信息进行更新”,可以包括:将各邻居节点对应的注意力权重和各邻居节点的节点特征信息进行融合,得到融合后特征信息,基于融合后特征信息对节点的节点特征信息进行更新,具体可以将融合后特征信息确定为节点对应的更新后节点特征信息。其中,融合方式有多种,本实施例对此不作限制。比如该融合方式可以是加权融合等。
[0266]
其中,本实施例可以根据更新后的节点特征信息进行新一轮的注意力处理,直到得到满足预设信息传递条件的节点对应的节点特征信息,并基于满足预设信息传递条件的节点对应的节点特征信息,确定节点对应的目标节点特征信息。
[0267]
其中,预设信息传递条件可以根据实际情况进行设置,本实施例对此不作限制。比
如,该预设信息传递条件可以是注意力处理的次数不超过预设次数,例如,预设次数为2,则只进行2轮注意力处理。
[0268]
可选地,本实施例中,步骤“基于所述目标对象对应的对象类型节点的目标节点特征信息,确定所述目标对象的搜索兴趣特征信息、以及所述目标对象对应的历史搜索结果的交互特征信息”,可以包括:
[0269]
基于所述目标对象对应的对象类型节点的目标节点特征信息,确定所述目标对象的搜索兴趣特征信息;
[0270]
针对目标对象的每个历史搜索结果,基于所述历史搜索结果对应的结果类型节点的目标节点特征信息、所述目标对象对应的对象类型节点的目标节点特征信息、以及所述对象类型节点和所述结果类型节点之间的边对应的边类型特征信息,确定所述历史搜索结果对应的交互特征信息。
[0271]
其中,本实施例可以取目标对象对应节点的最终向量作为用户的搜索兴趣特征信息,具体也即将目标对象对应的对象类型节点的目标节点特征信息确定为目标对象的搜索兴趣特征信息,其可以记为长期对象兴趣表示
[0272]
在一具体实施例中,可以使用特征信息来表示目标对象的搜索行为,对于目标对象在历史时间段检索某一内容(即历史搜索内容)这一操作对应的交互特征信息,也即历史搜索内容对应的交互特征信息,可以通过将目标对象对应的目标节点特征信息、该历史搜索内容对应的节点的目标节点特征信息、以及对象-检索内容这一边类型特征信息相加并取平均得到。对于目标对象在历史时间段点击某一搜索结果(即历史搜索结果)这一操作对应的交互特征信息,也即历史搜索结果对应的交互特征信息,可以通过将目标对象对应的目标节点特征信息、该历史搜索结果对应的节点的目标节点特征信息、以及对象-搜索结果这一边类型特征信息相加并取平均得到。这样可以得到目标对象对应的历史搜索集合的交互特征信息,其中,历史搜索集合可以包括目标对象i的历史搜索内容以及点击过的历史搜索结果。
[0273]
203、服务器获取针对所述目标搜索内容的至少一个目标搜索结果,并基于所述交互特征信息,计算所述目标对象的历史搜索结果对于各目标搜索结果的关联强度。
[0274]
其中,目标搜索结果可以是针对当前检索的目标搜索内容所召回的搜索结果。在具体场景中,每个目标搜索结果可以是针对目标搜索内容召回的搜索结果列表中的一个候选文档。
[0275]
可选地,本实施例中,步骤“基于所述交互特征信息,计算所述目标对象的历史搜索结果对于各目标搜索结果的关联强度”,可以包括:
[0276]
基于所述目标对象的历史搜索结果对应的搜索时间和当前时间,确定所述目标对象的历史搜索结果对应的时间权重信息;
[0277]
针对每个目标搜索结果,基于所述交互特征信息和所述时间权重信息,计算所述目标对象的历史搜索结果对于所述目标搜索结果的关联强度。
[0278]
其中,具体可以基于历史搜索结果对应的搜索时间和当前时间之间的时间差,来确定历史搜索结果对应的时间权重信息;时间差越大,时间权重信息越小,反之,时间差越小,时间权重信息越大。
[0279]
可选地,本实施例中,步骤“针对每个目标搜索结果,基于所述交互特征信息和所述时间权重信息,计算所述目标对象的历史搜索结果对于所述目标搜索结果的关联强度”,可以包括:
[0280]
针对每个目标搜索结果,基于所述目标对象的搜索兴趣特征信息和所述目标搜索结果之间的相似度,确定所述目标搜索结果的基础关联强度;
[0281]
基于所述交互特征信息和所述目标搜索结果之间的相关度、以及所述交互特征信息和所述目标搜索内容之间的相关度,确定所述目标对象的历史搜索结果与所述目标搜索结果的内容相关度;
[0282]
基于所述基础关联强度、所述内容相关度和所述时间权重信息,计算所述目标对象的历史搜索结果对于所述目标搜索结果的关联强度。
[0283]
其中,目标对象的搜索兴趣特征信息和目标搜索结果之间相似度的计算,可以采用余弦相似度等,本实施例对此不作限制。
[0284]
其中,交互特征信息和目标搜索结果之间的相关度、以及交互特征信息和目标搜索内容之间的相关度也可采用余弦相似度来进行确定。具体地,在计算得到交互特征信息和目标搜索结果之间的相关度、以及交互特征信息和目标搜索内容之间的相关度后,可以对这两个相关度进行融合处理,得到目标对象的历史搜索结果与目标搜索结果的内容相关度,该融合处理方法具体可以是相乘,也可以是加权运算等。
[0285]
其中,可以将基础关联强度、内容相关度和时间权重信息进行融合,来得到目标搜索结果的关联强度。具体地,可以将各个历史搜索结果与目标搜索结果的内容相关度、与各个历史搜索结果对应的时间权重信息进行加权融合,得到融合后关联强度,再将融合后关联强度和基础关联强度相加,得到目标搜索结果的关联强度。
[0286]
204、服务器根据所述目标搜索内容、所述关联强度以及所述搜索兴趣特征信息,对所述各目标搜索结果进行排序处理,输出排序后的搜索结果。
[0287]
一些实施例中,可以对目标搜索内容、关联强度以及搜索兴趣特征信息进行融合,可以得到各目标搜索结果对应的推荐相关度,其中,该融合方式可以是加权运算,也可以是拼接处理等,本实施例对此不作限制;基于所述推荐相关度对所述各目标搜索结果进行排序处理,输出排序后的搜索结果。
[0288]
可选地,本实施例中,步骤“根据所述目标搜索内容、所述关联强度以及所述搜索兴趣特征信息,对所述各目标搜索结果进行排序处理,输出排序后的搜索结果”,可以包括:
[0289]
对所述目标搜索内容和所述目标对象的历史搜索结果进行注意力特征提取,得到所述目标对象对应的当前搜索意图特征;
[0290]
计算各目标搜索结果与所述当前搜索意图特征之间的相似度,得到各目标搜索结果对应的意图相关度;
[0291]
基于所述意图相关度、所述关联强度以及所述搜索兴趣特征信息,对所述各目标搜索结果进行排序处理,输出排序后的搜索结果。
[0292]
其中,可以根据所述意图相关度、所述关联强度以及所述搜索兴趣特征信息,计算各目标搜索结果的推荐相关度,基于所述推荐相关度对所述各目标搜索结果进行排序处理,输出排序后的搜索结果。具体地,可以对各目标搜索结果按照推荐相关度的大小从大到小进行排序,得到排序后的搜索结果,可选地,还可以将排序后的搜索结果中前n个目标搜
索结果返回给目标对象。
[0293]
可选地,本实施例中,还可以从所述目标对象的历史交互内容中选取交互时间满足预设时间条件的目标历史交互内容;然后对所述目标搜索内容、和所述目标历史交互内容进行注意力特征提取,得到所述目标对象对应的当前搜索意图特征。其中,预设时间条件可以根据实际情况进行设置,具体地,预设时间条件可以是交互时间与当前时间的时间差不大于预设值。
[0294]
由上可知,本实施例可以通过服务器获取目标对象当前待搜索的目标搜索内容、以及所述目标对象对应的异质搜索图,所述异质搜索图表征关联对象和历史搜索结果之间的交互关系,所述历史搜索结果为所述关联对象针对历史搜索内容的搜索结果;根据所述异质搜索图,对所述关联对象和所述历史搜索结果进行特征信息传递处理,得到所述目标对象的搜索兴趣特征信息、以及所述目标对象对应的历史搜索结果的交互特征信息;获取针对所述目标搜索内容的至少一个目标搜索结果,并基于所述交互特征信息,计算所述目标对象的历史搜索结果对于各目标搜索结果的关联强度;根据所述目标搜索内容、所述关联强度以及所述搜索兴趣特征信息,对所述各目标搜索结果进行排序处理,输出排序后的搜索结果。本技术可以通过对目标对象的异质搜索图进行深层挖掘,来对搜索结果进行排序,有利于提高搜索结果排序的准确性,从而方便目标对象快速查找所需结果,提高查找效率。
[0295]
为了更好地实施以上方法,本技术实施例还提供一种内容处理装置,如图3所示,该内容处理装置可以包括获取单元301、信息传递单元302、计算单元303以及排序单元304,如下:
[0296]
(1)获取单元301;
[0297]
获取单元,用于获取目标对象当前待搜索的目标搜索内容、以及所述目标对象对应的异质搜索图,所述异质搜索图表征关联对象和历史搜索结果之间的交互关系,所述历史搜索结果为所述关联对象针对历史搜索内容的搜索结果。
[0298]
可选的,在本技术的一些实施例中,所述内容处理装置还可以包括搜索图构建单元,所述搜索图构建单元用于构建所述目标对象的异质搜索图;所述搜索图构建单元可以包括获取子单元、构建子单元、选取子单元和删除子单元,如下:
[0299]
所述获取子单元,用于获取参考对象针对历史搜索内容的历史搜索结果;
[0300]
构建子单元,用于根据所述参考对象和所述参考对象对应的历史搜索结果之间的交互关系,构建所述目标对象的初始异质搜索图;
[0301]
选取子单元,用于基于所述参考对象和所述目标对象之间的相似度,从所述参考对象中选取所述目标对象对应的关联对象;
[0302]
删除子单元,用于根据所述关联对象对所述初始异质搜索图进行节点删除处理,得到所述目标对象对应的异质搜索图。
[0303]
可选的,在本技术的一些实施例中,所述选取子单元具体可以用于针对每个参考对象,根据所述初始异质搜索图,确定所述参考对象对应的对象类型节点和所述目标对象对应的对象类型节点之间满足预设元路径条件的路径数量;根据所述路径数量,确定所述参考对象和所述目标对象之间的相似度;基于所述相似度,从所述参考对象中选取所述目标对象对应的关联对象。
[0304]
可选的,在本技术的一些实施例中,所述删除子单元具体可以用于根据所述关联对象在所述初始异质搜索图中进行节点搜索,以从所述初始异质搜索图中确定待删除节点,所述待删除节点不属于所述关联对象的对象类型节点、以及所述关联对象的历史搜索结果对应的结果类型节点;对所述初始异质搜索图中的所述待删除节点进行删除处理,得到所述目标对象对应的异质搜索图。
[0305]
(2)信息传递单元302;
[0306]
信息传递单元,用于根据所述异质搜索图,对所述关联对象和所述历史搜索结果进行特征信息传递处理,得到所述目标对象的搜索兴趣特征信息、以及所述目标对象对应的历史搜索结果的交互特征信息。
[0307]
可选的,在本技术的一些实施例中,所述异质搜索图包括至少一个节点、以及节点间的边,所述节点包括所述关联对象对应的对象类型节点、以及所述历史搜索结果对应的结果类型节点,所述边表征所述关联对象和所述历史搜索结果之间的交互关系;
[0308]
所述信息传递单元具体可以用于在所述异质搜索图中通过对节点之间的边进行特征信息传递处理,以对所述关联对象和所述历史搜索结果进行特征信息传递处理,得到所述目标对象的搜索兴趣特征信息、以及所述目标对象对应的历史搜索结果的交互特征信息。
[0309]
可选的,在本技术的一些实施例中,所述信息传递单元可以包括第一提取子单元、搜索子单元、传递子单元和第一确定子单元,如下:
[0310]
所述第一提取子单元,用于针对所述异质搜索图中各个节点进行特征提取,得到各个节点对应的节点特征信息,所述节点特征信息包括各对象类型节点对应的节点特征信息、以及各结果类型节点对应的节点特征信息;
[0311]
搜索子单元,用于针对所述异质搜索图中各个节点,根据所述节点在所述异质搜索图中进行节点搜索,以确定所述节点对应的邻居节点;
[0312]
传递子单元,用于根据所述邻居节点的节点特征信息、对所述节点的节点特征信息进行特征信息传递处理,得到所述节点的目标节点特征信息;
[0313]
第一确定子单元,用于基于所述目标对象对应的对象类型节点的目标节点特征信息,确定所述目标对象的搜索兴趣特征信息、以及所述目标对象对应的历史搜索结果的交互特征信息。
[0314]
可选的,在本技术的一些实施例中,所述传递子单元具体可以用于根据所述节点与其相应邻居节点之间的边对应的边类型特征信息、以及所述节点的节点特征信息,对所述邻居节点的节点特征信息进行注意力处理,得到所述邻居节点对应的注意力权重;基于所述注意力权重和所述邻居节点的节点特征信息,对所述节点的节点特征信息进行更新,得到所述节点的目标节点特征信息。
[0315]
可选的,在本技术的一些实施例中,步骤“基于所述注意力权重和所述邻居节点的节点特征信息,对所述节点的节点特征信息进行更新,得到所述节点的目标节点特征信息”,可以包括:
[0316]
基于所述注意力权重和所述邻居节点的节点特征信息,对所述节点的节点特征信息进行更新;
[0317]
返回执行所述根据所述节点与其相应邻居节点之间的边对应的边类型特征信息、
以及所述节点的节点特征信息,对所述邻居节点的节点特征信息进行注意力处理的步骤,直到得到满足预设信息传递条件的节点对应的目标节点特征信息。
[0318]
(3)计算单元303;
[0319]
计算单元,用于获取针对所述目标搜索内容的至少一个目标搜索结果,并基于所述交互特征信息,计算所述目标对象的历史搜索结果对于各目标搜索结果的关联强度。
[0320]
可选的,在本技术的一些实施例中,所述计算单元可以包括第二确定子单元和第一计算子单元,如下:
[0321]
所述第二确定子单元,用于基于所述目标对象的历史搜索结果对应的搜索时间和当前时间,确定所述目标对象的历史搜索结果对应的时间权重信息;
[0322]
第一计算子单元,用于针对每个目标搜索结果,基于所述交互特征信息和所述时间权重信息,计算所述目标对象的历史搜索结果对于所述目标搜索结果的关联强度。
[0323]
可选的,在本技术的一些实施例中,所述第一计算子单元具体可以用于针对每个目标搜索结果,基于所述目标对象的搜索兴趣特征信息和所述目标搜索结果之间的相似度,确定所述目标搜索结果的基础关联强度;基于所述交互特征信息和所述目标搜索结果之间的相关度、以及所述交互特征信息和所述目标搜索内容之间的相关度,确定所述目标对象的历史搜索结果与所述目标搜索结果的内容相关度;基于所述基础关联强度、所述内容相关度和所述时间权重信息,计算所述目标对象的历史搜索结果对于所述目标搜索结果的关联强度。
[0324]
(4)排序单元304;
[0325]
排序单元,用于根据所述目标搜索内容、所述关联强度以及所述搜索兴趣特征信息,对所述各目标搜索结果进行排序处理,输出排序后的搜索结果。
[0326]
可选的,在本技术的一些实施例中,所述排序单元可以包括第二提取子单元、第二计算子单元和排序子单元,如下:
[0327]
所述第二提取子单元,用于对所述目标搜索内容和所述目标对象的历史搜索结果进行注意力特征提取,得到所述目标对象对应的当前搜索意图特征;
[0328]
第二计算子单元,用于计算各目标搜索结果与所述当前搜索意图特征之间的相似度,得到各目标搜索结果对应的意图相关度;
[0329]
排序子单元,用于基于所述意图相关度、所述关联强度以及所述搜索兴趣特征信息,对所述各目标搜索结果进行排序处理,输出排序后的搜索结果。
[0330]
由上可知,本实施例可以由获取单元301获取目标对象当前待搜索的目标搜索内容、以及所述目标对象对应的异质搜索图,所述异质搜索图表征关联对象和历史搜索结果之间的交互关系,所述历史搜索结果为所述关联对象针对历史搜索内容的搜索结果;通过信息传递单元302根据所述异质搜索图,对所述关联对象和所述历史搜索结果进行特征信息传递处理,得到所述目标对象的搜索兴趣特征信息、以及所述目标对象对应的历史搜索结果的交互特征信息;通过计算单元303获取针对所述目标搜索内容的至少一个目标搜索结果,并基于所述交互特征信息,计算所述目标对象的历史搜索结果对于各目标搜索结果的关联强度;通过排序单元304根据所述目标搜索内容、所述关联强度以及所述搜索兴趣特征信息,对所述各目标搜索结果进行排序处理,输出排序后的搜索结果。本技术可以通过对目标对象的异质搜索图进行深层挖掘,来对搜索结果进行排序,有利于提高搜索结果排序
的准确性,从而方便目标对象快速查找所需结果,提高查找效率。
[0331]
本技术实施例还提供一种电子设备,如图4所示,其示出了本技术实施例所涉及的电子设备的结构示意图,该电子设备可以是终端或者服务器等,具体来讲:
[0332]
该电子设备可以包括一个或者一个以上处理核心的处理器401、一个或一个以上计算机可读存储介质的存储器402、电源403和输入单元404等部件。本领域技术人员可以理解,图4中示出的电子设备结构并不构成对电子设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
[0333]
处理器401是该电子设备的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或执行存储在存储器402内的软件程序和/或模块,以及调用存储在存储器402内的数据,执行电子设备的各种功能和处理数据。可选的,处理器401可包括一个或多个处理核心;优选的,处理器401可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器401中。
[0334]
存储器402可用于存储软件程序以及模块,处理器401通过运行存储在存储器402的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器402可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据电子设备的使用所创建的数据等。此外,存储器402可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器402还可以包括存储器控制器,以提供处理器401对存储器402的访问。
[0335]
电子设备还包括给各个部件供电的电源403,优选的,电源403可以通过电源管理系统与处理器401逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源403还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
[0336]
该电子设备还可包括输入单元404,该输入单元404可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。
[0337]
尽管未示出,该电子设备还可以包括显示单元等,在此不再赘述。具体在本实施例中,电子设备中的处理器401会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器402中,并由处理器401来运行存储在存储器402中的应用程序,从而实现各种功能,如下:
[0338]
获取目标对象当前待搜索的目标搜索内容、以及所述目标对象对应的异质搜索图,所述异质搜索图表征关联对象和历史搜索结果之间的交互关系,所述历史搜索结果为所述关联对象针对历史搜索内容的搜索结果;根据所述异质搜索图,对所述关联对象和所述历史搜索结果进行特征信息传递处理,得到所述目标对象的搜索兴趣特征信息、以及所述目标对象对应的历史搜索结果的交互特征信息;获取针对所述目标搜索内容的至少一个目标搜索结果,并基于所述交互特征信息,计算所述目标对象的历史搜索结果对于各目标搜索结果的关联强度;根据所述目标搜索内容、所述关联强度以及所述搜索兴趣特征信息,对所述各目标搜索结果进行排序处理,输出排序后的搜索结果。
[0339]
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
[0340]
由上可知,本实施例可以获取目标对象当前待搜索的目标搜索内容、以及所述目标对象对应的异质搜索图,所述异质搜索图表征关联对象和历史搜索结果之间的交互关系,所述历史搜索结果为所述关联对象针对历史搜索内容的搜索结果;根据所述异质搜索图,对所述关联对象和所述历史搜索结果进行特征信息传递处理,得到所述目标对象的搜索兴趣特征信息、以及所述目标对象对应的历史搜索结果的交互特征信息;获取针对所述目标搜索内容的至少一个目标搜索结果,并基于所述交互特征信息,计算所述目标对象的历史搜索结果对于各目标搜索结果的关联强度;根据所述目标搜索内容、所述关联强度以及所述搜索兴趣特征信息,对所述各目标搜索结果进行排序处理,输出排序后的搜索结果。本技术可以通过对目标对象的异质搜索图进行深层挖掘,来对搜索结果进行排序,有利于提高搜索结果排序的准确性,从而方便目标对象快速查找所需结果,提高查找效率。
[0341]
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
[0342]
为此,本技术实施例提供一种计算机可读存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本技术实施例所提供的任一种内容处理方法中的步骤。例如,该指令可以执行如下步骤:
[0343]
获取目标对象当前待搜索的目标搜索内容、以及所述目标对象对应的异质搜索图,所述异质搜索图表征关联对象和历史搜索结果之间的交互关系,所述历史搜索结果为所述关联对象针对历史搜索内容的搜索结果;根据所述异质搜索图,对所述关联对象和所述历史搜索结果进行特征信息传递处理,得到所述目标对象的搜索兴趣特征信息、以及所述目标对象对应的历史搜索结果的交互特征信息;获取针对所述目标搜索内容的至少一个目标搜索结果,并基于所述交互特征信息,计算所述目标对象的历史搜索结果对于各目标搜索结果的关联强度;根据所述目标搜索内容、所述关联强度以及所述搜索兴趣特征信息,对所述各目标搜索结果进行排序处理,输出排序后的搜索结果。
[0344]
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
[0345]
其中,该计算机可读存储介质可以包括:只读存储器(rom,read only memory)、随机存取记忆体(ram,random access memory)、磁盘或光盘等。
[0346]
由于该计算机可读存储介质中所存储的指令,可以执行本技术实施例所提供的任一种内容处理方法中的步骤,因此,可以实现本技术实施例所提供的任一种内容处理方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
[0347]
根据本技术的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述内容处理方面的各种可选实现方式中提供的方法。
[0348]
以上对本技术实施例所提供的一种内容处理方法以及相关设备进行了详细介绍,本文中应用了具体个例对本技术的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本技术的方法及其核心思想;同时,对于本领域的技术人员,依据本技术的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对
本技术的限制。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1