一种用户兴趣维度采集与推荐方法、装置、设备及存储介质与流程

文档序号:32891373发布日期:2023-01-12 23:14阅读:23来源:国知局
一种用户兴趣维度采集与推荐方法、装置、设备及存储介质与流程

1.本发明属于互联网技术领域,具体涉及一种用户兴趣维度采集与推荐方法、装置、设备及存储介质。


背景技术:

2.现有的用户兴趣维度采集主要是通过显性标签与隐性标签进行的。隐性标签型是通过针对于用户的行为数据进行分析提取来获得,在产品冷启动初期成本高,且由于用户行为累积量不足会导致标签采集不准确;而目前市场上通过显性标签采集用户兴趣维度仅仅是对单一分类维度的采集,无法满足文旅场景,而且由于采集维度少导致采集信息宽泛,存在一定的不准确性,不能满足针对采集用户的个性化推荐。


技术实现要素:

3.本发明所要解决的技术问题在于针对上述现有用户兴趣维度采集存在的信息采集不准确导致的无法满足针对采集用户的个性化推荐的问题,提供一种用户兴趣维度采集与推荐方法,一种用户兴趣维度采集与推荐装置,一种用户兴趣维度采集与推荐设备,还提供一种用户兴趣维度采集与推荐存储介质。
4.第一方面,本发明提供一种用户兴趣维度采集与推荐方法,包括以下步骤:
5.建立包括n个预设标签的标签数据库,n为正整数,所述预设标签包括用户特征标签和文旅地域特征标签;
6.获取用户行为数据,根据所述用户行为数据完成用户兴趣维度采集,所述用户行为数据包括通过预设标签选取得到的第一特征数据和文本信息输入得到的第二特征数据;
7.根据采集的用户兴趣维度在冷启动阶段对用户进行个性化推荐。
8.作为本发明的进一步改进,用户特征标签的标签维度包括但不限于性别、用户属地、旅游特征、新老用户、年龄段以及活跃度。
9.作为本发明的进一步改进,文旅地域特征标签的标签维度包括但不限于民俗、文化、非遗、地域、以及景观维度。
10.作为本发明的进一步改进,每个标签维度下均包含m个标签,m为正整数,所述标签包含用户特征或文旅地域特征。
11.作为本发明的进一步改进,所述方法还包括:
12.将所述标签维度按照所述用户特征标签与所述文旅地域特征进行排列组合,得到包括多个标签组合的标签字典。
13.作为本发明的进一步改进,所述方法还包括:
14.对所述第二特征数据进行自然语言文本处理,所述自然语言文本处理包括对文本信息内容划分主谓宾;
15.对所述文本信息内容进行特征提取,所述特征提取包括关键词提取和主题词提取。
16.作为本发明的进一步改进,所述方法还包括:
17.根据所述用户行为数据在所述标签字典中进行特征搜索,匹配标签组合;
18.选取匹配度高的标签组合作为当前用户的特征标签组合进行展示,所述特征标签组合用于供用户选取标签对用户兴趣维度进行补充;
19.若当前特征标签组合中有标签被选取,则当前特征标签组合不再出现在用户列表中。
20.第二方面,本发明提供一种用户兴趣维度采集与推荐装置,包括:
21.生成模块,用于建立包括n个预设标签的标签数据库,n为正整数,所述预设标签包括用户特征标签和文旅地域特征标签;
22.获取模块,用于获取用户行为数据,并根据所述用户行为数据完成用户兴趣维度采集,所述用户行为数据包括通过预设标签选取得到的第一特征数据和文本信息输入得到的第二特征数据;
23.推荐模块,用于根据采集的用户兴趣维度在冷启动阶段对用户进行个性化推荐。
24.第三方面,本发明提供一种用户兴趣维度采集与推荐设备,所述基于问答交互的个性化用户兴趣维度采集与推荐设备包括:存储器和至少一个处理器,所述存储器中存储有计算机执行指令;所述至少一个处理器调用所述存储器中的所述计算机执行指令,以使得所述基于问答交互的个性化用户兴趣维度采集与推荐设备执行上述任一实施例所述的用户兴趣维度采集与推荐方法。
25.第四方面,本发明提供一种计算机可读存储介质,其上存储有计算机执行指令,其特征在于,所述计算机执行指令被处理器执行用于实现上述任一实施例所述的用户兴趣维度采集与推荐方法。
26.本发明提供的一种用户兴趣维度采集与推荐方法,通过获取根据预设标签选取得到的第一特征数据和文本信息输入得到的第二特征数据采集用户兴趣维度,不仅降低了通过机器学习等技术获取信息的难度,还得到了更加准确的用户反馈,提升了推荐的丰富性与准确性。
27.下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
28.为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明一部分实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
29.图1为本发明实施例提供的一种用户兴趣维度采集与推荐方法流程图;
30.图2为本发明实施例提供的一种用户兴趣维度采集与推荐装置的结构框图;
31.图3为本发明实施例提供的一种用户兴趣维度采集与推荐设备的结构示意图。
32.附图中各标号的含义为:
33.生成模块-201;获取模块-202;推荐模块-203;存储器-301;处理器-302。
具体实施方式
34.为了使本发明的目的、技术方案及优点更加清楚明白,下面结合附图和具体实施例对本发明作进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
35.为了使本揭示内容的叙述更加详尽与完备,下文针对本发明的实施方式与具体实施例提出了说明性的描述;但这并非实施或运用本发明具体实施例的唯一形式。实施方式中涵盖了多个具体实施例的特征以及用以建构与操作这些具体实施例的方法步骤与其顺序。然而,亦可利用其它具体实施例来达成相同或均等的功能与步骤顺序。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
36.需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。
37.在本发明实施例的描述中,除非另有说明,“/”表示或的意思,例如,a/b可以表示a或b;文本中的“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况,另外,在本技术实施例的描述中,“多个”是指两个或多于两个,其它量词与之类似应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明,并且在不冲突的情况下,本技术的实施例及实施例中的特征可以相互组合。
38.现有的通过隐性便签采集用户兴趣维度往往是在产品冷启动初期进行的,存在成本高的问题,且由于用户行为累积量不足会导致标签采集不准确;而通过显性标签采集用户兴趣维度通常是对单一分类维度的采集,无法满足文旅场景,而且由于采集维度少导致采集信息宽泛,存在一定的不准确性,不能满足针对采集用户的个性化推荐。
39.为了解决现有用户兴趣维度采集存在的信息采集不准确导致的无法满足针对采集用户的个性化推荐的问题,本发明实施例提供的一种用户信息维度采集与推荐方法,图1为本发明实施例提供的一种用户信息维度采集与推荐方法流程图,如图1所示,本实施例提供的一种用户信息维度采集与推荐方法,包括以下步骤:
40.s110.建立包括n个预设标签的标签数据库,n为正整数,所述预设标签包括用户特征标签和文旅地域特征标签。
41.作为本发明的一个实施例,该用户特征标签的标签维度包括但不限于性别、用户属地、旅游特征、新老用户、年龄段以及活跃度,该文旅地域特征标签的标签维度包括但不限于民俗、文化、非遗、地域、以及景观维度,进一步地,每个标签维度下均包含m个标签,m为正整数,所述标签包含用户特征或文旅地域特征。
42.具体地,例如,整理出文旅地域特征下民俗标签包括a、a1、a2、a3、a4

an,文化标签为b、b1、b2、b3、b4

bn,其他特征维度以此类推;整理出用户特征下用户属地标签包括a、a1、a2、a3、a4

an,旅游特征标签为:b、b1、b2、b3、b4

bn,其他特征维度以此类推。
43.本方案通过从文旅行业多维度为用户设计采集标签,不仅解决了目前市场上对用户兴趣维度的采集仅为单一分类维度的采集,不能多维度的采集用户兴趣维度进行辅助个
性化推荐的问题,还极大的丰富了在冷启动阶段采集用户兴趣维度的文旅场景,降低了通过机器学习采集用户兴趣维度存在的技术难度高的问题,并且获取到的用户特征更加准确,也提升了文旅场景推荐的丰富性与准确性。
44.s120.获取用户行为数据,根据所述用户行为数据完成用户兴趣维度采集,所述用户行为数据包括通过预设标签选取得到的第一特征数据和文本信息输入得到的第二特征数据。
45.作为本发明实施例的进一步改进,步骤s120之前还包括,将所述标签维度按照所述用户特征标签与所述文旅地域特征进行排列组合,得到包括多个标签组合的标签字典。例如,将所述标签维度按照所述用户特征标签与所述文旅地域特征进行排列组合,得到ba、ba1、ba2、ba4、ba4

ban;b1a、b1a1、b1a2、b1a3、b1a4

b1an等多个标签组合组成的标签字典。
46.需要说明的是,将上述整理出的文旅地域特征下的各特征维度下的标签以及用户特征下的各特征维度下的标签进行排列组合后,得到包括多个标签组合的标签字典并进行存储。
47.作为本发明实施例的进一步改进,步骤s120之后还包括,对所述第二特征数据进行自然语言文本处理,所述自然语言文本处理包括对文本信息内容划分主谓宾;对所述文本信息内容进行特征提取,所述特征提取包括关键词提取和主题词提取。
48.需要说明的是,本发明通过预标签选取得到的第一特征数据以及文本信息输入得到的第二特征数据,均为用户针对不同问题进行作答得到的数据,通过用户对预设标签进行点击以及用户直接输入文本内容获取用户的显性反馈,从而更准确的获取用户兴趣维度,达到辅助个性化推荐的目的。
49.作为本发明实施例的进一步改进,根据所述用户行为数据在所述标签字典中进行特征搜索,匹配标签组合;选取匹配度高的标签组合作为当前用户的特征标签组合进行展示,所述特征标签组合用于供用户选取标签对用户兴趣维度进行补充。
50.优选地,若当前特征标签组合中有标签被选取,则当前特征标签组合不再出现在用户列表中。
51.具体地,通过去除选取过标签的标签组合,进一步缩小用户信息采集范围,进一步解决了采集信息宽泛的问题,提升推荐效果。
52.s130.根据采集的用户兴趣维度在冷启动阶段对用户进行个性化推荐。
53.本发明提供的一种用户兴趣维度采集与推荐方法,通过获取根据预设标签选取得到的第一特征数据和文本信息输入得到的第二特征数据采集用户兴趣维度,不仅降低了通过机器学习等技术获取信息的难度,还得到了更加准确的用户反馈,提升了推荐的丰富性与准确性。
54.图2为本发明实施例提供的一种用户兴趣维度采集与推荐装置的结构框图,如图2所示,该用户兴趣维度采集与推荐装置包括生成模块201、获取模块202、以及推荐模块203。
55.生成模块201,用于建立包括n个预设标签的标签数据库,n为正整数,该预设标签包括用户特征标签和文旅地域特征标签;
56.获取模块202,用于获取用户行为数据,并根据用户行为数据完成用户兴趣维度采集,用户行为数据包括通过预设标签选取得到的第一特征数据和文本信息输入得到的第二
特征数据;
57.推荐模块203,用于根据采集的用户兴趣维度在冷启动阶段对用户进行个性化推荐。
58.优选地,用户特征标签的标签维度包括但不限于性别、用户属地、旅游特征、新老用户、年龄段以及活跃度;文旅地域特征标签的标签维度包括但不限于民俗、文化、非遗、地域、以及景观维度。
59.优选地,每个标签维度下均包含m个标签,m为正整数,标签包含用户特征或文旅地域特征。
60.关于上述实施例中的用户兴趣维度采集与推荐装置中各模块实现技术方案的其他细节,可参考上述实施例中的用户兴趣维度采集与推荐方法中的描述,此处不再赘述。
61.需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
62.本技术实施例还提供了一种用户兴趣维度采集与推荐设备的结构示意图,图3为本技术实施例提供的一种用户兴趣维度采集与推荐设备的结构示意图,如图3所示,该用户兴趣维度采集与推荐设备可以包括:处理器以及与所述处理器通信连接的存储器;该存储器用于存储计算机程序;该处理器用于执行该存储器上存储的计算机程序,使得该处理器执行上述任一实施例所述的方法。具体地,存储器和处理器可以通过总线连接。
63.本技术实施例还提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序执行指令,计算机执行指令被处理器执行时用于实现上述本技术任一实施例中的方法。
64.在本技术所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,各个部分的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
65.作为分离部件说明的装置中的各个部分可以是或者也可以不是物理上分开的,比如,作为寄存器模型的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案
66.另外,在本技术各个实施例中该装置的各个部分可以集成在一个处理单元中,也可以是单独的物理存在,也可以两个或两个以上集成在一个单元中。扎样形成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。上述以软件功能模块的形式实现的集成的模块,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器执行本技术各个实施例所述方法的部分步骤。
67.应理解,上述处理器可以是中央处理单元(central processing unit,简称cpu),
还可以是其它通用处理器、数字信号处理器(digital signal processor,简称dsp)、专用集成电路(application specific integrated circuit,简称asic)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合申请所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
68.存储器可能包含高速随机存取存储器(random access memory,简称ram),也可能还包括非不稳定的存储器(non-volatile memory,简称nvm),例如至少一个磁盘存储器,还可以为u盘、移动硬盘、只读存储器、磁盘或光盘等。总线可以是工业标准体系结构(industry standard architecture,简称isa)总线、外部设备互连(peripheral component interconnect,简称pci)总线或扩展工业标准体系结构(extended industry standard architecture,简称eisa)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,本技术附图中的总线并不限定仅有一根总线或一种类型的总线。
69.上述存储介质可以是由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(static random-access memory,简称sram),电可擦除可编程只读存储器(electrically erasable programmable read only memory,简称eeprom),可擦除可编程只读存储器(erasable programmable read-only memory,简称eprom),可编程只读存储器(programmable read-only memory,简称prom),只读存储器(read-only memory,简称rom),磁存储器,快闪存储器,磁盘或光盘。存储介质可以是通用或专用计算机能够存取的任何可用介质。一种示例性的存储介质耦合至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于专用集成电路(application specific integrated circuits,简称asic)中。当然,处理器和存储介质也可以作为分立组件存在于用户兴趣维度采集与推荐设备或主控设备中。
70.以上对本发明实施例公开的一种用户兴趣维度采集与推荐方法、装置、设备及存储介质进行了详细介绍,尽管已描述了本发明的优选实施例,但其只作为范例,本发明并不限制于以上描述的具体实施方式。本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。因此,对于本领域的技术人员而言,依据本发明的思想,对该发明进行的等同修改或替代也都在本发明的范畴之中,在不脱离本发明的精神和原则范围下所作的均等变换和修改、改进等,都应涵盖在本发明的范围内。综上,本说明书内容不应理解为对本发明的限制。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1