本技术涉及人工智能,尤其涉及一种品牌词获取方法、装置、电子设备及存储介质。
背景技术:
1、目前,应用程序的分享社区发表有用户分享的笔记,用户可以去浏览各种笔记,当对每个笔记的内容感兴趣时,则会对该笔记进行截图,针对用户的截图行为,可获取用户的品牌意图,即用户对哪些品牌感兴趣,基于截图行为到品牌意图的智能化实时转换,可帮助商家建立日销和促销。
2、然而,目前检测到用户的截图行为时,通过logo对用户所要截图的图片内容进行品牌检测,得到该截图行为所关注的品牌词。
3、但是,logo检测所识别出的品牌词类型单一,且精度较低。
技术实现思路
1、本技术提供了一种品牌词获取方法、装置、电子设备及存储介质,通过文本和图像综合进行品牌词检测,以及进行品牌词的融合,能够检测出各种类型的品牌,对品牌词的覆盖率比较高,且检测精度较高。
2、第一方面,本技术实施例提供了一种品牌词获取方法,该方法包括:
3、响应用户的截图行为,获取与所述截图行为对应的笔记信息,其中,所述笔记信息包括笔记图片和笔记文本;
4、对所述笔记图片进行主体识别,得到h个主体的h个类别,所述h个主体和所述h个类别一一对应;
5、对所述笔记文本进行文本检测,得到第一品牌词集合;
6、对所述笔记图片进行品牌词检测,得到至少一个第二品牌词集合;
7、根据所述h个主体的h个类别,对所述第一品牌词集合和所述至少一个第二品牌词集合进行融合,得到z个目标品牌词。
8、结合第一方面,在一种可能的实施方式中,所述根据所述h个主体的h个类别,对所述第一品牌词集合和所述至少一个第二品牌词集合进行融合,得到z个目标品牌词,包括:
9、确定所述第一品牌词集合和所述至少一个第二品牌词集合中的m个第一目标品牌词,其中,每个第一目标品牌词至少存在于所述第一品牌词集和所述至少一个第二品牌词集合中的两个品牌词集合中;
10、移除所述第一品牌词集合和所述至少一个第二品牌词集合中的所述m个第一目标品牌词,得到与所述第一品牌词集合对应的第三品牌词集合,以及与每个第二品牌词集合对应的第四品牌词集合;
11、根据所述h个类别,对所述第三品牌词集合进行品牌词筛选,得到n个第二目标品牌词;
12、根据所述h个类别,对每个第四品牌词集合进行品牌词筛选,得到每个第四品牌词集合对应的k个第三目标品牌词;
13、将所述m个第一目标品牌词,所述n个第二目标品牌词,以及每个第四品牌词集合对应的k个第三目标品牌词进行融合,得到所述z个目标品牌词。
14、结合第一方面,在一种可能的实施方式中,所述根据所述h个类别,对所述第三品牌词集合进行品牌词筛选,得到n个第二目标品牌词,包括:
15、获取所述第三品牌词集合中的x个第四目标品牌词,其中,所述h个类别包含每个第四目标品牌词对应的类别;
16、移除所述第三品牌词集合中的所述x个第四目标品牌词,得到第五品牌词集合;
17、根据所述第五品牌词集合中的每个品牌词对应的类别进行加权处理操作,得到所述第五品牌词集合中的每个品牌词的目标置信度;
18、根据所述第五品牌词集合中的每个品牌词的目标置信度,得到y个第五目标品牌词;
19、将所述x个第四目标品牌词和所述y个第五目标品牌词进行融合,得到所述n个第二目标品牌词。
20、结合第一方面,在一种可能的实施方式中,所述根据所述h个类别,对每个第四品牌词集合进行品牌词筛选,得到每个第四品牌词集合对应的k个第三目标品牌词,包括:
21、获取每个第四品牌词集合中的q个第六目标品牌词,其中,所述h个类别包含每个第六目标品牌词对应的类别;
22、移除每个第四品牌词集合中的所述q个第六目标品牌词,得到与每个第四品牌词集合对应的第六品牌词集合;
23、根据所述第六品牌词集合中的每个品牌词对应的类别进行加权处理操作,得到所述第六品牌词集合中的每个品牌词的目标置信度;
24、根据所述第六品牌词集合中的每个品牌词的目标置信度,确定与每个第四品牌词集合对应的r个第七目标品牌词;
25、将每个第四品牌词集合中的q个第六目标品牌词,以及每个第四品牌词集合对应的r 个第七目标品牌词进行融合,得到每个第四品牌词集合对应的k个第三目标品牌词。
26、结合第一方面,在一种可能的实施方式中,加权处理操作,包括:
27、根据品牌词a对应的类别,确定所述品牌词a对应的惩罚系数,其中,所述品牌词a为所述第五品牌词集合中的任意一个或者为每个第六品牌词集合中的任意一个;
28、根据所述品牌词a所处的品牌词集合,获取与所述品牌词a对应的预设惩罚项;
29、根据所述品牌词a对应的惩罚系数、所述预设惩罚项,以及所述品牌词a的置信度,确定所述品牌词a对应的目标置信度。
30、结合第一方面,在一种可能的实施方式中,所述对所述第一笔记文本进行文本检测,得到第一品牌词集合,包括:
31、对所述笔记文本进行实体识别,得到a个第一候选品牌词;
32、对每个第一候选品牌词进行主品牌词映射,得到与每个第一候选品牌词对应的品牌词;
33、将每个第一候选品牌词对应的品牌词组合为所述第一品牌词集合。
34、结合第一方面,在一种可能的实施方式中,所述对所述笔记图片进行品牌词检测,得到至少一个第二品牌词集合,包括:
35、对所述笔记图片进行品牌logo检测,得到b个第二候选品牌词;
36、对每个第二候选品牌词进行主品牌词映射,得到与每个第二候选品牌词对应的品牌词;
37、将每个第二候选品牌词对应的品牌词组合为所述至少一个第二品牌词集合。
38、结合第一方面,在一种可能的实施方式中,所述对所述笔记图片进行品牌词检测,得到至少一个第二品牌词集合,包括:
39、对所述笔记图片进行光学字符识别,得到c个第三候选品牌词;
40、对每个第三候选品牌词进行品牌词映射,得到与每个第三候选品牌词对应的品牌词;
41、将每个第三候选品牌词对应的品牌词组合为所述至少一个第二品牌词集合。
42、结合第一方面,在一种可能的实施方式中,所述对所述笔记图片进行品牌词检测,得到至少一个第二品牌词集合,包括:
43、对所述笔记图片进行logo检测,得到b个第二候选品牌词;
44、对每个第二候选品牌词进行主品牌词映射,得到与每个第二候选品牌词对应的品牌词;
45、对所述笔记图片进行光学字符识别,得到c个第三候选品牌词;
46、对每个第二候选品牌词进行主品牌词映射,得到与每个第三候选品牌词对应的品牌词;
47、将每个第二候选品牌词对应的品牌词组合为一个第二品牌词集合,将每个第三候选品牌词对应的品牌词组合另一个第二品牌词集合,得到所述至少一个第二品牌词集合。
48、结合第一方面,在一种可能的实施方式中,所述对所述笔记图片进行光学字符识别,得到c个第三候选品牌词,包括:
49、对所述笔记图片进行光学字符识别,得到文本信息;
50、将所述文本信息与品牌词库进行匹配,得到d个第四候选品牌词;
51、将所述文本信息与所述h个类别进行匹配,得到e个第五候选品牌词;
52、将所述d个第四候选品牌词和所述e个第五候选品牌词作为所述c个第三候选品牌词。
53、结合第一方面,在一种可能的实施方式中,所述对所述笔记图片进行主体识别,得到 h个主体的h个类别,包括:
54、对所述笔记图片进行目标检测,得到多个候选框;
55、基于每个候选框的位置信息,对所述多个候选框进行主体检测,得到h个主体框,其中,每个主体框所框选的目标为一个主体;
56、对所述每个主体框所对应的主体进行分类,得到所述一个主体对应的h个类别。
57、结合第一方面,在一种可能的实施方式中,所述笔记信息还包括笔记类目;
58、所述笔记类目用于在对所述笔记文本进行文本检测时提供先验信息,以使得到的第一品牌词集合中的品牌词与所述笔记类目匹配;
59、所述笔记类目,还用于在对所述笔记图片进行品牌词检测时提供先验信息,以使得到的每个第二品牌词集合中的品牌词与所述笔记类目匹配;
60、所述笔记类目,还用于在对所述笔记图片进行主体识别时提供先验信息,以使得到的每个主体,以及每个主体的类别均与所述笔记类目匹配。
61、结合第一方面,在一种可能的实施方式中,所述方法还包括:
62、根据所述z个目标品牌词,为所述用户进行品牌推荐。
63、结合第一方面,在一种可能的实施方式中,所述方法还包括:
64、根据所述z个目标品牌词,为所述用户构建用户画像。
65、第二方面,本技术实施例提供了一种品牌词获取装置,包括:
66、获取单元,用于响应用户的截图行为,获取与所述截图行为对应的笔记信息,其中,所述笔记信息包括笔记图片和笔记文本;
67、处理单元,用于对所述笔记图片进行主体识别,得到h个主体的h个类别,所述h个主体和所述h个类别一一对应;
68、对所述笔记文本进行文本检测,得到第一品牌词集合;
69、对所述笔记图片进行品牌词检测,得到至少一个第二品牌词集合;
70、根据所述h个主体的h个类别,对所述第一品牌词集合和所述至少一个第二品牌词集合进行融合,得到z个目标品牌词。
71、第三方面,本技术实施例提供了一种电子设备,处理器和存储器,所述处理器与所述存储器相连,所述存储器用于存储计算机程序,所述处理器用于执行所述存储器中存储的计算机程序,以使得所述电子设备执行如第一方面所述的方法。
72、第四方面,本技术实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序使得计算机执行如第一方面所述的方法。
73、第五方面,本技术实施例提供一种计算机程序产品,所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,所述计算机可操作来使计算机执行如第一方面所述的方法。
74、本技术的上述方案至少包括以下有益效果:
75、本技术实施例中,首先,响应于用户的截图行为,获取与该截图行为对应的笔记信息。然后,对笔记文本进行文本检测,得到第一品牌词集合,即先在笔记文本检测品牌词。再者,对笔记图片进行品牌词检测,得到至少一个第二品牌词集合,即再对笔记图片进行品牌词检测。即通过多模态检测方式进行品牌词检测。再者,对笔记图片进行主体识别,得到h个主体的h个类别。最后,根据h个主体的h个类别,对第一品牌词集合和至少一个第二品牌词集合进行融合,得到z个目标品牌词。因此,当检测到用户的截图行为时,本技术中使用多模态的检测方式进行品牌词检测,从而可以全面的检测出各种类型的品牌词,提高了品牌词检测的覆盖率;此外,为了避免单一模态对某种品牌词检测不友好的情况,本技术中结合主体的类别,对多模态检测的品牌词进行融合,输出最终的品牌词,从而使最终得到的目标品牌词在多模态以及主体类别维度是相协调的,提高了品牌词的检测精度。