1.本技术涉及人工智能技术领域,尤其涉及一种对象属性获取方法、装置、电子设备及存储介质。
背景技术:2.诸如商品、动物等对象的属性信息对于很多领域都非常重要,以下以对象是商品为例进行说明,商品属性信息在诸如商品推荐、商品检索等众多电商任务中都是不可缺少的关键信息,其主要包括属性名和与其相应的属性值,然而,很多情况下属性名称对应的属性值并未记录,也即是缺失的。
3.业内主流技术是针对每个缺失属性值的属性名称,均尝试看能否从商品描述文本中直接提取出其对应的属性值,逐一尝试较为繁琐,效率低下,而且也可能出现提取出的属性值与属性名并不匹配的问题,准确率不高。
技术实现要素:4.本技术提供了一种对象属性获取方法、装置、电子设备及存储介质。
5.根据本技术的第一方面,提供了一种对象属性获取方法,包括:
6.获取训练样本;所述训练样本标注有样本所描述对象的真实属性名称和与所述真实属性名称匹配的真实属性值;
7.获取待训练的初始模型针对所述训练样本输出的属性名称预测结果和属性值识别结果;
8.计算所述属性名称预测结果和所述属性值识别结果的匹配程度;
9.根据所述真实属性名称、所述真实属性值、所述属性名称预测结果、所述属性值识别结果、以及所述属性名称预测结果和所述属性值识别结果的匹配程度对所述初始模型进行训练来获取信息识别模型,以根据所述信息识别模型获取对象描述文本对应的属性名称和与所述属性名称相匹配的属性值。
10.根据本技术的第二方面,提供了一种对象属性获取装置,所述装置包括:
11.样本获取模块,用于获取训练样本;所述训练样本标注有样本所描述对象的真实属性名称和与所述真实属性名称匹配的真实属性值;
12.结果获取模块,用于获取待训练的初始模型针对所述训练样本输出的属性名称预测结果和属性值识别结果;
13.匹配计算模块,用于计算所述属性名称预测结果和所述属性值识别结果的匹配程度;
14.属性获取模块,用于根据所述真实属性名称、所述真实属性值、所述属性名称预测结果、所述属性值识别结果、以及所述属性名称预测结果和所述属性值识别结果的匹配程度对所述初始模型进行训练来获取信息识别模型,以根据所述信息识别模型获取对象描述文本对应的属性名称和与所述属性名称相匹配的属性值。
15.根据本技术的第三方面,提供了一种电子设备,包括:
16.至少一个处理器;以及,
17.与所述至少一个处理器通信连接的存储器;其中,
18.所述存储器有可悲所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本技术的第一方面所述的对象属性获取方法。
19.根据本技术的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行本技术的第一方面所述的对象属性获取方法。
20.根据本技术的第五方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据第一方面所述的对象属性获取方法。
21.根据本技术提供的技术方案,通过标注有真实属性名称和与之匹配的真实属性值的训练样本对初始模型进行训练,而且在训练过程中充分考虑到了初始模型输出的属性名称预测结果和属性值识别结果的匹配程度,再结合真实属性名称和真实属性值共同对初始模型进行训练,使得最终通过训练方式获取到的信息识别模型能够直接获取对象描述文本的属性名称和与之相匹配的属性值,也即能够同时得到对象描述文本对应的属性名称和属性值,无需再针对每个待提取属性值的属性名称逐一尝试看能否从商品描述文本中提取对应的属性值,提高了对象属性的获取效率;此外,由于信息识别模型是基于属性名称预测结果和属性值识别结果的匹配程度训练得到,能够输出与属性名称匹配的属性值,有效提升了对象属性的获取准确率。
22.应当理解,本部分所描述的内容并非旨在标识本技术的实施例的关键或重要特征,也不用于限制本技术的范围。本技术的其它特征将通过以下的说明书而变得容易理解。
附图说明
23.附图用于更好地理解本方案,不构成对本技术的限定。其中:
24.图1是本技术实施例提供的一种对象属性获取方法的流程图;
25.图2是本技术实施例提供的一种信息识别模型的获取方法流程图;
26.图3是本技术实施例提供的另一种信息识别模型的获取方法流程图;
27.图4是本技术实施例提供的一种对象属性获取装置的结构框图;
28.图5是用来实现本技术实施例的对象属性获取方法的电子设备的框图。
具体实施方式
29.以下结合附图对本技术的示范性实施例做出说明,其中包括本技术实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本技术的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
30.考虑到相关技术在补充对象缺失的属性值时较为繁琐,效率低下且准确率不高,为改善以上问题至少之一,本技术实施例提供了一种对象属性获取方法、装置、电子设备及存储介质,通过训练获取的信息识别模型可以直接输出对象描述文本对应的属性名称以及
与属性名称匹配的属性值,这种方式能够更高效且更准确地从对象描述文本中抽取出对象属性信息。本技术实施例提供的信息识别模型可应用于诸如任何需要从对象描述文本中提取出对象属性信息的场景,在此不进行限制。本实施例提供的对象属性获取方法可应用于电子设备,该电子设备诸如可以为手机、电脑、机器人等等具有数据处理能力的设备,在此不进行限制。
31.为便于理解,以下对本技术实施例进行详细介绍。
32.首先参见图1所示的一种对象属性获取方法的流程图,该方法可以由电子设备执行,主要包括以下步骤s102~步骤s108:
33.步骤s102,获取训练样本;训练样本标注有样本所描述对象的真实属性名称和与真实属性名称匹配的真实属性值。
34.在一些具体的实施方式中,训练样本可以是以自然语言描述的非结构化文本,包含有对象的相关描述信息,本技术实施例中的对象可以是商品,也可以是物品、人物、动物等等,在此不进行限制。属性名称诸如可以理解为颜色、尺寸、功率、品种、材质等表征对象特征的属性名,属性值即为对象属性的具体表现,诸如,“颜色”属性的属性值可以为白色、黑色、蓝色等,“材质”属性的属性值可以为金属、塑料等。
35.上述训练样本可以包括多条文本,每条文本可以仅是一句话,也可以是一段话,在此不进行限制。训练样本都标注有(携带有)样本所描述对象的真实属性名称和与真实属性名称匹配的真实属性值。以训练样本中有一条鞋子描述文本“这双鞋子是白色的”为例,该文本同时标注有如下属性信息:颜色-白色;其中,“颜色”颜色为该文本中所描述鞋子的真实属性名称,“白色”为该文本中与“颜色”属性名称匹配的真实属性值。
36.步骤s104,获取待训练的初始模型针对训练样本输出的属性名称预测结果和属性值识别结果。
37.初始模型即为预先搭建的未被训练好的机器学习模型,在一些实施方式中,该初始模型可以为神经网络模型。将训练样本输入至初始模型,初始模型对训练样本进行识别,输出相应的属性名称预测结果和属性值识别结果。在一些具体的实施方式中,初始模型可以从句子层面上对训练样本进行分析以预测每句话可能表征的属性名称,并从字层面上对每句话中各个字进行分类,从而抽取出每句话中所包含的属性值。
38.步骤s106,计算属性名称预测结果和属性值识别结果的匹配程度。
39.诸如,对于训练样本“这双鞋子是白色的”而言,如果模型输出的属性名称预测结果为“颜色”,属性值识别结果为“白色”,则二者完全匹配。如果模型输出的属性名称预测结果为“尺寸”,属性值识别结果为“白色”,则二者不匹配。在一种实施方式中,可以预先设置用于衡量属性名称预测结果和属性值识别结果的匹配程度的损失函数,通过损失函数值客观表征属性名称预测结果和属性值识别结果的匹配程度。此外,还可以通过诸如余弦相似度算法等相关算法来衡量属性名称预测结果和属性值识别结果的匹配程度,在此不进行限制。在训练过程中,充分考虑了模型执行属性预测任务得到的属性名称预测结果以及模型执行属性值识别任务得到的关联性,从而能够有效避免模型执行两个独立任务得到的属性名称预测结果和属性值识别结果之间可能存在的不匹配问题。
40.步骤s108,根据真实属性名称、真实属性值、属性名称预测结果、属性值识别结果、以及属性名称预测结果和属性值识别结果的匹配程度对初始模型进行训练来获取信息识
别模型,以根据信息识别模型获取对象描述文本对应的属性名称和与属性名称相匹配的属性值。
41.诸如,通过真实属性名称与初始模型输出的属性名称预测结果之间的比较、真实属性值与初始模型输出的属性值识别结果之间的比较、以及结合属性名称预测结果和属性值识别结果的匹配程度,采用反向传播算法对初始模型进行训练,反复调整初始模型的参数,直至初始模型能够输出符合预期的属性名称预测结果和属性值识别结果时结束训练,并将完成训练的初始模型作为通过训练获取到的信息识别模型,该信息识别模型也即能够同时且准确地输出待识别的对象描述文本所描述对象的属性名称和与属性名称匹配的属性值。
42.本技术实施例提供的上述对象属性获取方法,通过标注有真实属性名称和与之匹配的真实属性值的训练样本对初始模型进行训练,而且在训练过程中充分考虑到了初始模型输出的属性名称预测结果和属性值识别结果的匹配程度,再结合真实属性名称和真实属性值共同对初始模型进行训练,使得最终通过训练方式获取到的信息识别模型能够直接获取对象描述文本的属性名称和与之相匹配的属性值,也即能够同时得到对象描述文本对应的属性名称和属性值,无需再针对每个待提取属性值的属性名称逐一尝试看能否从商品描述文本中提取对应的属性值,提高了对象属性的获取效率;此外,由于信息识别模型是基于属性名称预测结果和属性值识别结果的匹配程度训练得到,能够输出与属性名称匹配的属性值,有效提升了对象属性的获取准确率。
43.如上所述,本技术实施例中的信息识别模型针对对象描述文本输出的属性名称与属性值是相匹配的,也即经训练获取的信息识别模型可以针对对象描述文本直接输出准确的对象属性信息,能够避免相关技术直接依据属性名称提取属性值时可能出现的属性名称与属性值不匹配的问题。诸如,对于“这是一款白色的39码运动鞋”,倘若对这句话的对象属性信息识别正确,则应该得到:属性名称“颜色”以及与其相匹配的属性值“白色”,属性名称“尺寸”以及与其相匹配的属性值“39码”。而如果解析错误,则可能得到属性名称“颜色”对应的属性值为“39码”、属性名称“尺寸”对应的属性值为“白色”的错误属性信息识别结果。本技术实施例中的信息识别模型之所以能够直接输出正确的对象属性信息,主要原因在于训练过程中充分考虑到了模型输出的属性名称预测结果和属性值识别结果的匹配程度,使得到属性名称预测结果和属性值识别结果的任务执行过程并非独立,而是彼此相互约束,以尽可能使二者匹配,通过二者的匹配程度对模型进行训练,最终得到能够准确输出属性名称以及与其匹配的属性值的信息识别模型,以便进一步通过信息识别模型获取待识别的对象描述文本的属性信息。
44.为便于理解,在前述对象属性获取方法的实施例基础上,本技术实施例进一步提供了一种对象属性获取方法中所需的信息识别模型的获取方法,该实施例重点阐述了一种将初始模型训练成为信息识别模型的具体实施方式,参见图2所示的一种信息识别模型的获取方法流程图,主要包括如下步骤s202~步骤s214:
45.步骤s202,获取训练样本;训练样本标注有样本所描述对象的真实属性名称和与真实属性名称匹配的真实属性值。
46.步骤s204,获取待训练的初始模型针对训练样本输出的属性名称预测结果和属性值识别结果。
47.在一种实施方式中,属性名称预测结果是初始模型采用句子分类算法对训练样本进行处理得到;属性值识别结果是初始模型采用序列标注算法对训练样本进行处理得到。
48.步骤s206,将属性名称预测结果和属性值识别结果输入至预设的第一损失函数中,得到用于衡量属性名称预测结果和属性值识别结果的匹配程度的匹配程度损失函数值。
49.在训练过程中通过引入第一损失函数,可以对模型执行属性预测任务得到的属性名称预测结果以及模型执行属性值识别任务得到的属性值识别结果进行一致性约束,也即使模型输出的属性值识别结果与属性名称预测结果具有一定关联,而非相互独立,从而进一步保障属性值识别结果与属性名称预测结果相匹配。在一种具体的实施方式中,第一损失函数可以包括kl(kullback-leibler)损失函数,又可称之为kl散度损失函数。kl损失函数主要用于比较两个概率分布的接近程度,因此可将该函数应用于本技术实施例来衡量属性名称预测结果和属性值识别结果的匹配程度,二者通过kl损失函数进行衡量,kl损失函数指示二者越接近,则表征二者越匹配,采用kl损失函数可以更为客观地衡量属性名称预测结果和属性值识别结果的匹配程度。
50.步骤s208,将真实属性名称和属性名称预测结果输入至预设的第二损失函数,得到属性名称损失函数值。
51.在一种具体的实施方式中,第二损失函数可以包括交叉熵函数,通过交叉熵函数来衡量预测值(属性名称预测结果)与实际值(真实属性名称)的差异,可以理解的是,属性名称损失函数值越小,属性名称预测结果与真实属性名称越接近。
52.步骤s210,将真实属性值和属性值识别结果输入至预设的第三损失函数,得到属性值损失函数值。
53.在一种具体的实施方式中,第三损失函数也可以包括交叉熵函数,通过交叉熵函数来衡量预测值(属性值识别结果)与实际值(真实属性值)的差异。可以理解的是,属性值损失函数值越小,属性值识别结果与真实属性值越接近。
54.应当注意的是,上述第一损失函数、第二损失函数和第三损失函数分别可相同也可不同,本实施例不进行限制。
55.步骤s212,根据属性名称损失函数值、属性值损失函数值和匹配程度损失函数值计算总损失函数值。
56.在一种具体的实施方式中,可以为属性名称损失函数值、属性值损失函数值和匹配程度损失函数值分别赋予权重,然后通过加权方式得到总损失函数值,权重赋予方式可以灵活设置,诸如设置属性名称损失函数值、属性值损失函数值和匹配程度损失函数值的权重均相同。
57.步骤s214,根据总损失函数值对初始模型进行训练来获取信息识别模型。
58.通过本技术实施例提供的上述方法,通过三种损失函数分别来衡量属性名称预测结果与属性值识别结果的匹配程度、属性名称预测结果与真实属性名称的接近程度、属性值识别结果与真实属性值的接近程度,进而根据总损失函数值来对初始模型进行训练,以使最终训练获得的信息识别模型能够输出符合预期的属性名称预测结果与属性值识别结果,从而通过信息识别模型来提升对象属性获取效率和准确率。
59.在上述获取信息识别模型的实施例基础上,本技术实施例进一步提供了一种信息
识别模型的获取示例,参见图3所示的另一种信息识别模型的获取方法流程图,主要包括如下步骤s302~步骤s316:
60.步骤s302,获取训练样本;训练样本标注有样本所描述对象的真实属性名称和与真实属性名称匹配的真实属性值。
61.步骤s304,通过初始模型采用句子分类算法对训练样本进行处理,得到属性名称预测结果。
62.在本技术实施例中,初始模型可以通过执行句子分类任务来实现训练文本的属性名称预测,得到该文本对应的属性名称,也即得到属性名称预测结果。也即,初始模型通过对句子进行属性分类,来预测该句子所包含的属性名称。为便于理解,本实施例给出一种具体的实施方式:
63.使用bert(bidirectional encoder representations from transformers,基于转换器的双向编码表征)对训练文本进行编码,得到该训练文本的语义表示如下:h=(h0,h1,h2,
…
,hn),其中,h也可理解为句子序列向量,由多个语义向量构成,其中,句子的每个字都对应一个语义向量。n为输入文本的总长度。h0为[cls]向量,其中,cls为classification(分类)的缩写。初始模型基于句子序列向量中的[cls]向量对该文本进行句子分类,得到该文本中所包含的属性值对应的属性名称,一种实现方式中,初始模型可以基于以下公式预测得到该文本对应的属性名称ya:
[0064]
ya=σ(w1h0)
[0065]
其中,w1为可学参数,ya以向量形式表征。σ()即为西格玛函数。在实际应用中,可以预先建立向量与属性名称的对应关系,基于得到的向量即可直接获知其对应的具体属性名称。
[0066]
通过句子分类算法能够更为直接高效地在句子层面上预测每句话可能表征的属性名称。
[0067]
步骤s306,通过初始模型采用序列标注算法对训练样本进行处理,得到属性值识别结果。
[0068]
在本技术实施例中,初始模型可以通过执行序列标注任务来实现训练文本的属性值识别,得到该文本对应的属性值。属性值识别的过程也可理解为对句子序列向量中的每个语义向量hi进行分类,得到语义向量hi对应的属性值。初始模型可基于以下公式可确定该文本中每个字对应的语义向量hi为与属性名称匹配的属性值的概率
[0069][0070]
其中,w3为可学参数,softamx()为归一化指数函数。在实际应用中,可以进一步对于每个识别出的属性值以字母b、字母i来标注其属于起始字还是中间字,其中,b表征起始字(begin),i表征中间字(in)。假设初始模型对“这是一款白色的鞋”进行属性值识别及标注,则属性值“白”即可标注为“颜色b”,即为颜色属性的起始字,而属性值“色”即可标注为“颜色i”,即为颜色属性的中间字。在一种实施方式中,可以按照以下公式,进一步得到最有可能与属性名称匹配的属性值识别结果yv→a:
[0071]
[0072]
其中,表示每个字对应的语义向量hi为与属性名称匹配的属性值起始字的最大概率,表示每个字对应的语义向量hi为与属性名称匹配的属性值中间字的最大概率,yv→a即为最有可能与属性名称匹配的属性值识别结果。
[0073]
通过序列标注算法可以更为准确地提取出每句话中可能包含的属性值。
[0074]
步骤s308,将属性名称预测结果和属性值识别结果输入至预设的kl损失函数中,得到用于衡量属性名称预测结果和属性值识别结果的匹配程度的匹配程度损失函数值。
[0075]
其中,匹配程度损失函数loss
kl
以如下形式表征:
[0076]
loss
kl
=kl(ya||yv→a)
[0077]
ya为模型输出的属性名称预测结果,yv→a为最有可能与属性名称匹配的属性值识别结果,也即可以为模型输出的属性值识别结果,以下也可直接表示为yv。
[0078]
步骤s310,将真实属性名称和属性名称预测结果输入至预设的交叉熵损失函数,得到属性名称损失函数值。
[0079]
其中,属性名称损失函数lossa以如下形式表征:
[0080][0081]
ya为模型输出的属性名称预测结果,为训练样本标注的真实属性名称。
[0082]
步骤s312,将真实属性值和属性值识别结果输入至预设的交叉熵损失函数,得到属性值损失函数值。
[0083]
其中,属性值损失函数lossv以如下形式表征:
[0084][0085]yv
为模型输出的属性值识别结果,为训练样本标注的真实属性值。
[0086]
步骤s314,将属性名称损失函数值、属性值损失函数值和匹配程度损失函数值求和,得到总损失函数值。
[0087]
也即,总损失函数loss以如下形式表征:
[0088]
loss=lossa+lossv+loss
kl
[0089]
步骤s316,基于总损失函数值对初始模型进行训练,调整初始模型参数,直至训练结束得到信息识别模型。
[0090]
在上述训练方法中,通过kl损失函数衡量属性名称预测结果与属性值识别结果的匹配程度,交叉熵损失函数来分别衡量属性名称预测结果与真实属性名称的接近程度、属性值识别结果与真实属性值的接近程度,进而将得到的三个损失函数值求和,基于和值对初始模型进行训练,能够更为快速高效地训练出符合要求的信息识别模型,以便于基于信息识别模型进一步准确获取所需识别的对象描述文本的属性信息,提升对象属性获取效率和准确率。
[0091]
在通过上述任一训练方式获取到信息识别模型后,均可以采用信息识别模型得到待识别的对象描述文本所描述对象的属性名称及属性值,具体实现时,将待识别的对象描述文本输入至信息识别模型,然后通过信息识别模型对对象描述文本进行属性名称预测和属性值识别,得到对象描述文本对应的属性名称和与属性名称相匹配的属性值。
[0092]
为便于理解,以下给出一个可应用本技术实施例的具体示例进行说明。某电商平台需要获知某商品(以空调为例)的相关属性信息,假设该电商平台想要确定该空调的6个属性,但该空调已有的属性信息如下表1所示:
[0093]
属性名称品牌名型号匹数颜色能效能效等级属性值xx牌35gw/811.5 5.2 [0094]
表1
[0095]
如表1所示,该空调的颜色属性和能效等级属性都缺失与其匹配的属性值,而通过爬取技术得到描述该空调的一段文字(也即该空调的描述文本),通过本技术实施例提供的对象属性获取方法对该段文本进行识别,可抽取出该文本记载的该空调的属性信息。假设该空调描述文本中包含一句话为“该款空调是白色的,美观大方”,通过应用本技术实施例提供的对象属性获取方法,可以直接对其识别得出该句话对应的属性信息为“属性名称:颜色;属性值:白色”,从而将表1中的颜色相应的属性值进行补全。另外,假设空调描述文本中还包含一句话为“该空调为新一级能效,非常节能环保”,通过应用本技术实施例提供的对象属性获取方法,可以直接对其解析得出该句话对应的属性信息为“属性名称:能效等级;属性值:新一级能效”,从而将表1中的能效等级相应的属性值进行补全,最终完善空调的属性信息表。也即,将该空调描述文本输入至信息识别模型中,可以直接得到该文本对应的属性名称和属性值。而在相关技术中,可能就需要针对爬取到的每句话,逐一判断能否提取出属性名称“颜色”对应的属性值以及属性名称“能效等级”对应的属性值,较为繁琐,不仅效率低下,而且还可能针对“颜色”属性提取出并非与之匹配的“新一级能效”属性值,准确率不高。相比之下,本技术实施例提供的对象属性获取方法,通过训练获取到能够同时准确输出属性名称和与之匹配的真实属性值,不仅提高了对象属性获取效率,还提高了对象属性获取准确率。
[0096]
应当理解的是,以上仅是为便于理解,而针对本技术实施例提供的对象属性获取方法所举的一种应用示例,不应当被视为限制,在实际应用中,任何需要从对象描述文本中获取其所包含的属性信息的场景,都可采用本技术实施例提供的对象属性获取方法,在此不进行限制。
[0097]
对应于前述对象属性获取方法,本技术实施例进一步提供了一种对象属性获取装置,参见图4所示的一种对象属性获取装置的结构框图,该装置主要包括:
[0098]
样本获取模块42,用于获取训练样本;训练样本标注有样本所描述对象的真实属性名称和与真实属性名称匹配的真实属性值;
[0099]
结果获取模块44,用于获取待训练的初始模型针对训练样本输出的属性名称预测结果和属性值识别结果;
[0100]
匹配计算模块46,用于计算属性名称预测结果和属性值识别结果的匹配程度;
[0101]
属性获取模块48,用于根据真实属性名称、真实属性值、属性名称预测结果、属性值识别结果、以及属性名称预测结果和属性值识别结果的匹配程度对初始模型进行训练来获取信息识别模型,以根据信息识别模型获取对象描述文本对应的属性名称和与属性名称相匹配的属性值。
[0102]
本技术实施例提供的上述对象属性获取装置,通过标注有真实属性名称和与之匹配的真实属性值的训练样本对初始模型进行训练,而且在训练过程中充分考虑到了初始模
型输出的属性名称预测结果和属性值识别结果的匹配程度,再结合真实属性名称和真实属性值共同对初始模型进行训练,使得最终通过训练方式获取到的信息识别模型能够直接获取对象描述文本的属性名称和与之相匹配的属性值,也即能够同时得到对象描述文本对应的属性名称和属性值,无需再针对每个待提取属性值的属性名称逐一尝试看能否从商品描述文本中提取对应的属性值,提高了对象属性的获取效率;此外,由于信息识别模型是基于属性名称预测结果和属性值识别结果的匹配程度训练得到,能够输出与属性名称匹配的属性值,有效提升了对象属性的获取准确率。
[0103]
在一些实施例中,匹配计算模块46进一步用于:
[0104]
将属性名称预测结果和属性值识别结果输入至预设的第一损失函数中,得到用于衡量属性名称预测结果和属性值识别结果的匹配程度的匹配程度损失函数值。
[0105]
在一些实施例中,属性获取模块48进一步用于:
[0106]
将真实属性名称和属性名称预测结果输入至预设的第二损失函数,得到属性名称损失函数值;
[0107]
将真实属性值和属性值识别结果输入至预设的第三损失函数,得到属性值损失函数值;
[0108]
根据属性名称损失函数值、属性值损失函数值和匹配程度损失函数值计算总损失函数值;
[0109]
根据总损失函数值对初始模型进行训练来获取信息识别模型。
[0110]
在一些实施例中,第一损失函数包括kl损失函数。
[0111]
在一些实施例中,属性名称预测结果是初始模型采用句子分类算法对训练样本进行处理得到;属性值识别结果是初始模型采用序列标注算法对训练样本进行处理得到。
[0112]
在一些实施例中,属性获取模块48进一步用于:
[0113]
将待识别的对象描述文本输入至信息识别模型;
[0114]
通过信息识别模型对对象描述文本进行属性名称预测和属性值识别,得到对象描述文本对应的属性名称和与属性名称相匹配的属性值。
[0115]
本实施例所提供的装置,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容,在此不再赘述。
[0116]
基于本技术的实施例,本技术还提供了一种电子设备,至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行前述任一项对象属性获取方法。
[0117]
基于本技术的实施例,本技术还提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行根据本技术实施例提供的前述任一项的对象属性获取方法。
[0118]
基于本技术的实施例,本技术还提供了一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现根据本技术实施例提供的前述任一项的对象属性获取方法。
[0119]
图5示出了可以用来实施本技术的实施例的示例电子设备500的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字
助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本技术的实现。
[0120]
如图5所示,设备500包括计算单元501,其可以根据存储在只读存储器(rom)502中的计算机程序或者从存储单元508加载到随机访问存储器(ram)503中的计算机程序,来执行各种适当的动作和处理。在ram 503中,还可存储设备500操作所需的各种程序和数据。计算单元501、rom 502以及ram 503通过总线504彼此相连。输入/输出(i/o)接口505也连接至总线504。
[0121]
设备500中的多个部件连接至i/o接口505,包括:输入单元506,例如键盘、鼠标等;输出单元507,例如各种类型的显示器、扬声器等;存储单元508,例如磁盘、光盘等;以及通信单元509,例如网卡、调制解调器、无线通信收发机等。通信单元509允许设备500通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
[0122]
计算单元501可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元501的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。计算单元501执行上文所描述的各个方法和处理,例如对象属性获取方法。例如,在一些实施例中,对象属性获取方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元508。在一些实施例中,计算机程序的部分或者全部可以经由rom 502和/或通信单元509而被载入和/或安装到设备500上。当计算机程序加载到ram 503并由计算单元501执行时,可以执行上文描述的方法xxx的一个或多个步骤。备选地,在其他实施例中,计算单元501可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行对象属性获取方法。
[0123]
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、负载可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
[0124]
用于实施本技术的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
[0125]
在本技术的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电
子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
[0126]
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入、或者触觉输入)来接收来自用户的输入。
[0127]
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)、互联网和区块链网络。
[0128]
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与vps服务("virtual private server",或简称"vps")中,存在的管理难度大,业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器,或者是结合了区块链的服务器。
[0129]
根据本技术实施例提供的对象属性获取方法,通过标注有真实属性名称和与之匹配的真实属性值的训练样本对初始模型进行训练,而且在训练过程中充分考虑到了初始模型输出的属性名称预测结果和属性值识别结果的匹配程度,再结合真实属性名称和真实属性值共同对初始模型进行训练,使得最终通过训练方式获取到的信息识别模型能够直接获取对象描述文本的属性名称和与之相匹配的属性值,也即能够同时得到对象描述文本对应的属性名称和属性值,无需再针对每个待提取属性值的属性名称逐一尝试看能否从商品描述文本中提取对应的属性值,提高了对象属性的获取效率;此外,由于信息识别模型是基于属性名称预测结果和属性值识别结果的匹配程度训练得到,能够输出与属性名称匹配的属性值,有效提升了对象属性的获取准确率。
[0130]
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本技术公开的技术方案所期望的结果,本文在此不进行限制。
[0131]
上述具体实施方式,并不构成对本技术保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本技术的精神和原则之内所作的修改、等同替换和改进等,均应包含在本技术保护范围之内。