一种商品排重方法和系统的制作方法
【技术领域】
[0001] 本发明涉及电子商务领域,尤其涉及一种商品排重方法和系统。
【背景技术】
[0002] 随着互联网技术的飞速发展以及人们消费观念的逐渐转变,电子商务开始迅猛发 展,电子商务平台随着海量商家的入驻,对千万级商品的管理成为开放电子商务平台的难 题,商品重复过多,消费者在前台搜索后出现的商品太多,为消费者挑选商品造成了困难, 同时也为电子商务平台的管理带来了不便。
【发明内容】
[0003] 本发明所要解决的技术问题是,提供一种商品排重方法和系统,以解决由于商品 重复过多,商家、商品难以管理,商家搜索商品造成的一品多商的问题。
[0004] 本发明解决上述技术问题所采用的技术方案是提供一种商品排重方法,该方法包 括步骤:
[0005] Sl、根据商品类型和商品属性定制排重模板;
[0006] S2、获取商家申请商品的所述商品类型和商品属性;
[0007] S3、根据所述商品类型调用相应模板,根据所述商品属性计算相似度分值;
[0008] S4、将所述相似度分值与所述排重模版的排重阈值相比较;
[0009] S5、若所述分值大于所述阈值,则所述商品重复;
[0010] S6、若所述分值小于所述阈值,则新建所述商品。
[0011] 优选地,步骤Sl中,所述排重模板包括所述商品属性的排重阈值、排重参数和所 述参数的权重,其中,所述排重参数包括品牌、重量和体积等参数。
[0012] 优选地,步骤S3中,将所述商品属性输入到solr (企业级搜索应用服务器)中,查 询并打分,得到所述相似度分值。
[0013] 优选地,在所述solr中得到所述相似度分值包括步骤:
[0014] S301、读取用户输入的查询词;
[0015] S302、所述solr对所述查询词进行分词处理,将所述分词输入到所述solr中进行 查询;
[0016] S303、根据相似度计算公式
[0017]
[0018] 计算所述相似度分值,其中,
[0019] q为所述查询词,t为所述分词,d为所述查询词需匹配的模板;
[0020] tf (t in d)统计所述分词t在所述模板中的词频;
[0021] boost (t,field in d)在索引过程中设置字段参数;
[0022] lengthNorm(t, feild in d)计算在索引过程存储的分词的数目;
[0023] S304、将得到的所述相似度分值由高到低排列并返回至商家。
[0024] 优选地,步骤S303中,所述相似度分值score (t)在(0, 1]之间,分值越高,所述查 询词与所述模板d匹配度越高。
[0025] 另一方面,本发明提供一种商品排重系统,所述系统包括:
[0026] 模板制定单元,用于根据商品类型和商品属性制定排重模版;
[0027] 第一输入单元,用于输入商家申请的所述商品类型和商品属性;
[0028] solr计算单元,用于根据所述商品类型调用相应模板,并根据所述商品属性计算 相似度分值;
[0029] 判断单元,用于判断所述相似度分值是否超过所述排重模板中的阈值,若超过,则 所述商品重复,若未超过,则新建所述商品。
[0030] 优选地,所述排重模版包括所述商品属性的排重阈值、排重参数和所述参数的权 重,其中,所述排重参数包括品牌、重量和体积等参数。
[0031] 优选地,所述solr计算单元将所述商品属性输入到solr(企业级搜索应用服务 器)中,查询并打分,得到所述相似度分值。
[0032] 优选地,所述solr计算单元包括:
[0033] 第二输入单元,用于将商家输入的查询词输入到所述solr中;
[0034] 分词单元,用于对所述查询词进行分词处理;
[0035] 打分单元,用于根据相似度计算公式计算所述相似度分值;
[0036] 输出单元,用于按照得分高低排列所述相似度分值,并将查询结果输出至商家。
[0037] 优选地,所述打分单元中得到的所述相似度分值在(0, 1]之间,分值越高,所述查 询词与所述排重模板匹配度越高。
[0038] 本发明中,根据所述商品类型调用相应的排重模板,利用所述商品属性计算相似 度分值,并将所述相似度分值与设定好的阈值相比较,确定该商品是否重复,滤除掉大部分 重复商品,防止重复商品过多、商家和商品难以管理,同时,解决了同一商品多个商家重复 申请的问题。
【附图说明】
[0039] 图1是本发明的一个优选实施例中商品排重方法的流程图;
[0040]图2是本发明的一个优选实施例中商品排重系统的结构图。
【具体实施方式】
[0041] 以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明 的保护范围。说明书后续描述为实施本发明的较佳实施方式,然所述描述乃以说明本发明 的一般原则为目的,并非用以限定本发明的范围。本发明的保护范围当视所附权利要求所 界定者为准。
[0042] 下面结合附图和具体实施例对本发明做进一步详细说明。
[0043] 如图1所示,为本发明的一个优选实施例,公开了一种商品排重方法,该方法包含 步骤:
[0044] Sl、根据商品类型和商品属性定制排重模板;
[0045] S2、获取商家申请商品的商品类型和商品属性;
[0046] S3、根据商品类型调用相应模板,根据商品属性计算相似度分值;
[0047] S4、将相似度分值与排重模版的排重阈值相比较;
[0048] S5、若分值大于所述阈值,则商品重复;
[0049] S6、若分值小于阈值,则新建商品。
[0050] 本实施例中,根据商品类型调用相应的排重模板,利用商品属性计算相似度分值, 并通过与设定好的阈值相比较,确定该商品是否重复,这样可以根据对阈值的设定滤除掉 大部分重复商品,防止重复商品过多,商家和商品难以管理,解决了同一商品多个商家重复 申请的问题。
[0051] 进一步地,步骤Sl中,排重模板包括商品属性的排重阈值、排重参数和参数的权 重,其中,排重参数包括品牌、重量和体积等参数。
[0052] 本实施例中,排重模板包括阈值和品牌、重量以及体积等参数以及这些参数所占 的权重,能够使电子商务平台客观的根据商家输入的商品类型和属性判断该商品与排重模 板之间的相似度。
[0053] 进一步地,步骤S3中,将商品属性输入到solr (企业级搜索应用服务器)中,查询 并打分,得到相似度分值。
[0054] 进一步地,在solr中得到相似度分值包括步骤:
[0055] S301、读取用户输入的查询词;
[0056] S302、solr对查询词进行分词处理,将分词输入到solr中进行查询;
[0057] S303、根据相似度计算公式
[0058]
[0059] 计算相似度分值,其中,
[0060] q为查询词,t为分词,d为查询词需匹配的模板;
[0061] tf (t in d)统计分词t在模板中的词频;
[0062] boost (t,field in d)在索引过程中设置字段参数;
[0063] lengthNorm(t, feild in d)计算在索引过程存储的分词的数目;
[0064] S304、将得到的相似度分值由高到低排列并返回至商家。
[0065] 更进一步地,步骤S303中,