电子商务客户评价鉴别系统的制作方法

文档序号:8544228阅读:359来源:国知局
电子商务客户评价鉴别系统的制作方法
【技术领域】
[0001] 本发明设及互联网领域,特别设及电子商务客户评价鉴别系统。
【背景技术】
[0002] 在当代,随着互联网的普及,电子商务已经成为一种被广泛利用的商业贸易方式。 买卖双方主要是通过电商的网页或者是软件进行交易活动。由于电子商务没有传统的实体 店面,对销售人员的数量要求也不高,所W相比传统交易模式更能够控制运营成本,因而有 着更大的价格优势。但是,有很多不法商家为了提高自己的销量从而雇佣专业刷评价团队 也制造大量的虚假评价来对自己的商品进行虚假的宣传,从而欺骗消费者来提高自己的真 实销量。
[0003] 目前电子商务的发展迅猛,体量巨大,电商环境中的卖家数量众多,用户在进行购 买决定时难W判断商品描述的真实性,对商品评价的依赖度很高,由于卖家评价作弊而造 成的商品的性能好评度虚高的情况引起的买家利益损失的情况严重。在该样的情况下,如 何对电子商务中商家的评价作弊行为进行识别和判断成电子商务发展过程中亟待解决的 问题;在判断虚假评价过程中如何提高判断的准确性,避免误判情况的发生也是十分重要 的考量因素;目前现有技术中还缺乏准确有效的相关设备来实现相关的判断过程。

【发明内容】

[0004] 为了解决现有技术中存在的问题,本发明提供了电子商务客户评价鉴别系统,通 过内容相似性判断模块对目标商品中的评价内容进行识别;在此基础上通过ID相似性判 断模块来识别相同或者相似评价内容所对应的评价ID是否相同或者相似,并且在判断出 相同和相似ID的基础上通过作弊因子判断模块,来鉴别出作弊的评价ID,进而来判断专业 刷评价人员所给出的大量虚假评价;实现了目标商品评价中虚假评价的自动识别,虚假评 价判断过程较为严格,判断结果准确;为电商环境管理者和商品消费者提供了简单可靠的 评价辨识工具。
[0005] 为了实现上述发明目的,本发明提供了W下技术方案:
[0006] 电子商务客户评价鉴别系统;包括客户机、网络连接装置、内容相似性判断模块、 ID相似性判断模块W及作弊因子判断模块;其中所述客户机一端通过网络连接装置来获 取目标商品的相关评价数据信息(目前通过爬虫技术可W很方便的获取到目标网页中的 相关信息,提取的速度快,可分析数据的总量巨大,所提取数据的分析方法成熟,成本低 廉);所述客户机的另一端与所述内容相似性判断模块的输入端相连,所述内容相似性判 断模块的输出端与作弊因子判断模块的输入端相连。
[0007] 所述客户机将获取到的目标商品评价信息输出到内容相似性判断模块中,在所述 内容相似性判断模块判断出相同和相似评价内容的基础上,所述ID相似性判断模块判断 出该些评价内容的ID是否相同或者相似,并将判断出的相似ID输入到作弊因子判断模块 中;如果该些ID所发出评价的频率高于阔值,所述作弊因子判断模块则将该些ID判断为虚 假评价ID。
[000引 目前如果商家想要通过虚假交易和评价来提高系统显示商品的销量和好评情况, 所需要的虚假评价的数量较大,在该样的情况下人为捏造的评价往往在评价内容上具有较 高的相似性,或者就直接W相同的内容出现,本发明中的内容相似性判断模块通过比较目 标商品评价数据中的内容文本的相似性(目前文本相似性比较的判断方法已经比较成熟, 比如说可W采取余弦相似比较来判断文本内容之间的相似程度,当相似程度超过预设的阔 值,则可认为被比较的文本内容相似),统计内容相同评价的数量,判断出内容相似的评价, 并统计出内容相似评价的数量。但是仅仅通过评价内容相同或者相似来判断某些评价为虚 假评价的方式并不准确,因为在实际生活中商品购买者为了方便给出评价,往往会参考其 他评价的内容,甚至为了省事会直接复制别人的评价内容是,该样就产生了一些内容相同 或者相似的真实的评价内容,为了更加准确的判断出虚假评价,本发明在相同或者相似评 价内容判断的基础上,通过ID相似性判断模块来进一步判断该些相同和相似评价内容所 对应的评价ID是否相同或者相似。
[0009] 目前职业刷评价团队会人工或者利用自动注册机来注册很多小号(所谓的小号 是指,同一个人注册和使用的不同的ID号),该些职业评价团队所注册和使用的小号ID 具有一定规律性;一般情况下职业评价师所注册的一系列ID号也是根据系统推荐或者自 动生成的,该样的方式所产生的ID号会具有较大的关联性和相似性,比如说ABC1、ABC2、 ABC3、ABC4、AB巧.....AB化。通过对评价ID的文本相似性比较就可W判断出相同或者相似 评价内容所对应的评价ID是否相同或者相似;如果相同或者相似,那么该些ID为虚假ID的可能性很高。
[0010] 为了进一步提高虚假评价判断的准确性,使判断的结果更加严格,所述ID相似性 判断模块将判断结果输入到所述作弊因子判断模块中;所述作弊因子判断模块在判断出的 相同或者相似ID的基础上,分析对应ID发出评价的频率和时间,将对应ID发出评价的频 率与目标商品评价的平均评价频率进行比较,如果其比值高于设定的阔值,则将该些评价 ID判断为虚假评价ID,通过本系统所判断虚假评价的过程严格,判断结果准确性高。
[0011] 作为一种优选,所述内容相似性判断模块为相似评价内容判断服务器;所述ID相 似性判断模块为相似评价ID判断服务器;所述作弊因子判断模块为作弊因子判断服务器。 所述相似评价内容判断服务器、相似评价ID判断服务器W及作弊因子判断服务器通过数 据连接线依次相连。服务器在处理能力、稳定性、可靠性、安全性、可扩展性、可管理性等方 面表现优秀,通过服务器来完成相关的内容相似性,ID相似性的相关判断,可快速处理大量 电商目标商品的相关数据,处理速度快,效率高。
[0012] 进一步的,所述作弊因子判断模块还通过数据连接线与虚假评价标记模块相连。 所述虚假评价标记模块为虚假评价标记服务器,所述虚假评价标记模块根据所述作弊因子 判断模块的输出结果将判断出的虚假评价标记出来。本发明对目标商品的评价的真实性进 行科学分析和合理的判断,鉴别出目标商品评价中的虚假评价,并通过对虚假评价的标记, 直观的将电商的评价作弊的不诚信行为展示到商品买家和电商管理者面前;有利于电子商 务环境的净化,维护了商品购买者和诚信卖家的合理利益,提高商家信誉的可信度;有助于 电商行业的健康发展。
[0013] 与现有技术相比,本发明的有益效果:本发明提供电子商务客户评价鉴别系统。通 过客户机访问目标商品的网址,爬取对应商品网页的评价数据;并通过服务器对爬取到的 评价数据进行判断,分析评价数据中评价内容,统计相同评价内容的出现数量,并通过文本 比较算法来计算其他评价内容的相似概率;将该相似概率与通过机器学习方法所得出的评 价内容相似阔值进行比较,判定出相似的评价内容,并统计结果;通过对评价ID进行分析, 统计出相同ID的数量,并判断其他ID的相似概率,将相
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1