本发明涉及图像处理,更具体地说,本发明涉及一种基于图像处理的门户网站审核方法。
背景技术:
1、随着互联网的全球性发展,人们的生活和生产方式都产生了深远的影响,门户网站最初提供搜索引擎、目录服务,后来由于市场竞争日益激烈,门户网站不得不快速地拓展各种新的业务类型,希望通过门类众多的业务来吸引和留住互联网用户,以至于门户网站的业务包罗万象,成为网络世界的“百货商场”或“网络超市”。
2、目前现有的门户网站审核方法主要包括人工审核,通过雇佣专业的内容审核人员或建立审核团队,对发布的内容进行逐一审查,他们会基于网站的规定和法律法规的要求,去除审核过程中的一些复杂或灰色内容,同时,为了确保审核的准确性和合法性,审核人员会定期接受培训,更新自己的判断标准,以应对不断变化的内容形式和审核要求。
3、但是其在实际使用时,仍旧存在一些缺点,如人工审核需要大量的人力资源和时间成本,尤其是在内容量巨大的情况下,审核效率可能会受到影响,虽然技术审核可以提高效率,但由于算法和模型的局限性,可能会出现误判和漏判的情况,不同的审核人员可能对同一内容有不同的判断标准,这可能导致审核结果的不一致性和不公平性,随着网络技术的发展,新的内容形式不断涌现,现有的审核方法可能对这些新形式内容的应对不足,需要不断更新和完善。
技术实现思路
1、为了克服现有技术的上述缺陷,本发明的实施例提供一种基于图像处理的门户网站审核方法,通过以下方案,以解决上述背景技术中提出的问题。
2、为实现上述目的,本发明提供如下技术方案:一种基于图像处理的门户网站审核方法,包括:
3、步骤s1:审核区域划分步骤:用于将目标门户网站的审核内容确定为目标数据区域,通过等时间划分的方式将目标数据区域划分为各子数据区域,并依次标记为1、2……n。
4、步骤s2:审核内容采集步骤:用于采集目标门户网站的图片并通过图像处理技术采集各子数据区域的网站流量参数、页面内容参数以及产品销售参数,并传输到审核内容分析步骤。
5、步骤s3:审核内容分析步骤:包括网络流量分析单元、页面内容分析单元以及产品销售分析单元,各分析单元用于建立分析模型,将审核内容采集步骤传输的参数导入到分析模型中计算得出各子数据区域的流量变化系数、页面内容变化系数以及产品销售变化系数,并传输到异常指数计算步骤。
6、步骤s4:异常指数计算步骤:用于建立异常指数计算模型,将审核内容分析步骤传输的分析结果导入异常指数计算模型,计算得出各子数据区域的异常指数,并传输到综合分析步骤。
7、步骤s5:综合分析步骤:用于建立综合分析模型,将各异常指数计算步骤传输的各子数据区域的异常指数导入综合分析模型,计算得出目标门户网站的综合异常指数,通过综合异常指数安全阈值对目标门户网站的综合异常指数进行审核,并将审核结果传输到人工审核步骤。
8、步骤s6:人工审核步骤:用于接收综合分析步骤传输的需要人工审核状态的门户网站,并对需要人工审核状态的门户网站进行人工审核。
9、优选的,所述审核内容采集步骤通过图像处理技术在目标门户网站的每个页面上设置图像标签,当访客访问页面时,图像标签会采集记录访客的行为数据,并通过分析访客在页面上的鼠标移动轨迹或键盘敲击次数来采集各子数据区域的网站流量数据,通过将目标门户网站的页面内容图片上传到光学字符识别工具中,光学字符识别工具会自动识别图片中的文字并将其转换为数字信息的方式采集页面内容参数,通过在目标门户网站的产品图片上设置图像标签,当访客访问页面时,图像标签会自动记录产品的信息,并通过光学字符识别工具识别图片数字的方式采集产品销售参数。
10、优选的,所述网站流量参数包括访问数、独立访客数、跳出率以及转化率,分别标记为lfi、ldi、lti以及lhi,页面内容参数包括内容长度、内容更新频率、内部链接数量以及关键词密度,分别标记为yci、ypi、ysi以及ymi,产品销售参数包括销售额、订单量、退货量以及重复购买率,分别标记为xei、xbi、xqi以及xui,其中i=1、2……n,i表示第i个子数据区域。
11、优选的,所述网络流量分析单元用于建立网络流量分析模型,将网络流量参数导入网络流量分析模型得到:li表示第i个子数据区域的流量变化系数,lfi表示第i个子数据区域的访问数,ldi表示第i个子数据区域的独立访客数,lti表示第i个子数据区域的跳出率,lhi表示第i个子数据区域的转化率,μ1表示流量变化系数的其他影响因子。
12、优选的,所述页面内容分析单元用于建立页面内容分析模型,将页面内容参数导入页面内容分析模型得到:表示第i个子数据区域的页面内容变化系数,yci表示第i个子数据区域的内容长度,ypi表示第i个子数据区域的内容更新频率,ysi表示第i个子数据区域的内部链接数量,ymi表示第i个子数据区域的关键词密度,μ2表示页面内容变化系数的其他影响因子。
13、优选的,所述产品销售分析单元用于建立产品销售分析模型,将产品销售参数导入产品销售分析模型得到:xi表示第i个子数据区域的产品销售变化系数,xei表示第i个子数据区域的销售额,xbi表示第i个子数据区域的订单量,xqi表示第i个子数据区域的退货量,xui表示第i个子数据区域的重复购买率,μ3表示产品销售变化系数的其他影响因子。
14、优选的,所述异常指数计算模型为:ηi表示第i个子数据区域的异常指数,li表示第i个子数据区域的流量变化系数,yi表示第i个子数据区域的页面内容变化系数,xi表示第i个子数据区域的产品销售变化系数,l0表示流量变化系数预设安全值,y0表示页面内容变化系数预设安全值,x0表示产品销售变化预设安全值,λ异常指数的其他影响因子。
15、优选的,所述综合分析模型为:η表示目标门户网站的综合异常指数,ηi表示第i个子数据区域的异常指数,综合异常指数安全阈值为:表示综合异常指数最大安全阈值,表示综合异常指数最小安全阈值,当时,说明目标门户网站没有异常情况发生,当或当时,说明目标门户网站有异常情况发生,并将目标门户网站标记为需要人工审核的状态。
16、本发明的技术效果和优点:
17、本发明通过图像处理技术,可以快速识别图片内容,可以减轻人工审核的负担,提高审核效率,本发明可以减少人为因素导致的误判和漏判,提高审核的准确性,本发明通过图像处理方法,可以减少对大量图片进行人工审核的需求,可以降低人力成本,使得门户网站能够更高效地进行管理,同时节省了人力资源,本发明可以促进技术创新,推动门户网站审核技术的不断发展和完善。
1.一种基于图像处理的门户网站审核方法,包括,其特征在于:
2.根据权利要求1所述的一种基于图像处理的门户网站审核方法,其特征在于:所述审核内容采集步骤通过图像处理技术在目标门户网站的每个页面上设置图像标签,当访客访问页面时,图像标签会采集记录访客的行为数据,并通过分析访客在页面上的鼠标移动轨迹或键盘敲击次数来采集各子数据区域的网站流量数据,通过将目标门户网站的页面内容图片上传到光学字符识别工具中,光学字符识别工具会自动识别图片中的文字并将其转换为数字信息的方式采集页面内容参数,通过在目标门户网站的产品图片上设置图像标签,当访客访问页面时,图像标签会自动记录产品的信息,并通过光学字符识别工具识别图片数字的方式采集产品销售参数。
3.根据权利要求1所述的一种基于图像处理的门户网站审核方法,其特征在于:所述网站流量参数包括访问数、独立访客数、跳出率以及转化率,分别标记为lfi、ldi、lti以及lhi,页面内容参数包括内容长度、内容更新频率、内部链接数量以及关键词密度,分别标记为yci、ypi、ysi以及ymi,产品销售参数包括销售额、订单量、退货量以及重复购买率,分别标记为xei、xbi、xqi以及xui,其中i=1、2……n,i表示第i个子数据区域。
4.根据权利要求1所述的一种基于图像处理的门户网站审核方法,其特征在于:所述网络流量分析单元用于建立网络流量分析模型,将网络流量参数导入网络流量分析模型得到:li表示第i个子数据区域的流量变化系数,lfi表示第i个子数据区域的访问数,ldi表示第i个子数据区域的独立访客数,lti表示第i个子数据区域的跳出率,lhi表示第i个子数据区域的转化率,μ1表示流量变化系数的其他影响因子。
5.根据权利要求1所述的一种基于图像处理的门户网站审核方法,其特征在于:所述页面内容分析单元用于建立页面内容分析模型,将页面内容参数导入页面内容分析模型得到:yi表示第i个子数据区域的页面内容变化系数,yci表示第i个子数据区域的内容长度,ypi表示第i个子数据区域的内容更新频率,ysi表示第i个子数据区域的内部链接数量,ymi表示第i个子数据区域的关键词密度,μ2表示页面内容变化系数的其他影响因子。
6.根据权利要求1所述的一种基于图像处理的门户网站审核方法,其特征在于:所述产品销售分析单元用于建立产品销售分析模型,将产品销售参数导入产品销售分析模型得到:xi表示第i个子数据区域的产品销售变化系数,xei表示第i个子数据区域的销售额,xbi表示第i个子数据区域的订单量,xqi表示第i个子数据区域的退货量,xui表示第i个子数据区域的重复购买率,μ3表示产品销售变化系数的其他影响因子。
7.根据权利要求1所述的一种基于图像处理的门户网站审核方法,其特征在于:所述异常指数计算模型为:ηi表示第i个子数据区域的异常指数,li表示第i个子数据区域的流量变化系数,yi表示第i个子数据区域的页面内容变化系数,xi表示第i个子数据区域的产品销售变化系数,l0表示流量变化系数预设安全值,y0表示页面内容变化系数预设安全值,x0表示产品销售变化预设安全值,λ异常指数的其他影响因子。
8.根据权利要求1所述的一种基于图像处理的门户网站审核方法,其特征在于:所述综合分析模型为:η表示目标门户网站的综合异常指数,ηi表示第i个子数据区域的异常指数,综合异常指数安全阈值为:表示综合异常指数最大安全阈值,表示综合异常指数最小安全阈值,当时,说明目标门户网站没有异常情况发生,当或当时,说明目标门户网站有异常情况发生,并将目标门户网站标记为需要人工审核的状态。