一种基于RPA机器人的商品展示页违禁词检查方法与流程

文档序号:28067628发布日期:2021-12-17 23:57阅读:122来源:国知局
一种基于RPA机器人的商品展示页违禁词检查方法与流程
一种基于rpa机器人的商品展示页违禁词检查方法
技术领域
1.本发明涉及rpa技术领域,具体涉及一种基于rpa机器人的商品展示页违禁词检查方法。


背景技术:

2.机器人流程自动化(robotic process automation)简称rpa,是通过机器人软件,模拟人在计算机上的操作,按规则自动执行流程任务。随着企业信息数据日益增多,促使企业对rpa产生了极大依赖,rpa产品通过模拟人对计算机的操作,不仅可以高效完成大量重复性工作,还可以高质量地实现大规模数据的处理,极大提高了办公效率。但对于用户而言,rpa流程的设计,开发依旧存在比较高的技术门槛,需要具备一定编程基础才能开发设计。目前,对rpa流程设计通常需要由专业的技术人员根据具体需求进行开发,各个子流程之间的衔接也需要用户手动配置,每个参数的确定也需要用户参与,对用户的专业程度要求较高,普通技术人员或流程运营人员难以进行rpa流程设计,极大的限制的rpa的应用发展。
3.电子商务实现了人们不出门就可以选购全世界范围内商品,因为商品无法近距离查看,只能通过网络在商品详情页查看该商品的相关介绍,此时商品详情页文字描述和商品图片就在其中扮演了重要角色。电商平台高销量的构成大部分来自于视觉冲击,图片和描述的重要性由此体现。在商品详情页的描述展示都属于广告范畴,有些特定的关键词属于广告规定的违禁词,是不能展示在商品描述中。当前电子商务平台众多,企业往往需要花费大量的人力用于检查这一项工作,因此急需一种基于rpa机器人检查各个平台商品描述是否存在广告违禁词的方法。


技术实现要素:

4.本发明的目的在于,提供一种基于rpa机器人的商品展示页违禁词检查方法。本发明可以使用户通过rpa机器人来进行电商平台商品违禁词的检查,可以提高工作效率,降低人工成本。
5.为解决上述技术问题,本发明提供的技术方案如下:一种基于rpa机器人的商品展示页违禁词检查方法,包括:
6.在rpa机器人中通过指令编排搭建rpa应用流程;
7.通过rpa应用流程在电商平台中对商品展示页违禁词检查,包括:
8.步骤s1、在rpa应用流程中配置违禁词格式,输入商品链接以及自定义商品违禁词;
9.步骤s2、去除违禁词和商品链接中的无效数据和重复数据,形成检查表格;
10.步骤s3、rpa应用流程遍历检查表格中的商品链接,依次打开到对应平台商品详情页,获取商品详情页文本信息,判断是否存在违禁词,存在则记录;并下载详情页图片,再利用ocr技术识别下载详情页图片上文本内容,若存在违禁词则记录;
11.步骤s4、根据商品详情页文本信息的记录和商品详情页图片上文本内容的记录形成检查结果。
12.上述的基于rpa机器人的商品展示页违禁词检查方法,步骤s1中,通过手动输入、复制粘贴或excel批量导入进行输入商品链接以及自定义商品违禁词;
13.其中,所述手动输入是通过则双击表格单元,在表格单元出现输入光标后,输入对应的备注信息;
14.所述复制粘贴是通过在选中的单元格中粘贴所复制的内容或通过选择复制excel内容进行粘贴,
15.所述excel批量导入是通过弹出文件选择对话框,选择指定导入的excel文件,并选择要导入的sheet页,设置是否需要将第一行内容作为表头。
16.前述的基于rpa机器人的商品展示页违禁词检查方法,步骤s2中,去除违禁词和商品链接中的无效数据和重复数据,形成检查表格的过程具体是,
17.步骤s2.1、将电商平台的默认违禁词和自定义商品违禁词合并,去除重复的违禁词,形成违禁词变量;
18.步骤s2.2、读取用户输入的商品链接,去除重复的商品链接和为空的商品链接,形成商品链接数据;
19.步骤s2.3、将商品链接数据和违禁词变量写入数据表格,形成检查表格。
20.前述的基于rpa机器人的商品展示页违禁词检查方法,所述步骤s3的具体过程如下:
21.步骤s3.1、对检查表格进行行循环,从第一行循环遍历到最后一行;
22.步骤s3.2、循环遍历到一行数据,获取该行商品链接数据;
23.步骤s3.3、根据循环到的商品链接依次打开平台商品详情页,若检测到打开网页失败,记录失败原因,忽略本次循环,进行下一次循环;否则执行步骤s3.4;
24.步骤s3.4、获取商品详情页文本信息,并下载商品链接详情页的图片到本地;
25.步骤s3.5、循环商品详情页文本信息中是否存在违禁词,若存在则记录;
26.步骤s3.6、获取下载图片的尺寸大小;若图片高度大于2000dpi,则横向切割图片,将图片等比切割,生成图片列表,再执行步骤3.7;否则直接执行步骤3.7;
27.步骤s3.7、依次通过ocr技术识别图片文本内容;
28.步骤s3.8、基于步骤s3.7识别到的文本,循环检查图片文本内容本中是否存在违禁词,若存在则记录。
29.前述的基于rpa机器人的商品展示页违禁词检查方法,所述指令编排包括指令添加,指令编辑和指令折叠;
30.所述指令添加是将指令集列表中的指令添加到rpa机器人的流程设计器中;
31.所述指令编辑是对添加到流程设计器中的指令进行编辑;
32.所述指令折叠是将流程设计器中指定位置和数量的指令进行折叠,并添加注释,提高流程指令的管理效率。
33.前述的基于rpa机器人的商品展示页违禁词检查方法,所述指令添加具体实现如下:
34.a1、所述流程设计器检测到新增指令,判断指令新增的方式,如果是拖拽方式,则
执行步骤a2;如果是双击方式,则执行步骤a3;
35.a2、检测到为拖拽添加方式,获取鼠标拖拽的坐标位置,根据坐标得出最佳指令放置位置;
36.a3、检测到为双击添加方式,获取当前流程设计器中选中的流程所在位置,设置新增指令位置为选中位置加一;
37.a4、确定添加指令位置后,在流程设计器的指令列表中指定位置插入新增指令,再刷新指令列表;
38.a5、检测所添加的指令是否有参数需要配置,如果没有,添加完成;如果有,则执行步骤s6。
39.a6、弹出新增指令的参数配置界面,完成参数配置。
40.前述的基于rpa机器人的商品展示页违禁词检查方法,步骤a4中,在流程设计器的指令列表中指定位置插入新增指令,具体是,
41.a4.1、检测拖拽放置坐标处是否已有指令,如果没有,直接添加到当前流程设计器列表的最新位置,如果已有指令,执行a4.2;
42.a4.2、计算当前鼠标位置在这个已有指令界面上的相对坐标,如果相对坐标的y坐标小于指令界面高度的一半,即在这个指令界面的上半段,则插到此指令的前面,反之,则执行a4.3;
43.a4.3、如果相对坐标的y坐标大于或者等于指令界面高度的一半即在这个指令界面的下半段,则插到此指令的后面。
44.前述的基于rpa机器人的商品展示页违禁词检查方法,所述指令编辑包括指令移动、指令复制、指令剪切、指令粘贴、指令删除、指令撤销和指令重做;
45.所述指令移动是将指令集列表中的指令移动到流程设计器中或在流程设计器内移动指令从而调整指令的位置顺序;
46.所述指令复制是获取到当前所有选中的指令信息,将所有的指令信息转化成文本内容并保存到平台的剪切板中;
47.所述指令剪切是获取到当前所有选中的指令信息,将所有的指令信息转化成文本内容并保存到剪切板中,并删除所有选中的指令;
48.所述指令粘贴是从剪切板中获取指令信息,并插入指定位置;
49.所述指令删除是对当前选中的所有指令进行删除操作;
50.所述指令撤销是通过注册操作行为响应函数,获取用户的每一次操作信息,并将相应信息存储到缓存列表中,使用撤销操作时,从缓存列表中获取最后一个操作信息,将其恢复到前一步状态;
51.所述指令重做是把指令撤销操作的动作保存起来,让用户恢复到指令撤销的前一步状态。
52.前述的基于rpa机器人的商品展示页违禁词检查方法,所述指令折叠具体实现如下:
53.b1、判断应用主流程当前是否在运行或者暂停状态,如果是,则停止折叠操作;如果不是,则执行步骤b2;
54.b2、在流程设计器中获取选中的指令列表;
55.b3、检测选中指令列表长度,如果长度为0,则停止当前操作;如果长度大于0,则执行步骤b4;
56.b4、获取列表中第一个指令所在位置序列号startindex和最后一个指令所在位置序列号endindex;
57.b5、在startindex位置插入折叠开始指令;在endindex+1的位置插入折叠结束指令,完成指令折叠。
58.与现有技术相比,本发明通过在rpa机器人中通过指令编排搭建rpa应用流程,用户可以便捷地将指令进行编排形成积木式的排列组合,从而完成rpa应用流程的设计。本发明利用指令构成的排列组合来形成一整条rpa应用流程,通过rpa应用流程来执行相应的操作,实现在电商平台中对商品展示页违禁词检查,简便了人工操作,提高了工作效率,节省了人工成本。此外,本发明的rpa应用流程搭建可以实现low

code(低代码)甚至是no

code(无代码)的rpa产品。本发明进一步的优化了指令编排、模块化设计和流程调试的步骤,使得用户可以简单便捷的进行rpa应用流程设计,降低了rpa应用流程设计的难度,提高了上手度,方便了工作者的使用。本发明还支持调用python脚本,用户可以自主进行python编程供应用流程调用,极大提高了可扩展性。
附图说明
59.图1是本发明的rpa机器人示意图。
具体实施方式
60.下面结合实施例和附图对本发明作进一步的说明,但并不作为对本发明限制的依据。
61.实施例:一种基于rpa机器人的商品展示页违禁词检查方法,如图1所示,包括rpa机器人,所述rpa机器人由指令集,流程设计器,结果调试器,流程管理器,全局变量管理器以及工具栏组成。
62.图1中指令集1:用于存放管理rpa指令,用户可以选择需要的指令通过双击或者拖拽的方式添加到流程设计器,进行自由设计。
63.图1中流程设计器2:为用户提供可视化rpa流程编辑平台。
64.图1中结果调试器3:用于显示程序错误信息,日志信息以及其他调试数据。
65.图1中流程管理器4:管理rpa流程以及python脚本等流程文件。
66.图1中全局变量管理器5:管理全局变量。
67.图1中工具栏6:包含了流程编排和调试功能。
68.利用rpa机器人进行rpa流程的可视化设计,其步骤包括:
69.一、指令编排,用于在rpa机器人搭建rpa应用流程,形成应用主流程;所述指令编排包括指令添加、指令编辑和指令折叠;
70.所述指令添加是将指令集列表中的指令安装运行逻辑添加到流程设计器,具体实现如下:
71.a1、所述流程设计器检测到新增指令,判断指令新增的方式,如果是拖拽方式,则执行步骤a2;如果是双击方式,则执行步骤a3;
72.a2、检测到为拖拽添加方式,获取鼠标拖拽的坐标位置,根据坐标得出最佳指令放置位置;
73.a3、检测到为双击添加方式,获取当前流程设计器中选中的流程所在位置,设置新增指令位置为选中位置加一;流程设计器本质上是一个列表容器,每一个指令单元都是添加到列表当中,在列表里肯定就会有顺序和编号,也就是位置,例如:当前选中的指令在第三行,那么双击的新增指令就会自动添加到第四行,如果第四行已有指令,则原第四行指令以及后继的所有指令都会往后挪一个单元位置,给新增指令腾地方,删除也一样,删掉某个指令后,该指令后继所有指令都会凑上来,补齐这个空位;
74.a4、确定添加指令位置后,在流程设计器的指令列表中指定位置插入新增指令,再刷新指令列表;具体是,
75.a4.1、检测拖拽放置坐标处是否已有指令,如果没有,直接添加到当前流程设计器列表的最新位置(最后一个位置,当一条指令都没有的时候也就是妥妥第一位置),如果已有指令,执行a4.2;
76.a4.2、计算当前鼠标位置在这个已有指令界面上的相对坐标,如果相对坐标的y坐标小于指令界面高度的一半(也就是在这个指令界面的上半段),就插到这个指令的前面去,反之,则执行a4.3;
77.a4.3、如果相对坐标的y坐标大于或者等于指令界面高度的一半(也就是在这个指令界面的下半段),则插入到这条指令的后面去;
78.a5、检测所添加的指令是否有参数需要配置,如果没有,添加完成;如果有,则执行步骤s6。
79.a6、弹出新增指令的参数配置界面,完成参数配置,在参数配置中如果点击【确认】,则添加完成;如果点击【取消】,则取消添加。
80.所述指令编辑是对添加到流程设计器中的指令进行编辑;所述指令编辑包括指令移动、指令复制、指令剪切、指令粘贴、指令删除、指令撤销和指令重做;
81.所述指令移动是将指令集列表中的指令移动到流程设计器中或在流程设计器内移动指令从而调整指令的位置顺序;
82.所述指令复制是获取到当前所有选中的指令信息,将所有的指令信息转化成文本内容并保存到平台的剪切板中;
83.所述指令剪切是获取到当前所有选中的指令信息,将所有的指令信息转化成文本内容并保存到剪切板中,并删除所有选中的指令;
84.所述指令粘贴是从剪切板中获取指令信息,并插入指定位置;包括从rpa机器人剪切板中获取指令信息列表,再获取到当前需要插入的列表位置,完成指令信息列表插入操作,并刷新设计器流程列表。
85.所述指令删除是对当前选中的所有指令进行删除操作;包括获取当前所有选中的指令信息,将获取到的指令信息列表进行排序,再将排序后的指令信息列表从后往前进行删除操作,完成所有指令的删除,最后刷新当前设计器内容。
86.所述指令撤销是通过注册操作行为响应函数,获取用户的每一次操作信息,并将相应信息存储到缓存列表中,使用撤销操作时,从缓存列表中获取最后一个操作信息,将其恢复到前一步状态;具体包括步骤y1、创建撤销操作信息列表,注册操作行为响应函数。
87.步骤y2、获取到用户操作信息。
88.步骤y3、清除重做操作信息列表。在撤销操作信息列表最后节点添加新的操作信息。
89.步骤y4、检测撤销操作信息列表长度是否超过上限,如果超过,则删除列表第一个节点信息。
90.在用户使用撤销操作时,实现步骤包括:
91.步骤p1、调用撤销函数,检测撤销信息列表长度是否为0,如果是,则返回不进行任何操作;如果不是,则执行步骤s2。
92.步骤p2、将撤销信息列表最后一个节点弹出,并获取该节点信息。
93.步骤p3、调用该节点的撤销操作。
94.步骤p4、将该节点信息添加到重做操作列表最后一个节点。
95.所述指令重做操作依赖于是否调用过指令撤销,实现步骤包括:
96.步骤q1、检测重做信息列表长度是否为0,如果是,则返回不进行任何处理;如果不是,则执行步骤s2。
97.步骤q1.检测重做信息列表长度是否为0,如果是,则返回不进行任何处理;如果不是,则执行步骤s2。
98.步骤q2.将重做信息列表最后一个节点弹出,并获取该节点信息。
99.步骤q3.调用该节点的重做操作。
100.步骤q4.将该节点信息添加到撤销操作列表最后一个节点。
101.所述指令重做是把指令撤销操作的动作保存起来,让用户恢复到指令撤销的前一步状态。
102.所述指令折叠是将流程设计器中指定位置和数量的指令进行折叠,并添加注释,提高流程指令的管理效率。
103.所述指令折叠具体实现如下:
104.b1、判断应用主流程当前是否在运行或者暂停状态,如果是,则停止折叠操作;如果不是,则执行步骤b2;
105.b2、在流程设计器中获取选中的指令列表;
106.b3、检测选中指令列表长度,如果长度为0,则停止当前操作;如果长度大于0,则执行步骤b4;
107.b4、获取列表中第一个指令所在位置序列号startindex和最后一个指令所在位置序列号endindex;
108.b5、在startindex位置插入折叠开始指令;在endindex+1的位置插入折叠结束指令,完成指令折叠。
109.b6、刷新流程设计器。
110.二、模块化设计,用于将rpa应用功能进行模块划分,并将其封装成模块子流程,在应用主流程中进行调用。
111.所述模块化设计包括子流程设计、子流程调用以及参数传递;
112.所述子流程设计用于将rpa应用功能进行模块划分,并将其封装成模块子流程,其中模块子流程中的指令编排与应用主流程流程一致,为此本发明不在具体赘述;
113.所述子流程调用是在应用主流程中调用模块子流程,具体包括:
114.步骤h1、添加【调用流程】指令。
115.步骤h2、配置【调用流程】指令参数,选择要调用的子流程。
116.参数传递,对于流程间互相调用必不可少的传参,本发明为每个流程都配备了参数列表,用于配置任意类型的输入与输出参数,具体包括:
117.步骤l1.选择指定流程,打开“流程参数”界面,创建流程参数。
118.步骤l2、修改参数名称,参数方向,参数类型,根据需要设置默认值和参数描述,保存流程参数。
119.步骤l3、打开调用了该流程的【调用流程】指令配置页面,可以发现页面上自动加载了已配置好的参数列表。
120.步骤l4、在【调用流程】指令配置页面设置各参数。
121.三、流程的调试,用于实现应用主流程和模块子流程运行的调试,所述流程的调试通过流程调试器进行断点调试和单步调试,使其从任意位置指令开始调试运行,并通过日志系统显示流程运行日志,具体实现如下:
122.步骤y1、启动调试器,保存当前指令,流程变量等一切相关数据。
123.步骤y3、获取所有的断点信息,并设置到调试器中。
124.步骤y4、启动运行调试器,注册调试信息响应函数。
125.步骤y5、当正常运行到断点指令或者单步运行操作时,获取到指令调试信息并输出到界面。
126.运行日志:本发明的日志系统支持显示通用流程运行日志,调用【打印日志】指令输出的日志,异常消息日志。当日志信息太多时,支持清空日志信息,当需要导出日志时,支持日志内容一键导出。
127.本发明通过rpa应用流程在电商平台中对商品展示页违禁词检查,步骤主要有五个部分,配置基础信息(包括使用的浏览器类型、违禁词格式、所要查询的商品链接),违禁词处理(合并使用者输入的自定义违禁词与电商平台的默认违禁词(包括广告法违禁词),对输入的商品链接与违禁词去重,依次查询每个商品详情页违禁词并标注违禁词位置以及输出运行结果,运行平台为淘宝,步骤如下:
128.步骤s1、在rpa应用流程中配置违禁词格式,输入商品链接以及自定义商品违禁词;其中商品链接以及自定义商品违禁词可以手动输入、复制粘贴或excel批量导入;
129.其中,所述手动输入是通过则双击表格单元,在表格单元出现输入光标后,输入对应的备注信息;若选择复制文本内容进行粘贴,则在选中的单元格中粘贴所复制的内容;若选择复制excel内容进行粘贴,获取到剪切板中excel格式内容,根据行列单元格式,将对应单元格数据粘贴到数据表格的对应单元格中;若选择导入excel文件,弹出文件选择对话框,选择指定导入的excel文件,选择要导入的sheet页,设置是否需要将第一行内容作为表头,加载excel内容。
130.步骤s2、去除自定义违禁词和商品链接中的无效数据和重复数据,形成检查表格;具体是,
131.步骤s2.1、将自定义违禁词和电商平台的默认商品违禁词合并,去除重复的违禁词(对于重复的违禁词,可以将重复的部分在excel中替换成空格,即可以去除重复的违禁
词,这过程由rpa应用流程自动进行处理),形成违禁词变量;
132.步骤s2.2、读取用户输入的商品链接,去除重复的商品链接和为空的商品链接(同样的这过程由rpa应用流程自动进行处理),形成商品链接数据;
133.步骤s2.3、将商品链接数据和违禁词变量写入数据表格,形成检查表格。
134.步骤s3、rpa应用流程遍历检查表格中的商品链接,依次打开到对应平台商品详情页,获取商品详情页文本信息,判断是否存在违禁词,存在则记录;具体过程如下:
135.步骤s3.1、对检查表格进行行循环,从第一行循环遍历到最后一行;
136.步骤s3.2、循环遍历到一行数据,获取该行商品链接数据;
137.步骤s3.3、根据循环到的商品链接依次打开平台商品详情页,若检测到打开网页失败,记录失败原因,忽略本次循环,进行下一次循环;否则执行步骤s3.4;
138.步骤s3.4、获取商品详情页文本信息,并下载商品链接详情页的图片到本地;
139.步骤s3.5、循环商品详情页文本信息中是否存在违禁词,若存在则记录;
140.步骤s3.6、获取下载图片的尺寸大小;若图片高度大于2000dpi,则横向切割图片,将图片等比切割,生成图片列表,再执行步骤3.7;否则直接执行步骤3.7;
141.步骤s3.7、依次通过ocr技术识别图片文本内容;
142.步骤s3.8、基于步骤s3.7识别到的文本,循环检查图片文本内容本中是否存在违禁词,若存在则记录。
143.步骤s5、根据商品详情页文本信息的记录和商品详情页图片上文本内容的记录形成检查结果,检查结果数据表格中记录着所有商品链接及违禁词检查结果,如果存在违禁词,会告知违禁词位置是文本中还是某张图片中,用户可以将数据导出为excel文件。
144.本发明基于可视化rpa平台开发,使用搭积木式编程方式完成,并通过模块化设计来分解管理功能模块,极大降低了rpa的设计门槛,真正实现了no

code产品设计。在违禁词检查流程步骤s3和步骤s14中,加入了对网页异常情况,图片尺寸过大导致的识别有问题的处理,整个循环中也加入了异常情况处理,避免了因某个商品检查的错误导致后面商品无法检查违禁词的问题,且对异常情况做了备注,方便使用者追溯。本发明可以在电商平台备注规则更改或者需要使用新的电商平台时,支持调用python脚本,用户可以自主进行python编程供应用流程调用,大大降低了后续维护成本。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1