信息处理方法、装置、计算机设备和存储介质与流程

文档序号:31017554发布日期:2022-08-05 19:21阅读:148来源:国知局
信息处理方法、装置、计算机设备和存储介质与流程
信息处理方法、装置、计算机设备和存储介质
1.本技术要求于2021年02月04日提交中国专利局,申请号为2021101538026, 申请名称为“信息处理方法、装置、计算机设备和存储介质”的中国专利申请 的优先权,其全部内容通过引用结合在本技术中。
技术领域
2.本技术涉及计算机技术领域,特别是涉及一种信息处理方法、装置、计算 机设备和存储介质。


背景技术:

3.随着计算机技术的发展,在线推广已经成为企业进行业务推广的一种重要 方式,企业在进行在线业务推广时,通常会在线上发布一些线上资源,例如红 包、金币、优惠券等等,当用户满足一定的推广条件时,会将这些资源发放给 该用户,以达到推广的目的。然而,这种基于线上资源的推广活动中,很多情 形下,进行线上资源推广的业务逻辑会存在发布方未能发现的一些逻辑漏洞, 这些逻辑漏洞被发现后,会被加以利用,使得用户在不满足推广条件的情形下, 窃取这些原本用于推广的线上资源,并进行转卖盈利,给企业的业务资产和资 金造成了极大的损失。


技术实现要素:

4.基于此,有必要针对上述技术问题,提供一种信息处理方法、装置、计算 机设备和存储介质。
5.一种信息处理方法,所述方法包括:
6.获取目标社群发布的社群消息,所述目标社群为使用预置社交账号登录对 应的社交平台后,拉取并加入的所述社交平台的与预置第一类关键词匹配的社 群;
7.确定所述社群消息中与预置第二类关键词匹配的目标社群消息,并提取所 述目标社群消息中的关键信息;
8.确定与所述关键信息关联的业务数据,提取关联的业务数据中的关联业务 信息;
9.基于所述关键信息与所述关联业务信息确定处理信息。
10.一个实施例中,所述预置社交账号包括两个以上;
11.通过机器人模块使用所述预置社交账号登录对应的社交平台,包括:通过 所述机器人模块使用预置社交账号表中的各所述预置社交账号,登录各所述预 置社交账号对应的社交平台。
12.一个实施例中,通过所述机器人模块拉取所述社交平台的与所述预置第一 类关键词匹配的目标社群账号,包括:
13.通过所述机器人模块,每间隔第一预定时长,拉取所述社交平台的与所述 预置第一类关键词匹配的目标社群账号。
14.一个实施例中,通过机器人模块使用所述预置社交账号登录对应的社交平 台之
后,还包括步骤:
15.使所述预置社交账号在所述社交平台持续保持在线状态。
16.一个实施例中,通过所述机器人模块拉取所述社交平台的与所述预置第一 类关键词匹配的目标社群账号,包括:
17.所述机器人模块拉取所述社交平台的社群搜索接口返回的与所述预置第一 类关键词匹配的所述目标社群账号。
18.一个实施例中,所述机器人模块拉取所述社交平台的社群搜索接口返回的 与所述预置第一类关键词匹配的所述目标社群账号,包括:
19.所述机器人模块,通过所述社交平台的社群搜索接口发送包含所述预置第 一类关键词的社群搜索指令,获得所述社群搜索接口基于所述社群搜索指令返 回的与预置第一类关键词匹配的所述目标社群账号。
20.一个实施例中,获得所述社群搜索接口基于所述社群搜索指令返回的与预 置第一类关键词匹配的所述目标社群账号,包括:
21.获取所述社群搜索接口返回的社群名称或者社群简介中包含所述预置第一 类关键词的目标社群账号。
22.一个实施例中,每间隔第二预定时长,获取所述目标社群发布的社群消息。
23.一个实施例中,每间隔第二预定时长,通过消息拉取接口调用所述社交平 台的拉取信息接口或者消息推送接口,获得所述目标社群发布的社群消息。
24.一个实施例中,基于所述关键信息与所述关联业务信息确定处理信息,包 括:
25.拼接所述关键信息和所述关联业务信息,获得所述处理信息。
26.一种信息处理装置,所述装置包括:
27.消息获取模块,用于获取目标社群发布的社群消息,所述目标社群为使用 预置社交账号登录对应的社交平台后,拉取并加入的所述社交平台的与预置第 一类关键词匹配的社群;
28.关键信息提取模块,用于确定所述社群消息中与预置第二类关键词匹配的 目标社群消息,并提取所述目标社群消息中的关键信息;
29.关联业务信息提取模块,用于确定与所述关键信息关联的业务数据,提取 关联的业务数据中的关联业务信息;
30.处理信息确定模块,用于基于所述关键信息与所述关联业务信息确定处理 信息。
31.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序, 所述处理器执行所述计算机程序时实现以下步骤:
32.获取目标社群发布的社群消息,所述目标社群为使用预置社交账号登录对 应的社交平台后,拉取并加入的所述社交平台的与预置第一类关键词匹配的社 群;
33.确定所述社群消息中与预置第二类关键词匹配的目标社群消息,并提取所 述目标社群消息中的关键信息;
34.确定与所述关键信息关联的业务数据,提取关联的业务数据中的关联业务 信息;
35.基于所述关键信息与所述关联业务信息确定处理信息。
36.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处 理器执行时实现以下步骤:
37.获取目标社群发布的社群消息,所述目标社群为使用预置社交账号登录对 应的社交平台后,拉取并加入的所述社交平台的与预置第一类关键词匹配的社 群;
38.确定所述社群消息中与预置第二类关键词匹配的目标社群消息,并提取所 述目标社群消息中的关键信息;
39.确定与所述关键信息关联的业务数据,提取关联的业务数据中的关联业务 信息;
40.基于所述关键信息与所述关联业务信息确定处理信息。
41.上述信息处理方法、装置、计算机设备和存储介质,其通过预置社交账号 登录所述预置社交账号对应的社交平台,并加入社交平台的与预置第一类关键 词匹配的目标社群,并获取这些目标社群发布的社群消息中的目标社群消息中 的关键信息,并据此提取与关键信息关联的业务数据中的关联业务信息,在此 基础上基于关键信息和关联业务信息确定处理信息,由于被窃取的原本用于推 广的线上资源通常都是在社群进行沟通和交易,从而通过预置社交账号加入与 预置第一类关键词匹配的目标社群,并据此获取与预置第二类关键词匹配的目 标社群消息,从而可以实现对被窃取的线上资源的相关信息的获取,及时发现 线上资源泄露的风险,及时发现安全隐患,提高安全性。
附图说明
42.图1为一个实施例中信息处理方法的应用环境图;
43.图2为一个实施例中信息处理方法的流程示意图;
44.图3为一个具体示例中的信息处理方法涉及的原理架构示意图;
45.图4为一个具体示例中的信息处理方法的流程示意图;
46.图5为一个具体示例中的信息处理方法的应用场景示意图;
47.图6为一个实施例中信息处理装置的结构框图;
48.图7为一个实施例中计算机设备的内部结构图。
具体实施方式
49.为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及实 施例,对本技术进行进一步详细说明。应当理解,此处描述的具体实施例仅仅 用以解释本技术,并不用于限定本技术。
50.本技术提供的信息处理方法,可以应用于如图1所示的应用环境中。其中, 设备10和社交平台服务器20可以通过网络相互通信,社交平台服务器20为各 用户终端201、202等提供社交服务。设备10可以是终端,也可以是服务器, 本技术实施例中以设备10为服务器为例进行说明。用户终端201与用户终端202 之间,可以通过社交平台服务器20相互通信,设备10通过预置社交账号登录 所述预置社交账号对应的社交平台,并加入社交平台的与预置第一类关键词匹 配的目标社群,并获取这些目标社群发布的社群消息中的目标社群消息中的关 键信息,并据此提取与关键信息关联的业务数据中的关联业务信息,在此基础 上基于关键信息和关联业务信息确定处理信息,以此进行信息的获取。从而, 在终端201与终端202通过社群发送基于逻辑漏洞获得的非满足推广条件的线 上资源时,可以及时获取到这类社群信息,及时发现线上资源泄露的风险,及 时发现安全隐患,提高安全性。其中,终端可以但不限于是各种个人计算机、 笔记本电脑、智能手机、平板电脑和便携式可穿戴
设备,服务器可以用独立的 服务器或者是多个服务器组成的服务器集群来实现,其中多个服务器可组成一 区块链,服务器为区块链上的节点。
51.在一个实施例中,如图2所示,提供了一种信息处理方法,以该方法应用 于图1中的设备10为例进行说明,包括以下步骤s201至步骤s204。
52.步骤s201:获取目标社群发布的社群消息,所述目标社群为使用预置社交 账号登录对应的社交平台后,拉取并加入的所述社交平台的与预置第一类关键 词匹配的社群。
53.其中,预置社交账号,是预先确定的用以登录社交平台的账号,基于社交 平台的类型的不同,该预置社交平台的账号可以有不同的形式。例如,在其中 一些实施例中,该预置社交账号可以是在该社交平台进行注册的邮箱地址或者 注册时自定义的社交账号,在一些实施例中,该预置社交账号可以是在该社交 平台注册时该社交平台分配的社交账号,在其他实施例中,该预置社交账号也 可以是其他的形式,只要该预置社交账号的形式符合对应的社交平台的要求, 且能够登录对应的社交平台即可。
54.预置第一类关键词,是与黑产交换信息渠道相关的社群名称的关键词,黑 产指黑色产业链,是指通过利用业务逻辑存在的逻辑漏洞窃取线上资源,并针 对窃取的这些线上资源的黑色产业消息的制作、传播、交易的产业链条,本申 请的一些实施例中,预置第一类关键词,也可以称之为预置黑产关键词,具体 可以是根据历史累积的黑产案例进行收集。例如通过在黑产类论坛中定期爬取 和收集相关帖子的标题和内容,并对相关帖子的标题和内容进行统计分析,将 统计分析出的关键词作为该预置第一类关键词,并存储到预置第一类关键词列 表或者集合中,例如可以统计出高频共现的词语,作为预置第一类关键词,一 个示例中的预置第一类关键词可以包括例如股票资源数据、信用卡料、菠菜数 据等。
55.一些实施例中,获取目标社群发布的社群消息之前,还包括步骤:
56.通过机器人模块使用所述预置社交账号登录所述预置社交账号对应的社交 平台;
57.通过所述机器人模块拉取所述社交平台的与预置第一类关键词匹配的目标 社群账号,并使用所述预置社交账号加入所述目标社群账号对应的目标社群。
58.其中,机器人模块,是通过软件程序实现的独立软件模块,其模拟用户使 用社交账号登录社交平台、加入社交平台的社群以及获取加入的社群的社群信 息等相关功能。
59.一些实施例中,通过机器人模块使用所述预置社交账号登录所述预置社交 账号对应的社交平台,包括:
60.启动所述机器人模块,所述机器人模块通过自动化脚本使用所述预置社交 账号,生成终端与所述预置社交账号对应的社交平台服务器接口之间交互通信 的数据包,并基于所述数据包登录所述社交平台。
61.其中,在通过机器人模块使用所述预置社交账号登录所述预置社交账号对 应的社交平台之后,还可以使所述预置社交账号在所述社交平台持续保持在线 状态。一些实施例中,机器人模块可以每间隔一定的间隔时长向该社交平台发 送在线信号,以维持该机器人使用的预置社交账号在该社交平台上的在线状态。 在机器人使用多个预置社交账号登录了不同的社交平台的情况下,针对不同的 社交平台,可以设置不同的间隔时长来发送在线信号。以两个社交平台为例, 可以每间隔第一时长向其中一个社交平台发送在线信号,每间隔第二时长向另 一个社交平台发送在线信号,第一时长和第二时长可以基于这两个
社交平台的 不同,设置为相同或者不同。其中,在使用多个预置社交账号登录了相同的社 交平台的情况下,针对这多个预置社交账号发送在线信号时,对应的间隔时长 可以设置为相同,也可以设置为不相同。从而通过使预置社交账号在对应的社 交平台持续保持在线状态,可以有利于持续地进行基于该社交平台的信息获取 过程,有利于信息获取过程的完整性和持续性。
62.一些实施例中,所述预置社交账号包括两个以上。此时,通过机器人模块 使用所述预置社交账号登录对应的社交平台,包括:通过所述机器人模块使用 各所述预置社交账号分别登录各所述预置社交账号对应的社交平台。其中,各 所述预置社交账号可以保存在预置社交账号表或者预置社交账号集合等可以保 存和记录多个预置社交账号的信息载体中,此时,以预置社交账号表为例,具 体可以是通过所述机器人模块使用预置社交账号表中的各所述预置社交账号, 登录各所述预置社交账号对应的社交平台。应当理解的是,在其他实施例中, 也可以通过其他的方式保存各所述预置社交账号,只要机器人模块能够获得这 些预置社交账号以实现对应的社交平台的登录即可。
63.一些实施例中,各预置社交账号对应的社交平台可以不同。例如,预置社 交账号表中存在三个预置社交账号:第一社交账号、第二社交账号、第三社交 账号,各预设社交账号分别对应不同的社交平台,此时,机器人模块可以使用 第一社交账号登录第一社交账号对应的第一社交平台、使用第二社交账号登录 第二社交账号对应的第二社交平台、以及使用第三社交账号登录第三社交账号 对应的第三社交平台。
64.一些实施例中,也可以是存在其中两个以上的预置社交账号对应同一个社 交平台。同样以上述预置社交账号表中存在三个预置社交账号为例,可以是第 一社交账号和第二社交账号对应第一社交平台,第三社交账号对应第二社交平 台,此时,机器人模块使用第一社交账号和第二社交账号登录第一社交平台, 使用第三社交账号模拟登录第二社交平台。其中,在预置社交账号表中,还可 以包括各预置社交账号对应的社交平台标识,以识别出预置社交账号对应的社 交平台。
65.一些实施例中,通过所述机器人模块拉取所述社交平台的与预置第一类关 键词匹配的目标社群账号,包括:通过所述机器人模块,每间隔第一预定时长, 拉取所述社交平台的与预置第一类关键词匹配的目标社群账号。
66.其中第一预定时长可以结合实际需要设定,例如在一些实施例中可以将第 一预定时长设置为1小时,在其他实施例中也可以设定为其他时长。
67.一些实施例中,通过所述机器人模块拉取所述社交平台的与预置第一类关 键词匹配的目标社群账号,包括:
68.所述机器人模块拉取所述社交平台的社群搜索接口返回的与所述预置第一 类关键词匹配的所述目标社群账号。
69.社群搜索接口指社交平台提供的用以搜索和查询社交平台的社群的接口, 机器人模块可以通过社交平台的社群搜索接口,拉取获得与预置第一类关键词 匹配的目标社群账号。
70.具体地,所述机器人模块,通过所述社交平台的社群搜索接口发送包含所 述预置第一类关键词的社群搜索指令,获得所述社群搜索接口基于所述社群搜 索指令返回的与预置第一类关键词匹配的所述目标社群账号。具体地,通过社 群搜索接口发送的社群搜索
指令,会发送给该社群搜索接口对应的社交平台的 服务器,社交平台的服务器接收到该社群搜索指令后,搜索与预置第一类关键 词匹配的目标社群账号,并将搜索获得的目标社群账号通过社群搜索接口返回 给机器人模块。
71.其中,获取所述社群搜索接口基于所述社群搜索指令返回的与预置第一类 关键词匹配的所述目标社群账号,具体可以包括:获取所述社群搜索接口返回 的社群名称或者社群简介中包含所述预置第一类关键词的目标社群账号。从而, 搜索获得的目标社群账号,是社群名称或者社群简介中包含有预置第一类关键 词的社群的社群账号。
72.以上述预置第一类关键词包括菠菜数据为例,机器人模块可通过社交平台 的社群搜索接口发送社群搜索指令,该社群搜索指令中可包括有上述关键词“菠 菜数据”,社交平台会以“菠菜数据”为关键字在其各社群的社群名称以及社群 简介中进行搜索,若某个社群的社群名称包含该关键词“菠菜数据”或者其社 群简介中包含该关键词“菠菜数据”,则将该社群的账号作为搜索获得的目标社 群账号。在其他实施例中,社交平台也可以是进行模糊检索,例如以“菠菜数 据”为关键字在其各社群的社群名称以及社群简介中进行搜索,若某个社群的 社群名称或者社群简介中包含该关键词“菠菜数据”中的一部分,例如某个社 群的社群名称或者社群简介中包含“菠菜”或者未连接在一起的“菠菜”、“数 据”,则社交平台也可以将该社群的账号作为搜索获得的目标社群账号。具体的 搜索方式与该社交平台的搜索机制有关。本技术实施例不做具体限定。
73.一些实施例中,机器人模块拉取所述社交平台的社群搜索接口返回的与所 述预置第一类关键词匹配的所述目标社群账号的同时,还可以同时拉取获得所 述目标社群账号的社群的社群名称和社群简介。
74.一些实施例中,使用所述预置社交账号加入所述目标社群账号对应的目标 社群,包括:
75.通过所述机器人模块,调用所述社交平台的社群加入接口,加入所述目标 社群账号对应的目标社群。
76.社群加入接口指社交平台提供的用以加入该社交平台的某个具体社群的接 口,机器人模块通过社交平台的社群加入接口,可以加入目标社群账号对应的 目标社群。
77.具体地,所述机器人模块,调用所述社交平台的社群加入接口,发送加群 申请信息,以加入所述目标社群账号对应的目标社群。其中,所述加群申请信 息包括所述目标社群账号以及申请内容。一个具体示例中,所述申请内容与所 述目标社群账号匹配的预置第一类关键词的分类标识相对应。
78.具体地,对于各预置第一类关键词,可以分别记录或者设置该预置第一类 关键词的分类标识,该分类标识标识了该预置第一类关键词的分类类别,针对 不同的分类类别,可以分别设置对应的申请内容,以实现不同类型的社群的按 类别加入。其中,可以是各预置第一类关键词分别对应一个分类标识,也可以 是存在两个以上的预置第一类关键词对应同一个分类标识。各分类标识分别对 应设置有相应的申请内容,其中,针对任意一个分类标识,可以设置有一个申 请内容,也可以是设置有两个以上的多个,在具体需要加入目标社群时,可以 是使用这些申请内容中的一个或多个即可。
79.例如,以上述预置第一类关键词包括股票资源数据、信用卡料、菠菜数据 为例,可设置关键词“股票资源数据”、“信用卡料”的分类标识均为数据交易 类别,设置关键词“菠
菜数据”的分类标识均为博彩类别。针对数据交易类别, 设置的申请可以例如是“买主求购一手数据”。可以理解,在其他实施例中,也 可以是通过其他的方式设置分类标识,针对各分类标识设置对应的不同的申请 内容。另外,在一些实施例中,各分类标识对应的申请内容,也可以在间隔一 定时长之后,或者基于用户的操作进行更新。
80.具体地,在拉取获得预置第一类关键词匹配的目标社群账号后,获得与该 预置第一类关键词对应的分类标识,并基于该分类标识,获得与该分类标识对 应的申请内容,然后调用所述社交平台的社群加入接口,发送加群申请信息, 所述加群申请信息包括所述目标社群账号以及分类标识对应的申请内容中的至 少一个,以加入所述目标社群账号对应的目标社群。
81.一些实施例中,通过预置社交账号模拟加入目标社群后,可以是每间隔第 二预定时长,获取所述目标社群发布的社群消息。具体地,可以是每间隔第二 预定时长,通过消息拉取接口调用所述社交平台的拉取信息接口或者消息推送 接口,获得所述目标社群发布的社群消息。
82.其中,社群消息包括目标社群的群成员在该目标社群发送的可以由目标社 群的其他成员查看的群聊天消息,还可以包括目标社群的群成员在该目标社群 的状态信息。
83.消息拉取接口是用以从社交平台拉取该目标社群的群消息的接口,拉取信 息接口是社交平台的服务器提供的用以供终端拉取消息的接口,在具体技术应 用中,消息拉取接口和拉取信息接口分别部署到终端和社交平台的服务器,消 息拉取接口和拉取信息接口相互配合,实现从社交平台服务器拉取社群消息。
84.具体地,可以通过该消息拉取接口,向目标社群所在的社交平台的服务器 发送拉取消息请求。一些实施例中,该拉取消息请求可以包括该预置社交账号, 社交平台的服务器通过拉取信息接口接收到该拉取消息请求后,获取该预置社 交账号在该社交平台的关联的所有消息,这些消息包含有社群消息,并将这些 消息返回给消息拉取接口,以通过消息拉取接口返回给机器人模块。一些实施 例中,该拉取消息请求可以包括有该目标社群账号,还可以同时包括有该预置 社交账号,社交平台的服务器接收到该拉取消息请求后,获取该目标社群账号 的社群消息,具体可以是该预置社交账号自上一次拉取消息(即接收到了包含 该预置社交账号的拉取消息请求并向其返回了社群消息)至当前该目标社群账 号的新产生的社群消息,并将这些消息通过拉取信息接口返回给机器人模块。
85.消息推送接口是社交平台提供的主动向终端推送社群的实时消息的接口。 具体地,社交平台服务器可以是定时或者在目标社群产生了新的社群消息时, 主动向该目标社群的各社群用户推送社群消息,机器人模块可以通过消息推送 接口获取社交平台服务器通过消息推送接口推送的社群消息,从而获得目标社 群发布的社群消息。
86.步骤s202:确定所述社群消息中与预置第二类关键词匹配的目标社群消息, 并提取所述目标社群消息中的关键信息。
87.预置第二类关键词,是与黑产交换信息渠道发布的信息相关的关键词,本 申请的一些实施例中,预置第二类关键词也可以称之为预置黑词,其可以包含 有上述预置第一类关键词,还可以包括有预置的敏感词、量词等等。具体实现 时,预置第二类关键词可以以正则表达式的形式进行表示,正则表达式是定义 搜索模式的字符序列,用于表示匹配文本的模式,正则表达式中的每个字符(即 描述其模式的字符串中的每个字符)要么是具有特殊
意义的元字符,要么是具有 字面意义的常规字符。以预置第二类关键词以正则表达式表示为例,一些示例 中的预置第二类关键词可以例如是:股票资源数据\d+、信用卡料\d+、(\d+(条| 批|份))?菠菜数据(\d+)?、王者荣耀.*?抽奖.*?绕过限制等等。其中,正则表达式 (regular expression)描述了一种字符串匹配的模式(pattern),可以用来检查一个 串是否含有某种子串、将匹配的子串替换或者从某个串中取出符合某个条件的 子串等。其是对字符串(包括普通字符(例如,a到z之间的字母)和特殊字 符(称为“元字符”))操作的一种逻辑公式,即用事先定义好的一些特定字符、 及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对 字符串的一种过滤逻辑。普通字符包括数字和大小写的字母,而元字符是具有 特殊的含义的字符,包括如下11个文字字符:[]\^$.|?*+()。普通字符\d+表示匹 配一个或多个数字。元字符用于特殊用途,例如,“.”用于匹配除换行元字符“\n
”ꢀ
和“\r”以外的任意字符;“*”用于匹配前面的子表达式任意次;“?”表示匹配0或 1个正好在它之前的那个字符,当该字符紧跟在任何一个其他限制符(*,+,?, {n},{n,},{n,m})后面时,匹配模式是非贪婪的,非贪婪模式尽可能少的匹配 所搜索的字符串,而默认的贪婪模式则尽可能多的匹配所搜索的字符串;“|”表 示将两个匹配条件进行逻辑“或”(英文:or)运算;“()”,将(和)之间的表达式定义 为“组”(英文:group)。
[0088]
与预置第二类关键词匹配的目标社群消息,可以是社群消息中包含有与预 置第二类关键词匹配的信息的社群消息,以上述预置第二类关键词以正则表达 式的形式表示为例,可以是社群消息中包含有与预置第二类关键词的正则表达 式匹配的信息的社群消息。
[0089]
提取的目标社群消息中的关键信息,是与目标社群消息中符合线上资源策 略的信息以及与线上资源相关的其他信息,例如可以是链接地址、电话、邮箱、 证件号等等。
[0090]
一些实施例中,在提取所述目标社群消息之后的关键信息之后,还可以包 括如下步骤:
[0091]
将所述关键信息与历史提取关键信息比对;
[0092]
在所述历史提取关键信息中包括所述关键信息时,丢弃所述关键信息;
[0093]
在所述历史提取关键信息中不包括所述关键信息时,进入下述步骤s203的 确定业务数据中与所述关键信息关联的业务数据的步骤。
[0094]
其中,历史提取关键信息是指历史从各个目标社群中提取的关键信息,通 过将当前提取的关键信息与历史提取关键信息进行比对,若历史提取关键信息 中包括所述关键信息,则说明当前提取的关键信息对应的黑产交易信息已经被 获取到,从而可以直接丢弃该关键信息,避免对相同的黑产交易信息的重复获 取,提高处理效率和处理性能。
[0095]
步骤s203:确定与所述关键信息关联的业务数据,提取关联的业务数据中 的关联业务信息。
[0096]
业务数据是指与业务服务相关的信息,具体可以是与企业提供的业务服务 相关的信息,是企业用以确定是否存在业务资源是否存在被泄露风险的基础。 一些具体示例中,可以是企业提供和存储的与业务服务相关的信息,例如一些 示例中可以包含有用户信息表,该用户信息表中可能包含有用户注册手机号、 邮箱、账号等相关信息。
[0097]
一个实施例中,确定与所述关键信息关联的业务数据,包括:
[0098]
根据所述关键信息的类型,将所述关键信息与业务数据中的所述类型的业 务信
息进行比对,若存在比对结果为关联的业务信息,则确定所述业务数据与 所述关键信息关联。
[0099]
从而通过将关键信息与业务数据中的同类型的业务信息进行比对,可以判 断出是否存在与该关键信息相关的业务数据。通过同类型的信息的关联比对, 可以进一步提高对业务数据的关联分析的准确性。
[0100]
提取的关联的业务数据中的关联业务信息时,可以是任何与业务服务相关 的信息,具体地,该关联业务信息可以是有助于确定业务漏洞、定位业务内容 的相关信息,例如,在一个实施例中,提取的关联业务信息可以是业务数据中 的业务名、域名、管理员等相关信息。在其他实施例中,提取的关联业务信息 也可以是其他的信息。
[0101]
步骤s204:基于所述关键信息与所述关联业务信息确定处理信息。
[0102]
在基于关键信息与所述关联业务信息确定处理信息时,可以用各种可能方 式进行确定。例如可以基于确定的处理信息模板,对关键信息与关联业务信息 填充到处理信息模板,以确定处理信息。再例如,可以基于提取的关键信息的 类型,对关键信息和关联业务信息进行与该类型对应的处理,以确定处理信息。 在一个具体示例中,可以是拼接所述关键信息和所述关联业务信息,获得所述 处理信息。
[0103]
在获得处理信息后,可以将处理信息通过邮箱、短信、微信推送等方式发 送到企业安全运维人员或者相关人员的邮箱账号、手机或者微信终端,以方便 企业安全运维人员或者相关按人员知晓业务服务存在安全问题,业务存在被大 规模利用进行盈利的风险,便于随时排查隐患,防患于未然。
[0104]
本技术的上述信息处理方法,具体可以应用于对业务威胁情报信息的获取, 以有利于及时发现业务漏洞,防患于未然。以下结合一个具体应用场景的示例 进行详细说明。
[0105]
目前企业在进行在线业务推广时,通常会在线上发布一些线上资源,并将 这些资源发放给满足推广条件的用户,以达到推广的目的。然而,进行线上资 源推广的业务逻辑会存在发布方未能发现的一些逻辑漏洞,因此,目前越来越 多的组织或个人通过利用业务的逻辑漏洞大量窃取企业业务原本用于推广的线 上资源,如红包、金币、优惠券等虚拟资产,并通过地下渠道转卖盈利。团伙 性质利用服务器的作案手法屡见不鲜,最终形成制作地下黑色产业消息、传播、 交易的一个完整的产业链条,即黑色产业链。通过这些恶意操作产生各种非法 所得数据,从而获取利益,对企业的业务资产和资金造成了极大隐患,而此类 消息往往仅在黑色产业团伙的社交群体中传播。基于本技术实施例的方案,可 以针对以上的业务类威胁消息进行常态化识别。
[0106]
基于本技术实施例方案在进行业务类威胁消息的常态化识别时,通过利用 程序实现的机器人模块,模拟多个成员加入作为黑色产业信息源的社群,并对 这些社群中发布的数据作定期收集,获取与企业业务和资产相关的数据,并通 过预置的信息识别策略,当命中信息识别策略时自动记录命中的社群消息和提 取命中的社群消息,分析提取其中的关键信息作为威胁情报实时推送告警至企 业管理员,实现了及时全面获取黑色产业相关信息,从而帮助企业针对性地进 行业务安全加固和上线防御策略。
[0107]
具体地,本技术实施例方法在具体实施之前,可以配置预置第一类关键词、 预置第二类关键词,同时还可以配置企业相关资产表,并设置机器人模块。
[0108]
预置第一类关键词,是与黑产交换信息渠道相关的社群名称的关键词,其 具体可
以是通用的黑产交换信息渠道的社群名相关关键词,可以根据历史累积 的黑产案例进行收集。例如通过在黑产类论坛中定期爬取和收集相关帖子的标 题和内容,并对相关帖子的标题和内容进行统计分析,统计分析出关键词作为 该预置第一类关键词,并存储到预置第一类关键词列表或者集合中,例如可以 统计出高频共现的词语,作为预置第一类关键词,一个示例中的预置第一类关 键词可以包括例如股票资源数据、信用卡料、菠菜数据等。可以理解,在其他 实施例中,以及基于实际技术和黑产行业变化的发展,预置第一类关键词还可 以包含有其他的关键词或者做其他的变化。
[0109]
预置第二类关键词,是与黑产交换信息渠道发布的信息相关的关键词,其 可以包含有上述预置第一类关键词,还可以包括有预置的敏感词、量词等等。 具体实现时,预置第二类关键词可以以正则表达式的形式进行表示,一些示例 中的预置第二类关键词可以例如是:股票资源数据\d+、信用卡料\d+、(\d+(条| 批|份))?菠菜数据(\d+)?、王者荣耀.*?抽奖.*?绕过限制等等。
[0110]
企业相关资产表,用以存储企业相关资产的信息,具体可以是用户配置的 本企业相关的资产的信息,例如根域名***.com,***.com.cn等,以关联提取与 本企业相关的情报信息。
[0111]
其中,机器人模块,用以模拟真实用户,保持在线状态获取所接收的所有 消息。机器人模块中,设置有预置账号表、黑产社群关联模块、登录态维持以 及消息接收模块。在一些实施例中,机器人模块中还可以设置有上述配置的预 置第一类关键词,在其他实施例中,预置第一类关键词还可以设置在机器人模 块的外部,机器人模块在实际使用中对配置的预置第一类关键词进行使用即可。 在下述相关示例的说明中,以机器人模块中设置预置第一类关键词为例进行说 明。
[0112]
其中,机器人模块通过黑产社群关联模块,根据预置黑产关键词表(即上 述预置第一类关键词),在社交平台中关联出黑产社群帐号(即上述目标社群账 号),并通过登录态维持以及消息接收模块,使用预置社交账号模拟登录的接口 以及社交平台提供的web接口(api),维持预置社交账号的在线状态,并通过 轮询相关web接口,拉取多个预置社交账号接收到的社群消息。
[0113]
参考图3、图4所示,在实际的业务场景中,启动机器人模块后,机器人模 块通过社交平台的服务器提供的相关api(application programming interface,应 用程序编程接口.)接口与社交平台的服务器进行通信,例如通过自动化脚本使 用所述预置社交账号,模拟生成终端与所述预置社交账号对应的社交平台服务 器接口之间交互通信的数据包,基于所述数据包登录所述预置社交账号对应的 社交平台。其中,在一些实施例中,自动化脚本也可以有机器人模块来自主编 写,具体地,机器人模块通过编写自动化脚本使用预置账号表并在服务器环境 下启动运行,模拟客户端与服务端接口交互通信的数据包,脚本可实现模拟登 录相关社交平台。
[0114]
机器人模块在运行期间,基于预置的黑产关键词(预置第一类关键词)定 期(如每小时)拉取所登录的社交平台的社群搜索接口返回的数据,获得相关 黑色产业社群账号列表(即目标社群账号的列表),并通过社群加入接口使预置 社交账号加入相关黑色产业社群(即加入目标社群账号列表中的各目标社群账 号对应的社群)。
[0115]
其中,拉取的社群搜索接口返回的数据,可以是社群搜索接口通过搜索社 群的社
群名称、群简介内容等,搜索到的与黑产关键词匹配的社群名称或群简 介内容对应的社群的社群账号,从而关联出黑产社群名称,搜索到的社群账号 在相关实施例中也可以称为黑产社群名称。各预置第一类关键词存在与之对应 的分类标识,每个分类标识分别设置有不同的申请内容,在通过社群加入接口 使预置社交账号加入相关黑色产业社群时,会同时携带匹配到该黑色产业社群 的预置第一类关键词对应的分类标识对应的申请内容,以加大能够加入黑色产 业社群的概率。例如当分类标识对应的分类类型为数据交易类,其发送的申请 内容是可以是例如:买主求购一手数据。在其他实施例中,申请内容也可以是 做不同的设置。
[0116]
机器人模块通过预置社交账号加入黑色产业社群后,通过消息拉取接口定 期(如每秒)轮询式调用相关社交平台服务端提供的拉取信息接口,获取当前 发布的社群消息,该社群消息具体可以包括聊天信息和发布的状态信息。
[0117]
基于上述获取到的社群消息,按照预置第二类关键词(相关实施例中也可 以称为黑词),确定与预置第二类关键词匹配的目标社群消息(相关实施例中也 可以称为命中文本),从而提取出命中文本和命中文本中的关键信息,一些实施 例中的关键信息可以是包括:活动链接、电话、邮箱,例如:
[0118]
预置第二类关键词为“王者荣耀.*?抽奖.*?绕过限制”,据此命中的目标社群 消息为“某公司新游戏上线特权抽奖活动可绕过限制无限抽取奖品”,提取的关 键信息可以是例如:http://www.xxx.com/activity?mode=1;
[0119]
预置第二类关键词为“某公司.*?泄露、xxx.com、手机号码和邮箱匹配提取 这三类信息”的正则表达式,命中的目标社群消息为“某公司论坛5百万用户 信息泄露”,从中提取的关键信息的部分数据可以包括:
[0120]
{“phone”:”18********1”,”email”:aaa@xxx.com}
[0121]
{“phone”:”18********2”,”email”:bbb@xxx.com}
[0122]
{“phone”:”18********3”,”email”:ccc@xxx.com}。
[0123]
随后,将提取的关键信息与数据库中已存储的历史提取关键信息进行比对, 判定该提取的关键信息是否重复,即历史提取关键信息中是否包括提取的所述 关键信息,若重复则丢弃提取的关键信息。
[0124]
若不重复,则将提取的关键信息与业务数据中的同类型的业务信息进行比 对,若存在比对结果为关联的业务信息,则确定所述业务数据与所述关键信息 关联。其中,比对结果为关联的业务信息,可以是该关联的业务信息中包含相 同类型的该关键信息或者该关键信息中的部分字段。例如:
[0125]
若提取的关键信息包括邮箱信息aaa@xxx.com,则在与业务数据中的业务信 息进行比对时,除了查找该邮箱信息aaa@xxx.com是否在业务数据中的企业的 员工邮箱表内,也同时提取该邮箱信息中的域名xxx.com,将提取的域名xxx.com 与业务数据中的企业的域名资产信息表作比对判断是否为企业所属域名;
[0126]
若提取的关键信息包括链接地址http://www.xxx.com/activity?mode=1,则提 取链接地址中的根域名xxx.com,将提取的根域名与业务数据中的企业的域名资 产信息表作比对判断是否为企业所属域名;
[0127]
若提取的关键信息包括手机号信息,则将提取的手机号与业务数据中的企 业业
务保存的用户手机号库作比对,判断是否为企业业务注册用户的信息。
[0128]
在其他实施例中,针对提取的其他类型的关键信息,也可以是采用其他的 方式与业务数据进行关联比对,以确定关键信息与业务数据是否关联。
[0129]
在确定业务数据中与所述关键信息关联的业务数据,提取关联的业务数据 中的关联业务信息,该关联业务信息具体可以包括上述与关键信息的比对结果 为关联的业务信息,同时还可以包括该关联的业务数据中的业务名、域名、管 理员等信息。提取的关联业务信息可以存储到数据库中,具体存储时,可以是 将该关联业务信息与对应的关键信息关联对应存储。
[0130]
其中,在将对应的关键信息和关联业务信息存储到数据库中之前,可以将 其与数据库中已存储的信息进行比对,若数据中已经存储有该关键信息和关联 业务信息,则将其丢弃,无需重复存储。
[0131]
最后,将存储到数据库中的提取的关键信息与业务关联信息拼接为处理信 息,该处理信息作为新情报告警,可以通过邮件、短信服务等方式发送到企业 安全运维人员的邮箱账号和手机号,在其他实施例中也可以通过其他的方式通 知到企业安全运维人员。
[0132]
在具体将处理信息推送到企业安全运维人员时,处理信息的具体的样式可 以做不同的设定,一个应用示例中,以业务漏洞被利用的传播情报的处理信息 的样式可以是如下所述:
[0133]
【情报原文】
[0134]
某公司新游戏上线特权抽奖活动可绕过限制无限抽取奖品: http://www.xxx.com/activity?mode=1
[0135]
【关键信息】
[0136]
http://www.xxx.com/activity?mode=1
[0137]
【来源】
[0138]
telegram社群,社群id:123456
[0139]
基于如上所述的本技术实施例的方案,企业可及时确定在外暴露的业务被 大规模利用盈利风险,及时排查隐患,防患于未然。同时,企业可通过设定行 业关注的特定敏感词,定制化自身业务安全需求。参考图5所示,在具体的应 用示例的业务安全场景中,企业的业务安全保障,除了内部审计外,还需要确 定重点和核心业务的外部未公开业务风险,以便出现严重安全事件时第一时间 响应确认是否遭受影响。本技术实施例提供的信息处理方法,可以很方便的帮 助企业实现外部黑产利用风险的确定和可控。
[0140]
应该理解的是,虽然上述各实施例涉及的各流程图中的各个步骤按照箭头 的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除 非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可 以以其它的顺序执行。而且,这些流程图中的至少一部分步骤可以包括多个步 骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可 以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而 是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替 地执行。
[0141]
在一个实施例中,如图6所示,提供了一种信息处理装置,该装置可以采 用软件模块或硬件模块,或者是二者的结合成为计算机设备的一部分,该装置 具体包括:
[0142]
消息获取模块601,用于获取目标社群发布的社群消息,所述目标社群为使 用预置社交账号登录对应的社交平台后,拉取并加入的所述社交平台的与预置 第一类关键词匹配的社群;
[0143]
关键信息提取模块602,用于确定所述社群消息中与预置第二类关键词匹配 的目标社群消息,并提取所述目标社群消息中的关键信息;
[0144]
关联业务信息提取模块603,用于确定与所述关键信息关联的业务数据,提 取关联的业务数据中的关联业务信息;
[0145]
处理信息确定模块604,用于基于所述关键信息与所述关联业务信息确定处 理信息。
[0146]
一个实施例中,所述装置还包括:机器人模块,用于使用所述预置社交账 号登录对应的社交平台;拉取所述社交平台的与预置第一类关键词匹配的目标 社群账号,并使用所述预置社交账号加入所述目标社群账号对应的目标社群。
[0147]
一个实施例中,所述预置社交账号包括两个以上;
[0148]
所述机器人模块使用预置社交账号表中的各所述预置社交账号,登录各所 述预置社交账号对应的社交平台。
[0149]
一个实施例中,所述机器人模块,每间隔第一预定时长,拉取所述社交平 台的与预置第一类关键词匹配的目标社群账号。
[0150]
一个实施例中,所述机器人模块使用所述预置社交账号登录对应的社交平 台之后,使所述预置社交账号在所述社交平台持续保持在线状态。
[0151]
一个实施例中,所述机器人模块通过自动化脚本使用所述预置社交账号, 生成终端与所述预置社交账号对应的社交平台服务器接口之间交互通信的数据 包,基于所述数据包登录所述社交平台。
[0152]
一个实施例中,所述机器人模块拉取所述社交平台的社群搜索接口返回的 与所述预置第一类关键词匹配的所述目标社群账号。
[0153]
一个实施例中,所述机器人模块,通过所述社交平台的社群搜索接口发送 包含所述预置第一类关键词的社群搜索指令,获得所述社群搜索接口基于所述 社群搜索指令返回的与预置第一类关键词匹配的所述目标社群账号。
[0154]
一个实施例中,所述机器人模块,获取所述社群搜索接口返回的社群名称 或者社群简介中包含所述预置第一类关键词的目标社群账号。
[0155]
一个实施例中,所述机器人模块,调用所述社交平台的社群加入接口,加 入所述目标社群账号对应的目标社群。
[0156]
一个实施例中,所述机器人模块,调用所述社交平台的社群加入接口,发 送加群申请信息,以加入所述目标社群账号对应的目标社群,所述加群申请信 息包括所述目标社群账号以及申请内容,所述申请内容与所述目标社群账号匹 配的预置第一类关键词的分类标识相对应。
[0157]
一个实施例中,所述机器人模块,每间隔第二预定时长,获取通过预置社 交账号模拟加入目标社群后,所述目标社群发布的社群消息。
[0158]
一个实施例中,所述机器人模块,每间隔第二预定时长,通过消息拉取接 口调用所述社交平台的拉取信息接口或者消息推送接口,获得所述目标社群发 布的社群消息。
[0159]
一个实施例中,关键信息提取模块602,还将所述关键信息与历史提取关键 信息比对;在所述历史提取关键信息中包括所述关键信息时,丢弃所述关键信 息。
[0160]
一个实施例中,关联业务信息提取模块603,根据所述关键信息的类型,将 所述关键信息与所述业务数据中的所述类型的业务信息进行比对,若存在比对 结果为关联的业务信息,则确定所述业务数据与所述关键信息关联。
[0161]
一个实施例中,处理信息确定模块604拼接所述关键信息和所述关联业务 信息,获得所述处理信息。
[0162]
关于信息处理装置的具体限定可以参见上文中对于信息处理方法的限定, 在此不再赘述。上述信息处理装置中的各个模块可全部或部分通过软件、硬件 及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处 理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调 用执行以上各个模块对应的操作。
[0163]
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器, 其内部结构图可以如图7所示。该计算机设备包括通过系统总线连接的处理器、 存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。 该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介 质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中 的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储提 取的关键信息、对应的关键信息与关联业务信息、预置社交账号表、预置第一 类关键词、预置第二类关键词等数据。该计算机设备的网络接口用于与外部的 终端通过网络连接通信。该计算机程序被处理器执行时以实现一种信息处理方 法。
[0164]
本领域技术人员可以理解,图7中示出的结构,仅仅是与本技术方案相关 的部分结构的框图,并不构成对本技术方案所应用于其上的计算机设备的限定, 具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件, 或者具有不同的部件布置。
[0165]
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储 器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中 的步骤。
[0166]
在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序, 该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
[0167]
在一个实施例中,提供了一种计算机程序产品或计算机程序,该计算机程 序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介 质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器 执行该计算机指令,使得该计算机设备执行上述各方法实施例中的步骤。
[0168]
需要说明的是,本技术所涉及的用户信息(包括但不限于用户设备信息、 用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示 的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据 的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
[0169]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程, 是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于 一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述 各方法的实施例的流程。其中,本技术所提供的各实施例中所使用的对存储器、 存储、数据库或其它介质的任何引
用,均可包括非易失性和易失性存储器中的 至少一种。非易失性存储器可包括只读存储器(read-only memory,rom)、磁 带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(randomaccess memory,ram)或外部高速缓冲存储器。作为说明而非局限,ram可 以是多种形式,比如静态随机存取存储器(static random access memory, sram)或动态随机存取存储器(dynamic random access memory,dram)等。
[0170]
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述 实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特 征的组合不存在矛盾,都应当认为是本说明书记载的范围。
[0171]
以上所述实施例仅表达了本技术的几种实施方式,其描述较为具体和详细, 但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的 普通技术人员来说,在不脱离本技术构思的前提下,还可以做出若干变形和改 进,这些都属于本技术的保护范围。因此,本技术专利的保护范围应以所附权 利要求为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1