基于智能大模型的第三方模块数据实时监控方法及系统与流程

文档序号：37085722发布日期：2024-02-20 21:41阅读：19来源：国知局

本发明涉及互联网信息监控，更具体地说，本发明涉及基于智能大模型的第三方模块数据实时监控方法及系统。

背景技术：

1、随着开放平台的日益发展，第三方软件公司可以利用平台提供的接口和工具，独立开发和运营自己的应用程序，向用户提供个性化的服务，然而，由于第三方软件公司基数庞大以及接入平台的第三方模块(即第三方应用程序)多样复杂，且受限于开放平台方监管资源的限制，导致这些应用程序易通过应用接口在平台上上传或发布违法信息、广告或其他与服务内容无关的信息；但是，对于使用开放平台的用户而言，由于应用程序都是通过开放平台提供的入口接入的，用户通常不会对于应用的开发商有所了解，甚至认为所有通过开放平台运行的应用都来自于平台的运营商，因此若存在违规的第三方模块，易导致用户对开放平台产生负面印象；

2、因而，对于提供开放平台的运营商而言，如何保障第三方模块的服务质量，监管第三方模块的业务环境，向用户提供尽可能优质的服务，以维护用户对开放平台的良好体验以及自身的信誉，是面临的一个迫切需要解决的技术问题。

3、目前，现有对第三方模块的监控方法大多基于用户反馈或人工审核实现，此类方法费时费力，且效率和效果均较低，而部分第三方模块的监控方法又倾向于对第三方应用网络传输延时和加载速度进行设计，例如：授权公告号cn103138993b的中国专利公开了一种监控第三方应用加载速度的方法及装置，此类发明虽然能够实现对第三方应用网络传输延时和加载速度进行监控，但无法针对第三方模块的违规应用行为进行自动化的实时监控，无法有效合理调控监控和分析资源，且难以针对易违规的第三方模块进行重点监控和关注。

技术实现思路

1、为了克服现有技术的上述缺陷，本发明的实施例提供基于智能大模型的第三方模块数据实时监控方法及系统。

2、为实现上述目的，本发明提供如下技术方案：

3、基于智能大模型的第三方模块数据实时监控方法，包括：

4、步骤1：实时获取第三方模块的当前页面信息，以及调取对应所述第三方模块的初始置信度；所述当前页面信息包括界面区域文本、界面区域图像或界面视频中的至少一种；

5、步骤2：对所述当前页面信息进行内容比较，得到内容比较数据；以及对无量纲化后的所述内容比较数据与所述初始置信度进行处理计算，得到对应所述第三方模块的行为隶属度；

6、步骤3：判断所述行为隶属度是否大于预设隶属度阈值，若所述行为隶属度大于预设隶属度阈值，则对所述当前页面信息进行信息提取，以获取当前页面的待识别数据；

7、步骤4：根据所述当前页面的待识别数据和预配置违规识别大模型进行识别，以获取违规识别结果，所述违规识别结果包括对应所述第三方模块存在违规行为和对应所述第三方模块不存在违规行为；

8、步骤5：根据违规行为对对应所述第三方模块违规行为对对应所述第三方模块的初始置信度进行计算更新，以获取更新置信度；以及将所述违规行为反馈至开放平台。

9、进一步地，所述置信度相关信息包括第三方模块的用户评分sur、第三方模块的平台评分spr、第三方模块的更新速度sus、违规次数nov以及纠正时长scd；

10、对所述当前页面信息进行内容比较，包括：

11、判断是否存在界面区域图像；

12、若存在界面区域图像，则提取对应所述第三方模块的预存特征图片，并基于余弦相似度算法对所述界面区域图像与预存特征图片进行计算，以获取第一余弦相似度；

13、将第一余弦相似度作为内容比较数据。

14、进一步地，对所述当前页面信息进行内容比较，还包括：

15、若不存在界面区域图像，则对所述第三方模块的当前页面进行截图，以获取页面截图图像；

16、基于余弦相似度算法对所述页面截图图像与预存特征图片进行计算，以获取第二余弦相似度；

17、将第二余弦相似度作为内容比较数据。

18、进一步地，判断所述行为隶属度是否大于预设隶属度阈值，包括：

19、若所述行为隶属度小于等于预设隶属度阈值，则判定对应所述第三方模块不存在违规行为，并返回至步骤1。

20、进一步地，对所述当前页面信息进行信息提取，包括：

21、判断是否存在界面区域文本；

22、若存在界面区域文本，则对所述界面区域文本进行分词处理，以获取若干个文本属性分词数据；

23、将若干个所述文本属性分词数据作为当前页面的待识别数据。

24、进一步地，对所述当前页面信息进行信息提取，还包括：

25、若不存在界面区域文本，则对所述界面区域图像和界面视频进行ocr识别，以获取ocr识别文本；

26、对所述ocr识别文本进行分词处理，以获取若干个ocr属性分词数据；

27、将若干个所述ocr属性分词数据作为当前页面的待识别数据。

28、进一步地，根据所述当前页面的待识别数据和预配置违规识别大模型进行识别，包括：

29、提取所述当前页面的待识别数据中的若干个所述文本属性分词数据或若干个ocr属性分词数据；

30、将所述文本属性分词数据或ocr属性分词数据输入至预配置的违规识别大模型，得到违规识别结果；

31、其中，所述预配置的违规识别大模型的生成逻辑如下；

32、获取历史违规识别数据，将历史违规识别数据划分为违规识别训练集和违规识别测试集；所述历史违规识别数据包括多个词组及其对应的标注标签；

33、其中，所述标注标签将属于敏感词词库的对应词组标记为“1”，将不属于敏感词词库的对应词组标记为“0”，其中，“0”表示对应所述第三方模块不存在违规行为，“1”表示对应所述第三方模块存在违规行为；

34、构建分类器，将违规识别训练集中的词组作为分类器的输入数据，将违规识别训练集中的标注标签作为分类器的输出数据，对分类器进行训练，得到初始违规识别网络；

35、利用违规识别测试集对初始违规识别网络进行模型验证，输出大于等于预设测试准确度的初始违规识别网络作为预配置的违规识别大模型。

36、基于智能大模型的第三方模块数据实时监控系统，用于实现所述的基于智能大模型的第三方模块数据实时监控方法，包括：

37、实时获取模块，用于实时获取第三方模块的当前页面信息，以及调取对应所述第三方模块的初始置信度；

38、比对计算模块，用于对所述当前页面信息进行内容比较，得到内容比较数据；以及对无量纲化后的所述内容比较数据与所述初始置信度进行处理计算，得到对应所述第三方模块的行为隶属度；

39、第一判断处理模块，用于判断所述行为隶属度是否大于预设隶属度阈值，若隶属度大于预设隶属度阈值，则对所述当前页面信息进行信息提取，以获取当前页面的待识别数据；

40、第二判断处理模块，用于判断所述当前页面的待识别数据中是否存在预设特征数据，若存在预设特征数据，则判定对应所述第三方模块存在违规行为；

41、更新反馈模块，用于根据违规行为对对应所述第三方模块违规行为对对应所述第三方模块的初始置信度进行计算更新，以获取更新置信度；以及将所述违规行为反馈至开放平台。

42、一种电子设备，包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述任一项所述的基于智能大模型的第三方模块数据实时监控方法。

43、一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被执行时实现上述任一项所述的基于智能大模型的第三方模块数据实时监控方法。

44、本发明首先实时获取第三方模块的当前页面信息，以及调取对应所述第三方模块的初始置信度；然后对所述当前页面信息进行内容比较，得到内容比较数据；以及对无量纲化后的所述内容比较数据与所述初始置信度进行处理计算，得到对应所述第三方模块的行为隶属度；接着判断所述行为隶属度是否大于预设隶属度阈值，若隶属度大于预设隶属度阈值，则对所述当前页面信息进行信息提取，以获取当前页面的待识别数据；之后根据所述当前页面的待识别数据和预配置违规识别大模型进行识别，以获取违规识别结果；最后根据违规行为对对应所述第三方模块违规行为对对应所述第三方模块的初始置信度进行计算更新，以获取更新置信度；以及将所述违规行为反馈至开放平台；通过将内容比较数据与初始置信度结合获取行为隶属度，并基于行为隶属度进行初步判断。

45、与现有技术相比，本发明具有如下有益效果：

46、本发明有利于降低监控资源的利用率；此外，通过引入第三方模块的置信度作为监控分析触发条件，本发明有利于针对易违规的第三方模块进行重点监控和关注，从而有利于保障开放平台服务质量和环境。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：韩涵,王晓文,何江,谢开浪,马文龙,陈善君,夏暄
技术所有人：北京中数睿智科技有限公司
我是此专利的发明人

上一篇：一种用于六角螺母生产的打孔装置的制作方法
上一篇：一种饲料加工用制粒机的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。