一种运营商感知并结合大模型语义分析获取关键词的方法与流程

文档序号:40824803发布日期:2025-02-06 17:00阅读:8来源:国知局
一种运营商感知并结合大模型语义分析获取关键词的方法与流程

本发明涉及一种关键词获取方法,具体涉及一种运营商感知并结合大模型语义分析获取关键词的方法。


背景技术:

1、当前网络运营商普遍面临着如何避免运营商被通道化,以及如何能在和智能终端厂家的竞争中保持优势的问题。运营商业务链是电信运营商在提供服务过程中所涉及的一系列业务活动和环节,这包括但不限于网络基础设施的建设与维护、客户服务、市场营销、计费与账务管理、用户数据管理、业务开发与创新等。电信运营商通过这一业务链来确保其服务的顺畅运行,满足用户需求,同时保持市场竞争力和盈利能力。

2、在此情况下,则需考虑如何从运营商业务链的海量数据中进行挖掘感知和分析,即包括用户行为、设备状态、网络流量等相关数据,来获取市场动态和用户需求变化相关的关键词,以用于分析确认用户的需求变化,发现潜在的模式和规律来提高运营商的竞争力。

3、因此,亟需一种运营商感知并结合大模型语义分析获取关键词的方法,来解决如何从运营商业务链中获取需求相关的关键词的问题。


技术实现思路

1、本发明针对现有技术中的不足,提供一种运营商感知并结合大模型语义分析获取关键词的方法,以解决如何从运营商业务链中获取需求相关的关键词的问题。

2、为实现上述目的,本发明采用以下技术方案:

3、一种运营商感知并结合大模型语义分析获取关键词的方法,其特征在于,包括如下步骤:

4、通过chatgpt大模型对运营商业务链进行语义提取,获得第一次的相关关键词,采用误差算法嵌入chatgpt大模型,利用嵌入误差算法的chatgpt大模型进行二次语义提取,获得第二次的相关关键词,比较两次的关键词,如关键词相同,则关键词准确,输出关键词,如关键词不同,则关键词不准确,对第一次的关键词进行校正;将第一次的关键词代入两步拼写校正detector-corrector模型进行校正,重新将校正后的第一次关键词与第二次关键词进行比较,如相同,则输出关键词,如不同,则放弃输出,重新进行语义提取获取新的关键词。

5、为优化上述技术方案,采取的具体措施还包括:

6、进一步地,所述通过chatgpt大模型对运营商业务链进行语义提取,获得第一次的相关关键词,包括如下步骤:

7、准备带有业务链相关关键词标签的训练数据,并使用这些数据对chatgpt大模型进行训练,以对chatgpt大模型进行微调,利用微调后的chatgpt大模型对运营商业务链中的文本数据进行语义提取,这包括识别文本中的关键实体、关系、事件或情感,提取出与运营商业务链需求相关的第一次的关键词。

8、进一步地,所述对运营商业务链中的文本数据进行语义提取,这包括识别文本中的关键实体、关系、事件或情感,包括如下步骤:

9、在进行语义提取时,应用chatgpt的ner功能,从文本中抽取出具有特定意义的实体,实体包括公司名称、产品名称、设备名称、服务类型;利用chatgpt的关系抽取能力,从文本中抽取出实体之间的关系和状态,并提取出相关的关键词;利用chatgpt识别文本中描述的事件信息,事件信息包括新业务推出、市场活动、用户投诉,从中提取出关键词;利用chatgpt进行情感分析,通过分析用户行为中的情感倾向,包括用户评论和反馈中的情感倾向,间接地识别出用户关注的需求点,从而提取出相关的关键词。

10、进一步地,所述误差算法嵌入chatgpt大模型,包括如下步骤:

11、准备带有业务链相关关键词标签的训练数据,并使用这些数据对chatgpt大模型进行训练,而后由人工对chatgpt大模型输出的关键词进行校验和标注正确或错误,以供chatgpt大模型训练学习,并收集分析标注错误时存在的误差信息,基于收集到的误差信息,采用误差算法来调整和优化chatgpt大模型的参数或结构,得到嵌入误差算法的chatgpt大模型;每次收集新的误差信息后,根据新的误差信息,再次调整chatgpt大模型的参数或结构,以进行chatgpt大模型的的迭代更新。

12、进一步地,所述基于收集到的误差信息,采用误差算法来调整和优化chatgpt大模型的参数或结构,包括如下步骤:

13、基于收集到的误差信息,将误差信息按照类型进行分类,类型包括语法错误、语义理解错误、知识缺失,量化每种类型的错误频率,并分析每种错误类型的根本原因,根据误差分析结果,设定具体的优化目标,根据错误的影响程度和频率,为不同的优化目标设定优先级,通过网格搜索、随机搜索或贝叶斯优化方法,调整chatgpt大模型的超参数,通过调整正则化项或权重衰减来平衡模型的复杂度和泛化能力。

14、进一步地,所述将第一次的关键词代入两步拼写校正detector-corrector模型进行校正,包括如下步骤:

15、输入第一次的关键词,使用预训练的detector-corrector模型对输入的关键词进行扫描,detector-corrector模型中的detector模块采用序列标注的方法,对每个字符或词进行识别,判断其是否存在拼写错误,并标注正确或错误的结果,输出关键词中每个字符或词的标注结果;将detector模块输出的数据输入至detector-corrector模型中的corrector模块,由corrector模块对于标记为错误的字符或词进行分析,corrector模型利用语言模型来预测其可能的正确形式,语言模型会基于上下文信息,预测出被掩盖部分的正确词汇,根据预测结果,选择置信度最高的候选词作为纠正结果,并输出纠正后的关键词。

16、进一步地,所述通过chatgpt大模型对运营商业务链进行语义提取前,还包括如下步骤:通过优化sib网络的物理拓扑和应用服务拓扑,来优化运营商业务链的构建。

17、进一步地,所述通过优化sib网络的物理拓扑和应用服务拓扑,来优化运营商业务链的构建,包括如下步骤:

18、去除不必要的网络设备和链路,简化网络结构,采用层次化设计,实现功能的分离和管理的简化,在关键节点和链路上实施冗余设计,通过路由优化算法,选择最优的传输路径,减少数据包的传输跳数和延迟,利用sdn技术实现网络流量的动态调度和路由优化,以优化sib网络的物理拓扑;

19、将复杂的应用服务拆分为多个独立的模块,每个模块负责特定的功能,通过服务接口实现模块之间的通信和协作,在应用服务层部署负载均衡器,将用户请求合理地分配到多个服务器上,进行流量的均衡分配,以优化sib网络的应用服务拓扑。

20、进一步地,一种计算机可读存储介质,存储有计算机程序,其特征在于:所述计算机程序使计算机执行如上述的一种运营商感知并结合大模型语义分析获取关键词的方法。

21、进一步地,一种电子设备,其特征在于,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行计算机程序时,实现如上述的一种运营商感知并结合大模型语义分析获取关键词的方法。

22、本发明的有益效果是:

23、本发明通过chatgpt大模型对运营商业务链进行语义提取,可以准确捕捉并解析业务链各环节的语义信息,避免传统方法在解析复杂语境时的局限,chatgpt大模型能够快速地从海量数据中提取与运营商业务链相关的关键信息,提高信息处理的效率,chatgpt大模型不仅能够提取文本表面的信息,还能理解其深层次的语义含义,这使得它能够对运营商业务链中的数据进行更深层次的智能分析,挖掘出隐藏的业务洞察和潜在风险;

24、同时利用嵌入误差算法的chatgpt大模型进行二次语义提取,通过嵌入误差算法的调整,chatgpt大模型能够更精细地捕捉文本中的细粒度信息,如语境中的微妙差别、隐含的语义关联等,获得更精细的语义理解,提升信息提取的准确性;

25、再将不准确的关键词输入detector-corrector模型进行校正,减少因chatgpt大模型语义提取的第一次关键词存在错误信息,或两次提取的关键词均存在错误信息,导致最终输出的关键词精度缺失的风险,保障了本方法从运营商业务链中获取需求相关的关键词的获取精度。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1