本技术涉及数据处理,特别是指一种基于大模型的半导体数据分析与可视化方法和装置。
背景技术:
::1、在半导体行业中,数据来源多样,包括市场动态、制造能力、资本支出等方面。现有技术通常依赖手动数据分析和静态报告生成,这不仅耗时且容易出错。传统方案主要包括使用电子表格手动分析数据和使用基本的图表工具生成静态图表。这些方法缺乏自动化和智能化,无法有效应对快速变化的市场需求。2、现有技术采用电子表格软件(如excel)的方法,无法处理大量数据,手动操作繁琐,缺乏动态分析能力;现有技术采用商业智能工具(如tableau、power bi)的方法,学习曲线陡峭,初始设置复杂,实时数据处理能力有限;现有技术采用编程语言与数据分析库的方法,需要编程技能,开发时间长,图表生成需要手动编;现有技术采用专用半导体数据分析软件,价格昂贵,适用范围有限,缺乏通用性。3、可见,在半导体行业中,现有技术中生成图表的方法,自动化程度低,大多数方案依赖手动操作,效率低且易出错;智能化不足,缺乏利用人工智能进行深度数据挖掘和分析的能力。技术实现思路1、在本技术的目的是提供一种基于大模型的半导体数据分析与可视化方法和装置,以解决现有技术中针对半导体负责的可研报告的自动化生成程度低和智能化不足的问题。2、为达到上述目的,本技术的实施例提供一种基于大模型的半导体数据分析与可视化方法,包括:3、利用大语言模型解析用户输入的需求信息,获取所述需求信息所对应的关键信息;所述关键信息包括时间信息、行业信息、指标信息和地理信息;4、利用数据集自动选择算法,从预设数据库中,确定与所述关键信息最相关的目标数据集;5、根据所述需求信息和所述目标数据集,确定所述需求信息的可视化策略;6、根据所述可视化策略和所述大语言模型,生成与所述可视化策略对应的可视化代码,并执行所述可视化代码自动生成可视化图表。7、可选地,利用数据集自动选择算法,从预设数据库中,确定与所述关键信息最相关的目标数据集,包括:8、初始化所述预设数据库中的每个数据集;每个所述数据集包括多个特征信息,所述特征信息包括时间特征、行业特征、指标类型、地理范围和数据可靠度;9、利用数据集自动选择算法,解析所述关键信息,确定在每个所述数据集中与所述关键信息对应的所述特征信息的匹配得分和每个所述数据集的可靠性得分;10、根据每个所述特征信息的匹配得分和所述可靠性得分,进行权重加和,计算每个所述数据集的总匹配得分;11、从所有所述数据集中选择所述总匹配得分最高的确定为所述目标数据集。12、可选地,根据所述需求信息和所述目标数据集,确定所述需求信息的可视化策略前,所述方法还包括:13、提取所述目标数据集中的目标数据;14、利用所述大语言模型,验证所述目标数据与所述需求信息是否对应一致;15、若所述对应不一致,则重新获取所述目标数据集或者在所述目标数据集中补充缺失对应的特征,并重新执行提取所述目标数据集中的目标数据的步骤;16、若所述对应一致,则执行根据所述需求信息和所述目标数据集,确定所述需求信息的可视化策略的步骤。17、可选地,根据所述需求信息和所述目标数据集,确定所述需求信息的可视化策略,包括:18、利用所述大语言模型,解析所述需求信息,确定所述需求信息对应的用户意图;19、利用所述大语言模型,提取所述目标数据集中的可视化参数;20、根据所述用户意图和所述可视化参数,利用所述大语言模型,选择可视化图表类型和颜色方案;21、根据所述可视化图表类型和颜色方案,确定所述需求信息的可视化策略。22、可选地,根据所述可视化策略和所述大语言模型,生成与所述可视化策略对应的可视化代码,并执行所述可视化代码自动生成可视化图表,包括:23、对所述可视化策略进行语义意图理解,获取需要生成的可视化图表的多个图表属性和多个指标;24、根据多个所述图表属性、多个所述指标和所述大语言模型进行代码生成处理,动态生成与所述可视化策略对应的可视化代码;25、执行所述可视化代码,以绘制所述可视化策略所对应的可视化图表。26、可选地,生成与所述可视化策略对应的可视化代码后,所述方法还包括:27、对所述可视化代码进行测试,在测试结果不通过时,对用户展示测试失败原因;28、若所述测试失败原因为代码原因,利用所述大语言模型,结合失败代码的上下文,对失败代码重新生成目标代码;29、重新对全文的可视化代码进行测试,在测试结果仍不通过时,响应于用户输入的代码请求,生成新的可视化代码并重新验证。30、可选地,所述方法还包括:31、将所述可视化图表显示给所述用户;32、按照预设周期,获取所述用户与所述可视化图表之间的交互数据;33、根据所述交互数据,对所述可视化策略进行调整;34、根据调整后的可视化策略,获取优化后的可视化图表,并将优化后的可视化图表显示给所述用户。35、为达上述目的,本技术实施例还提供一种基于大模型的半导体数据分析与可视化装置,包括:36、第一处理模块,用于利用大语言模型解析用户输入的需求信息,获取所述需求信息所对应的关键信息;所述关键信息包括时间信息、行业信息、指标信息和地理信息;37、第一确定模块,用于利用数据集自动选择算法,从预设数据库中,确定与所述关键信息最相关的目标数据集;38、第二确定模块,用于根据所述需求信息和所述目标数据集,确定所述需求信息的可视化策略;39、第二处理模块,用于根据所述可视化策略和所述大语言模型,生成与所述可视化策略对应的可视化代码,并执行所述可视化代码自动生成可视化图表。40、为达上述目的,本技术实施例还提供一种可读存储介质,其上存储有程序或指令,所述程序或指令被处理器执行时实现如上所述的方法中的步骤。41、为达上述目的,本技术实施例还提供一种计算机程序产品,包括计算机指令,所述计算机指令被处理器执行时实现如上所述的方法的步骤。42、本技术的上述技术方案的有益效果如下:43、本技术实施例中,利用大语言模型解析用户输入的需求信息,获取所述需求信息所对应的关键信息;所述关键信息包括时间信息、行业信息、指标信息和地理信息;利用数据集自动选择算法,从预设数据库中,确定与所述关键信息最相关的目标数据集;根据所述需求信息和所述目标数据集,确定所述需求信息的可视化策略;根据所述可视化策略和所述大语言模型,生成与所述可视化策略对应的可视化代码,并执行所述可视化代码自动生成可视化图表。本技术的方案,解决了半导体可研报告中复杂数据的自动化分析与可视化难题,支持动态数据展示,提升数据可视化效果。当前第1页12当前第1页12