基于建筑服务平台的咨询数据自助查询系统的制作方法

文档序号:38174966发布日期:2024-05-30 12:28阅读:17来源:国知局
基于建筑服务平台的咨询数据自助查询系统的制作方法

本发明涉及数据处理领域,更具体地说,本发明涉及基于建筑服务平台的咨询数据自助查询系统。


背景技术:

1、随着建筑服务行业的迅速发展,建筑服务平台成为企业和用户获取专业建筑服务的重要途径。然而,随之而来的是大量的咨询数据积累,用户在查询服务信息时可能面临信息过载的问题。为了提高用户体验和系统效率,由此基于建筑相关知识的查询系统应运而生。

2、现有的查询系统为确保查询结果的高效和准确性,需要不断学习和更新知识内容,这导致图谱不断臃肿庞大。为应对这一挑战,内部采用了基于设定的图谱维护方式进行定期优化。目前的维护方式主要依赖于图谱体量和节点的热度等因素进行优化。然而,随着建筑信息的不断增加和复杂化,传统的优化方式并没有充分考虑图谱单位时间内的稳定性和节点复杂度,导致了误删节点的问题。此外,维护时间的不及时也导致了一些潜在问题的发生。

3、当前挑战主要表现在对图谱的综合分析上,传统优化方式未考虑到单位时间内图谱的稳定性,以及节点复杂度的计算方式。这使得系统在进行图谱优化时容易误删节点,影响了查询结果的准确性。同时,由于维护时间的滞后,一些问题未能及时发现和处理,进一步降低了系统的稳定性。

4、为了解决上述问题,现提供一种技术方案。


技术实现思路

1、为了克服现有技术的上述缺陷,本发明的实施例提供基于建筑服务平台的咨询数据自助查询系统,通过将咨询数据表示为节点,建立初始的知识图谱,有助于形成更完整和准确的知识网络。新节点的加入扩展了图谱的广度,同时更新边和时间权重的变化反映了数据的时效性和关联性。计算图谱体量、整体活跃指数和整体活跃指数,以及通过归一化加权处理得到的动态触发系数,使系统能够全面了解图谱的规模、节点活跃度和整体更新需求。动态触发系数的使用允许系统根据实时情况灵活地调整维护策略,智能地评估图谱的状态,并决定是否需要进行维护。这一做法具有智能维护、资源优化、及时更新和系统性能提升的有益效果。通过准确判断何时进行维护,系统避免了不必要的操作,优化了资源使用,保证了图谱的实时性和准确性,提升了整体系统性能和可维护性,以解决上述背景技术中提出的问题。

2、为实现上述目的,本发明提供如下技术方案:包括信息收录模块、图谱构建模块、模型构建模块、增量学习模块和查询处理模块;

3、信息收录模块用于对建筑相关的文本数据进行预处理,并对文本进行分词干提取,将经过处理的文本数据发送至图谱构建模块;

4、图谱构建模块将每条咨询数据表示为节点,构建初始的知识图谱,并依据动态触发系数动态调整图谱的维护策略,将更新后的动态知识图谱发送至模块构建模块;

5、模型构建模块利用图卷积网络进行节点嵌入学习,实现多层次的节点表示学习,将训练好的图神经网络模型发送至增量学习模块和查询处理模块;

6、增量学习模块利用额定量带有标签的数据与额定量的无标签的数据进行学习,将更新后的图神经网络发送至查询处理模块;

7、查询处理模块接收用户的查询请求,对查询文本进行与咨询数据相同的文本预处理,并将查询文本映射为查询向量,并计算与节点嵌入的相似度,返回相似度高于对应阈值且排名最高的节点作为查询结果,并提供解释性信息。

8、在一个优选的实施方式中,数据预处理模块的运行过程如下:

9、步骤一,从建筑相关文本数据的数据源中获取原始文本数据;

10、步骤二,使用正则表达式去除文本中的html标签以及文本中的特殊字符;

11、步骤三,全部转换为小写,以统一不同大小写形式的单词,将缩写词扩展为全称,以确保语言的一致性;

12、步骤四,将文本拆分为句子,使用自然语言处理工具或库对每个句子进行分词,将句子划分为单词;

13、步骤五,利用词干提取器对每个单词进行词干提取,以去除词缀,保留单词的基本形式;

14、步骤六,利用停用词列表去除文本中的常见停用词;

15、步骤七,将经过清洗、标准化、分句、分词干提取和停用词移除的文本组织成一个结构化的数据格式。

16、在一个优选的实施方式中,图谱构建模块的运行过程如下:

17、实时添加新节点,当有新的咨询数据产生时,即时接收这些数据,对于与新节点相关的已有节点,构建新的关系边;

18、边的建模:

19、步骤一,基于相似性的度量方法确定与新节点相关的已有节点;

20、步骤二,对于新节点与每个相关节点,初始化关系边,将关系边的特征表示为新节点与相关节点之间的语义关系;

21、步骤三,使用余弦相似度计算新节点与相关节点之间的特征相似性度量,利用相似性度量结果,计算新关系边的权重;

22、步骤四,将新的关系边添加到图谱中,并与相关节点连接起来,实时将更新后的图谱信息同步到图数据库中。

23、在一个优选的实施方式中,设计动态图谱更新策略,考虑图谱信息和节点信息,动态调整图谱的维护策略,其中,图谱信息包括图谱体量,节点信息包括节点访问强度和整体活跃指数。

24、在一个优选的实施方式中,图谱体量的获取过程为:

25、1.0,进行每次的图谱体量计算时,遍历图谱中所有节点,统计节点的数量;

26、1.1,每条边都被计算一次,再一次遍历图谱中所有边,统计边的数量和节点数量;

27、1.2,将边数量和节点数量的相加得到图谱体量值;

28、1.3,在单位时间内,多次获取图谱体量值,依据图谱体量值的大小计算标准差值;

29、1.4将标准差值和波动阈值进行比较,若标准差值小于波动阈值,则输出图谱体量值,否则不进行输出。

30、在一个优选的实施方式中,节点访问强度的获取过程为:

31、2.1,收集一定时间窗口内的所有查询记录,包括查询的时间戳和查询涉及的节点;

32、2.2,对于每个节点,计算在时间窗口内被查询的总次数;

33、2.3,对于每个节点,根据节点的重要性,计算节点权重,将节点的查询频率与节点权重相乘,得到加权查询频率;

34、2.4,对于每个节点,分别计算读取查询频率和写入查询频率;

35、2.5,对所有节点的查询频率求和,获得整个图谱的节点访问强度;

36、整体活跃指数的获取过程为:

37、3.1,根据图谱中节点的连接关系,构建一个邻接矩阵a,其中a[i][j]表示节点i和j之间的连接关系;

38、3.2,对于每个的连接,计算节点i到节点j之间的距离,并构建一个连接关系复杂性矩阵c,使用距离的倒数,构建一个边权重矩阵w;

39、3.3,计算每个节点的度k[i],表示节点i与其他节点的连接数量,通过对邻接矩阵的每一行求和得到;

40、3.4,对于每个节点i,计算节点参与度p[i],可以使用以下计算公式获得:其中,m是图谱中节点的总数量,c[i][j]表示节点i和j之间的连接关系复杂性;

41、3.5,将节点参与度和活跃阈值进行比较,计算图谱节点中大于或等于活跃阈值的数量与总数的占比,得到整体活跃指数。

42、在一个优选的实施方式中,模型构建模块的运行过程如下:

43、步骤一,对图谱中的节点构建邻接矩阵,然后进行对称归一化处理,即乘以度矩阵的负半平方根;

44、步骤二,随机初始化权重矩阵,用于多层图卷积中的线性变换,为后续的节点嵌入学习提供初始参数;

45、步骤三,利用图卷积操作逐层更新节点表示,其中包括邻接矩阵与节点表示矩阵相乘,并通过非线性激活函数引入非线性;

46、步骤四,对多层次的节点表示进行聚合操作,得到每个节点的最终嵌入表示。

47、在一个优选的实施方式中,增量学习模块的运行过程如下:

48、步骤一,收集额定量带有明确标签的样本和无标签数据,并对收集的有明确标签的样本和无标签数据进行预处理;

49、步骤二,在每个训练迭代中,模型使用有标签数据进行监督学习更新,并使用无标签数据进行自监督学习或半监督学习更新;

50、步骤三,使用有标签的验证集对模型进行评估,以检验其性能;

51、步骤五,根据评估结果对模型进行调整,然后迭代步骤三至步骤五,直至模型达到满意的性能;

52、步骤六,使用训练好的半监督学习模型对未标注的数据进行预测。

53、在一个优选的实施方式中,查询处理模块的运行过程如下:

54、步骤一,系统接收用户的查询文本请求;

55、步骤二,对用户查询文本进行与咨询数据相同的文本预处理;

56、步骤三,利用事先训练好的词嵌入模型,将预处理后的查询文本映射为查询向量;

57、步骤四,遍历咨询数据图谱的所有节点,并计算查询向量与每个节点嵌入的相似度;

58、步骤五,筛选过滤相似度低于相似阈值的节点,从筛选过后的结果中选择最高的节点作为查询结果;

59、步骤六,返回选定节点的相关信息。

60、本发明基于建筑服务平台的咨询数据自助查询系统的技术效果和优点:

61、1.本发明将咨询数据表示为节点,建立初始的知识图谱,有助于形成更完整和准确的知识网络。新节点的加入扩展了图谱的广度,同时更新边和时间权重的变化反映了数据的时效性和关联性。计算图谱体量、整体活跃指数和整体活跃指数,以及通过归一化加权处理得到的动态触发系数,使系统能够全面了解图谱的规模、节点活跃度和整体更新需求。动态触发系数的使用允许系统根据实时情况灵活地调整维护策略,智能地评估图谱的状态,并决定是否需要进行维护。这一做法具有智能维护、资源优化、及时更新和系统性能提升的有益效果。通过准确判断何时进行维护,系统避免了不必要的操作,优化了资源使用,保证了图谱的实时性和准确性,提升了整体系统性能和可维护性。

62、2.通过与咨询数据相同的文本预处理,确保了查询文本与图谱数据的一致性,提高了匹配的准确性。其次,通过将查询文本嵌入为向量,系统能够在高维语义空间中捕捉查询的语义信息,使得相似度计算更具智能性。通过余弦相似度计算,能够有效度量查询向量与图谱节点嵌入的相似性,为结果选择提供了客观的依据。选取相似度最高的节点作为查询结果,系统在提供准确结果的同时,通过解释性信息的提供,增强了用户对结果的理解。这一综合处理过程有效提高了查询的精度、智能性和用户体验,使得系统更为适应复杂的咨询数据查询场景。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1