1.本技术涉及计算机技术领域,尤其是一种政策推荐方法、系统、装置及存储介质。
背景技术:2.政策制定需要业务人员阅读大量的历史政策文本,从中找出与待制定政策同类型的政策或政策段落,并对历史政策文本信息进行理解和主旨提取,得到新政策。然而,历史政策文献的数量较多、文本信息量较大,且政策内容分类标签数量较大、层次结构复杂,业务人员需仔细阅读大量文本信息并经过分析判断才能得到想要的标签分类。因此,相关技术中政策制定依赖于人工,费时费力。
技术实现要素:3.本技术的目的在于至少一定程度上解决现有技术中存在的技术问题之一。
4.为此,本技术实施例的一个目的在于提供一种高效的政策推荐方法、系统、装置及存储介质。
5.为了达到上述技术目的,本技术实施例所采取的技术方案包括:
6.一方面,本技术实施例提供了一种政策推荐方法,包括以下步骤:
7.本技术实施例的政策推荐方法,包括:获取与目标政策相关的文本作为第一文本;对第一文本进行段落特征提取,得到若干段落;将若干段落输入多标签多分类模型进行分类处理,得到所述若干段落的分类结果;所述多标签多分类模型包括至少两个分类层级模块,各所述分类层级模块用于为所述若干段落增加对应层级的分类标签,相邻两个所述分类层级模块中下一个分类层级模块用于对上一个分类层级模块进行调整,且下一个分类层级模块所增加的分类标签为上一个分类层级模块所增加的分类标签对应的细化标签,所述若干段落的分类结果根据各所述分类标签得到;根据分类结果,从若干段落中确定出预设数量的段落作为目标政策的参考信息,推送并展示参考信息。通过使用本技术中的方法,能够为政策信息增加多个层级标签,有利于提升政策推荐的准确度,提升客户满意度。
8.另外,根据本技术上述实施例的政策推荐方法,还可以具有以下附加的技术特征:
9.进一步地,本技术实施例的政策推荐方法,所述多标签多分类模型包括第一分类层级模块和第二分类层级模块,所述分类标签包括第一层级标签和第二层级标签;所述将所述若干段落输入多标签多分类模型进行分类处理,包括以下步骤:
10.将所述若干段落输入所述第一分类层级模块进行分类处理,为所述若干段落增加第一层级标签;
11.将所述若干段落输入所述第二分类层级模块进行分类处理,为所述若干段落增加第二层级标签;
12.其中,所述第一分类层级模块和所述第二分类层级模块均采用卷积结构,所述第二分类层级模块与所述第一分类层级模块具有相同的嵌入层和卷积层。
13.进一步地,在本技术的一个实施例中,所述根据所述分类结果,从所述若干段落中
确定出预设数量的段落作为所述目标政策的参考信息,包括以下步骤:
14.根据所述分类结果与所述目标政策,确定所述若干段落的得分;
15.根据所述若干段落的得分,从所述若干段落中筛选出预设数量的段落作为参考信息。
16.进一步地,在本技术的一个实施例中,所述根据所述分类结果与所述目标政策,确定所述若干段落的得分,包括以下步骤:
17.根据所述分类结果,确定所述分类标签的概率;
18.根据所述分类结果和所述目标政策,确定所述分类标签的权重;
19.根据所述概率和所述权重,确定所述若干段落的得分。
20.进一步地,在本技术的一个实施例中,所述对所述第一文本进行段落特征提取,得到若干段落,包括:
21.将所述第一文本输入自然段落拆分模型,得到若干段落。
22.进一步地,在本技术的一个实施例中,所述获取与目标政策相关的文本作为第一文本,包括以下步骤:
23.根据所述目标政策的主题,获取数据库中相关的文本作为第一文本;
24.或者,通过人机交互方式获取输入的文本作为第一文本。
25.进一步地,在本技术的一个实施例中,所述将所述若干段落输入多标签多分类模型进行分类处理这一步骤前,还包括下列步骤:
26.将所述若干段落通过bert编码器处理,得到所述若干段落对应的词向量信息;
27.将所述词向量信息通过特征聚合器处理,得到政策实例信息。
28.另一方面,本技术实施例提出了一种政策推荐系统,包括:
29.获取模块,用于获取与目标政策相关的文本作为第一文本;
30.特征提取模块,用于对所述第一文本进行段落特征提取,得到若干段落;
31.分类处理模块,用于将所述若干段落输入多标签多分类模型进行分类处理,得到所述若干段落的分类结果;所述多标签多分类模型包括至少两个分类层级模块,各所述分类层级模块用于为所述若干段落增加对应层级的分类标签,相邻两个所述分类层级模块中下一个分类层级模块用于对上一个分类层级模块进行调整,且下一个分类层级模块所增加的分类标签为上一个分类层级模块所增加的分类标签对应的细化标签,所述若干段落的分类结果根据各所述分类标签得到;
32.推荐展示模块,用于根据所述分类结果,从所述若干段落中确定出预设数量的段落作为所述目标政策的参考信息,推送并展示所述参考信息。
33.另一方面,本技术实施例提供了一种政策推荐装置,包括:
34.至少一个处理器;
35.至少一个存储器,用于存储至少一个程序;
36.当所述至少一个程序被所述至少一个处理器执行时,使得所述至少一个处理器实现上述的任一种政策推荐方法。
37.另一方面,本技术实施例提供了一种存储介质,其中存储有处理器可执行的程序,所述处理器可执行的程序在由处理器执行时用于实现上述的任一种政策推荐方法。
38.本技术实施例提供的政策推荐方法包括:获取与目标政策相关的文本作为第一文
本;对第一文本进行段落特征提取,得到若干段落;将若干段落输入多标签多分类模型进行分类处理,得到若干段落的分类结果;多标签多分类模型包括至少两个分类层级模块,各分类层级模块用于为若干段落增加对应层级的分类标签,相邻两个分类层级模块中下一个分类层级模块用于对上一个分类层级模块进行调整,且下一个分类层级模块所增加的分类标签为上一个分类层级模块所增加的分类标签对应的细化标签,若干段落的分类结果根据各分类标签得到;根据分类结果,从若干段落中确定出预设数量的段落作为目标政策的参考信息,推送并展示参考信息。通过使用本技术中的方法,能够为政策信息增加多个层级标签,有利于提升政策推荐的准确度,提升客户满意度。
附图说明
39.为了更清楚地说明本技术实施例或者现有技术中的技术方案,下面对本技术实施例或者现有技术中的相关技术方案附图作以下介绍,应当理解的是,下面介绍中的附图仅仅为了方便清晰表述本技术的技术方案中的部分实施例,对于本领域的技术人员来说,在无需付出创造性劳动的前提下,还可以根据这些附图获取到其他附图。
40.图1为相关技术中部分政策层级标签的结构示意图;
41.图2为本技术提供的政策推荐方法的一种实施例的流程示意图;
42.图3为本技术提供的政策推荐方法中第一文本的结构示意图;
43.图4为本技术提供的多标签多分类模型的一种实施例的结构示意图;
44.图5为本技术提供的政策推荐方法的另一种实施例的流程示意图;
45.图6为本技术提供的政策推荐方法的推送展示的效果示意图;
46.图7为本技术提供的政策推荐系统的一种实施例的结构示意图;
47.图8为本技术提供的政策推荐装置的一种实施例的结构示意图。
具体实施方式
48.下面详细描述本技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本技术,而不能理解为对本技术的限制。对于以下实施例中的步骤编号,其仅为了便于阐述说明而设置,对步骤之间的顺序不做任何限定,实施例中的各步骤的执行顺序均可根据本领域技术人员的理解来进行适应性调整。
49.相关技术中政策制定需要业务人员阅读大量的历史政策文本,从中找出与待制定政策同类型的政策或政策段落,并对历史政策信息进行理解和主旨提取,得到新政策。然而,参照图1所示的相关技术中的部分政策层级标签的结构示意图,由此可见,政策标签可以有多个层级,每个层级的标签数量众多,一定程度上增加了相关业务人员的工作复杂程度。因此,针对历史政策文献的数量较多、文本信息量较大,且政策内容分类标签数量较大、层次结构复杂的特点,业务人员需仔细阅读大量文本信息并经过分析判断才能得到想要的标签分类,根据历史标签的标签分类信息选择若干历史标签,根据历史标签制定新政策。由上可见,相关技术中政策制定依赖于人工,费时费力。
50.对此,本技术提出的高效的一种政策推荐方法、系统、装置及存储介质。本技术用到的相关技术主要有:
51.人工智能(artificial intelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
52.人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
53.本技术实施例提供的方案属于人工智能领域下属的自然语言处理(nature language processing,nlp)和机器学习(machine learning,ml)。
54.自然语言处理(nature language processing,nlp)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、信息抽取、语义理解、机器翻译、机器人问答、知识图谱等众多方向。
55.机器学习(machine learning,ml)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习等技术。
56.下面参照附图详细描述根据本技术实施例提出的政策推荐方法和系统,首先将参照附图描述根据本技术实施例提出的政策推荐方法。
57.参照图2,本技术实施例中提供一种政策推荐方法,本技术实施例中的政策推荐方法,可应用于终端中,也可应用于服务器中,还可以是运行于终端或服务器中的软件等。终端可以是平板电脑、笔记本电脑、台式计算机等,但并不局限于此。服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、cdn、以及大数据和人工智能平台等基础云计算服务的云服务器。本技术实施例中的政策推荐方法主要包括以下步骤:
58.s110:获取与目标政策相关的文本作为第一文本;
59.本步骤中,获取与目标政策相关的文本作为第一文本。目标政策用于表征待制定的政策,通过人机交互的方式获取相关业务人员或用户输入的待制定的政策信息。在一些可能的实施方式中,目标政策可以是涉及个人问题的相关政策,也可以是涉及团体问题的相关政策,还可以是涉及社会问题的相关政策。同时,目标政策的所属领域也可以是多样的,本技术并不限定目标政策的具体领域和具体用途。
60.在一些可能的实施方式中,与目标政策相关的文本,可以来源于数据库中,根据目
标政策,从数据库中筛选出与目标政策相关的若干文本作为第一文本;与目标政策相关的文本,也可以来源于用户或业务人员的输入,用户或业务人员将历史政策信息或对照政策信息通过人机交互的方式输入;与目标政策相关的文本,还可以来源于数据库和用户的输入,通过用户的输入和数据库中的筛选文本信息的组合,确定第一文本。本技术并不限定与目标政策相关的文本的具体来源。
61.s120:对所述第一文本进行段落特征提取,得到若干段落;
62.本步骤中,对第一文本进行段落特征提取,得到若干段落。上述获取的与目标政策相关的文本,即第一文本,通常是若干文本信息,其中,每个文本均包括若干段落,因此,需要对每个文本进行段落特征提取,对提取后的段落特征信息进行后续的政策推荐处理过程。在一些可能的实施方式中,第一文本的结构如图3所示,文本通常包括标题和各个不同层级的标题。通常情况下,同一个级别标题下的内容,均描述同一个主题或标签,因此,段落的特征提取可以根据第一文本的各个层级标题进行拆分。同样,在一些可能的实施例中,段落的特征提取也可以根据第一文本的实际自然段落进行拆分,每个自然段落均描述相应的主题,因此,根据自然段落拆分的方式,有利于提升段落特征提取的准确度。当然,段落的特征提取还可以使用上述两种方式的结合方式进行拆分,具体地,对于级别较高的层级标题下的段落,再使用自然段落拆分的方法进行二次拆分;对于级别较低的层级标题下的段落作为一个整体,不进行进一步的段落拆分。如图3中所示的第一文本的一种实施例的结构示意图,对于该形式的第一文本,对于一级标题1-0-0和2-0-0下的段落,再根据自然段落进行二次拆分;而对于二级标题1-1-0和三级标题1-1-1下的段落,不再进行自然段落拆分。或者,对于一级标题1-0-0和2-0-0下的段落,和二级标题1-1-0下的段落,再根据自然段落进行二次拆分;而对于三级标题1-1-1下的段落,不再进行自然段落的二次拆分。本领域技术人员可以根据具体的政策类型或第一文本的具体数量,选择合适的段落等级进行二次拆分。该组合形式的段落特征提取方式,在不降低段落提取的准确度的情况下,有利于提升段落特征提取的效率。当然,本领域技术人员可以理解的是,本技术并不限定具体地段落特征提取方式。
63.在一些可能的实施方式中,段落特征提取过程可以通过业务人员或者客户根据实际需要将第一文本拆分为若干段落;段落特征提取过程也可以通过特定的自然段落提取模型进行,通过选择段落拆分方式,调整相关模型参数,得到符合需求的段落拆分结果;段落特征提取过程还可以通过特定的自然段落提取模型处理后,再经过业务人员或者客户的检验反馈处理,得到符合需求的若干段落。本技术并不限定段落提取的具体实施方式,本领域技术人员可以根据实际需求进行选择。
64.s130:将所述若干段落输入多标签多分类模型进行分类处理,得到所述若干段落的分类结果;所述多标签多分类模型包括至少两个分类层级模块,各所述分类层级模块用于为所述若干段落增加对应层级的分类标签,相邻两个所述分类层级模块中下一个分类层级模块用于对上一个分类层级模块进行调整,且下一个分类层级模块所增加的分类标签为上一个分类层级模块所增加的分类标签对应的细化标签,所述若干段落的分类结果根据各所述分类标签得到;
65.本步骤中,将所述若干段落输入多标签多分类模型进行分类处理,得到所述若干段落的分类结果。通过将若干段落输入多标签多分类模型进行分类处理,为若干段落中的
每个段落增加标签,确定若干段落中的每个段落所属的技术领域,即得到若干段落的分类结果,以使业务人员或者用户根据该分类结果,更快更高效的找到需要参考的历史政策段落信息,有利于提升政策制定的效率。
66.在一些可能的实施方式中,多标签多分类模型包括至少两个分类层级模块,各所述分类层级模块用于为所述若干段落增加对应层级的分类标签。通过图1所示的相关技术中的政策层级标签的结构示意图可以得到,政策信息的分类庞大,且分支众多,使得仅通过一个标签来判断段落的分类不能很好的体现出段落的实际所属领域。因此,通过多标签多分类模型对段落进行分类,有利于提升政策推荐的准确度。其中,多标签多分类用于表征样本或实例所对应的标签数量可能是多个,且多个标签属于层级关系。如图1中所示的政策层级标签中,共有四级层级标签,其中,经济调控属于一级标签,宏观调控和提供产品与服务属于二级标签,三级标签和四级标签的标签数量较多,参见图1所示,当然,图1中所示的政策标签,属于示例性的举例,并不作为对本技术的政策所属领域的限定。此外,政策层级标签中下一层标签属于上一层标签对应的细化标签,即先对文本进行大类别的分类划分,再对文本在大类别下进行小类别的划分,其中,小类别包含于大类别。即图1中,下一层标签统计和物价属于上一层标签经济管理的细化标签,同样,下一层标签资产评估和资产产权登记属于上一层标签资产监管的细化标签。
67.在一些可能的实施方式中,多标签多分类模型包括至少两个分类层级模块,其中,每个分类层级模块用于为段落增加相应层级的标签,得到段落相对于相应层级标签的分类。针对与政策标签的多层级特点,本技术中的多标签多分类模型采用多个分类层级模块的结构,如图4中所示的多标签多分类模型的其中一种实施例,该实施例中的多标签多分类模型采用两个分类层级模块的结构,即图中上部分所示的第一分类层级模块,和下部分所示的第二分类层级模块。当然,图4中的模型结构属于示例性的举例,多标签多分类模型可以包括两个分类层级模块,多标签多分类模型也可以包括三个分类层级模块,多标签多分类模型还可以包括多个分类层级模块。具体地,对于政策标签属于两级层级标签的情况,多标签多分类模型选择两个分类层级模块;对于政策标签属于三级层级标签的情况,多标签多分类模型选择三个分类层级模块;对于政策标签属于n级层级标签的情况,多标签多分类模型选择n个分类层级模块。因此,多标签多分类模型的分类层级模块的数量根据政策标签的层级数据设定。多标签多分类模型的第一分类层级模块用于为段落增加第一层级标签,多标签多分类模型的第二分类层级模块用于为段落增加第二层级标签,同样,多标签多分类模型的第n分类层级模块用于为段落增加第n层级标签。通过不同分类层级模块的作用,为段落增加层级标签,以使段落进行多分类,提升政策推荐的准确度。
68.在一些可能的实施方式中,参照图4所示的多标签多分类模型的结构示意图,相邻两个分类层级模块中下一个分类层级模块用于对上一个分类层级模块进行调整,即图中所示的第二分类层级模块用于对第一分类层级模块进行调整。第一分类层级模型用于将段落按照第一层级标签进行分类,在第一分类层级模块的基础上,第二分类层级模块相对于第一分类层级模块进行微调学习,得到相对于比第一层级标签更为细化的第二层级标签,使得段落的分类结果更加准确。通过多标签多分类模型为段落增加若干层级标签,根据若干层级标签,得到段落的分类结果,进而用于后续的政策推荐过程。
69.s140:根据所述分类结果,从所述若干段落中确定出预设数量的段落作为所述目
标政策的参考信息,推送并展示所述参考信息。
70.本步骤中,根据若干段落的分类结果,从所述若干段落中确定出预设数量的段落作为所述目标政策的参考信息,推送并展示所述参考信息。在一些可能的实施方式中,根据目标政策的主题,按照若干段落的分类结果,从若干段落中筛选出与目标政策的主题相似度高的若干段落作为目标政策的参考信息,推送并展示参考信息。可选地,可以根据目标政策的主题,将与目标政策的主题相同的标签所对应的所有段落作为参考信息;也可以根据目标政策的主题和分类结果,对段落进行相似度打分,将得分高的若干段落作为参考信息;还可以根据目标政策,对若干段落进行筛选并打分,将与目标政策的主题相同且得分高的若干段落作为参考信息。在一些可能的实施方式中,对于参考信息,可以通过人机交互设备向业务人员或用户进行推送并展示,以使业务人员或用户能够根据该参考信息,更快地制定新政策。
71.可选地,本技术实施例中提供的政策推荐方法,所述多标签多分类模型包括第一分类层级模块和第二分类层级模块,所述分类标签包括第一层级标签和第二层级标签;所述将所述若干段落输入多标签多分类模型进行分类处理,包括以下步骤:
72.将所述若干段落输入所述第一分类层级模块进行分类处理,为所述若干段落增加第一层级标签;
73.将所述若干段落输入所述第二分类层级模块进行分类处理,为所述若干段落增加第二层级标签;
74.其中,所述第一分类层级模块和所述第二分类层级模块均采用卷积结构,所述第二分类层级模块与所述第一分类层级模块具有相同的嵌入层和卷积层。
75.本步骤中,参照图4,提出本技术的一种实施例,多标签多分类模型包括两个分类层级模块:第一分类层级模块和第二分类层级模块。在一些可能的实施方式中,将所述若干段落输入第一分类层级模块为所述若干段落增加第一层级标签,即图中的经济管理或者资产监管中的一个;在为段落增加第一层级标签后,将所述若干段落输入第二分类层级模块进行分类处理,为若干段落增加第二层级标签;若段落的第一层级标签为经济管理,则段落的第二层级标签为物价或统计中的一个,若段落的第一层级标签为资产监管,则段落的第二层级标签为清产核资或资产评估中的一个。由上述过程可以知道,通过两层分类层级模块,为段落增加了两个标签。相应地,多标签多分类模型可以包含三个分类层级模块,为段落增加三个标签;多标签多分类模型还可以包含四个分类层级模块,为段落增加四个标签。
76.在一些可能的实施方式中,第一分类层级模块和所述第二分类层级模块均采用卷积结构,所述第二分类层级模块与所述第一分类层级模块具有相同的嵌入层和卷积层。具体地,在第一分类层级模块完成对段落的打标过程后,第二分类层级模块只需要在第一分类层级模块的基础上进行调整,在第一层级标签的基础上,为段落增加细化标签。具体地,多标签多分类模型通过训练得到,第一分类层级模块和所述第二分类层级模块均采用卷积结构。在训练过程中,先对第一分类层级模块进行训练,训练第一层级标签,在第一嵌入层后加卷积层、第一全连接层,后加入sigmoid层,可以使用二元交叉熵对第一层级标签进行预测。完成第一分类层级模块的训练后,对第二分类层级模块进行训练,预测第二层级标签,第二分类层级模块的嵌入层和卷积层不重新生成,继承第一分类层级模块的结果,在此基础上进行微调学习,进行后续的步骤,过程同第一分类层级模块。同样,对于含有三个分
类层级模块的多标签多分类模型,第三分类层级模块的第三嵌入层和第三卷积层不重新生成,继承第二分类层级模块的结果。依次类推,对于含有多个分类层级模块的多标签多分类模型,下一层级的嵌入层和卷积层,继承上一层级的结果。
77.可选地,本技术实施例中提供的政策推荐方法,所述根据所述分类结果,从所述若干段落中确定出预设数量的段落作为所述目标政策的参考信息,包括以下步骤:
78.根据所述分类结果与所述目标政策,确定所述若干段落的得分;
79.根据所述若干段落的得分,从所述若干段落中筛选出预设数量的段落作为参考信息。
80.本步骤中,根据所述分类结果与所述目标政策的主题,确定所述若干段落的得分;将得分进行由大到小进行排序,筛选出得分高的若干段落作为参考信息。其中,该得分用于表征段落与目标政策的相似程度,将相似程度较高的若干段落作为参考信息,推荐并展示给业务人员或用户,提升政策制定的效率。
81.可选地,本技术实施例中提供的政策推荐方法,所述根据所述分类结果与所述目标政策,确定所述若干段落的得分,包括以下步骤:
82.根据所述分类结果,确定所述分类标签的概率;
83.根据所述分类结果和所述目标政策,确定所述分类标签的权重;
84.根据所述概率和所述权重,确定所述若干段落的得分。
85.本步骤中,参照图5所示的政策推荐方法流程示意图,将第一文本输入多标签多分类模型,通过第一分类层级模块为段落增加第一层级标签,得到第一分类结果,还可以得出若干段落相对于第一层级标签的概率,同样,通过后续的分类层级模块,可以得到若干段落相对于每个层级标签的概率。根据分类结果和目标政策,具体地,可以根据分类标签与目标政策的相似度大小或排序,确定分类标签的权重。根据上述概率和上述权重,确定若干段落的得分,该得分可以表征若干段落与目标政策的相似度。示例性地,对于民生领域的政策,对于标签一:医疗和标签二:交通,若目标政策的主题为道路建设,则根据标签一和标签二与目标政策的相似程度,标签二:交通与目标政策的相关度更高,因此,可以将标签二:交通的权重设置一个较高的数值,而将标签一:医疗的权重设置一个较低的数值,以使段落的得分,更能体现目标政策的主题。
86.在一些可能的实施方式中,参照图6所示的政策推荐的效果,图中第一文本包含三个段落,通过本技术提出的政策推荐方法,将三个段落按照与目标政策的相关度重新排序后,推荐并展示给业务人员或用户。当然,图6属于效果的示意图,实际情况中第一文本的数量远远大于三个,通过本技术提出的方法,将与目标政策相关的若干段落筛选出来,推荐给用户。
87.可选地,本技术实施例中提供的政策推荐方法,所述对所述第一文本进行段落特征提取,得到若干段落,包括:
88.将所述第一文本输入自然段落拆分模型,得到若干段落。
89.本步骤中,通过自然段落拆分模型将第一文本拆分成若干段落。参照图3中所示的第一文本的结构示意图,根据不同等级的标题对第一文本进行拆分。在一些可能的实施方式中,自然段落拆分模型可以使用递归树结构的模型,自然段落拆分模型还可以使用机器学习模型。本技术并不限定自然段落拆分模型的具体结构。
90.可选地,本技术实施例中提供的政策推荐方法,所述获取与目标政策相关的文本作为第一文本,包括以下步骤:
91.根据所述目标政策的主题,获取数据库中相关的文本作为第一文本;
92.或者,通过人机交互方式获取输入的文本作为第一文本。
93.本步骤中,第一文本可以是根据目标政策的主题,从数据库中获取的相关文本作为第一文本;第一文本也可以是通过人机交互方式获取业务人员或者用户输入的文本作为第一文本。第一文本用于表征与目标政策相关的历史政策文本或对照政策文本。
94.可选地,本技术实施例中提供的政策推荐方法,所述将所述若干段落输入多标签多分类模型进行分类处理这一步骤前,还包括下列步骤:
95.将所述若干段落通过bert编码器处理,得到所述若干段落对应的词向量信息;
96.将所述词向量信息通过特征聚合器处理,得到政策实例信息。
97.本步骤中,将所述若干段落输入多标签多分类模型进行分类处理这一步骤前,对若干段落进行预处理,以方便后续的处理过程。预处理的具体过程如下:
98.步骤710:将每个政策段落使用bert编码器转化为词向量:
99.{h1,h2,h3......hn}=e(w1,w2......wn)
100.步骤720:特征聚合器将隐层嵌入聚合成一个实例,得到政策实例信息:
101.[x1,p
t
]i=max{[h1]i,......,[h
pt
]i},
[0102][0103][0104][0105]
其中,[.]i表示向量的第i个值;pt,pa分别是触发词t和候选元素a的位置。
[0106]
通过上述描述可知,本技术提供的政策推荐方法,能够为政策信息增加多个层级标签,有利于提升政策推荐的准确度,提升客户满意度。
[0107]
其次,参照附图描述根据本技术实施例提出的一种政策推荐系统。
[0108]
图7是本技术提出的一个实施例的政策推荐系统的结构示意图,该系统具体包括:
[0109]
获取模块710,用于获取与目标政策相关的文本作为第一文本;
[0110]
特征提取模块720,用于对所述第一文本进行段落特征提取,得到若干段落;
[0111]
分类处理模块730,用于将所述若干段落输入多标签多分类模型进行分类处理,得到所述若干段落的分类结果;所述多标签多分类模型包括至少两个分类层级模块,各所述分类层级模块用于为所述若干段落增加对应层级的分类标签,相邻两个所述分类层级模块中下一个分类层级模块用于对上一个分类层级模块进行调整,且下一个分类层级模块所增加的分类标签为上一个分类层级模块所增加的分类标签对应的细化标签,所述若干段落的分类结果根据各所述分类标签得到;
[0112]
推荐展示模块740,用于根据所述分类结果,从所述若干段落中确定出预设数量的段落作为所述目标政策的参考信息,推送并展示所述参考信息。
[0113]
可见,上述方法实施例中的内容均适用于本系统实施例中,本系统实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法实施例所达到的有益
效果也相同。
[0114]
参照图8,本技术实施例提供了一种政策推荐装置,包括:
[0115]
至少一个处理器810;
[0116]
至少一个存储器820,用于存储至少一个程序;
[0117]
当所述至少一个程序被所述至少一个处理器810执行时,使得所述至少一个处理器810实现所述的政策推荐方法。
[0118]
同理,上述方法实施例中的内容均适用于本装置实施例中,本装置实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法实施例所达到的有益效果也相同。
[0119]
在一些可选择的实施例中,在方框图中提到的功能/操作可以不按照操作示图提到的顺序发生。例如,取决于所涉及的功能/操作,连续示出的两个方框实际上可以被大体上同时地执行或所述方框有时能以相反顺序被执行。此外,在本技术的流程图中所呈现和描述的实施例以示例的方式被提供,目的在于提供对技术更全面的理解。所公开的方法不限于本文所呈现的操作和逻辑流程。可选择的实施例是可预期的,其中各种操作的顺序被改变以及其中被描述为较大操作的一部分的子操作被独立地执行。
[0120]
此外,虽然在功能性模块的背景下描述了本技术,但应当理解的是,除非另有相反说明,功能和/或特征中的一个或多个可以被集成在单个物理装置和/或软件模块中,或者一个或多个功能和/或特征可以在单独的物理装置或软件模块中被实现。还可以理解的是,有关每个模块的实际实现的详细讨论对于理解本技术是不必要的。更确切地说,考虑到在本文中公开的装置中各种功能模块的属性、功能和内部关系的情况下,在工程师的常规技术内将会了解该模块的实际实现。因此,本领域技术人员运用普通技术就能够在无需过度试验的情况下实现在权利要求书中所阐明的本技术。还可以理解的是,所公开的特定概念仅仅是说明性的,并不意在限制本技术的范围,本技术的范围由所附权利要求书及其等同方案的全部范围来决定。
[0121]
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干程序用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0122]
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行程序的定序列表,可以具体实现在任何计算机可读介质中,以供程序执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从程序执行系统、装置或设备取程序并执行程序的系统)使用,或结合这些程序执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供程序执行系统、装置或设备或结合这些程序执行系统、装置或设备而使用的装置。
[0123]
计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线
的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(ram),只读存储器(rom),可擦除可编辑只读存储器(eprom或闪速存储器),光纤装置,以及便携式光盘只读存储器(cdrom)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
[0124]
应当理解,本技术的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的程序执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(pga),现场可编程门阵列(fpga)等。
[0125]
在本说明书的上述描述中,参考术语“一个实施方式/实施例”、“另一实施方式/实施例”或“某些实施方式/实施例”等的描述意指结合实施方式或示例描述的具体特征、结构、材料或者特点包含于本技术的至少一个实施方式或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施方式或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施方式或示例中以合适的方式结合。
[0126]
尽管已经示出和描述了本技术的实施方式,本领域的普通技术人员可以理解:在不脱离本技术的原理和宗旨的情况下可以对这些实施方式进行多种变化、修改、替换和变型,本技术的范围由权利要求及其等同物限定。
[0127]
以上是对本技术的较佳实施进行了具体说明,但本技术并不限于所述实施例,熟悉本领域的技术人员在不违背本技术精神的前提下还可做作出种种的等同变形或替换,这些等同的变形或替换均包含在本技术权利要求所限定的范围内。