本申请实施例属于计算机,特别是涉及一种文本匹配方法、装置、终端设备及存储介质。
背景技术:
1、在一些场景中,可能需要对用户输入的信息进行识别,得到能够概括该用户输入的信息的另一信息。示例性地,在远程问诊过程中,用户可以输入用于描述自身身体状况的文本或语句,远程问诊系统可以根据这些文本或语句确定出用户希望表达自身所患疾病的信息,以便为用户推荐适合的医生。又或者,在用户购买保险时,投保系统需要根据用户的描述,确定用户当前所要告知自身健康状况是否符合投保要求的准确信息。
2、目前,远程问诊系统或投保系统在对用户输入的描述信息进行识别时,通常都是由人工来实现的。例如,远程问诊系统后台的导诊人员和投保系统的保险销售人员可以根据自身经验判断用户描述的信息或输入的文本是在告知其是否患有某种疾病。但是,这种通过人工对用户输入的文本进行识别来确定用户真实表达的信息的方式,不仅耗费大量的人力、物力,也无法保证准确性。
技术实现思路
1、有鉴于此,本申请实施例提供了一种文本匹配方法,可以对用户输入的待匹配的文本进行粗匹配和精匹配,得到与待匹配的文本高度匹配的疾病,用以提高文本匹配的准确度和效率。
2、本申请实施例的第一方面提供了一种文本匹配方法,包括:
3、获取待匹配的文本;
4、采用文本转向量模型,将所述文本转换为目标向量;
5、通过在向量数据库中对所述目标向量进行粗匹配,从所述向量数据库中的多个向量中筛选出与所述目标向量之间的相似度大于预设阈值的多个粗匹配向量,各个所述向量用于表征不同疾病,每个所述向量具有一一对应的标签文本;
6、对所述文本和与各个所述粗匹配向量一一对应的标签文本进行精匹配,得到与所述文本匹配的目标标签文本,所述目标标签文本用于表示所述文本对应的疾病。
7、本申请实施例的第二方面提供了一种文本匹配装置,包括:
8、获取模块,用于获取待匹配的文本;
9、转换模块,用于采用文本转向量模型,将所述文本转换为向量;
10、粗匹配模块,用于通过在向量数据库中对所述向量进行粗匹配,从所述向量数据库中的多个目标向量中筛选出与所述向量之间的相似度大于预设阈值的多个粗匹配向量,各个所述目标向量用于表征不同疾病,每个所述目标向量具有一一对应的标签文本;
11、精匹配模块,用于对所述文本和与各个所述粗匹配向量一一对应的标签文本进行精匹配,得到与所述文本匹配的目标标签文本,所述目标标签文本用于表示所述文本对应的疾病。
12、本申请实施例的第三方面提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面所述的文本匹配方法。
13、本申请实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面所述的文本匹配方法。
14、与现有技术相比,本申请实施例具有以下优点:
15、应用本申请实施例提供的方法,对用户输入的待匹配的文本先进行粗匹配,得到多个粗匹配向量,再基于多个粗匹配向量,采用大语言模型对待匹配的文本进行精匹配,通过两次匹配,筛选出与待匹配的文本高度匹配的疾病对应的目标标签文本,保证了文本匹配的准确度,提高了文本匹配的效率。
1.一种文本匹配方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述通过在向量数据库中对所述目标向量进行粗匹配,从所述向量数据库中的多个向量中筛选出与所述目标向量之间的相似度大于预设阈值的多个粗匹配向量,包括:
3.根据权利要求1所述的方法,其特征在于,所述对所述文本和与各个所述粗匹配向量一一对应的标签文本进行精匹配,得到与所述文本匹配的目标标签文本,包括:
4.根据权利要求1-3任一项所述的方法,其特征在于,在所述获取待匹配的文本之前,还包括:
5.根据权利要求4所述的方法,其特征在于,还包括:
6.根据权利要求5所述的方法,其特征在于,所述将多个所述向量存入所述向量数据库中,包括:
7.根据权利要求1-3或5-6中任一项所述的方法,其特征在于,在所述获取待匹配的文本之前,还包括:
8.一种文本匹配装置,其特征在于,包括:
9.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-7任一项所述的文本匹配方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-7任一项所述的文本匹配方法。