数据处理方法、装置、计算机设备及存储介质与流程

文档序号:20779469发布日期:2020-05-19 21:06阅读:108来源:国知局
数据处理方法、装置、计算机设备及存储介质与流程

本发明涉及数据处理领域,尤其涉及一种数据处理方法、装置、计算机设备及存储介质。



背景技术:

在健康保险行业中,医疗资源是一种十分重要的资源。用户在购买健康险保险产品后能否享受到优质的医疗服务成为用户选择保险公司的一个重要因素,也是各保险公司的竞争焦点。目前,保险公司可以通过计算机赔付系统或者移动终端上的应用程序等进行自动赔付,但在计算机赔付系统或者移动终端上产生的可赔付的医院信息并未与用户类型或者疾病类型等具有关联性,因此,该医院信息并不能对用户治疗疾病时选取目标医院具有明确的指导作用,进而,用户也无法准确获知每一种保险产品、医院信息和自身三者的关联关系。如此,一方面,用户可能后续就治疗和赔付等处理流程与保险公司的员工进行人工反复咨询,给理赔工作带来了不便,降低了通过计算机赔付系统或者移动终端进行自动理赔的理赔效率,浪费了人力资源,也给用户带来极其不良的用户体验;另一方面,用户可能在医院信息中随机选择医院进行治疗,其随机选择的医院可能对用户疾病并不具有针对性,可能会延误用户的对症治疗,进而导致用户的病情加重,同时,可能也会增加保险公司的赔付额度。

因此,寻找一种可通过大数据分析保险产品、医院信息和用户信息三者的关联关系并产生最准确和最适合用户的目标医院的医院信息的技术方案成为本领域技术人员亟需待解的问题。



技术实现要素:

基于此,有必要针对上述技术问题,提供一种数据处理方法、装置、计算机设备及存储介质,用于通过大数据分析用户信息、匹配信息与医院信息后,向用户推荐适合度且准确度高的目标医院,从而可供用户选择目标医院后提升用户的体验效果。

一种数据处理方法,包括:

接收包含用户信息的推荐指令,根据所述用户信息中的身份信息自数据库中查询待匹配项;

自所述用户信息的患病特征信息中提取关键信息;

通过语义模型获取所述待匹配项的匹配信息,在所述匹配信息与所述关键信息匹配成功时,遍历查询所述数据库与所述匹配信息关联的医院信息列表,确定与所述关键信息匹配的医院信息,并根据与所述关键信息匹配的所述医院信息生成匹配列表;所述医院信息列表中包含至少一项所述医院信息;

利用lucene组件生成所述匹配列表中的每一项所述医院信息对应的目标医院的显示权重因子,并根据所述显示权重因子确定所述用户信息、所述匹配信息与所述目标医院的所述医院信息之间的关联度;

按照所述关联度对各所述目标医院进行排序,并在客户端的交互界面上按照预设维度展示排序之后的各所述目标医院对应的所述医院信息和/或所述显示权重因子。

一种数据处理装置,包括:

接收模块,用于接收包含用户信息的推荐指令,根据所述用户信息中的身份信息自数据库中查询待匹配项;

提取模块,用于自所述用户信息的患病特征信息中提取关键信息;

生成模块,用于通过语义模型获取所述待匹配项的匹配信息,在所述匹配信息与所述关键信息匹配成功时,遍历查询所述数据库与所述匹配信息关联的医院信息列表,确定与所述关键信息匹配的医院信息,并根据与所述关键信息匹配的所述医院信息生成匹配列表;所述医院信息列表中包含至少一项所述医院信息;

确定模块,用于利用lucene组件生成所述匹配列表中的每一项所述医院信息对应的目标医院的显示权重因子,并根据所述显示权重因子确定所述用户信息、所述匹配信息与所述目标医院的所述医院信息之间的关联度;

展示模块,用于按照所述关联度对各所述目标医院进行排序,并在客户端的交互界面上按照预设维度展示排序之后的各所述目标医院对应的所述医院信息和/或所述显示权重因子。

一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述数据处理方法。

一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述数据处理方法。

上述数据处理方法、装置、计算机设备及存储介质,自所述用户信息的患病特征信息中提取关键信息;通过语义模型获取所述待匹配项的匹配信息,在所述匹配信息与所述关键信息匹配成功时,遍历查询所述数据库与所述匹配信息关联的医院信息列表,确定与所述关键信息匹配的医院信息,并根据与所述关键信息匹配的所述医院信息生成匹配列表;所述医院信息列表中包含至少一项所述医院信息;利用lucene组件生成所述匹配列表中的每一项所述医院信息对应的目标医院的显示权重因子,并根据所述显示权重因子确定所述用户信息、所述匹配信息与所述目标医院的所述医院信息之间的关联度;按照所述关联度对各所述目标医院进行排序,并在客户端的交互界面上按照预设维度展示排序之后的各所述目标医院对应的所述医院信息和/或所述显示权重因子。此时在客户端的交互界面是按照预设维度展示,即交互界面中的每一个页面都展示了目标医院的医院信息(比如医院的名称、医院的主治科目等)和/或显示权重因子(比如地理因子、保险的赔付因子等),且每一个页面的目标医院的医院信息是通过分析用户信息、匹配信息与医院信息后按适合度(关联度)高低产生的排序。因此用户很方便地在客户端的交互界面中观看排序后选择一个与自身身份信息关联的待匹配项(保险产品)最适合的目标医院,如此,可减少用户选择目标医院的疑惑性,避免了后续的反复咨询导致的浪费人力资源的状况出现;且用户选择的目标医院将会与其自身身份信息中包含的患病特征信息匹配,也即选择的目标医院将具备针对性,因此,用户可以在选择的目标医院中对症治疗,一方面使得用户的患病特征信息可以得到最好的治疗,进一步提升了用户体验效果,另一方通过显示权重因子(保险的赔付因子)可让用户最大化得到关于治疗所产生的费用的赔付,另一方面由于选择的目标医院具有针对性也间接减少了保险公司的为病情延误所额外支出的赔付额度。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1是本发明一实施例中数据处理方法的一应用环境示意图;

图2是本发明一实施例中数据处理方法的一流程图;

图3是本发明一实施例中数据处理方法步骤s40的流程示意图;

图4是本发明一实施例中数据处理装置的结构示意图;

图5是本发明一实施例中计算机设备的一示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明提供的数据处理方法,可应用在如图1的应用环境中,其中,客户端通过网络与服务器进行通信。其中,客户端可以但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一实施例中,如图2所示,提供一种数据处理方法,以该方法应用在图1中的服务器为例进行说明,包括如下步骤s10-s50:

s10,接收包含用户信息的推荐指令,根据所述用户信息中的身份信息自数据库中查询待匹配项;

可理解地,在用户通过按钮去触发医院的推荐指令后,服务器接收到推荐指令,同时可从一个预设存储数据库中获取到与用户匹配的用户信息,并根据用户信息中的身份信息(包括姓名、身份证号码、家庭住址等)可在与各个合作公司关联的数据库中查询出至少一个待匹配项,其中,待匹配项为与各个医院存在关联关系的产品项,比如,所述产品项为各个合作保险公司的保险产品,包括健康险的保险产品。

s20,自所述用户信息的患病特征信息中提取关键信息;

可理解地,患病特征信息是从各个医院系统关联的数据库获取的病历信息,并与用户信息关联存储至一个预设存储数据库中,此时可根据识别固定模块的规则在预设存储数据库中固定模块位置直接提取患病特征信息中的关键信息,比如,患病特征信息为一个用户在一家医院的病历信息,此时可在识别到病历信息中的患病模块位置(上述提到的固定模板位置,可通过识别该固定模板位置关联的信息或者标识,比如所患疾病名称、带星标识等)直接提取该用户所患疾病的具体学术名称(感冒、发烧等)。

s30,通过语义模型获取所述待匹配项的匹配信息,在所述匹配信息与所述关键信息匹配成功时,遍历查询所述数据库与所述匹配信息关联的医院信息列表,确定与所述关键信息匹配的医院信息,并根据与所述关键信息匹配的所述医院信息生成匹配列表;所述医院信息列表中包含至少一项所述医院信息;

可理解地,匹配信息是指上述提到的产品项的产品信息(当待匹配项为保险产品时,匹配信息为保险产品的条款信息,条款信息可为疾病相关的责任条款等),其中,每一种产品项都有关联一个产品合同或者产品说明书(以电子的形式存在),因此通过该产品合同或者产品说明书就能直接获取与其对应的产品信息;医院信息列表中存在多个与待匹配项关联的各种医院信息;医院信息是指清洗和标签化之后的医院数据,因此医院信息最后是以标签形式所呈现出的医院数据,比如某一个医院的医院信息是以公立医院或私立医院中的一个、三级特等医院或三级甲等医院或三级乙等医院或三级丙等医院或二级甲等医院或二级乙等医院或二级丙等医院种的一个、未评级医院、限定社保定点医院、海外医院等标签形式所呈现出的医院数据。

具体地,首先可通过语义模型去识别待匹配项对应的所有匹配信息中的关键字,并可只提取关键字所在模块的匹配信息(比如可以识别待匹配项中关于用户患各种疾病时相关的关键字,此时可直接提取关键字所在模块的匹配信息,待匹配项中的所有匹配信息被多个模块进行划分;可理解地,一个模块中的匹配信息是指待匹配项中一个条款序号下的匹配信息,待匹配项中所有的匹配信息都关联于一个唯一的条款序号);接着将匹配信息与关键信息进行匹配(也即将记录在匹配信息的疾病种类和用户所患疾病的具体学术名称进行匹配),并在匹配成功时(在另一实施例中,即在匹配失败时,确定待匹配项的匹配信息并不具备保障患病特征信息的功能),自数据库中查询与匹配信息关联的医院信息列表(医院信息列表中各项医院信息与待匹配项的匹配信息之间的关联关系已被绑定成功),也即确定与待匹配项关联的至少一项医院信息;最后可通过匹配信息与关键信息之间的匹配关系,匹配信息与医院信息列表中医院信息的关联关系,进一步确定出关键信息匹配的医院信息。

在本实施例中,通过匹配信息与关键信息的匹配,并在匹配成功时可先确定出与待匹配项的匹配信息关联的医院信息列表中的各项医院信息,再来确定与关键信息匹配的医院信息,从而可避免关键信息直接与所有未确定出与匹配信息关联的医院信息进行匹配的过程,因此可减少服务器确定与关键信息匹配的医院信息的时间,也可减少服务器的工作负担。

进一步地,所述通过语义模型获取所述待匹配项的匹配信息,在所述匹配信息与所述关键信息匹配成功时,遍历查询所述数据库与所述匹配信息关联的医院信息列表,确定与所述关键信息匹配的医院信息,包括:

确定通过所述语义模型从所述待匹配项获取到的所述匹配信息的数量;一个所述待匹配项对应一个所述匹配信息;

在所述匹配信息的数量为一个且所述匹配信息与所述关键信息匹配成功时,遍历查询所述数据库与该所述匹配信息关联的所述医院信息列表,确定与所述关键信息匹配的所述医院信息;在另一实施例中,在所述匹配信息的数量为一个且所述匹配信息与所述关键信息匹配失败时,提示所述关键信息不与所述待匹配项关联。

在所述匹配信息的数量为两个以上且所述匹配信息与所述关键信息匹配成功时,遍历查询所述数据库与所有所述匹配信息关联的所述医院信息列表,获取每一个所述匹配信息匹配的所述医院信息组成的各组匹配数据,获取各组所述匹配数据中重合的所述医院信息,并将重合的所述医院信息确定为与所述关键信息匹配的所述医院信息。在另一实施例中,在所述匹配信息的数量为两个以上且所述匹配信息与所述关键信息匹配成功时,自所述数据库与所述匹配信息关联的所述医院信息列表中,获取每一个所述匹配信息匹配的所述医院信息组成的各组匹配数据,在获取不到各组所述匹配数据中重合的所述医院信息时,从所述匹配数据中选择匹配度最高的所述医院信息并将其确定为与所述关键信息匹配的所述医院信息;所述匹配度是从各组所述匹配数据中确定出与所述关键信息最适合的医院信息,包括确定医院信息中治疗关键信息的门诊排名、医院的等级排名、专家等级等情况的评分,最后再通过评分计算出各医院信息与关键信息的匹配度。

在本实施例中,由于一个待匹配项对应一个匹配信息,且用户信息中的身份信息至少关联一个以上的待匹配项,因此在用户信息中的身份信息关联两个以上的待匹配项时,可确定从待匹配项获取到的匹配信息的数量为一个;在用户信息中的身份信息关联两个以上的待匹配项时,可确定从待匹配项获取到的匹配信息的数量为两个以上。此时可将匹配信息与关键信息进行匹配,并在匹配成功时,可说明关键信息关联于待匹配项,也可确定出与关键信息匹配的医院信息。此实施例可通过确定从待匹配项获取到的匹配信息的数量来确定出与关键信息匹配的医院信息,因此确定出来的医院信息将会更吻合于关键信息,也能给用户起到一个整合推荐的作用(在与用户信息中的身份信息关联的待匹配项存在两个以上时,也即在待匹配项的匹配信息的数量为两个以上时,确定出一个与用户的关键信息最适合的医院信息)。

进一步地,所述遍历查询所述数据库与所述匹配信息关联的医院信息列表,确定与所述关键信息匹配的医院信息之前,还包括:

通过预设数据获取方式收集所有医院的医院数据,并对所有所述医院数据进行数据核对后执行数据清洗,得到清洗后的所述医院数据;

对清洗后的所述医院数据进行标签化,将每一个医院标签化之后的各所述医院数据记录为该医院的所述医院信息。

可理解地,预设数据获取方式包括网络爬虫或人工收集方式;数据清洗对所有的医院数据进行重新审查和校验的过程,目的在于删除重复信息、纠正存在的错误,并保证医院数据的一致性,具体的实现方式可通过设置清洗规则或者人工整合处理,上述清洗规则可包括去重处理等;标签化具体可以从清洗后的医院数据筛选或总结出具有代表性的关键词。

在本实施例中,通过数据清洗可对收集到的所有医院的医院数据进行清洗,从而能过滤掉无效的或者重复的医院数据,并对清洗后的医院数据进行标签化,从而能对清洗后的医院数据转换成一个简化的形式,方便于用户的查看。

s40,利用lucene组件生成所述匹配列表中的每一项所述医院信息对应的目标医院的显示权重因子,并根据所述显示权重因子确定所述用户信息、所述匹配信息与所述目标医院的所述医院信息之间的关联度;

可理解地,显示权重因子是指利用用户信息、匹配信息与匹配列表中的各医院信息的对应关系设置lucene组件生成并呈现关于目标医院的重要医院信息以及这部分重要医院信息所占的重要程度,比如目标医院的等级排名的重要程度为百分之二十(等级排名为三甲的目标医院所占的重要程度为百分之二十之下的百分之一百、等级排名为二甲为的目标医院所占的重要程度为百分之二十之下的百分之八十等)、目标医院的治疗关键信息的门诊排名的重要程度为百分之二十(门诊排名为第一名的目标医院所占的重要程度为百分之二十之下的百分之一百等)、目标医院的评价信息的重要程度为百分之二十(好的评价信息的目标医院所占的重要程度为百分之二十之下的百分之一百等。评价信息具体可由预设人员去判定好坏情况)、目标医院与待匹配项的关联程度(也即用户在目标医院就诊后保险产品的赔付情况,也可被为保险的赔付因子,保险的赔付因子包括全赔付、部分赔付等)的重要程度为百分之二十,目标医院与用户之间的距离(也即下文提到的地理因子)的重要程度为百分之十,其他的重要程度为百分之十等,上述提到的重要程度可根据需求自行设定;关联度是指通过显示权重因子中的目标医院的重要医院信息和重要程度来计算出用户信息、匹配信息与目标医院的医院信息对应的目标医院(用户信息、匹配信息与目标医院的医院信息之间存在一个对应关系,即一个用户信息对应至少一个匹配信息,而一个匹配关系对应至少一个目标医院的医院信息,因此,一旦通过预设权重因子确定出一个目标医院的重要医院信息以后,也能通过预设权重因子确定出目标医院的重要医院信息之间的关联度;上述提到的联系关系是通过数据图谱组件建立出来)的权重值(通过相加运算计算权重因子中的所有重要医院信息所占的重要程度),此权重值适用于对目标医院的排序,且关联度可通过权重值反映出目标医院与用户的适合度。

进一步地,如图3所示,所述利用lucene组件生成所述匹配列表中的每一个所述医院信息对应的目标医院的显示权重因子,包括:

s401,利用所述lucene组件获取通过数据图谱组件建立的所述用户信息、所述匹配信息与所述目标医院中的所述医院信息之间的对应关系,并利用所述lucene组件将每一组具有对应关系的所述用户信息、所述匹配信息和所述目标医院的所述医院信息的进行文档化处理之后,得到一个目标文档;

s402,将所述目标文档输入至所述lucene组件中的预设分词组件进行分词处理,得到分词处理后的第一目标词元;

s403,将所述第一目标词元输入至所述lucene组件中的预设语言处理组件进行过滤和总结化处理,得到第二目标词元;

s404,将所述第二目标词元输入至所述lucene组件中的预设索引组件,得到所述预设索引组件生成的一个索引文件;所述索引文件包括与所述第二目标词元对应的索引关键信息;

s405,在将所述关键信息输入至所述lucene组件后,将所述关键信息与所述索引文件中的所述索引关键信息进行匹配,并在匹配成功时,获取通过与所述lucene组件关联的第一数据接口输出关于所述目标医院的所述显示权重因子。

可理解地,lucene组件是一个具备全文搜素功能的工具,可以为本服务器种的系统程序添加索引后,然后可通过索引去搜索到目标信息;数据图谱组件是一种通过数据与数据之间的连续关系而建立的一个可输出与一个数据关联的所有数据信息,即数据图谱组件已写入一种数据关系的逻辑。第一数据接口是用于将lucene组件中目标医院的显示权重因子的数据传输出来。

在本实施例中,通过数据图谱组件建立的对应关系将会很直观地对用户信息、匹配信息与目标医院中的医院信息进行准确关联,并且一旦其中一种数据被确定出来,其他与此种数据关联对应的数据将会快速的被查询出来,从而可以增加服务器的运行效率;将关键信息输入至lucene组件后,可通过到用户信息、匹配信息与匹配列表中的各医院信息的对应关系查询到目标医院的医院信息,但由于lucene组件设置了重要医院信息,因此lucene组件关联的第一数据接口输出并不为目标医院对应的全部医院信息,而是目标医院对应的重要医院信息(也即显示权重因子)。从而本实施例可呈现重要的信息给用户观看,也方便于设置目标医院显示的权重关系(也即上述提到的关联度)。

进一步地,所述步骤s404中,所述得到所述预设索引组件生成的一个索引文件之后,还包括:

获取包含更新标识的索引文件更新指令,从数据库中获取与所述更新标识对应的待更新的索引文件,并在内存索引中删除所述待更新的索引文件,并将删除的所述待更新的索引文件放入内存文档删除列表;

根据所述更新标识获取新的索引文件,并将所述新的索引文件加入至所述内存索引中;

将所述内存文档删除列表应用到与所述数据库对应的硬盘索引中后,以删除所述硬盘索引中的所述待更新的索引文件;

将加入所述新的索引文件的所述内存索引合并到所述硬盘索引中,确认完成所述索引文件的更新。

可理解地,由于各个索引文件都被存储至数据库中,并在数据库中已对所有的索引文件关联起了更新标识(比如编号),因此查询到更新标识就可以确定出索引文件,比如,1号关联的索引文件为待更新的索引文件。此时,就可通过1号去从数据库查询到待更新的索引文件;在数据库中将与更新标识对应的待更新的索引文件进行删除后,可将与更新标识对应的新的索引文件(在确定出待更新的索引文件的更新标识后,可预先将更新标识关联起新的索引文件)加入到数据库中

在本实施例中,可对数据库中的索引文件进行及时更新,从而可清除掉无效的待更新的索引文件,从而在关键信息与索引文件中的索引关键信息进行匹配的过程中,可利用lucene组件生成有针对性的显示权重因子。

进一步地,所述用户信息包括用户所在位置的第一地理位置;所述显示权重因子包括地理因子;所述步骤s40中,所述利用lucene组件生成所述匹配列表中的每一个所述医院信息对应的目标医院的显示权重因子,包括:

获取所述目标医院的医院信息中的各个所述目标医院所在的第二地理位置,利用lucene组件计算所述第一地理位置和所述第二地理位置之间相差的第三地理位置,并将所述第三地理位置记录为地理因子。

可理解地,用户信息种用户所在位置的第一地理位置可通过用户去触发医院的推荐指令后通过客户端的定位功能获取用所在的第一地理位置;各个目标医院所在的第二地理位置可预先通过网上爬取得到,并将第二地理位置的数据存储至医院信息中。第三地理位置是通过多种交通方式(包括但不限于步行、驾车、公交和地铁)来确定出第一地理位置和第二地理位置之间的实际距离,也即上述提到的地理因子可显示在多种交通方式下第一地理位置和第二地理位置之间的实际距离,也可显示一种常用的交通方式下第一地理位置和第二地理位置之间的实际距离。

本实施例中的地理因子将会作为预先权重因子中的一个,并会展示至客户端的交互界面上以供用户查看目标医院与自身的距离。

s50,按照所述关联度对各所述目标医院进行排序,并在客户端的交互界面上按照预设维度展示排序之后的各所述目标医院对应的所述医院信息和/或所述显示权重因子。

可理解地,确定出来的关联度也为一个排序的权重值,通过此权重值的大小可实现在客户端的交互界面上对目标医院进行排序(其中,权重值的大小越大,排序的顺序越靠前,排序越靠前就说明目标医院与用户信息的适合度越高,因此关联度可理解为用户信息的适合度)。此时在客户端的交互界面是按照预设维度展示,即交互界面中的每一个页面都展示了目标医院的医院信息(比如医院的名称、医院的主治科目等)和/或显示权重因子(比如地理因子、保险的赔付因子等),且每一个页面的目标医院的医院信息是通过分析用户信息、匹配信息与医院信息后按适合度(关联度)高低产生的排序。因此可方便于用户去观看排序后选择一个与自身身份信息关联的待匹配项最适合的目标医院,从而可增加了用户体验,一方面可减少用户选择目标医院的疑惑性,另一方通过显示权重因子(保险的赔付因子)可让用户最大化得到关于治疗所产生的费用的赔付,另一方面由于选择的目标医院具有针对性也间接减少了保险公司的为病情延误所额外支出的赔付额度。

进一步地,所述步骤s50之后,还包括:

将反馈请求通过预设方式发送至用户,获取用户根据所述反馈请求针对一个所述目标医院反馈的评价信息,通过与该目标医院关联的第二数据接口查询所述目标医院中是否存在与所述用户的所述身份信息匹配的就诊信息;

在存在与所述用户的所述身份信息匹配的所述就诊信息时,将所述评价信息发送至预设人员进行验证,并在验证无误后,根据所述评价信息调整该目标医院对应的所述关联度。

可理解地,评价信息是在用户触发医院的推荐指令的一段预设时长后,服务器自动生成一条对应的提示进行评级的信息反馈至用户所关联的客户端中。第二数据接口是与目标医院关联的就诊系统。

在本实施例中,先获取用户针对一个目标医院反馈的评价信息,再去查询目标医院中是否存在与用户的身份信息匹配的就诊信息,从而可避免用户未到目标医院进行就诊就进行恶意评价的情况,因此可保证各目标医院的排序(上述关联度)的公平性。并在存在与用户的身份信息匹配的就诊信息时,去通过预设人员去验证评价信息,也可进一步地避免用户进行恶意评价的情况。

进一步地,所述步骤s50中,所述在客户端的交互界面上按照预设维度展示排序之后的各所述目标医院对应的医院信息和/或显示权重因子之后,还包括:

获取所述用户在所述交互界面中针对一个所述目标医院触发的展示指令后,令所述交互界面展示与该目标医院关联的所有清洗后的所述医院数据。

可理解地,客户端的交互界面的主页面存在多个预设维度的目标医院对应的医院信息和/或显示权重因子,可选地,一个预设维度可对应一个医院信息和/或显示权重因子,且一个预设维度下存在一个子维度,每个子维度中存在目标医院关联的所有清洗后的医院数据。

在本实施例中,用户在交互界面中针对一个目标医院触发的展示指令后,用户可清晰观看到与该目标医院关联的所有清洗后的医院数据,从而可加深用户对该目标医院的了解,且提供给用户进一步地判断的参考。

综上所述,上述提供了一种数据处理方法,自所述用户信息的患病特征信息中提取关键信息;通过语义模型获取所述待匹配项的匹配信息,在所述匹配信息与所述关键信息匹配成功时,遍历查询所述数据库与所述匹配信息关联的医院信息列表,确定与所述关键信息匹配的医院信息,并根据与所述关键信息匹配的所述医院信息生成匹配列表;所述医院信息列表中包含至少一项所述医院信息;利用lucene组件生成所述匹配列表中的每一项所述医院信息对应的目标医院的显示权重因子,并根据所述显示权重因子确定所述用户信息、所述匹配信息与所述目标医院的所述医院信息之间的关联度;按照所述关联度对各所述目标医院进行排序,并在客户端的交互界面上按照预设维度展示排序之后的各所述目标医院对应的所述医院信息和/或所述显示权重因子。此时在客户端的交互界面是按照预设维度展示,即交互界面中的每一个页面都展示了目标医院的医院信息(比如医院的名称、医院的主治科目等)和/或显示权重因子(比如地理因子、保险的赔付因子等),且每一个页面的目标医院的医院信息是通过分析用户信息、匹配信息与医院信息后按适合度(关联度)高低产生的排序。因此用户很方便地在客户端的交互界面中观看排序后选择一个与自身身份信息关联的待匹配项(保险产品)最适合的目标医院,如此,可减少用户选择目标医院的疑惑性,避免了后续的反复咨询导致的浪费人力资源的状况出现;且用户选择的目标医院将会与其自身身份信息中包含的患病特征信息匹配,也即选择的目标医院将具备针对性,因此,用户可以在选择的目标医院中对症治疗,一方面使得用户的患病特征信息可以得到最好的治疗,进一步提升了用户体验效果,另一方通过显示权重因子(保险的赔付因子)可让用户最大化得到关于治疗所产生的费用的赔付,另一方面由于选择的目标医院具有针对性也间接减少了保险公司的为病情延误所额外支出的赔付额度。

应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。

在一实施例中,提供一种数据处理装置,该数据处理装置与上述实施例中数据处理方法一一对应。如图4所示,该数据处理装置包括接收模块11、提取模块12、生成模块13、确定模块14和展示模块15。各功能模块详细说明如下:

接收模块11,用于接收包含用户信息的推荐指令,根据所述用户信息中的身份信息自数据库中查询待匹配项;

提取模块12,用于自所述用户信息的患病特征信息中提取关键信息;

生成模块13,用于通过语义模型获取所述待匹配项的匹配信息,在所述匹配信息与所述关键信息匹配成功时,遍历查询所述数据库与所述匹配信息关联的医院信息列表,确定与所述关键信息匹配的医院信息,并根据与所述关键信息匹配的所述医院信息生成匹配列表;所述医院信息列表中包含至少一项所述医院信息;

确定模块14,用于利用lucene组件生成所述匹配列表中的每一项所述医院信息对应的目标医院的显示权重因子,并根据所述显示权重因子确定所述用户信息、所述匹配信息与所述目标医院的所述医院信息之间的关联度;

展示模块15,用于按照所述关联度对各所述目标医院进行排序,并在客户端的交互界面上按照预设维度展示排序之后的各所述目标医院对应的所述医院信息和/或所述显示权重因子。

进一步地,所述生成模块包括:

第一确定子模块,用于确定通过所述语义模型从所述待匹配项获取到的所述匹配信息的数量;一个所述待匹配项对应一个所述匹配信息;

第二确定子模块,用于在所述匹配信息的数量为一个且所述匹配信息与所述关键信息匹配成功时,遍历查询所述数据库与该所述匹配信息关联的所述医院信息列表,确定与所述关键信息匹配的所述医院信息;

第三确定子模块,用于在所述匹配信息的数量为两个以上且所述匹配信息与所述关键信息匹配成功时,遍历查询所述数据库与所有所述匹配信息关联的所述医院信息列表,获取每一个所述匹配信息匹配的所述医院信息组成的各组匹配数据,获取各组所述匹配数据中重合的所述医院信息,并将重合的所述医院信息确定为与所述关键信息匹配的所述医院信息。

进一步地,所述数据处理装置还包括:

数据清洗模块,用于通过预设数据获取方式收集所有医院的医院数据,并对所有所述医院数据进行数据核对后执行数据清洗,得到清洗后的所述医院数据;

记录模块,用于对清洗后的所述医院数据进行标签化,将每一个医院标签化之后的各所述医院数据记录为该医院的所述医院信息。

进一步地,所述确定模块包括:

第一处理子模块,用于利用所述lucene组件获取通过数据图谱组件建立的所述用户信息、所述匹配信息与所述目标医院中的所述医院信息之间的对应关系,并利用所述lucene组件将每一组具有对应关系的所述用户信息、所述匹配信息和所述目标医院的所述医院信息的进行文档化处理之后,得到一个目标文档;

第二处理子模块,用于将所述目标文档输入至所述lucene组件中的预设分词组件进行分词处理,得到分词处理后的第一目标词元;

第三处理子模块,用于将所述第一目标词元输入至所述lucene组件中的预设语言处理组件进行过滤和总结化处理,得到第二目标词元;

输入子模块,用于将所述第二目标词元输入至所述lucene组件中的预设索引组件,得到所述预设索引组件生成的一个索引文件;所述索引文件包括与所述第二目标词元对应的索引关键信息;

匹配子模块,用于在将所述关键信息输入至所述lucene组件后,将所述关键信息与所述索引文件中的所述索引关键信息进行匹配,并在匹配成功时,获取通过与所述lucene组件关联的第一数据接口输出关于所述目标医院的所述显示权重因子。

进一步地,所述数据处理装置还包括:

放入模块,用于获取包含更新标识的索引文件更新指令,从数据库中获取与所述更新标识对应的待更新的索引文件,并在内存索引中删除所述待更新的索引文件,并将删除的所述待更新的索引文件放入内存文档删除列表;

加入模块,用于根据所述更新标识获取新的索引文件,并将所述新的索引文件加入至所述内存索引中;

应用模块,用于将所述内存文档删除列表应用到与所述数据库对应的硬盘索引中后,以删除所述硬盘索引中的所述待更新的索引文件;

确认模块,用于将加入所述新的索引文件的所述内存索引合并到所述硬盘索引中,确认完成所述索引文件的更新。

进一步地,所述确定模块包括:

获取子模块,用于获取所述目标医院的医院信息中的各个所述目标医院所在的第二地理位置,利用lucene组件计算所述第一地理位置和所述第二地理位置之间相差的第三地理位置,并将所述第三地理位置记录为地理因子。

进一步地,所述数据处理装置还包括:

查询模块,用于将反馈请求通过预设方式发送至用户,获取用户根据所述反馈请求针对一个所述目标医院反馈的评价信息,通过与该目标医院关联的第二数据接口查询所述目标医院中是否存在与所述用户的所述身份信息匹配的就诊信息;

验证模块,用于在存在与所述用户的所述身份信息匹配的所述就诊信息时,将所述评价信息发送至预设人员进行验证,并在验证无误后,根据所述评价信息调整该目标医院对应的所述关联度。

关于数据处理装置的具体限定可以参见上文中对于数据处理方法的限定,在此不再赘述。上述数据处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储数据处理方法中涉及到的数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种数据处理方法。

在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述实施例中数据处理方法的步骤,例如图2所示的步骤s10至步骤s50。或者,处理器执行计算机程序时实现上述实施例中数据处理装置的各模块/单元的功能,例如图4所示模块11至模块15的功能。为避免重复,这里不再赘述。

在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述实施例中数据处理方法的步骤,例如图2所示的步骤s10至步骤s50。或者,计算机程序被处理器执行时实现上述实施例中数据处理装置的各模块/单元的功能,例如图4所示模块11至模块15的功能。为避免重复,这里不再赘述。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本发明所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。

所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。

以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1