1.本技术涉及人工智能与互联网数据处理技术领域,具体而言,涉及一种基于人工智能的数据存储方法、系统及云平台。
背景技术:2.借助人工智能与互联网技术和通信技术的进步,数字化业务和电子化档案得到有效发展。信息大爆炸为用户带来便利的同时,也为用户带来识别有用信息的时间和精力成本。为了提高数据信息服务的智能化程度,对电子档案进行归类存储是非常有必要的。狭义的电子档案仅涉及个人信息。然而,随着互联网技术的发展,电子档案在广义上可以承载更多的信息,是一系列信息的载体,例如可以承载文档内容、用户信息、交互评价信息、区块链交易信息等等。现如今,如何对海量的电子档案进行合理的存储,是需要考虑的技术问题。
技术实现要素:3.本技术的目的在于提供一种基于人工智能的数据存储方法、系统及云平台,以对海量的电子档案进行合理的存储。
4.为了达到上述目的,本技术实施例是这样实现的:第一方面,本技术实施例提供一种基于人工智能的数据存储方法,应用于数据存储云平台,所述数据存储云平台与终端设备通信连接,所述方法包括:接收所述终端设备发送的待存储电子档案,并获取所述待存储电子档案携带的第一存储指示信息;其中,所述第一存储指示信息包括所述待存储电子档案的文档生成时间和产出所述待存储电子档案的第一生产对象的倾向性标签集合;获取所述待存储电子档案与归类电子档案序列中的各个归类电子档案的文本匹配结果,并基于所述第一存储指示信息和各个归类电子档案的第二存储指示信息,获取所述待存储电子档案与各个归类电子档案的文档匹配结果;其中,所述文档匹配结果用于在文档文本形式和文档倾向性上指示电子档案的匹配程度;通过所述待存储电子档案与归类电子档案序列中的各个归类电子档案的文本匹配结果和文档匹配结果,获得和所述待存储电子档案对应的关联归类电子档案;将所述待存储电子档案确定为归类电子档案,并在所述归类电子档案序列中,创建所述待存储电子档案和所述关联归类电子档案共同围绕的目标话题的映射关系;将所述待存储电子档案和创建的所述映射关系进行存储。
5.可选的,所述基于所述第一存储指示信息和各个归类电子档案的第二存储指示信息,获取所述待存储电子档案与各个归类电子档案的文档匹配结果,包括:对于各个归类电子档案,基于所述第一存储指示信息和所述归类电子档案的第二存储指示信息,获取所述待存储电子档案与所述归类电子档案的联合评估信息;其中,所述联合评估信息用以指示所述待存储电子档案与所述归类电子档案的文档生成时间和生产对象之间的联系;
对于各个归类电子档案,依据所述待存储电子档案和所述归类电子档案的文档文本形式,获取所述待存储电子档案与所述归类电子档案的文本评估信息;对于各个归类电子档案,基于所述待存储电子档案与所述归类电子档案的联合评估信息和文本评估信息,获取所述待存储电子档案与所述归类电子档案的文档匹配结果。
6.可选的,所述联合评估信息包括如下信息中的一个或多个:所述第一生产对象与产生所述归类电子档案的第二生产对象之间的发布主体关系、所述待存储电子档案和所述归类电子档案的文档生成时间之间的时间间隔、所述待存储电子档案中的话题的第一热力指数、所述归类电子档案中的话题的第二热力指数,以及所述第一生产对象和所述第二生产对象之间的情感统一指数;其中,所述情感统一指数用以指示所述待存储电子档案中的文本情感分析结果与所述归类电子档案的文本情感分析结果一致的置信结果;所述文本评估信息包括如下信息中的一个或多个:所述待存储电子档案与所述归类电子档案的文本匹配结果、所述待存储电子档案的目标文本信息,以及所述归类电子档案的所述目标文本信息;其中,所述目标文本信息包括文本数量和预设关键词中一种或多种。
7.可选的,所述联合评估信息包括所述第一生产对象与所述第二生产对象之间的情感统一指数,所述情感统一指数的获取过程包括:针对待存储电子档案或归类电子档案,确定拟分析文档的文本描述向量,其中,拟分析文档对应预先批注的情感极性标记;确定情感极性标记所对应的拟分析文档的文本描述向量中的多个目标向量维度,对于所述情感极性标记,依据所述情感极性标记所对应的拟分析文档的文本描述向量中在每个目标向量维度下的向量结果和所述多个目标向量维度,确定所述情感极性标记在每个目标向量维度下的向量维度计算结果,通过所述情感极性标记在每个目标向量维度下的向量维度计算结果和所述多个目标向量维度,获取所述情感极性标记对应的向量计算结果;对所述情感极性标记对应的向量计算结果和所述拟分析文档的文本描述向量进行共性度量,得到所述拟分析文档与情感极性标记之间的共性度量结果,依据所述拟分析文档与情感极性标记之间的共性度量结果,对所述拟分析文档与情感极性标记进行分类处理,得到所述拟分析文档符合情感极性标记的概率;依据所述拟分析文档符合情感极性标记的概率,判断所述拟分析文档预先批注的情感极性标记是否符合要求;在所述拟分析文档预先批注的情感极性标记不符合要求时,对所述情感极性标记进行修正;通过获取所述待存储电子档案和归类电子档案的情感极性标记,判断所述待存储电子档案和所述归类电子档案的情感统一指数。
8.可选的,所述通过所述待存储电子档案与归类电子档案序列中的各个归类电子档案的文本匹配结果和文档匹配结果,获得和所述待存储电子档案对应的关联归类电子档案,包括:对于各个归类电子档案,当所述待存储电子档案与所述归类电子档案的文本匹配结果大于第一预设文本匹配度,则将所述归类电子档案确定为与所述待存储电子档案对应的关联归类电子档案;
对于各个归类电子档案,当所述待存储电子档案与所述归类电子档案的文本匹配结果小于第二预设文本匹配度,则继续确定下一归类电子档案;其中,所述第二文本匹配度小于所述第一文本匹配度;对于各个归类电子档案,当所述待存储电子档案与所述归类电子档案的文本匹配结果小于所述第一文本匹配度,且大于所述第二文本匹配度,则当所述待存储电子档案与所述归类电子档案的文档匹配结果大于第三预设文本匹配度时,将所述归类电子档案确定为与所述待存储电子档案对应的关联归类电子档案。
9.可选的,所述获取所述待存储电子档案与归类电子档案序列中的各个归类电子档案的文本匹配结果,并基于所述第一存储指示信息和各个归类电子档案的第二存储指示信息,获取所述待存储电子档案与各个归类电子档案的文档匹配结果,包括:对于选定电子档案集合,获取所述待存储电子档案与所述选定电子档案集合的代表电子档案的文本匹配结果,确定为所述待存储电子档案与所述选定电子档案集合中的各个归类电子档案的文本匹配结果;其中,所述选定电子档案集合为具备代表电子档案的电子档案集合;对于所述选定电子档案集合,基于所述第一存储指示信息和所述选定电子档案集合的代表电子档案的第二存储指示信息,获取所述待存储电子档案与所述选定电子档案集合的代表电子档案的文档匹配结果,作为所述待存储电子档案与所述选定电子档案集合的各个归类电子档案的文档匹配结果;所述将所述待存储电子档案确定为和所述关联归类电子档案为相同集合的归类电子档案,与所述第一存储指示信息映射并存储在所述归类电子档案序列中,包括:获取所述待存储电子档案的文档评价指标;当所述关联归类电子档案所在的电子档案集合具备代表电子档案,同时所述待存储电子档案的文档评价指标优于所述代表电子档案的文档评价指标,则将所述代表电子档案更换成所述待存储电子档案,并将所述第一存储指示信息进行存储;当所述关联归类电子档案所在的电子档案集合不具备代表电子档案,同时所述待存储电子档案的文档评价指标优于文档评价指标设定值,则将所述待存储电子档案配置成所述关联归类电子档案所在的电子档案集合的代表电子档案,并将所述第一存储指示信息进行存储;若以上情况均不满足,则将所述待存储电子档案确定为与所述关联归类电子档案为相同集合的归类电子档案,与所述第一存储指示信息映射并存储在所述归类电子档案序列中。
10.可选的,所述通过所述待存储电子档案与归类电子档案序列中的各个归类电子档案的文本匹配结果和文档匹配结果,获得和所述待存储电子档案对应的关联归类电子档案,包括:当通过所述待存储电子档案与归类电子档案序列中的各个归类电子档案的文本匹配结果和文档匹配结果,确定出与所述待存储电子档案对应的多个候选归类电子档案时,将与所述待存储电子档案的文本匹配结果或文档匹配结果最匹配的候选归类电子档案,确定成和所述待存储电子档案对应的关联归类电子档案;所述归类电子档案序列包括第一序列和第二序列;其中,所述第一序列中的归类
电子档案的产出账号为认证账号,所述第二序列中的归类电子档案的产出账号为未认证账号,所述多个候选归类电子档案包括所述第一序列中的归类电子档案;所述将与所述待存储电子档案的文本匹配结果或文档匹配结果最大的候选归类电子档案,确定为与所述待存储电子档案对应的关联归类电子档案,包括:获取所述多个候选归类电子档案中源自所述第一序列的各个第一归类电子档案;将与所述待存储电子档案的文本匹配结果或文档匹配结果最匹配的第一归类电子档案,确定成和所述待存储电子档案对应的关联归类电子档案;所述方法还包括:将所述多个候选归类电子档案中排除所述关联归类电子档案后,其他各个归类电子档案隶属的选定电子档案集合,和所述关联归类电子档案隶属的电子档案集合进行融合,并创建所述选定电子档案集合中的各个归类电子档案,和所述关联归类电子档案共同围绕的目标话题的映射关系。
11.可选的,在获取所述待存储电子档案与归类电子档案序列中的各个归类电子档案的文本匹配结果之前,所述方法还包括:确实所述待存储电子档案的目标文档要求;其中,所述目标文档要求包括文档篇幅、文档发布账号的账号状态和文档是否包含预设敏感词中的一个或多个;当所述目标文档要求符合预设的文档要求,获取所述待存储电子档案与归类电子档案序列中的各个归类电子档案的文本匹配结果;所述获取待存储电子档案和所述待存储电子档案携带的第一存储指示信息,包括:获取第一生产对象发布的待存储电子档案和所述待存储电子档案携带的第一存储指示信息;或者,获取第一生产对象发布的待存储电子档案、所述待存储电子档案的文档生成时间和所述第一生产对象的账号号码;基于所述账号号码,获取所述第一生产对象的倾向性标签集合,得到所述待存储电子档案的第一存储指示信息。
12.第二方面,本技术实施例提供了一种数据存储系统,包括云平台和与所述云平台通信连接的终端设备,所述云平台包括处理器和存储器,所述存储器存储有计算机程序,当所述处理器运行所述计算机程序时,执行以上提供的方法。
13.第三方面,本技术实施例提供了一种数据存储云平台,包括处理器和存储器,所述存储器存储有计算机程序,当所述处理器运行所述计算机程序时,执行以上所述的方法。
14.本技术实施例提供的基于人工智能的数据存储方法、系统及云平台,在获取待存储电子档案和待存储电子档案携带的第一存储指示信息后,再确定待存储电子档案与归类电子档案序列中的各个归类电子档案的文本匹配结果,以及待存储电子档案和各个归类电子档案的文档匹配结果,根据待存储电子档案与各个归类电子档案的文本匹配结果和文档匹配结果,获得和待存储电子档案对应的关联归类电子档案,接着将待存储电子档案确定为归类电子档案存储到归类电子档案序列中,创建待存储电子档案与关联归类电子档案共同围绕的目标话题的映射关系。通过上述流程,本技术实施例通过部署归类电子档案序列,在对待存储的电子档案进行存储时,将与归类电子档案序列中的归类电子档案进行比较,当确定出与待存储电子档案对应的归类电子档案时,将待存储的电子档案进行针对性存储,并建立映射关系,以便于后期调取推荐电子档案时快速准确,同时分类存储的效率高。
15.在后面的描述中,将部分地陈述其他的特征。在检查后面内容和附图时,本领域的
技术人员将部分地发现这些特征,或者可以通过生产或运用了解到这些特征。通过实践或使用后面所述详细示例中列出的方法、工具和组合的各个方面,当前申请中的特征可以被实现和获得。
附图说明
16.为了更清楚地说明本技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
17.附图中的方法、系统和/或程序将根据示例性实施例进一步描述。这些示例性实施例将参照图纸进行详细描述。这些示例性实施例是非限制的示例性实施例,其中参考数字在附图的各个视图中代表相似的机构。
18.图1是根据本技术的一些实施例所示的一种数据存储系统的框图。
19.图2是根据本技术的一些实施例所示的一种云平台中硬件和软件组成的示意图。
20.图3是根据本技术的一些实施例所示的一种基于人工智能的数据存储方法的流程图。
21.图4是本技术实施例提供的数据存储装置的架构示意图。
具体实施方式
22.现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本技术将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。
23.此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本技术的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本技术的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本技术的各方面。
24.附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
25.附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
26.图1是根据本技术的一些实施例所示的数据存储系统300的系统架构框图,该数据存储系统300可以包括云平台100和多个与之通信的终端设备200。终端设备200是生产对象使用以产出电子档案的设备,例如可以是具备网络交互功能的个人电脑、笔记本电脑、平板电脑或智能手机等,生产对象可以在终端设备200上进行创作,撰写电子文档,终端设备200将电子文档结合生产对象的其他相关信息产生电子档案,发送至云平台100,云平台100可以是运营平台的服务器。
27.在一些实施例中,请参照图2,是云平台100的架构示意图,该云平台100包括数据存储装置110、存储器120、处理器130和通信单元140。存储器120、处理器130以及通信单元140各元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。数据存储装置110包括至少一个可以软件或固件(firmware)的形式存储于存储器120中或固化在云平台100的操作系统(operating system,os)中的软件功能模块。处理器130用于执行存储器120中存储的可执行模块,例如数据存储装置110所包括的软件功能模块及计算机程序等。
28.其中,存储器120可以是,但不限于,随机存取存储器(random access memory,ram),只读存储器(read only memory,rom),可编程只读存储器(programmable read-only memory,prom),可擦除只读存储器(erasable programmable read-only memory,eprom),电可擦除只读存储器(electric erasable programmable read-only memory,eeprom)等。其中,存储器120用于存储程序,处理器130在接收到执行指令后,执行所述程序。通信单元140用于通过网络建立云平台100与终端设备之间的通信连接,并用于通过网络收发数据。
29.处理器可能是一种集成电路芯片,具有信号的处理能力。上述的处理器可以是通用处理器,包括中央处理器(central processing unit,cpu)、网络处理器(network processor,np)等;还可以是数字信号处理器(dsp))、专用集成电路(asic)、现场可编程门阵列(fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本技术实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
30.可以理解,图2所示的结构仅为示意,云平台100还可包括比图2中所示更多或者更少的组件,或者具有与图2所示不同的配置。图2中所示的各组件可以采用硬件、软件或其组合实现。
31.图3是根据本技术的一些实施例所示的一种基于人工智能的数据存储方法的流程图,该方法应用于图1中的云平台100,具体可以包括以下步骤s1000~s5000。在以下步骤s1000~s5000的基础上,将对一些可选实施例进行说明,这些实施例应当理解为示例,不应理解为实现本方案所必不可少的技术特征。
32.s1000,获取待存储电子档案和待存储电子档案携带的第一存储指示信息。
33.第一存储指示信息包括待存储电子档案的文档生成时间和产出或者生成待存储电子档案的第一生产对象的倾向性标签集合。
34.本技术实施例中,待存储电子档案是生产对象(发布者)撰写的围绕某一话题的电子档案,生产对象将其通过网络发布在平台上,平台接收到该待存储电子档案后,可以先进行审核,例如通过机器学习模型识别敏感词,或者人工进行审核,通过审核后进行电子档案的分类存储,以便在后期将存储在同一存储空间(例如归类电子档案序列)的电子档案进行分类推荐。文档生成时间是生产对象撰写完成该待存储电子档案的时间,倾向性标签集合可以是平台为生产对象进行分析后,标记的风格倾向性标签的集合,倾向性标签例如可以是保守、激进、理性、感性、强逻辑性等。作为另一些实施方式,倾向性标签还可以不通过平台进行分析标记,而是通过阅读者对生产对象的过往电子档案进行评价后,归类分析得到的标签,还可以是生产对象自行标记的标签,本技术实施例对此不做限定。
35.本技术实施例中,云平台获取待存储电子档案和待存储电子档案携带的第一存储
指示信息的方式可以包括多种方式,例如可以接收生产对象对应的终端设备上传的待存储电子档案和待存储电子档案携带的第一存储指示信息;或者,还可以接收其他通信设备(如服务器)发送的待存储电子档案和待存储电子档案携带的第一存储指示信息。作为一种实施方式可以实时接收待存储电子档案和待存储电子档案携带的第一存储指示信息,例如生产对象对应的终端设备将所产出的待存储电子档案,以及待存储电子档案携带的第一存储指示信息实时上传至云平台。
36.作为一种实施方式,步骤s1000具体可以包括以下步骤。
37.步骤s100,获取第一生产对象发布的待存储电子档案和待存储电子档案携带的第一存储指示信息。
38.该实施方式中,云平台存储有第一生产对象的倾向性标签集合,在获取到待存储电子档案后,云平台可以直接获取到该待存储电子档案携带的第一存储指示信息。
39.作为一种实施方式,上述步骤s1000可以包括以下步骤:步骤s200,获取第一生产对象发布的待存储电子档案、待存储电子档案的文档生成时间和第一生产对象的账号号码;步骤s300,基于账号号码,确定第一生产对象的倾向性标签集合,得到待存储电子档案的第一存储指示信息。
40.该实施方式中,云平台存储有每一个生产对象的账号号码和各个生产对象的倾向性标签集合之间的映射关系,从而可以基于每个生产对象的账号号码,从该映射关系得到该生产对象的倾向性标签集合。
41.第一生产对象在产出待存储电子档案时,可以得到该待存储电子档案的文档生成时间,第一生产对象的终端设备可以向云平台上传该待存储电子档案、该待存储电子档案的文档生成时间和账号的账号号码。
42.如此一来,云平台在接收到待存储电子档案、待存储电子档案的文档生成时间和对应的账号号码,即可基于第一生产对象的账号号码,从所存储的各个生产对象的账号号码和各个生产对象的倾向性标签集合之间的映射关系中,确定第一生产对象的倾向性标签集合。基于此,云平台获得待存储电子档案的文档生成时间和待存储电子档案的第一生产对象的倾向性标签集合,换言之,云平台可以获取到待存储电子档案携带的第一存储指示信息。
43.s2000,获取待存储电子档案与归类电子档案序列中的各个归类电子档案的文本匹配结果,并基于第一存储指示信息和各个归类电子档案的第二存储指示信息,获取待存储电子档案与各个归类电子档案的文档匹配结果。
44.文档匹配结果用于在文档文本形式和文档倾向性上指示电子档案的匹配程度。本技术实施例中,确定了待存储电子档案和待存储电子档案对应的存储指示信息后,可以在目前的归类电子档案序列中确定和待存储电子档案对应的关联归类电子档案,从而将待存储电子档案存储到归类电子档案序列中合理的电子档案集合中,也可以对目前的归类电子档案序列进行更新迭代。
45.对于归类电子档案序列中的各个归类电子档案,可以基于待存储电子档案的文档文本形式和归类电子档案的文档文本形式,确定待存储电子档案和归类电子档案的文本匹配结果,此外,基于待存储电子档案携带的第一存储指示信息和归类电子档案的第二存储
指示信息,确定待存储电子档案和归类电子档案的文档匹配结果。
46.其中,各个归类电子档案的第二存储指示信息包括归类电子档案的文档生成时间和产生归类电子档案的第二生产对象的倾向性标签集合。
47.对于各个归类电子档案,确定待存储电子档案和归类电子档案的文本匹配结果,和待存储电子档案与归类电子档案的文档匹配结果的先后次序不做限制。
48.待存储电子档案和各个归类电子档案的文本匹配结果由待存储电子档案和各个归类电子档案的文本评估信息确定,文本评估信息是依据文档文本形式确定的信息。该文本评估信息包括如下信息中的一种或多种:待存储电子档案和归类电子档案的文本匹配结果、待存储电子档案的目标文本信息,以及归类电子档案的目标文本信息。其中,目标文本信息至少包括文本数量、预设关键词,或者二者皆包括,文本数量表示归类电子档案的篇幅,预设关键词表示电子档案中预设的文本,能够反应文档的内容,例如话题为“xx贸易”,关键词为“x国”、“y国”、“电子商务”等。
49.进一步地,文档匹配结果用于在文档文本形式和文档倾向性上指示电子档案的匹配程度。因此,待存储电子档案和各个归类电子档案的文档匹配结果可以由待存储电子档案和各个归类电子档案的文本评估信息和联合评估信息确定。其中,联合评估信息是依据电子档案对应的存储指示信息确定的信息。
50.作为一种实施方式,该联合评估信息包括如下信息中的一个或多个:第一生产对象与产生所述归类电子档案的第二生产对象之间的发布主体关系(例如官方账号下的两个子账号、同一媒体公司的两个账号主体)、待存储电子档案和归类电子档案的文档生成时间之间的时间间隔(可以反映电子档案是否是实时的)、待存储电子档案中的话题的第一热力指数(话题讨论的热度,可以从评论、转发、收藏数量,带话题标签发布的数量进行反映)、归类电子档案中的话题的第二热力指数(同第一热力指数定义相同),以及第一生产对象与第二生产对象之间的情感统一指数。其中,情感统一指数用以指示待存储电子档案中的文本情感分析结果与所述归类电子档案的文本情感分析结果一致的置信结果。
51.待存储电子档案中的话题的第一热力指数和归类电子档案中的话题的第二热力指数,可以通过预设的热力指数评估策略获取,例如互动数量与热力指数的映射关系,具体而言,当转发评论数超过1000,低于5000,热力指数为7,转发评论数超过5000,低于10000,热力指数为8,以上仅为举例,具体视实际情况而定。
52.用户在阅读电子档案时,尤其是需要表达态度的电子档案时,往往倾向于连续阅读情感倾向性一致的电子档案,例如对社会实事的谴责和批判,则用户希望看到的下一篇电子档案的情感态度也是谴责和批判。那么,在确定联合评估信息时,可以确定第一生产对象与第二生产对象之间的情感统一指数。
53.该情感统一指数是通过比较待存储电子档案和归类电子档案各自的文本情感分析结果得到的结果,例如计算各自得到的文本情感分析结果的相似度来获取。以下介绍该情感统一指数的获取过程,其可以包括如下步骤:sa,针对待存储电子档案或归类电子档案,确定拟分析文档的文本描述向量,其中,拟分析文档对应预先批注的情感极性标记。
54.文本描述向量是对文本进行向量转换后得到的向量集合,情感极性标记是对拟分析分档进行预先标记的结果,例如对于待存储电子档案而言,在存储前的审核阶段,通过人
工进行简单的情感分析并进行标记的结果,对于归类电子档案,可以是经过文本情感分析(即意向挖掘或倾向性分析)后得到的标记结果。
55.sb,确定情感极性标记所对应的拟分析文档的文本描述向量中的多个目标向量维度,对于情感极性标记,依据情感极性标记所对应的拟分析文档的文本描述向量中在每个目标向量维度下的向量结果和多个目标向量维度,确定情感极性标记在每个目标向量维度下的向量维度计算结果,通过情感极性标记在每个目标向量维度下的向量维度计算结果和多个目标向量维度,获取情感极性标记对应的向量计算结果。
56.每个拟分析文档可以包括多个维度,每个拟分析文档的文本描述向量可以为多个维度下的文本描述向量,为了确定情感极性标记的向量计算结果,作为一些实施方式,基于每个情感极性标记所对应的拟分析文档的文本描述向量,分别确定每个情感极性标记对应的向量计算结果可以参考上述步骤sb,该步骤sb中,为了提升情感极性标记对应的向量计算结果(例如向量的均值计算结果)的完整,可以获取每个情感极性标记所对应的拟分析文档的文本描述向量中的多个目标向量维度,针对情感极性标记对应的拟分析文档的文本描述向量在每个目标向量维度下的向量结果,综合计算情感极性标记在每一目标向量维度下的向量维度计算结果,再针对情感极性标记在每个目标向量维度下的向量维度计算结果,可以确定情感极性标记对应的向量计算结果。
57.sc,对情感极性标记对应的向量计算结果和拟分析文档的文本描述向量进行共性度量,得到拟分析文档与情感极性标记之间的共性度量结果,依据拟分析文档与情感极性标记之间的共性度量结果,对拟分析文档与情感极性标记进行分类处理,得到拟分析文档符合情感极性标记的概率。
58.步骤sc中,确定了各情感极性标记对应的向量计算结果后,可以对每个情感极性标记对应的向量计算结果和拟分析文档的文本描述向量进行共性度量(相似性评估),得到拟分析文档与每个情感极性标记之间的共性度量结果。再对拟分析文档与每个情感极性标记之间的共性度量结果可以进行分类处理(如逻辑回归、线性回归),得到拟分析文档针对每个情感极性标记的概率。对拟分析文档和每个情感极性标记之间的共性度量结果,可以应用归一化指数函数等现有计算方式计算得到拟分析文档对于每个情感极性标记的概率。需要说明的是,每个拟分析文档与每个情感极性标记之间的共性度量结果的度量范围一般不同,通过分类处理将概率区间固定在0~1间,也即依据相同的度量方式来评估拟分析文档分别归属各个情感极性标记的概率。如此一来,通过每个情感极性标记对应的向量计算结果和拟分析文档的文本描述向量,确定拟分析文档与每个情感极性标记之间的共性度量结果,从而确定拟分析文档针对每个情感极性标记的概率,可以避免度量范围不同的共性度量结果不可对比的情形,通过分类处理将度量范围不同的共性度量结果用相同的方式进行评估,确保了拟分析文档对每个情感极性标记的概率的精确有效,提升概率评估的适用性。
59.sd,依据拟分析文档符合情感极性标记的概率,判断拟分析文档预先批注的情感极性标记是否符合要求。
60.判断是否符合要求,具体通过以下方式确定,在本实施例中,概率可以包括第一概率和第二概率,第一概率是拟分析文档对拟分析文档被标注出的情感记性标记的概率,第二概率为拟分析文档针对多个情感记性标记中除拟分析文档被标注出的情感记性标记以外的其余情感记性标记的概率,在第一概率不大于概率预设值且具有至少一个第二概率大
于概率预设值时,确定拟分析文档被标注出的情感记性标记不符合要求。在确定拟分析文档针对各情感记性标记的概率后,可以再确定拟分析文档针对拟分析文档被标注出的情感记性标记的第一概率和拟分析文档对多个情感记性标记中除拟分析文档被标注出的情感记性标记之外的其他情感记性标记的第二概率,再获取针对待处理数据集的概率预设值,并对概率预设值、第一概率和第二概率进行对比,在第一概率不大于对概率预设值且具有至少一个第二概率大于概率预设值的情况下,确定拟分析文档被标注出的情感记性标记不符合要求。如此,在拟分析文档针对拟分析文档被标注出的情感记性标记的第一概率不大于概率预设值且具有至少一个拟分析文档针对多个情感记性标记中除拟分析文档被标注出的情感记性标记之外的其他情感记性标记的第二概率大于概率预设值的情况下,此时与拟分析文档被标注出的情感记性标记对比,拟分析文档对其他情感记性标记的概率更高,可以认为当前拟分析文档被标注出的情感记性标记不符合要求,确保情感极性标记判断的准确性,进而提高数据处理的效率。
61.se,在拟分析文档预先批注的情感极性标记不符合要求时,对情感极性标记进行修正(修改为符合要求的情感极性标记)。
62.sf,通过获取待存储电子档案和归类电子档案的情感极性标记,判断待存储电子档案和归类电子档案的情感统一指数。
63.待存储电子档案和归类电子档案的情感极性标记获取到之后,即可评估二者的统一性,得到情感统一指数,例如,通过预设的情感极性标记之间的指数对应关系得到。如:情感记性标记a-情感记性标记b-情感统一指数为7。
64.通过以上步骤sa~sf即可获得情感统一指数。
65.s3000,通过待存储电子档案与归类电子档案序列中的各个归类电子档案的文本匹配结果和文档匹配结果,获得和待存储电子档案对应的关联归类电子档案。
66.对于各个归类电子档案,在获得待存储电子档案与归类电子档案的文本匹配结果和文档匹配结果后,即可通过所获取的文本匹配结果和文档匹配结果,确定归类电子档案是否为和待存储电子档案对应的关联归类电子档案。
67.作为一种实施方式,上述步骤s3000可以包括以下步骤:步骤s310,对于各个归类电子档案,当文本匹配结果大于第一预设文本匹配度且文档匹配结果大于第二预设文本匹配度,则确定归类电子档案为与待存储电子档案对应的关联归类电子档案,否则确定归类电子档案与待存储电子档案不对应。
68.举例而言,若第一预设文本匹配度为0.8,第二预设文本匹配度为0.7,当一归类电子档案与待存储电子档案的文本匹配结果为0.7,文档匹配结果为0.8,因为0.7<0.8,则文本匹配结果小于第一预设文本匹配度,0.7<0.8,即文档匹配结果大于第二预设文本匹配度,因此不符合文本匹配结果大于第一预设文本匹配度与文档匹配结果大于第二预设文本匹配度,则上述归类电子档案不是关联归类电子档案,归类电子档案与待存储电子档案不对应。
69.作为又一种实施方式,上述步骤s3000可以包括以下步骤:步骤s320,对于各个归类电子档案,当待存储电子档案与归类电子档案的文本匹配结果大于第一预设文本匹配度,将归类电子档案确定为与待存储电子档案对应的关联归类电子档案。
70.步骤s330,对于各个归类电子档案,当待存储电子档案与归类电子档案的文本匹配结果小于第二预设文本匹配度,则继续确定下一归类电子档案。其中,第二文本匹配度小于第一文本匹配度。
71.步骤s340,对于各个归类电子档案,当待存储电子档案与归类电子档案的文本匹配结果小于第一文本匹配度,且大于第二文本匹配度,则当待存储电子档案与归类电子档案的文档匹配结果大于第三预设文本匹配度时,将归类电子档案确定为与待存储电子档案对应的关联归类电子档案。
72.因为文本匹配结果是从文档文本形式方面评估待存储电子档案与归类电子档案是否对应,可以从文本层面直接评估待存储电子档案中的内容与归类电子档案中的内容的接近度,则可以先基于待存储电子档案与归类电子档案的文本匹配结果进行评估。
73.若上述文本匹配结果大于第一文本匹配度,则可以确定待存储电子档案与归类电子档案中的内容接近度高。若上述文本匹配结果小于第二文本匹配度,则可以确定待存储电子档案与归类电子档案中的内容接近度低。
74.若上述文本匹配结果位于第一文本匹配度和第二文本匹配度之间,则待存储电子档案与归类电子档案可能对应或不对应。因为可以基于文档匹配结果,结合联合评估信息再次确定待存储电子档案与上述归类电子档案是否对应。
75.若待存储电子档案与归类电子档案的文档匹配结果大于第三文本匹配度时,则待存储电子档案与归类电子档案对应。若待存储电子档案与归类电子档案的文档匹配结果小于第三文本匹配度,则待存储电子档案与归类电子档案不对应。
76.其中,第二文本匹配度小于第一文本匹配度。
77.s4000,将待存储电子档案确定为归类电子档案,并在归类电子档案序列中,创建待存储电子档案和关联归类电子档案共同围绕的目标话题的映射关系。
78.获取到和待存储电子档案对应的关联归类电子档案后,可以将待存储电子档案确定为归类电子档案存储至关联归类电子档案隶属的电子档案集合。此外,由于上述待存储电子档案与关联归类电子档案相对应,则上述待存储电子档案中的内容与关联归类电子档案中的内容接近,可以在归类电子档案序列中创建待存储电子档案与关联归类电子档案对应的目标话题的映射关系,例如:待存储电子档案-关联归类电子档案-话题a。
79.将待存储电子档案保存在归类电子档案序列后,当又接收到的新的待存储电子档案时,归类电子档案序列变为了更替之后的涵盖以上待存储电子档案的归类电子档案序列。换言之,归类电子档案序列的建立,是实时变化的。
80.作为一种实施方式,上述步骤s2000中,基于第一存储指示信息和各个归类电子档案的第二存储指示信息,确定待存储电子档案与各个归类电子档案的文档匹配结果的步骤,包括以下步骤:步骤s210,对于各个归类电子档案,基于待存储电子档案的第一存储指示信息和归类电子档案的第二存储指示信息,确定关于待存储电子档案与该归类电子档案的联合评估信息。
81.其中,联合评估信息用以指示待存储电子档案与该归类电子档案的文档生成时间和生产对象倾向性标签集合之间的联系。
82.步骤s220,对于各个归类电子档案,依据待存储电子档案和该归类电子档案的文
档文本形式,获取待存储电子档案与归类电子档案的文本评估信息。
83.步骤s230,对于各个归类电子档案,基于关于待存储电子档案与归类电子档案的联合评估信息和文本评估信息,获取待存储电子档案与归类电子档案的文档匹配结果。
84.该实施方式中,对于各个归类电子档案,可以基于待存储电子档案的第一存储指示信息和归类电子档案的第二存储指示信息,确定关于待存储电子档案与归类电子档案的联合评估信息,并依据待存储电子档案和归类电子档案的文档文本形式,确定关于待存储电子档案与该归类电子档案的文本评估信息。如此即可以基于所获得的基于关于待存储电子档案与归类电子档案的联合评估信息和文本评估信息,确定待存储电子档案与该归类电子档案的文档匹配结果。
85.在上述步骤中,联合评估信息和文本评估信息与步骤s2000的联合评估信息和文本评估信息相同,因此不再说明。
86.例如,对于各个归类电子档案,可以采用预先训练好的文档匹配网络,基于所确定的基于关于待存储电子档案与归类电子档案的联合评估信息和文本评估信息,确定待存储电子档案与该归类电子档案的文档匹配结果。
87.该文档匹配网络的调校过程可以包括:获得多个电子档案样本,以及每个电子档案样本对应的存储指示信息样本,容易理解,每个电子档案样本对应的存储指示信息样本包括电子档案样本的文档生成时间和产生电子档案样本的生产对象的倾向性标签集合。
88.对于多个电子档案样本中的每两个电子档案,识别两个电子档案的文本评估信息和联合评估信息,并获取两个电子档案的文档匹配结果的真值。
89.再将确定的每两个电子档案的文本评估信息和联合评估信息,和文档匹配结果的真值,作为输入数据输入上述文档匹配网络进行迭代训练,过程中通过损失函数对参数进行修正,直至满足预设的训练停止条件,例如达到预设次数,或者达到预设的预测精度。
90.如此,对于各个归类电子档案,基于关于待存储电子档案与归类电子档案的联合评估信息和文本评估信息,确定待存储电子档案与归类电子档案的文档匹配结果时,即可将所确定的关于待存储电子档案与归类电子档案的联合评估信息和文本评估信息输入上述文档匹配网络中,获得文档匹配网络的输出,即待存储电子档案与归类电子档案的文档匹配结果。
91.在一些实施方式中,生产对象生产的待存储电子档案中的内容,可能因文档篇幅不足或过长、文档发布账号的账号状态为封禁状态或文档包含预设敏感词而无法发布,在与归类电子档案序列中的归类电子档案进行比较之前,可以先对待存储电子档案进行过滤。
92.作为一种实施方式,该方法还可以包括以下步骤:步骤s900,确定待存储电子档案的目标文档要求。当目标文档要求符合预设的文档要求时,执行步骤s1000。
93.其中,目标文档要求包括文档篇幅、文档发布账号的账号状态和文档是否包含预设敏感词中的一个或多个。
94.该实施方式中,在得到待存储电子档案和待存储电子档案携带的第一存储指示信息后,先确定待存储电子档案的目标文档要求,再确定目标文档要求是否符合预设的文档
要求。
95.当待存储电子档案的目标文档要求符合预设的文档要求时,即再执行后续的步骤s1000-s5000。反之则不进行后续步骤s1000-s5000。
96.在一些实施例中,归类电子档案序列中可以包含多个与待存储电子档案对应的归类电子档案,因此可以在多个与待存储电子档案对应的归类电子档案中,确定关联归类电子档案。
97.作为一种实施方式,步骤s3000可以包括以下步骤:步骤s3100,当通过待存储电子档案与归类电子档案序列中的各个归类电子档案的文本匹配结果和文档匹配结果,确定出与待存储电子档案对应的多个候选归类电子档案,将与待存储电子档案的文本匹配结果或文档匹配结果最匹配的候选归类电子档案,确定为与待存储电子档案对应的关联归类电子档案。
98.该实施方式中,对于各个归类电子档案,可以根据待存储电子档案与归类电子档案的文本匹配结果和文档匹配结果,确定归类电子档案与待存储电子档案是否对应。
99.进一步地,在确定出与待存储电子档案对应的多个候选归类电子档案时,即可将多个候选归类电子档案中,与待存储电子档案的文本匹配结果或文档匹配结果最匹配(例如数值最大)的候选归类电子档案,确定为待存储电子档案对应的关联归类电子档案。
100.例如,可以在多个候选归类电子档案中识别出与待存储电子档案的文本匹配结果最匹配的归类电子档案,确定为与待存储电子档案对应的关联归类电子档案。
101.作为一些实施方式,可以在以上多个候选归类电子档案中识别出与待存储电子档案的文档匹配结果最匹配的归类电子档案,确定为与待存储电子档案对应的关联归类电子档案。
102.作为一种实施方式,可以对于每个候选归类电子档案,获取归类电子档案与待存储电子档案的文本匹配结果与文档匹配结果的均值。在以上多个候选归类电子档案中,确定出所获取到的均值中最大的归类电子档案,确定为与待存储电子档案对应的关联归类电子档案。
103.需要说明的是,以上各种实施方式仅为从多个候选归类电子档案中筛选关联归类电子档案的举例还可以通过其他方式从多个候选归类电子档案中选取关联归类电子档案,本技术不做限定。
104.在一些实施方式中,在初次建立归类电子档案序列时,可以基于认证账号的归类电子档案进行建立,认证账号为进行了个人信息认证的账号;此外,还可以基于未认证账号的归类电子档案进行建立。
105.作为一种实施方式,归类电子档案序列包括第一序列和第二序列。第一序列中的归类电子档案的产出账号为认证账号,第二序列中的归类电子档案的产出账号为未认证账号。此外,多个候选归类电子档案包括第一序列中的归类电子档案。该实施方式中,在步骤s3100将与待存储电子档案的文本匹配结果或文档匹配结果最匹配的候选归类电子档案,作为与待存储电子档案对应的关联归类电子档案,可以包括以下步骤。
106.步骤s3101,确定多个候选归类电子档案中源自第一序列的各个第一归类电子档案。
107.步骤s3102,将与待存储电子档案的文本匹配结果或文档匹配结果最匹配的第一
归类电子档案,确定成和与待存储电子档案对应的关联归类电子档案。
108.在该实施方式中,当得到与待存储电子档案对应的多个候选归类电子档案,且多个候选归类电子档案中包括第一序列中的归类电子档案时,可先确定多个候选归类电子档案中源自第一序列的第一归类电子档案,因而可以将与待存储电子档案的文本匹配结果或文档匹配结果最匹配的第一归类电子档案,确定成和待存储电子档案对应的关联归类电子档案。
109.步骤s3102的实现过程可以和步骤s3100中将与待存储电子档案的文本匹配结果或文档匹配结果最匹配的候选归类电子档案,确定成与待存储电子档案对应的关联归类电子档案的方式一致。
110.作为一种实施方式,本技术中提供的基于人工智能的数据存储方法还可以包括以下步骤。
111.步骤s3103,将多个候选归类电子档案中排除关联归类电子档案后,其他各个归类电子档案隶属的选定电子档案集合,和关联归类电子档案隶属的电子档案集合进行融合,并创建选定电子档案集合中的各个归类电子档案,和关联归类电子档案共同围绕的目标话题的映射关系。
112.该实施方式中,如果多个候选归类电子档案同时对应同一待存储电子档案,则上述多个候选归类电子档案中的内容与待存储电子档案中的内容近似。
113.在得到与待存储电子档案对应的关联归类电子档案时,将多个候选归类电子档案中排除关联归类电子档案后,其他各个归类电子档案隶属的选定电子档案集合,和关联归类电子档案隶属的电子档案集合进行融合,并创建选定电子档案集合中的各个归类电子档案,和关联归类电子档案共同围绕的目标话题的映射关系。
114.归类电子档案序列中包含多个同一话题内容的电子档案。如此一来,把包含相同话题内容的归类电子档案划入同一集合的归类电子档案,在对待存储电子档案与归类电子档案比较时,可以仅对同一集合的归类电子档案中的一个来比较。
115.作为一种实施方式,选取同一集合的归类电子档案中文档评价指标最佳的一个电子档案,作为归类电子档案集合的代表电子档案。后续进行待存储电子档案与归类电子档案比较时,仅基于对代表电子档案与待存储电子档案的比较,判断上述待存储电子档案是否和属于该集合的各个归类电子档案相对应。
116.作为一种实施方式,步骤s2000可以包括以下步骤:步骤s2100,对于选定电子档案集合,确定待存储电子档案与选定电子档案集合的代表电子档案的文本匹配结果,确定为待存储电子档案与选定电子档案集合中的各个归类电子档案的文本匹配结果。
117.其中,选定电子档案集合为具备代表电子档案的电子档案集合。
118.步骤s2200,对于选定电子档案集合,基于第一存储指示信息和选定电子档案集合的代表电子档案的第二存储指示信息,获取待存储电子档案与选定电子档案集合的代表电子档案的文档匹配结果,作为待存储电子档案与选定电子档案集合的各个归类电子档案的文档匹配结果。
119.该实施方式中,对于归类电子档案序列中,具备代表电子档案的选定电子档案集合来说,在获取待存储电子档案与选定电子档案集合中的每一归类电子档案的文本匹配结
果和文档匹配结果时,通过获取待存储电子档案与选定电子档案集合的代表电子档案的文本匹配结果和文档匹配结果,将所获得的文本匹配结果和文档匹配结果作为待存储电子档案与选定电子档案集合中的每一归类电子档案的文本匹配结果和文档匹配结果。
120.此外,在通过所获取的文本匹配结果和文档匹配结果,获得和待存储电子档案对应的关联归类电子档案时,对具备代表电子档案的选定电子档案集合来说,可通过所获得的待存储电子档案与选定电子档案集合的代表电子档案的文本匹配结果和文档匹配结果,确定选定电子档案集合的代表电子档案是否是关联归类电子档案。
121.若该选定电子档案集合的代表电子档案为关联归类电子档案,则不用继续评判该选定电子档案集合中的剩余归类电子档案是否是关联归类电子档案。
122.另一方面,对于归类电子档案序列中,不具备代表电子档案的电子档案集合而言,获取待存储电子档案与归类电子档案集合中的各个归类电子档案的文本匹配结果和文档匹配结果时,需各自获取待存储电子档案与归类电子档案集合的每个归类电子档案的文本匹配结果和文档匹配结果。
123.在通过所获得的文本匹配结果和文档匹配结果,获得和待存储电子档案对应的关联归类电子档案时,对于不具备代表电子档案的电子档案集合来说,需各自通过所获得的待存储电子档案与归类电子档案集合中的各个归类电子档案的文本匹配结果和文档匹配结果,确定归类电子档案是否是关联归类电子档案。
124.选定电子档案集合的代表电子档案往往是选定电子档案集合中的各个归类电子档案中文档评价指标最佳的归类电子档案,因此,为了增加往后获得的待存储电子档案与选定电子档案集合的代表电子档案的文本匹配结果和文档匹配结果的精确,如果目前待存储电子档案与选定电子档案集合的代表电子档案相对应,同时文档评价指标优于代表电子档案的文档评价指标,则基于目前的待存储电子档案更新成选定电子档案集合的代表电子档案,文档评价指标可以是预先设置的对电子档案的质量进行评估的指标,例如电子档案中包含的内容形式多样性,如是否同时包含文字、图片、视频、注解、引用、链接等,又例如文档的语病数量是否小于预设的数量等。
125.作为一种实施方式,步骤s4000,可以包括以下步骤:步骤s4100,确定待存储电子档案的文档评价指标。当关联归类电子档案所在的电子档案集合具备代表电子档案,同时待存储电子档案的文档评价指标优于代表电子档案的文档评价指标时,执行步骤s4200。当关联归类电子档案所在的电子档案集合不具备代表电子档案,同时待存储电子档案的文档评价指标优于文档评价指标设定值时,执行步骤s4300。若以上条件均不满足,执行步骤s4400。
126.步骤s4200,将代表电子档案更换成待存储电子档案,并将第一存储指示信息进行存储。
127.步骤s4300,将待存储电子档案配置成关联归类电子档案所在的电子档案集合的代表电子档案,并将第一存储指示信息进行存储。
128.步骤s4400,将待存储电子档案作为与关联归类电子档案为相同集合的归类电子档案,与第一存储指示信息映射并存储在归类电子档案序列中。
129.获得与待存储电子档案对应的关联归类电子档案后,可先确定归类电子档案序列中,关联归类电子档案所在的电子档案集合是否包含代表电子档案,并在该电子档案集合
具有代表电子档案时,判断待存储电子档案的文档评价指标是否优于代表电子档案的文档评价指标,从而判断是否基于待存储电子档案更换代表电子档案。在电子档案集合不存在代表电子档案时,确定待存储电子档案的文档评价指标是否优于文档评价指标设定值,从而判断是否将待存储电子档案确定为关联归类电子档案所在电子档案集合的代表电子档案。
130.在关联归类电子档案所在的电子档案集合包含代表电子档案,且待存储电子档案的文档评价指标优于代表电子档案的文档评价指标时,即可基于待存储电子档案更换代表电子档案,将代表电子档案更换成待存储电子档案,并将第一存储指示信息进行存储。关联归类电子档案所属的电子档案集合中新增了待存储电子档案,同时待存储电子档案为关联归类电子档案所在的电子档案集合的新的代表电子档案。另外,保存待存储电子档案和关联归类电子档案共同围绕的话题的映射关系。
131.在关联归类电子档案所在的电子档案集合不包含代表电子档案,且待存储电子档案的文档评价指标优于文档评价指标设定值时,即可将待存储电子档案配置成关联归类电子档案所在的电子档案集合的代表电子档案,并将第一存储指示信息进行存储。关联归类电子档案所在的电子档案集合中新增了待存储电子档案,同时待存储电子档案被配置成关联归类电子档案所在的电子档案集合的代表电子档案。同时保存待存储电子档案和关联归类电子档案共同围绕的话题的映射关系。
132.其他实施方式中,例如关联归类电子档案所属的电子档案集合包含代表电子档案,且待存储电子档案的文档评价指标不优于代表电子档案的文档评价指标时,或者关联归类电子档案所在的电子档案集合不包含代表电子档案,且待存储电子档案的文档评价指标不优于文档评价指标设定值时,则不能将待存储电子档案更换关联归类电子档案所在的电子档案集合已有的代表电子档案,抑或不能将待存储电子档案配置成关联归类电子档案所在的电子档案集合的代表电子档案。因此,在排除以上两种情况后,其他情形中直接把待存储电子档案确定为隶属关联归类电子档案所在的电子档案集合中新的归类电子档案,保存在归类电子档案序列中的关联归类电子档案所在的电子档案集合内,同时保存待存储电子档案和关联归类电子档案共同围绕的话题的映射关系。
133.步骤s5000,将待存储电子档案和创建的映射关系进行存储。
134.数据存储的形式和采取的方式,可以参考现有技术,此处不作赘述。
135.综上所述,本技术实施例提供的方法在获取待存储电子档案和待存储电子档案携带的第一存储指示信息后,再确定待存储电子档案与归类电子档案序列中的各个归类电子档案的文本匹配结果,以及待存储电子档案和各个归类电子档案的文档匹配结果,根据待存储电子档案与各个归类电子档案的文本匹配结果和文档匹配结果,获得和待存储电子档案对应的关联归类电子档案,接着将待存储电子档案确定为归类电子档案存储到归类电子档案序列中,创建待存储电子档案与关联归类电子档案共同围绕的目标话题的映射关系。通过上述流程,本技术实施例通过部署归类电子档案序列,在对待存储的电子档案进行存储时,将与归类电子档案序列中的归类电子档案进行比较,当确定出与待存储电子档案对应的归类电子档案时,将待存储的电子档案进行针对性存储,并建立映射关系,以便于后期调取推荐电子档案时快速准确,同时分类存储的效率高。
136.基于与上述方法同一发明构思,请参照图4,本技术实施例还提供一种数据存储装
置110,图4是该装置的架构示意图,该数据存储装置110可用于执行基于人工智能的数据存储方法,其中,数据存储装置110包括:接收模块111,用于接收终端设备发送的待存储电子档案,并获取待存储电子档案携带的第一存储指示信息。
137.匹配模块112,用于获取待存储电子档案与归类电子档案序列中的各个归类电子档案的文本匹配结果,并基于第一存储指示信息和各个归类电子档案的第二存储指示信息,获取待存储电子档案与各个归类电子档案的文档匹配结果。
138.关联档案确定模块113,用于通过待存储电子档案与归类电子档案序列中的各个归类电子档案的文本匹配结果和文档匹配结果,获得和待存储电子档案对应的关联归类电子档案。
139.创建模块114,用于将待存储电子档案确定为归类电子档案,并在归类电子档案序列中,创建待存储电子档案和关联归类电子档案共同围绕的目标话题的映射关系。
140.存储模块115,用于将待存储电子档案和创建的映射关系进行存储。
141.其中,接收模块111可用于执行步骤s1000,匹配模块112可用于执行步骤s2000,关联档案确定模块113可用于执行步骤s3000,创建模块114可用于执行步骤s4000,存储模块115可用于执行步骤s5000。
142.在上述的实施例介绍中,已经对本技术实施例提供的基于人工智能的数据存储方法进行了详细的介绍,而该数据存储装置110的原理与该方法相同,此处不再对数据存储装置110的各模块的执行原理进行赘述。
143.在本技术所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本技术的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
144.另外,在本技术各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
145.所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,云平台,或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
146.需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实
体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
147.需要理解的是,针对上述内容没有进行名词解释的技术术语,本领域技术人员可以根据上述所公开的内容进行前后推导毫无疑义地确定其所指代的含义。本技术实施例公开的上述内容对于本领域技术人员而言是清楚完整的。应当理解,本领域技术人员基于上述公开的内容对未作解释的技术术语进行推导和分析的过程是基于本技术所记载的内容进行的,因此上述内容并不是对整体方案的创造性的评判。
148.上文已对基本概念做了描述,显然,对于本领域技术人员来说,上述详细披露仅作为示例,而并不构成对本技术的限定。虽然此处并没有明确说明,本领域技术人员可以对本技术进行各种修改、改进和修正。该类修改、改进和修正在本技术中被建议,所以该类修改、改进、修正仍属于本技术示范实施例的精神和范围。
149.同样应当理解的是,为了简化本技术揭示的表述,从而帮助对至少一个发明实施例的理解,前文对本技术实施例的描述中,有时会将多种特征归并至一个实施例、附图或对其的描述中。但是,这种披露方法幷不意味着本技术对象所需要的特征比权利要求中提及的特征多。实际上,实施例的特征要少于上述披露的单个实施例的全部特征。