会议数据分析处理方法、装置、计算机设备和存储介质与流程

文档序号:18731188发布日期:2019-09-21 00:32阅读:246来源:国知局
会议数据分析处理方法、装置、计算机设备和存储介质与流程

本申请涉及计算机技术领域,特别是涉及语音语义处理的一种会议数据分析处理方法、装置、计算机设备和存储介质。



背景技术:

随着经济和互联网的迅速发展,商业社会和商务模式也在迅速发展,各种商务会议的召开需求也不断增大,会议中通常包含有价值的会议信息需要记录下来。但传统的会议中是通过人工记录会议纪要,会议记录效率较低。随着人工智能技术的迅速发展,出现了一些从音视频会议中提取会议纪要的方式,这种方式通常是从会议音视频中提取语音信息,再通过语音识别转换为对应的文本信息进行存储。

传统的方式中,在时间较长会议内容较多的情况下,将会议内容转换成对应的文本信息后,文本信息内容较多较繁琐,在查询会议记录数据时需要浏览所有信息,对用户而言工作来量较大,会议记录的识别和分析效率较低。因此,如何有效提高会议数据的识别和分析准确率成为目前需要解决的技术问题。



技术实现要素:

基于此,有必要针对上述技术问题,提供一种能够有效提高会议数据的识别和分析准确率的会议数据分析处理方法、装置、计算机设备和存储介质。

一种会议数据分析处理方法,所述方法包括:

获取终端上传的语音数据;

对所述语音数据进行特征提取和端点分析,得到多个语音特征信息;

获取预设的声纹识别模型,通过所述声纹识别模型对所述语音特征信息进行声纹分析,得到多个语音片段和对应的声纹标识,并根据所述声纹标识将所述多个语音片段转换为对应的会议文本信息;

获取预设的数据分析模型,通过数据分析模型将所述文本信息拆分为多个文本块,对多个文本块进行分类分析,得到文本块对应的关键字标签;

在所述文本块的预设位置添加对应的关键字标签,并将添加关键字标签的会议文本信息按照预设方式生成会议报告数据;

将所述会议报告数据存储至会议数据存储库中,并根据所述关键字标签建立与所述会议文本信息对应的索引。

在其中一个实施例中,所述对所述语音数据进行特征提取和端点分析,得到多个语音特征信息的步骤包括:获取所述语音数据的语音信号,对所述语音信号进行分帧加窗,提取出对应的声学特征和频谱特征;对所述声学特征和频谱特征进行转换,得到对应的声学特征向量和频谱特征向量;获取预设的语音端点检测模型,将所述声学特征向量和频谱特征向量输入至所述语音端点检测模型,通过所述语音端点检测模型检测所述语音信号的多个起始点和终止点;根据所述语音信号的多个起始点和终止点将所述语音数据切分为多个语音特征信息。

在其中一个实施例中,所述通过所述声纹识别模型对所述语音特征信息进行声纹分析,得到多个语音片段和对应的声纹标识的步骤包括:通过所述声纹识别模型计算多个语音特征信息中的特征参数序列;根据所述特征参数序列对所述语音特征信息进行切分,得到多个语音片段;计算所述多个语音片段的特征参数序列的相似度,将所述相似度达到预设阈值的多个语音片段进行归类;根据归类后的特征参数序列在声纹模型库中进行匹配,对归类后的语音片段添加相匹配的声纹标识。

在其中一个实施例中,所述通过数据分析模型将所述文本信息拆分为多个文本块,对多个文本块进行分类分析的步骤,包括:通过所述数据分析模型对所述文本信息进行上下文分析,得到多个文本块以及对应的的词向量和词频;对多个词向量和文本块向量进行分类,从而得到每个文本块对应每个类别的概率;提取出达到预设阈值的类别,获取所述类别对应的关键字标签。

在其中一个实施例中,所述将所述会议报告数据存储至会议数据存储库的步骤包括:将所述关键字标签配置为所述会议数据存储库的主键;根据所述关键字标签生成索引表;根据所述索引表对会议报告数据中的文本块进行存储。

在其中一个实施例中,所述方法还包括:接收终端发送的查询请求,所述查询请求包括关键字;根据所述关键字对应的索引从所述会议数据存储库中获取会议文本数据,根据所述关键字与所述会议文本数据中的关键字标签进行匹配;获取匹配度达到预设阈值的关键字标签对应的文本内容;将所述文本内容发送至所述终端,并按照匹配度进行排列显示。

一种会议数据分析处理装置,所述装置包括:

数据获取模块,用于获取终端上传的语音数据;

特征提取模块,用于对所述语音数据进行特征提取和端点分析,得到多个语音特征信息;

声纹识别模块,用于获取预设的声纹识别模型,通过所述声纹识别模型对所述语音特征信息进行声纹分析,得到多个语音片段和对应的声纹标识,并根据所述声纹标识将所述多个语音片段转换为对应的会议文本信息;

数据分析模块,用于获取预设的数据分析模型,通过数据分析模型将所述文本信息拆分为多个文本块,对多个文本块进行分类分析,得到文本块对应的关键字标签;

会议报告生成模块,用于在所述文本块的预设位置添加对应的关键字标签,并将添加关键字标签的会议文本信息按照预设方式生成会议报告数据;

会议报告存储模块,用于将所述会议报告数据存储至会议数据存储库中,并根据所述关键字标签建立与所述会议文本信息对应的索引。

在其中一个实施例中,所述数据分析模块还用于通过所述数据分析模型对所述文本信息进行上下文分析,得到多个文本块以及对应的的词向量和词频;对多个词向量和文本块向量进行分类,从而得到每个文本块对应每个类别的概率;提取出达到预设阈值的类别,获取所述类别对应的关键字标签。

一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现本申请任意一个实施例中提供的会议数据分析处理方法的步骤。

一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现本申请任意一个实施例中提供的会议数据分析处理方法的步骤。

上述会议数据分析处理方法、装置、计算机设备和存储介质,获取终端上传的语音数据后,对语音数据进行特征提取和端点分析,得到多个语音特征信息后,获取预设的声纹识别模型,通过声纹识别模型对语音特征信息进行声纹识别,由此能够有效得到多个语音片段和有效识别出对应的声纹标识,进而根据声纹标识将多个语音片段转换为对应的文本信息。由此能够准确有效地识别出会议中的各个发言人和对应的语音,根据用户标识将语音数据转换为对应的文本信息。进一步获取预设的数据分析模型,通过数据分析模型将文本信息拆分为多个文本块,并对多个文本块进行分类分析,得到文本块对应的关键字标签,由此能够准确有效地分析出会议文本信息中的重要内容并打算标签。在文本块的预设位置添加对应的关键字标签,并将添加关键字标签的会议文本信息按照预设方式生成会议报告数据,进一步将会议报告数据存储至会议数据存储库中,并根据关键字标签建立与会议文本信息对应的索引,由此能够有效将关键字与对应的文本信息关联起来,并且有效提高了会议数据的查询效率。

附图说明

图1为一个实施例中会议数据分析处理方法的应用场景图;

图2为一个实施例中会议数据分析处理方法的流程示意图;

图3为一个实施例中通过声纹识别模型对语音特征信息进行声纹分析步骤的流程示意图;

图4为一个实施例中通过数据分析模型对多个文本块进行分类分析步骤的流程示意图;

图5为一个实施例中会议数据分析处理装置的结构框图;

图6为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

本申请提供的会议数据分析处理方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一个实施例中,如图2所示,提供了一种会议数据分析处理方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:

步骤202,获取终端上传的语音数据。

用户可以预先在应用程序上进行注册,并采集每个用户的语音进行声纹识别以验证身份。服务器则利用多个用户注册后的声纹信息和用户标识生成声纹模型库。用户在召开会议的时候,可以通过终端记录会议过程中的会议语音信息。终端可以向服务器发起会议记录请求,会议记录请求中携带了会议关键字。其中,终端可以为一个,也可以为多个。服务器接收到终端发送的会议记录请求后,则向终端发送录音指令,终端进而根据录音指令进行录音,并将录制的语音数据实时上传至服务器。

步骤204,对语音数据进行特征提取和端点分析,得到多个语音特征信息。

服务器接收到终端上传的语音数据后,对语音信号进行预处理,例如服务器可以获取语音数据中的语音信号,并对语音数据中的语音信号进行噪声抑制等预处理,得到预处理后的语音信号。服务器进一步对预处理后的语音信号数据进行特征提取,并对特征提取后的语音信号进行语音端点检测,例如,可以根据语音数据的停顿词和停顿频率进行端点检测。服务器则根据语音端点将语音数据切分为多个语音特征信息。

步骤206,获取预设的声纹识别模型,通过声纹识别模型对语音特征信息进行声纹分析,得到多个语音片段和对应的声纹标识,并根据声纹标识将多个语音片段转换为对应的会议文本信息。

服务器进一步获取预设的声纹识别模型,将预处理后的语音信号数据输入至声纹识别模型中,通过声纹识别模型计算多个语音特征信息对应的特征参数序列,其中,特征参数序列可以是根据语音信号的音色进行分析,根据特征参数序列的相似度将语音信号切分为多个语音片段,服务器并在声纹模型库中进行匹配,得到对应匹配的声纹标识。服务器进而根据识别后的声纹标识将语音信号转换为对应的文本信息,由此能够有效提高语音数据的识别准确率。

步骤208,获取预设的数据分析模型,通过数据分析模型将文本信息拆分为多个文本块,对多个文本块进行分类分析,得到文本块对应的关键字标签。

服务器将语音信号转换为对应的文本信息后,进一步获取预设的数据分析模型。其中,数据分析模型可以是预先利用大量数据通过神经网络分类模型进行训练的到的。

服务器可以将文本信息按照预设的方式进行拆分,得到多个文本块后,对多个文本块进行特征提取,计算出文本块中多个词的词向量和文本块对应的文本块向量,服务器还可以计算出每个词向量对应的词频。服务器进而将文本块向量以及多个词向量和对于的词频输入至预设的数据分析模型中,通过数据分析模型对多个词向量和文本块向量进行分类,提取出达到预设阈值的类别,获取类别对应的关键字标签,从而得到每个文本块对应每个类别的概率。其中,每个文本块可以包括多个关键字标签。例如,关键字标签可以包括业务类型、技术类型、流程类型等多个维度的标签。服务器通过利用预设的数据分析模型并结合词频对会议文本数据进行分类和关键字提取出来,由此能够有效地从自然语言会议谈话内容中获取关键的会议核心内容,从而能够有效提高会议文本的分析准确率。

步骤210,在文本块的预设位置添加对应的关键字标签,并将添加关键字标签的会议文本信息按照预设方式生成会议报告数据。

步骤212,将会议报告数据存储至会议数据存储库中,并根据关键字标签建立与会议文本信息对应的索引。

服务器通过数据分析模型分析出文本信息中关键字对应的核心内容后,获取类别对应的关键字标签,并将关键字标签添加至对应的文本块中,由此将关键字和对应的文本内容进行关联。服务器则可以进一步根据会议主题获取预设的会议报告模板,并根据会议报告目标和添加关键字后的文本信息按照预设方式生成对应的会议报告数据,服务器还可以进一步对会议报告数据生成对应的会议数据标识。

服务器生成会议报告数据后,则根据会议数据标识将会议报告数据存储至会议数据存储库中。进一步地,为了便于对会议报告数据中的会议文本信息进行查询,服务器可以将会议报告数据采集到结构化的会议数据存储库中,并根据关键字标签建立与会议文本信息对应的索引。通过将关键字与对应的文本信息关联起来,由此利用文本信息对应的关键字索引,能够快速查询到所需的文本信息,从而能够有效地根据关键字标签关联会议信息中的重要内容,有效提高了会议数据的归纳分析效率,并且有效提高了会议数据的查询效率。

上述会议数据分析处理方法中,服务器获取终端上传的语音数据后,对语音数据进行特征提取和端点分析,得到多个语音特征信息后,获取预设的声纹识别模型,通过声纹识别模型对语音特征信息进行声纹识别,由此能够有效得到多个语音片段和有效识别出对应的声纹标识,服务器进而根据声纹标识将多个语音片段转换为对应的文本信息。由此能够准确有效地识别出会议中的各个发言人和对应的语音,服务器根据用户标识将语音数据转换为对应的文本信息。服务器进一步获取预设的数据分析模型,通过数据分析模型将文本信息拆分为多个文本块,并对多个文本块进行分类分析,得到文本块对应的关键字标签,由此能够准确有效地分析出会议文本信息中的重要内容并打算标签。在文本块的预设位置添加对应的关键字标签,并将添加关键字标签的会议文本信息按照预设方式生成会议报告数据,并且有效提高了会议语音数据的识别和分析准确率服务器进一步将会议报告数据存储至会议数据存储库中,并根据关键字标签建立与会议文本信息对应的索引,由此能够有效将关键字与对应的文本信息关联起来,有效提高了会议数据的查询效率。

在一个实施例中,对语音数据进行特征提取和端点分析,得到多个语音特征信息的步骤包括:获取语音数据的语音信号,对语音信号进行分帧加窗,提取出对应的声学特征和频谱特征;对声学特征和频谱特征进行转换,得到对应的声学特征向量和频谱特征向量;获取预设的语音端点检测模型,将声学特征向量和频谱特征向量输入至语音端点检测模型,通过语音端点检测模型检测语音信号的多个起始点和终止点;根据语音信号的多个起始点和终止点将语音数据切分为多个语音特征信息。

服务器接收到终端上传的语音数据后,对语音数据进行声学特征提取。具体地,服务器提取语音数据中的语音信号,终端上传的语音数据中的语音信号通常为带有噪声的带噪语音信号。服务器获取语音信号后,对语音信号进行加窗分帧,提取出对应的声学特征和频谱特征,并对声学特征和频谱特征进行转换,得到对应的声学特征向量和频谱特征向量。

服务器进一步获取预设的语音端点检测模型,将声学特征向量和频谱特征向量输入至语音端点检测模型,通过语音端点检测模型对输入的声学特征向量和频谱特征向量进行分类,可以得到声学特征向量和频谱特征向量对应的决策值。当得到的决策值为预设的第一阈值时,对声学特征向量或频谱特征向量添加语音标签。其中,第一阈值可以是一个范围值。

当得到的决策值为预设的第二阈值时,对声学特征向量或频谱特征向量添加非语音标签。进而可以得到添加语音标签的声学特征向量和添加语音标签的频谱特征向量。对添加语音标签的声学特征向量和添加语音标签的频谱特征向量进行解析,得到添加语音标签的语音信号,根据语音信号的时序和添加语音标签确定语音信号的多个起始点和终止点,进而根据语音信号的多个起始点和终止点将语音数据切分为多个语音特征信息。通过利用语音端点检测模型对语音信号进行端点检测和分类,从而能够准确地识别出带噪语音信号中语音信号和非语音信号,进而能够有效提取出语音数据中的语音特征信息。

在一个实施例中,如图3所示,通过声纹识别模型对语音特征信息进行声纹分析,得到多个语音片段和对应的声纹标识的步骤,具体包括以下内容:

步骤302,通过声纹识别模型计算多个语音特征信息中的特征参数序列。

步骤304,根据特征参数序列对语音特征信息进行切分,得到多个语音片段。

步骤306,计算多个语音片段的特征参数序列的相似度,将相似度达到预设阈值的多个语音片段进行归类。

步骤308,根据归类后的特征参数序列在声纹模型库中进行匹配,对归类后的语音片段添加相匹配的声纹标识。

服务器在获取预设的声纹识别模型之前,需要预先构建出声纹识别模型。具体地,服务器可以首先获取大量的语音样本数据,将语音样本数据分为训练集和验证集,其中,训练集中可以是已经标注的语音样本数据。服务器则将训练集中的语音样本数据输入至预设的声纹识别模型中进行训练,得到初始的声纹识别模型,服务器进而将验证集中的语音样本数据输入至初始的声纹识别模型中进行进一步训练和验证。当验证集中的满足预设匹配度值的语音样本数据的数量达到预设阈值时,则停止训练,进而得到训练完成的声纹识别模型。服务器进一步将声纹模型库中用户的声纹输入至训练完成的声纹识别模型中,由此能够有效地构建出识别准确率较高的声纹识别模型。

服务器对语音信号数据进行特征提取得到多个语音特征信息后,则获取预设的声纹识别模型,并将多个语音特征信息输入至声纹识别模型中,通过声纹识别模型对语音特征信息进行声纹识别。具体地,服务器通过声纹识别模型计算出每个语音特征信息中的特征参数序列,其中,每个语音特征序列中可能包括不同特征参数序列的语音片段。服务器则根据不同的特征参数序列将语音特征信息切分为多个语音片段,并将特征参数序列相同的语音片段进行归类,例如,可以将特征参数序列相同的多个语音片段归为同一类。

服务器进而根据归类后的特征参数序列在声纹模型库中进行匹配,其中,声纹模型库中预先存储了多个发言人对应的声纹特征和对应的声纹标识。服务器通过将多个语音片段的特征参数序列与声纹模型库中的声纹特征进行匹配,提取出匹配度最高的特征参数序列对应的声纹标识,进而能够有效地匹配出每个语音片段所对应的声纹标识,服务器则对每一个语音片段添加识别出的对应的声纹标识,由此能够有效地识别出语音数据中各个发言人对应的语音片段信息。

通过声纹识别模型计算出每个语音特征片段对应的特征参数序列,并将特征参数序列与预设的声纹模型库中的特征参数序列进行比对,提取出匹配度最高的特征参数序列的用户对应的声纹标识,并将用户标识添加至对应的语音特征片段中,由此能够准确有效地识别出会议中的各个发言人和对应的语音。

服务器将多个语音片段转换为对应的文本信息后,进一步获取预设的语义分析模型,通过语义分析模型对文本信息进行上下文语义分析,得到包括关键字和校正信息的分析结果。服务器则根据校正信息对文本信息进行校正,并对校正后的文本信息添加对应的关键字,进而根据会议主题和添加关键字的文本信息按照预设方式生成对应的会议报告数据。由此能够有效地生成对应的会议报告数据,进而能够有效地提高会议语音数据的处理效率和识别准确率。

在一个实施例中,如图4所示,通过数据分析模型将文本信息拆分为多个文本块,对多个文本块进行分类分析的步骤,具体包括以下内容:

步骤402,通过数据分析模型对文本信息进行上下文分析,得到多个文本块以及对应的的词向量和词频。

步骤404,对多个词向量和文本块向量进行分类,从而得到每个文本块对应每个类别的概率。

步骤406,提取出达到预设阈值的类别,获取类别对应的关键字标签。

服务器在获取预设的数据分析模型之前,还需要预先构建和训练数据分析模型。具体地,服务器可以从数据库中获取大量的样本数据,样本数据可以是大量的历史会议文本数据。服务器可以利用样本数据生成训练集和验证集,其中训练集中的数据可以是已经标注了关键字标签的会议文本数据。服务器则将训练集中的数据输入至预先构建的数据分析模型中进行训练,得到初始数据分析模型。服务器进一步将验证集中的数据输入至初始数据分析模型中进行进一步训练和验证。当验证集中的满足预设匹配度的样本数据的数量达到预设阈值时,则停止训练,进而得到训练完成的数据分析模型。由此能够有效地构建出分析准确率较高的数据分析模型。

服务器获取终端上传的语音数据后,对语音数据进行特征提取和端点分析,得到多个语音特征信息后,获取预设的声纹识别模型,通过声纹识别模型对语音特征信息进行声纹识别,由此能够有效得到多个语音片段和有效识别出对应的声纹标识,服务器进而根据声纹标识将多个语音片段转换为对应的文本信息。由此能够准确有效地识别出会议中的各个发言人和对应的语音,服务器根据用户标识将语音数据转换为对应的文本信息。服务器进一步获取预设的数据分析模型,通过数据分析模型对文本信息进行分类分析。

具体地,服务器对会议文本数据按照预设的方式进行拆分,得到多个文本块后,对多个文本块进行特征提取,计算出文本块中多个词的词向量和文本块对应的文本块向量,服务器还可以计算出每个词向量对应的词频。服务器进而将文本块向量以及多个词向量和对于的词频输入至预设的数据分析模型中,通过数据分析模型对多个词向量和文本块向量进行分类,从而得到每个文本块对应每个类别的概率。服务器提取出达到预设阈值的类别,获取类别对应的关键字标签,并将关键字标签添加至对应的文本块中。其中,每个文本块可以包括多个关键字标签。例如,关键字标签可以包括业务类型、技术类型、流程类型等多个维度关键字对应的标签。服务器通过利用预设的数据分析模型并结合词频对会议文本数据进行分类和关键字提取出来,由此能够有效地从自然语言会议谈话内容中获取关键的会议核心内容。

在一个实施例中,将会议报告数据存储至会议数据存储库的步骤包括:将关键字标签配置为会议数据存储库的主键;根据关键字标签生成索引表;根据索引表对会议报告数据中的文本块进行存储。

服务器获取终端上传的语音数据,对语音数据进行特征提取和端点分析,得到多个语音特征信息,获取预设的声纹识别模型,通过声纹识别模型对语音特征信息进行声纹分析,得到多个语音片段和对应的声纹标识,并根据声纹标识将多个语音片段转换为对应的会议文本信息。服务器进一步获取预设的数据分析模型,通过数据分析模型将文本信息拆分为多个文本块,对多个文本块进行分类分析,得到文本块对应的关键字标签。在文本块的预设位置添加对应的关键字标签,并将添加关键字标签的会议文本信息按照预设方式生成会议报告数据。

服务器生成会议报告数据后,则根据会议数据标识将会议报告数据存储至会议数据存储库中。为了便于对会议报告数据中的会议文本信息进行查询,服务器可以将会议报告数据采集到结构化的会议数据存储库中,并根据关键字标签建立与会议文本信息对应的索引。具体地,服务器可以将关键字标签设置为会议数据存储库表中的主键,并根据关键字标签生成索引表,通过主键根据关键字标签建立与对应的文本块内容的索引,服务器则根据索引表对会议报告数据中的文本块进行存储。通过索引将关键字与对应的文本信息关联起来,由此利用文本信息对应的关键字索引,能够快速查询到所需的文本信息,从而能够有效地根据关键字标签关联会议信息中的重要内容,有效提高了会议数据的归纳分析效率,并且有效提高了会议数据的查询效率。

在一个实施例中,该方法还包括:接收终端发送的查询请求,查询请求包括关键字;根据关键字对应的索引从会议数据存储库中获取会议文本数据,根据关键字与会议文本数据中的关键字标签进行匹配;获取匹配度达到预设阈值的关键字标签对应的文本内容;将文本内容发送至终端,并按照匹配度进行排列显示。

服务器将会议过程中的语音数据生成对应的会议报告数据后,根据关键字标签建立与会议文本信息对应的索引,并根据索引将会议报告数据存储至会议数据存储库后,用户可以利用关键字标签查询会议报告数据中对应的会议文本块内容。具体地,用户可以通过对应的用户终端向服务器发送查询请求,查询请求中携带了关键字。进一步的,查询请求中也可以携带关键字和会议数据标识。其中,关键字也可以包括用户标识,用户标识与声纹标识可以相一致。

服务器接收到用户终端发送的查询请求后,获取会议数据存储库表对应的索引表,根据关键字标签和索引表从数据库中获取会议报告数据中与该关键字标签相关联的会议文本块内容。具体地,服务器从会议数据存储库中获取会议文本数据后,根据关键字标签与会议文本数据中的关键字标签进行匹配,获取匹配度达到预设阈值的关键字标签对应的文本内容,并将会议文本内容按照预设方式发送至用户终端,并按照匹配度进行排列显示。例如,可以按照匹配度对文本内容进行降序排列显示,还可以对文本内容进行突出显示。由此可以有效地使用户快速便捷地了解到用户所需的会议内容。

应该理解的是,虽然图2-4的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-4中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中,如图5所示,提供了一种会议数据分析处理装置,包括:数据获取模块502、特征提取模块504、声纹识别模块506、数据分析模块508、会议报告生成模块510和会议报告存储模块512,其中:

数据获取模块502,用于获取终端上传的语音数据;

特征提取模块504,用于对语音数据进行特征提取和端点分析,得到多个语音特征信息;

声纹识别模块506,用于获取预设的声纹识别模型,通过声纹识别模型对语音特征信息进行声纹分析,得到多个语音片段和对应的声纹标识,并根据声纹标识将多个语音片段转换为对应的会议文本信息;

数据分析模块508,用于获取预设的数据分析模型,通过数据分析模型将文本信息拆分为多个文本块,对多个文本块进行分类分析,得到文本块对应的关键字标签;

会议报告生成模块510,用于在文本块的预设位置添加对应的关键字标签,并将添加关键字标签的会议文本信息按照预设方式生成会议报告数据;

会议报告存储模块512,用于将会议报告数据存储至会议数据存储库中,并根据关键字标签建立与会议文本信息对应的索引。

在一个实施例中,特征提取模块504还用于获取语音数据的语音信号,对语音信号进行分帧加窗,提取出对应的声学特征和频谱特征;对声学特征和频谱特征进行转换,得到对应的声学特征向量和频谱特征向量;获取预设的语音端点检测模型,将声学特征向量和频谱特征向量输入至语音端点检测模型,通过语音端点检测模型检测语音信号的多个起始点和终止点;根据语音信号的多个起始点和终止点将语音数据切分为多个语音特征信息。

在一个实施例中,声纹识别模块506还用于通过声纹识别模型计算多个语音特征信息中的特征参数序列;根据特征参数序列对语音特征信息进行切分,得到多个语音片段;计算多个语音片段的特征参数序列的相似度,将相似度达到预设阈值的多个语音片段进行归类;根据归类后的特征参数序列在声纹模型库中进行匹配,对归类后的语音片段添加相匹配的声纹标识。

在一个实施例中,数据分析模块508还用于通过数据分析模型对文本信息进行上下文分析,得到多个文本块以及对应的的词向量和词频;对多个词向量和文本块向量进行分类,从而得到每个文本块对应每个类别的概率;提取出达到预设阈值的类别,获取类别对应的关键字标签。

在一个实施例中,会议报告存储模块512还用于将关键字标签配置为会议数据存储库的主键;根据关键字标签生成索引表;根据索引表对会议报告数据中的文本块进行存储。

在一个实施例中,该装置还包括数据查询模块,用于接收终端发送的查询请求,查询请求包括关键字;根据关键字对应的索引从会议数据存储库中获取会议文本数据,根据关键字与会议文本数据中的关键字标签进行匹配;获取匹配度达到预设阈值的关键字标签对应的文本内容;将文本内容发送至终端,并按照匹配度进行排列显示。

关于会议数据分析处理装置的具体限定可以参见上文中对于会议数据分析处理方法的限定,在此不再赘述。上述会议数据分析处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储语音数据、会议文本信息、索引表已经会议报告数据等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现本申请任意一个实施例中提供的会议数据分析处理方法的步骤。

本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现本申请任意一个实施例中提供的会议数据分析处理方法的步骤。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1