语音处理系统的制作方法

文档序号:14040818阅读:203来源:国知局
语音处理系统的制作方法

本实用新型涉及语音识别技术领域,尤其涉及一种语音处理系统。



背景技术:

目前,在一些会议场景、审讯场景或者谈话场景下,多数是通过录音录像以及人工手动记录的方式来形成记录文档,以便于后期查看与追溯。但是会议、审讯或者谈话时的记录人员不仅需要对语音进行听取,并且还需要在电脑上手动录入与会人员、嫌疑人或者谈话人的说话内容,用于签字确认、存档以及后续业务流转。记录人员在会议、审讯或者谈话现场,需要同时开展听取、记录以及核对等方面的工作,不仅导致记录人员身心疲惫不堪,而且还会发生遗漏细节或关键内容等情况。

尤其在实际讯问或询问过程中,办案人员同时开展审讯、记录以及核对等方面的工作,不仅导致办案人员身心疲惫不堪,而且还会发生遗漏细节或关键供述内容等情况。



技术实现要素:

本实用新型旨在至少在一定程度上解决相关技术中的技术问题之一。

为此,本实用新型的第一个目的在于提出一种语音处理系统,以缓解记录人员在会议、审讯或谈话过程中的压力,使得会议、审讯或谈话人员能够将更多的精力投入到在会议、审讯、谈话过程中,用于解决现有记录人员同时开展听取、记录以及核对等方面的工作,不仅导致记录人员身心疲惫不堪,而且还会发生遗漏细节或关键内容的问题。

为达上述目的,本实用新型第一方面实施例提出了一种语音处理系统,包括:

至少两个拾音装置和用于对语音进行处理的处理装置;所述拾音装置包括第一拾音装置和第二拾音装置;

其中,所述第一拾音装置与所述第二拾音装置与所述处理装置连接;

所述第一拾音装置,用于采集第一用户的第一语音;

所述第二拾音装置,用于采集第二用户的第二语音;

所述处理装置,用于获取所述第一语音或者所述第二语音,对所述第一语音或者所述第二语音进行识别得到对应的文字内容以及对应的用户,并根据所述用户分段记录所述文字内容。

作为本实用新型第一方面实施例的一种可能的实现方式,声卡,分别与所述第一拾音装置、所述第二拾音装置连接以及所述处理装置连接;

所述声卡,用于识别当前接收到的语音对应的用户,并将识别结果发送给所述处理装置处理。

作为本实用新型第一方面实施例的一种可能的实现方式,所述声卡集成在所述第二拾音装置中;所述第一拾音装置通过所述第二拾音装置与所述处理装置连接。

作为本实用新型第一方面实施例的一种可能的实现方式,所述处理装置,包括:拾音单元、转写单元和显示屏;其中,所述拾音单元与所述第二拾音装置连接,所述转写单元分别与所述拾音单元和显示屏连接;

其中,所述拾音单元,用于接收所述第一语音或者所述第二语音,对接收到的语音进行拾音并进行自动降噪去混响;

所述转写单元,用于对处理后的所述语音进行语音识别,将所述语音中携带的内容转化成所述文字内容并确定所述文字内容对应的用户,关联所述文字内容与对应用户,根据识别出所述文字内容对应的用户,判断所述文字内容与上一段内容是否为同一用户,如果不是同一用户,则分段记录所述文字内容;

所述显示屏,用于显示记录的所述文字内容。

作为本实用新型第一方面实施例的一种可能的实现方式,所述转写单元,包括:

语音识别子单元,用于对由所述拾音单元处理后的所述语音进行语音识别,将所述语音中携带的内容转化成所述文字内容,并从所述语音中提取声纹特征;

对比子单元,用于将提取到的所述声纹特征与声纹存储器中的声纹特征进行比对,当提取到的所述声纹特征不存在于所述声纹存储器中,则将提取到的所述声纹特征存储到所述声纹存储器并形成用户标记,关联所述文字内容与所述用户标记;

所述声纹存储器存储器,用于存储首次提取出的所述用户的所述声纹特征。

作为本实用新型第一方面实施例的一种可能的实现方式,所述处理装置,还包括:

与所述转写单元和拾音单元连接的存储单元,用于存储接收到的所述第一语音和所述第二语音;

所述转写单元,还用于在记录所述文字内容过程中,按照句子嵌入与所述句子对应的原始语音的第一信息;其中,所述第一信息包括接收到的所述语音在所述存储单元中的地址以及与所述句子对应的原始语音时间戳信息;

与所述转写单元连接的所述播放单元,用于当点击所述句子时,根据所述第一信息播放所述句子对应的所述原始语音。

作为本实用新型第一方面实施例的一种可能的实现方式,所述处理装置,还包括:

所述转写单元,还用于在记录所述文字内容过程中,按照段落嵌入与所述段落对应的原始语音的第二信息;其中,所述第二信息包括接收到的所述语音在所述存储单元中的地址以及与所述段落对应的原始语音时间戳信息;

与所述转写单元连接的关键词提取单元,用于从所述文字内容中提取关键词,形成所述关键词与所在段落的关联关系;

所述播放单元,还用于查询或者点击到所述关键词后,根据所述关联关系和所述第二信息,播放所述关键词所在段落对应的原始语音。

作为本实用新型第一方面实施例的一种可能的实现方式,所述处理装置,还包括:数据库,用于存储记录时的文本模板和/或语句模板;

与所述转写单元和所述数据库连接选取单元,用于在所述转写单元进行记录之前从所有文本模板中选取一个目标文本模板,以及在记录过程中匹配到当前语音所表述的意思第一语句模板的所表述的意思一致时,将所述第一语音模板发送给所述转写单元进行记录,其中,所述第一语音模板为所述数据库中所有语句模板中的一个。

作为本实用新型第一方面实施例的一种可能的实现方式,所述处理装置,还包括:

与所述转写单元连接的编辑单元,用于编辑实时识别出的所述文字内容;

与所述转写单元连接的翻译单元,用于接收用户的翻译指令,所述翻译指令中包括转换后的目标语种,根据所述翻译指令将所述文字内容从当前语种翻译到目标语种。

作为本实用新型第一方面实施例的一种可能的实现方式,所述处理装置为终端设备。

作为本实用新型第一方面实施例的一种可能的实现方式,所述第一拾音装置和所述第二拾音装置中分别包括麦克风阵列,其中,所述第一拾音装置为线型麦克风阵列,所述第二拾音装置为盘型麦克风阵列。

作为本实用新型第一方面实施例的一种可能的实现方式,其特征在于,所述第一拾音装置和所述第二拾音装置在工作时按照设定的位置关系摆放。

作为本实用新型第一方面实施例的一种可能的实现方式,其特征在于,所述第一拾音装置的拾音范围覆盖所述第一用户;所述第二拾音装置与所述第二用户的距离要在设定的距离范围内。

本实用新型实施例的语音处理系统,包括至少第一拾音装置和第二拾音装置,其中第一拾音装置和第二拾音装置与处理装置连接,第一拾音装置采集第一用户的第一语音信息,第二拾音装置采集第二用户的第二语音信息,处理装置对第一语音和第二语音进行识别得到对应的文字内容以及对应的用户,并根据用户分段记录文字内容。本实施例中,利用语音识别的方式,自动的将语音信号转化成文字信号并进行记录,不再依赖人工识别语音信息并手动进行记录,提高记录效率,降低人力成本,并且可以降低漏记的概率。

尤其在审讯办案过程中,通过本实施例的语音处理系统可以将对话实时转文字,缓解检察人员办案过程中的压力,使得办案人员能够将更多的精力投入到案件审理中,提升审讯质量,用于解决现有审讯过程中,办案人员需要同时开展审讯、记录以及核对等方面的工作,不仅导致办案人员身心疲惫不堪,而且还会发生遗漏细节或关键供述内容的问题。

本实用新型附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本实用新型的实践了解到。

附图说明

本实用新型上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:

图1为本实用新型实施例提供的一种语音处理系统的结构示意图;

图2为本实用新型实施例提供的另一种语音处理系统的结构示意图;

图3为本实用新型实施例提供的另一种语音处理系统的结构示意图;

图4为本实用新型实施例提供的一种语音处理系统的应用示意图;

图5为本实用新型实施例提供的另一种语音处理系统的结构示意图;

图6为本实用新型实施例提供的另一种语音处理系统的结构示意图;

图7为本实用新型实施例提供的另一种语音处理系统的结构示意图;

图8为本实用新型实施例提供的另一种语音处理系统的结构示意图。

具体实施方式

下面详细描述本实用新型的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本实用新型,而不能理解为对本实用新型的限制。

下面参考附图描述本实用新型实施例的语音处理系统。

现在多数讯问或询问笔录的记录仍然采用的是Word或WPS手工记录犯罪嫌疑人口供,用于签字确认、存档以及后续业务流转,不仅导致办案人员身心疲惫不堪,而且还会发生遗漏细节或关键供述内容等情况。

针对上述问题,本实用新型实施例提出一种语音处理系统,缓解检察人员办案过程中的压力,使得办案人员能够将更多的精力投入到办案审理中,提升审讯质量。

图1为本实用新型实施例提供的一种语音处理系统的结构示意图。如图1所示,该语音处理系统包括:至少包括第一拾音装置10和第二适应装置20以及用于对语音进行处理的处理装置30其中,第一拾音装置10和第二拾音装置20与处理装置30连接。

第一拾音装置10,用于采集第一用户的第一语音。

第二拾音装置20,用于采集第二用户的第二语音。

处理装置30,用于获取第一语音和第二语音,对第一语音和第二语音进行识别得到对应的文字内容以及对应的用户,并根据对应的用户分段记录文字内容。

作为一种示例,在图1的基础上,图2提供了另一种语音处理系统的结构示意图。如图2所示,语音处理系统还包括一个声卡40,该声卡40分别与第一拾音装置10、第二拾音装置20连接以及处理装置30连接。

本实施例中,通过声卡30可以识别当前接收到的语音对应的用户,并将识别结果发送给处理装置30连接,这样处理装置30就可以根据识别结果中的文字内容对应的用户进行记录。

具体地,声卡40为一个硬件元件,包括两路输入接口,一路与第一拾音装置10连接,接收第一拾音装置10采集的第一语音,另一路与第二拾音装置20连接,接收第二拾音装置20采集的第二语音。声卡40可以区分接收到的语音所对应的输入接口,进而可以识别出对应的用户,可以实现自动语音角色的分离。

在存在多个拾音装置的会议场景下,声卡40上应该包括与拾音装置数量一致的输入接口,每一个拾音装置对应一个输入接口,进而声卡40可以识别出当前接收到语音所对应的角色。

作为另一种示例,在图2的基础上,图3提供了另一种语音处理系统的结构示意图。如图3所示,该语音处理系统中的声卡40集成在第二拾音装置20内,声卡40分别与第一拾音装置10、第二拾音装置20以及处理装置30连接,能够使得第一拾音装置10通过第二拾音装置20与处理装置30连接,这样可以避免在处理装置30设置多个接口,通过接口与拾音装置连接。可选地,本实施例中,第二拾音装置20中包括采集的麦克风(MIC)),MIC与声卡40连接。

进一步地,第二拾音装置20内还可以设置有语音预处理程序或者软件,同语音预处理程序或者软件对接收到的语音进行过滤噪声,以及模数转换,然后将预处理后的语音输入到处理装置30中进行语音识别,提高语音识别的准确性。

可选地,可以将语音预处理程序或者软件内置在处理装置30中,在语音识别之前进行语音预处理,进而对接收到的语音进行过滤噪声,以及模数转换,然后对预处理后语音进行语音识别,提高语音识别的准确性。

作为一种示例,处理装置30可以为一个移动工作站,可以为笔记本电脑、超级笔记本、个人计算机(Personal Computer,简称PC)、手机或者ipad等终端设备。可以在处理装置30中安装有能够语音识别并且将识别结果转写成文字内容的软件或者硬件。

本实施例中,为了能够提高拾音效果,第一拾音装置10和第二拾音装置20可以为麦克风、拾音器等,优选地,第一拾音装置10和第二拾音装置20中均包括麦克风阵列。由于麦克风阵列可以实现定向拾音,从而能够滤除背景噪音,提高拾音装置的拾音质量。

本实用新型提供的语音处理系统,包括至少第一拾音装置和第二拾音装置,其中第一拾音装置和第二拾音装置与处理装置连接,第一拾音装置采集第一用户的第一语音信息,第二拾音装置采集第二用户的第二语音信息,处理装置对第一语音和第二语音进行识别得到对应的文字内容以及对应的用户,并根据用户分段记录文字内容。本实施例中,利用语音识别的方式,自动的将语音信号转化成文字信号并进行记录,不再依赖人工识别语音信息并手动进行记录,提高记录效率,降低人力成本,并且可以降低漏记的概率。

一般情况下,不同的应用场景下,两个拾音装置放置的位置不同,可能需要不同形状的拾音装置。本实施例中,第一拾音装置10可以为线型麦克风阵列,第二拾音装置20为盘型麦克风阵列。进一步地,可以设定工作时第一拾音装置10和第二拾音装置20的位置关系,按照该位置关系摆放。例如,第一拾音装置10处于第二拾音装置20正前方或侧前方。

如图4所示,为本实用新型的一种应用示意图。本实用新型提供的语音处理系统用于审讯人员审讯嫌疑人这一场景下。在该场景下嫌疑人一般为坐在凳子上的,前面不会设置障碍物,因此,可以将第一拾音装置20设置成一个线型麦克风阵列。审讯人员前面一般会设置有桌子,因此,可以将第二拾音装置20设置成一个盘型麦克风阵列。

具体地,线型麦克风阵列指向第一用户,此处,第一用户为嫌疑人,采集嫌疑人的第一语音作为口供。线型麦克风阵列与嫌疑人的距离最长可以达5米。将盘型麦克风阵列设置在第二用户前方,第二用户为审讯人,采集审讯人员的第二语音。线型麦克风阵列和盘型麦克风阵列分别可以采集8路语音。

在使用过程中,可以根据实际场景调整线型麦克风阵列的仰角,可以上扬或者下俯。一般情况下,线型麦克风阵列拾音角度为30度,在使用时,需要保证嫌疑人在第一拾音装置的拾音范围内。例如,可以将线型麦克风阵列指向嫌疑人并对准嫌疑人嘴巴,或者以线型麦克风阵列的轴线为中心线,嫌疑人嘴巴偏离中心线左右的角度不能超过15度。

进一步地,盘型麦克风阵列处于线型麦克风阵列正后方或侧后方,第二用户即审讯人员要与盘型麦克风阵列保持一定的距离,审讯人员与盘型麦克风阵列之间的距离控制在预设的距离范围内,距离过大不能很好的采集审讯人员的语音,距离太近会造成俯角过大影响拾音质量。

审讯人一定要在线型麦克风阵列后方,例如正后方,不可将线型麦克风阵列指向审讯人或侧偏向审讯人,这样会导致对嫌疑人的拾音不清楚等问题。

进一步地,线型麦克风阵列和盘型麦克风阵列连接,盘型麦克风阵列与一个超级笔记本连接,该超级笔记本为本实用新型中的处理装置30。处理装置30获取当前语音进行识别,可以识别出语音对应的是审讯人,进而能够将识别出文字内容归属于审讯人。当审讯人提问完成后,嫌疑人进行回答时,处理装置30可以再次接收到语音后,能够识别出该语音来自嫌疑人,进而可以对识别出的文字内容进行分段记录,以便于后续查阅,识别出文字内容后可以在超级笔记本的屏幕上进行显示。

在审讯过程中,一般开始由审讯人员开始提问嫌疑人,进而可以先区分出审讯人员的声音特征,进而后面就可以区分出审讯人员与嫌疑人。例如,可以通过“问”“答”方式来区别出审讯人员的文字内容和嫌疑人的文字内容。

尤其在审讯办案过程中,通过本实施例的语音处理系统可以将对话实时转文字,以缓解检察人员办案过程中的压力,使得办案人员能够将更多的精力投入到案件审理中,提升审讯质量,用于解决现有审讯过程中,办案人员需要同时开展审讯、记录以及核对等方面的工作,不仅导致办案人员身心疲惫不堪,而且还会发生遗漏细节或关键供述内容的问题。

作为一种示例,在上述实施例的基础上,图5提供了另一种语音处理系统的结构示意图。如图5所示,该语音处理系统中的处理装置30包括:拾音单元301、转写单元302和显示屏303。拾音单元301与转写单元302连接,转写单元302与显示屏303连接。

拾音单元301接收第一语音或者第二语音,对接收到的语音进行拾音并进行自动降噪去混响,以提高后续语音识别的准确性。进一步地,转写单元302对由拾音单元301处理后的语音进行语音识别,进而将语音中携带的内容转化成文字内容并确定对应的用户,关联文字内容与对应用户。本实施例中,拾音单元301可以为设置在处理装置30上的硬件接口,该硬件接口能够实现对语音的接收和解混响。转写单元302为处理装置30上的语音识别的芯片,可以对接收到的语音进行语音识别,将语音内容转换成文字描述。

作为一种示例,拾音单元301与声卡40连接,在接收第一语音或者第二语音的同时,可以接收到声卡40传输过来的识别结果,确定出接收到的当前语音对应的用户,进而对接收到的语音进行识别,将语音中携带的内容转化成文字内容,并且关联文字内容与对应用户。

作为一种示例,转写单元302可以提取出接收到的语音的声纹特征,进而根据声纹特征确定出文字内容对应的用户。图6为本实用新型实施例提供的另一种语音处理系统的结构示意图。图6语音处理系统中转写单元302包括:

语音识别子单元3021、对比子单元3022和声纹存储器3023。语音识别子单元3021与从拾音单元301连接,从拾音单元301中接收处理后的第一语音或者第二语音。

对比子单元3022与语音识别子单元3021连接,声纹存储器3023分别与语音识别子单元3021和对比子单元3022连接。

其中,语音识别子单元3021对接收到经过拾音自动降噪去混响后的语音进行语音识别,将语音中携带的内容转化成所述文字内容,以及从语音中提取声纹特征。进一步地,语音识别子单元3021将提取到的声纹特征发送给对比子单元3022,对比子单元3022将提取到的声纹体征与声纹存储器中已有的声纹特征进行比对,当提取到的声纹特征不存在于声纹存储器中,则将提取到的声纹特征存储到声纹存储器并形成用户标记,关联文字内容与用户标记。其中,用户标记用于标记文字内容对应的用户,例如用户标记可以为用户C或者用户5等。

本实施例中,在转写单元302中设置的声纹存储器3023,可以存储首次出现的声纹特征。也就是说,在每一个新的使用场景下,都会建立一个新的声纹存储器3023,在使用之初,该声纹存储器3023中为存储任何声纹特征。在语音识别的过程中,每当出现一个新的声纹特征后,就将这个声纹特征存储到声纹存储器3023中,用于对后续采集来的语音进行识别,确定出该语音对应的用户。当切换使用场景后,声纹存储器3023中的声纹特征并不会被共享,只是为此次使用场景来使用的。

此次需要说的是,虽然不同场景之间不能共享声纹存储器3023中的声纹特征,但是可以被管理中心或者安全部门作为样本进行采集,例如公安系统。

具体地,转写单元302可以根据识别结果中文字内容对应的用户,判断该文字内容与上一段文字内容是否为同一用户,如果非同一用户,则分段记录该识别结果中的文字内容。

本实施例中,转写单元302可以将转写的文字内容发送到显示屏303将文字内容在显示屏上进行显示,显示屏303中可以划分成多个显示区域,其中一个显示区域为文档编辑区域,用于显示之前已经记录的文字内容,另一区域文字内容追加区域,用于显示当前实时识别出的文字内容。通过设置多个显示区域可以实现文字的自动追加,分开显示便有人工排除错误。

本实施例中,通过转写单元302提取的语音的声音特性可以进行角色分离,从而使得转写单元302可以实现对话方式进行记录,在一对一的场景下例如可以按照“问答”方式进行记录。

进一步地,转写单元302还可以使用语音活动检测(Voice Activity Detection,简称VAD)进行分段,例如,可以设置一定的时间间隔,当静音的时间间隔超过预设的时间间隔时,就可以将同一用户的文字内容在该静音点出进行切分,然后将后面的文字内容记录在下一段中。

在上述实例中基础之上,图7提供了本实用新型的另一种语音处理系统的结构示意图。如图7所示,处理装置还包括:存储单元304和播放单元305。

存储单元304分别与转写单元302和拾音单元301连接,可以存储接收到的第一语音和第二语音。转写单元302在记录文字内容过程中,按照句子嵌入与句子对应的原始语音的第一信息。第一信息包括接收到的语音在存储单元304中的地址以及与句子对应的原始语音的时间戳信息。即可以记录出该句子开始的时间戳以及结束的时间戳。

播放单元305与转写单元302连接,用户当点击记录的文字内中的某个句子时,根据该句子中嵌入的第一信息,就可以获取到语音在存储单元304中地址,并且根据该地址以及时间戳信息,就可以确定与该句子对应的原始语音的起始点和结束点,进而播放出这一个时间段内的语音。本实施例中,播放单元305可以为扬声器或者麦克风阵列,例如可以为圆盘型麦克风等。

进一步地,由于设置有播放单元305,也播放所记录的实际文字内容,这样针对不认识字的嫌疑人可以通过机器朗读笔录的方式播放给犯罪嫌疑人听,有效减轻检察的人员的工作压力。

本实施例中,通过在文字内容中为每个句子嵌入与该句子对应的原始语音的第一信息,可以灵活地点击所需要回放的原始内容。

尤其在审讯过程中,能够根据对审讯记录中每个句子播放原始语音。这对于后期庭审过程中嫌疑人提出的无理要求或翻供行为,提供了审判证据,能够精准回溯。而且现有通过同步录音录像形成的资料时间长、容量大,往往导致无法及时准确地定位到嫌疑人翻供部分的录音录像,解决了现有技术中无法精准回溯的难题。

在图7的基础之上,图8提供了本实用新型的另一种语音处理系统的结构示意图。如8所示,该处理装置30还包括:关键词提取单元306、数据库307、选取单元308、编辑单元309和翻译单元310。其中,关键词提取单元306与转写单元302连接,选取单元308分别与转写单元302和数据库307连接,编辑单元309与转写单元302连接,翻译单元310与转写单元302连接。

本实施例中,转写单元302在记录文字内容过程中,按照段落嵌入与段落对应的原始语音的第二信息;其中,第二信息包括接收到的语音在存储单元中的地址以及与段落对应的原始语音时间戳信息。

提取单元306可以通过自然语音处理(Natural Language Processing,简称NLP)技术,在识别出的文字内容上自动提取关键词,如时间、地点、人物、事件以及事由等关键词。进一步地,在获取到关键词之后,提取单元306可以对关键词进行标记,例如对关键词突出高亮显示。进一步地,在获取到关键词之后,可以关键词所在段落,建立关键词与所在段落之间的关联关系。本实施例中,可以利用关键词形成一个关键词集合,并为每个关键词设置定位点击按钮,可以通过点击该点击按钮,用户能够快速定位到关键词对应的段落

进一步地,关键词提取单元306还可以接收用户对短语的修改,并且进行标记,当下次出现该短语后,就可以利用修改的短语显示,并且统计文字内容中热词出现的频率,将超过一定频率的作为新的关键词进行添加,并且可以实时生效,能有效提升该关键词的识别准确率。

进一步地,处理装置30中还可以设置一个数据库,该数据库中可以预先存储一些文本模板和/或一些重用的短语或者句子。

审讯人员可以通过选取单元308从数据库中选取一个目标文本模板,在选取出目标文本模板后,转写单元302就可以按照目标文本模板的格式要求进行文字内容的记录。进一步地,通过选取单元308从历史记录或硬盘中选择底稿模板作为目标文本模板。本实施例中,可以通过选择单元308创建新的文本模板并存入到数据库中,也可以对选择的目标文本模板进行编辑,例如可以修改字体的大小,字体的颜色或者页面页脚等删除操作等。

进一步地,选取单元308在记录的过程中,举例说明,在审讯笔录的过程中,审讯人员为嫌疑人名字的语音“你叫什么名字”或者“说说叫什么”,识别出可以知道审讯人的意图为“姓名”,这样就可以在笔录中形成一条简单的记录“姓名”。进一步地,选取单元308支持用户对常用的语句模板进行自定义编辑。

进一步地,处理装置30中的编辑单元309可以对转写单元302转写的文字内容进行编辑,例如,对文字内容进行排版,或者自动检查拼写错误以及基本语法错误,帮助用户快速校对记录文稿。进一步地,编辑单元309还可以将语气词和多余的词汇去除,以保证记录的规整。本实施例中,通过编辑单元309可以自动地对文字内容进行检查和整理,进一步地降低审讯人员的工作强度,使得审讯人员可以集中精力进行审讯。

进一步地,处理装置30中的翻译单元310可以实现多种语种的翻译功能。具体地,翻译单元310根据用户输入的翻译指令,其中,翻译指令中包括转换后的目标语种,然后根据该翻译指令将识别出的文字内容从当前语种翻译到目标语种。例如,可以从汉语翻译成维语、从汉语翻译成英语、从汉语翻译成日语等。

本实施例中,利用语音识别的方式,自动的将语音信号转化成文字信号并进行记录,不再依赖人工识别语音信息并手动进行记录,提高记录效率,降低人力成本,并且可以降低漏记的概率。

尤其在审讯办案过程中,通过本实施例的语音处理系统可以将对话实时转文字,以缓解检察人员办案过程中的压力,使得办案人员能够将更多的精力投入到案件审理中,提升审讯质量,用于解决现有审讯过程中,办案人员需要同时开展审讯、记录以及核对等方面的工作,不仅导致办案人员身心疲惫不堪,而且还会发生遗漏细节或关键供述内容的问题。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本实用新型的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本实用新型的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。

就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。

应当理解,本实用新型的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。

此外,在本实用新型各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。

上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本实用新型的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本实用新型的限制,本领域的普通技术人员在本实用新型的范围内可以对上述实施例进行变化、修改、替换和变型。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1