音频文本处理方法、装置、存储介质及电子设备与流程

文档序号：36105510发布日期：2023-11-22 06:58阅读：53来源：国知局

本技术属于计算机，尤其涉及一种音频文本处理方法、装置、存储介质及电子设备。

背景技术：

1、随着计算机技术的发展，会议的形式越来越多样，不局限于参会人员聚集到统一的会议室中进行开会，可以通过远程音视频的网络会议，实现跨地域的会议召开，便利了人们的工作和生活。

2、目前市面上存在一些可以进行网络会议的音视频会议应用，这些音视频会议应用可以录制会议音频数据，并通过对该会议音频数据进行文本识别，得到会议文本，且用户可以通过对该会议文本中的内容进行复制粘贴操作，实现会议文本的部分内容截取或者多个会议文本的内容合并，得到不同于原始会议文本的新文本，但是目前技术得到的复制粘贴文本不具备回听功能，也即无法对新文本中各文本内容实现相应会议音频的回听，用户体验感较差。

技术实现思路

1、本技术旨在至少解决现有技术中存在的技术问题之一。为此，本技术提出一种音频文本处理方法、装置、存储介质及电子设备，能使复制粘贴的音频文本具有回听功能。

2、第一方面，本技术提供了一种音频文本处理方法，包括：

3、响应于对目标音频识别文本的第一操作，获取所述目标音频识别文本对应的目标结构化数据，所述目标结构化数据包括所述目标音频识别文本和音频描述信息，所述音频描述信息用于获取所述目标音频识别文本对应的目标音频数据；

4、在共享存储区中存储所述目标结构化数据；

5、响应作用于目标位置处的第二操作，从所述共享存储区中获取所述目标结构化数据，并根据所述目标结构化数据在所述目标位置处显示所述目标音频识别文本，以根据显示的所述目标音频识别文本获取所述目标音频数据。

6、在一些实施例中，所述在共享存储区中存储所述目标结构化数据，包括：

7、根据所述目标结构化数据生成目标字段对应的字段内容；

8、在所述共享存储区中关联存储所述目标字段和所述字段内容；

9、所述从所述共享存储区中获取所述目标结构化数据，包括：从所述共享存储区中获取所述目标字段对应的所述字段内容。

10、在一些实施例中，所述根据所述目标结构化数据生成目标字段对应的字段内容，包括：

11、对所述目标结构化数据进行加密，得到加密数据；

12、将所述加密数据作为目标字段对应的字段内容；

13、所述从所述共享存储区中获取所述目标结构化数据，还包括：对获取的所述字段内容进行解密，以得到所述目标结构化数据。

14、在一些实施例中，所述共享存储区包括第一存储区和第二存储区，所述在所述共享存储区中关联存储所述目标字段和所述字段内容，包括：

15、在所述第一存储区内关联存储所述目标字段和所述字段内容；

16、所述在共享存储区中存储所述目标结构化数据，还包括：

17、在所述第二存储区内存储所述目标结构化数据中的所述目标音频识别文本。

18、在一些实施例中，所述根据所述目标结构化数据在所述目标位置处显示所述目标音频识别文本，包括：

19、确定所述目标位置所在的文本编辑窗口；

20、确定所述文本编辑窗口对应的第一结构化数据存储区，并确定所述第一结构化数据存储区中所述目标位置对应的共享存储区；

21、在所述共享存储区中存储所述目标结构化数据，以更新所述第一结构化数据存储区；

22、根据更新的所述第一结构化数据存储区更新所述文本编辑窗口中的内容，以在所述目标位置处显示所述目标音频识别文本。

23、在一些实施例中，在确定所述目标位置所在的文本编辑窗口之前，还包括：

24、响应于针对第一音频识别文本的文本编辑指令，获取所述第一音频识别文本对应的第二结构化数据存储区中的全部结构化数据；

25、根据获取的所述全部结构化数据创建所述第一结构化数据存储区；

26、根据所述第一结构化数据存储区中的结构化数据，生成所述文本编辑窗口。

27、在一些实施例中，该音频文本处理方法还包括：

28、响应作用于所述文本编辑窗口的编辑结束操作，确定所述第一结构化数据存储区中当前存储的结构化数据；

29、根据所述第一结构化数据存储区中当前存储的结构化数据，通过浏览窗口显示第二音频识别文本。

30、在一些实施例中，在响应于对目标音频识别文本的第一操作之前，还包括：

31、识别出目标音频源数据对应的音频识别文本，并确定所述音频识别文本中每个文本单元对应的音频描述信息，所述音频识别文本包括至少一个文本单元，所述目标音频源数据包括所述目标音频数据，所述目标音频识别文本为其中一个所述文本单元；

32、根据每个所述文本单元和相应音频描述信息创建相应文本单元对应的结构化数据；

33、根据创建的所述结构化数据显示所述音频识别文本。

34、在一些实施例中，该音频文本处理方法还包括：

35、响应于针对所述目标音频识别文本的音频回放指令，从所述目标结构化数据中提取出所述音频描述信息；

36、获取所述音频描述信息对应的所述目标音频数据；

37、播放获取的所述目标音频数据。

38、在一些实施例中，所述音频描述信息包括音频源标识和音频起止时间，所述获取所述音频描述信息对应的所述目标音频数据，包括：

39、从已存储的音频源数据集中查找所述音频源标识对应的目标音频源数据；

40、从所述目标音频源数据中提取出所述音频起止时间对应的内容，作为所述目标音频数据。

41、在一些实施例中，该音频文本处理方法还包括：

42、响应于对所述目标音频识别文本的确定操作，显示多个功能控件，所述多个功能控件包括目标功能控件，所述目标功能控件用于指示对确定的文本进行音频回放；

43、响应于对所述目标功能控件的确定操作，生成针对所述目标音频识别文本的音频回放指令。

44、第二方面，本技术提供了一种音频文本处理装置，包括：

45、获取模块，用于响应于对目标音频识别文本的第一操作，获取所述目标音频识别文本对应的目标结构化数据，所述目标结构化数据包括所述目标音频识别文本和音频描述信息，所述音频描述信息用于获取所述目标音频识别文本对应的目标音频数据；

46、存储模块，用于在共享存储区中存储所述目标结构化数据；

47、显示模块，用于响应作用于目标位置处的第二操作，从所述共享存储区中获取所述目标结构化数据，并根据所述目标结构化数据在所述目标位置处显示所述目标音频识别文本，以根据显示的所述目标音频识别文本获取所述目标音频数据。

48、在一些实施例中，所述存储模块具体用于：

49、根据所述目标结构化数据生成目标字段对应的字段内容；

50、在所述共享存储区中关联存储所述目标字段和所述字段内容；

51、所述显示模块具体用于：从所述共享存储区中获取所述目标字段对应的所述字段内容。

52、在一些实施例中，所述存储模块具体用于：

53、对所述目标结构化数据进行加密，得到加密数据；

54、将所述加密数据作为目标字段对应的字段内容；

55、所述显示模块还用于：对获取的所述字段内容进行解密，以得到所述目标结构化数据。

56、在一些实施例中，所述共享存储区包括第一存储区和第二存储区，所述存储模块具体用于：

57、在所述第一存储区内关联存储所述目标字段和所述字段内容；

58、所述存储模块还用于：在所述第二存储区内存储所述目标结构化数据中的所述目标音频识别文本。

59、在一些实施例中，所述显示模块具体用于：

60、确定所述目标位置所在的文本编辑窗口；

61、确定所述文本编辑窗口对应的第一结构化数据存储区，并确定所述第一结构化数据存储区中所述目标位置对应的共享存储区；

62、在所述共享存储区中存储所述目标结构化数据，以更新所述第一结构化数据存储区；

63、根据更新的所述第一结构化数据存储区更新所述文本编辑窗口中的内容，以在所述目标位置处显示所述目标音频识别文本。

64、在一些实施例中，在确定所述目标位置所在的文本编辑窗口之前，所述显示模块还用于：

65、响应于针对第一音频识别文本的文本编辑指令，获取所述第一音频识别文本对应的第二结构化数据存储区中的全部结构化数据；

66、根据获取的所述全部结构化数据创建所述第一结构化数据存储区；

67、根据所述第一结构化数据存储区中的结构化数据，生成所述文本编辑窗口。

68、在一些实施例中，所述显示模块还用于：

69、响应作用于所述文本编辑窗口的编辑结束操作，确定所述第一结构化数据存储区中当前存储的结构化数据；

70、根据所述第一结构化数据存储区中当前存储的结构化数据，通过浏览窗口显示第二音频识别文本。

71、在一些实施例中，在响应于对目标音频识别文本的第一操作之前，所述获取模块还用于：

72、识别出目标音频源数据对应的音频识别文本，并确定所述音频识别文本中每个文本单元对应的音频描述信息，所述音频识别文本包括至少一个文本单元，所述目标音频源数据包括所述目标音频数据，所述目标音频识别文本为其中一个所述文本单元；

73、根据每个所述文本单元和相应音频描述信息创建相应文本单元对应的结构化数据；

74、根据创建的所述结构化数据显示所述音频识别文本。

75、在一些实施例中，所述音频文本处理装置还包括播放模块，用于：

76、响应于针对所述目标音频识别文本的音频回放指令，从所述目标结构化数据中提取出所述音频描述信息；

77、获取所述音频描述信息对应的所述目标音频数据；

78、播放获取的所述目标音频数据。

79、在一些实施例中，所述音频描述信息包括音频源标识和音频起止时间，所述播放模块具体用于：

80、从已存储的音频源数据集中查找所述音频源标识对应的目标音频源数据；

81、从所述目标音频源数据中提取出所述音频起止时间对应的内容，作为所述目标音频数据。

82、在一些实施例中，所述播放模块还用于：

83、响应于对所述目标音频识别文本的确定操作，显示多个功能控件，所述多个功能控件包括目标功能控件，所述目标功能控件用于指示对确定的文本进行音频回放；

84、响应于对所述目标功能控件的确定操作，生成针对所述目标音频识别文本的音频回放指令。

85、第三方面，本技术提供了一种非暂态计算机可读存储介质，其上存储有计算机程序，其特征在于，该计算机程序被处理器执行时实现上述任一项所述的音频文本处理方法。

86、第四方面，本技术提供了一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现上述任一项所述的音频文本处理方法。

87、第五方面，本技术提供了一种计算机程序产品，包括计算机程序，其特征在于，所述计算机程序被处理器执行时实现上述任一项所述的音频文本处理方法。

88、本技术实施例提供的音频文本处理方法、装置、计算机程序、存储介质及电子设备，通过响应于对目标音频识别文本的第一操作，获取目标音频识别文本对应的目标结构化数据，所述目标结构化数据包括目标音频识别文本和音频描述信息，所述音频描述信息用于获取目标音频识别文本对应的目标音频数据；在共享存储区中存储目标结构化数据；响应作用于目标位置处的第二操作，从共享存储区中获取目标结构化数据，并根据所述目标结构化数据在目标位置处显示目标音频识别文本，从而能使复制粘贴的音频文本带有音频描述信息，进而使复制粘贴的音频文本具备音频回放功能，丰富了文本展现功能，用户体验感好。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王玮周腾飞周旸旻李全程旭
技术所有人：安徽听见科技有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。