确定音频的方法、计算机存储介质和电子设备与流程

文档序号：31837215发布日期：2022-10-18 21:40阅读：56来源：国知局

1.本发明涉及智能技术领域，尤其涉及一种确定音频的方法、计算机存储介质和电子设备。

背景技术：

2.随着生活水平的提高和科技的发展，通过语音指令指示智能终端播放音频的功能，在智能终端中越来越普遍。
3.在将语音指令与播放列表的内容匹配，以指定播放音频的过程中，通常，将语音指令解析为中文信息后，将解析得到的中文信息与播放列表进行比对。
4.然而，一方面，在将语音指令解析为中文的过程中，由于需要较大的数据库，以对各种非常用中文的汉字字符也进行存储，因此，需要存储的数据量大，导致大量占用了终端的存储资源。现有技术中提出了一种方法以解决上述问题，该方法通过将该数据库单独存储在云端或者专用服务器上，同时，通过终端与所述云端或专用服务器之间的通信，使终端发送语音指令，并自云端或专用服务器获取到解析后的中文信息，然而，所述方法仅通过终端本地无法实现语音指令在播放列表中指定音频，因此，当终端处于信号较差的位置时，难以流畅的发送语音指令和接收中文信息，导致不能将中文信息与播放列表进行匹配、或是匹配不流畅，造成了用户的使用体验差。另一方面，由于在将语音指令解析为中文的过程中，对语音指令中的发音要求较高，导致语音指令中的语调、发音与标准语调和发音有区别时容易解析错误，使得与播放列表间容易出现无法匹配的情况，也造成了用户的使用体验差。

技术实现要素：

5.本发明解决的技术问题是提供一种确定音频的方法、计算机存储介质和电子设备，以在存储较少数据的同时，实现终端在本地通过语音指令确定播放列表中的音频的功能，并且，实现确定音频的过程中降低语音指令与音频无法匹配的风险，使得用户体验得到提高。
6.为解决上述技术问题，本发明的技术方案提供一种确定音频的方法，包括以下步骤：获取播放列表，所述播放列表包括与若干音频对应的音频信息，所述音频信息包括音频名称、歌手姓名和专辑名称中的至少一者；获取确定音频的语音指令；识别所述语音指令中的对象关键词，所述对象关键词用于确定所述音频信息；将所述对象关键词解析为相应的对象关键词字母；根据对象关键词字母对所述音频信息进行检索，获取检索结果；在所述若干音频中，根据所述检索结果确定相应的音频。
7.相应的，本发明的技术方案还提供一种计算机存储介质，存储有包括程序指令的计算机程序，所述程序指令被处理器执行时，执行如上所述的确定音频的方法的步骤。
8.相应的，本发明的技术方案还提供一种电子设备，包括处理器、存储器、通信接口、一个或多个程序，所述通信接口用于获取如上所述的播放列表，所述一个或多个程序被存
储在所述存储器中，并且被配置由所述处理器执行，所述程序包括用于执行如上所述的方法中的步骤的指令。
9.与现有技术相比，本发明实施例的技术方案具有以下有益效果：
10.本发明的技术方案提供的确定音频的方法中，由于将语音指令中的对象关键词解析为相应的对象关键词字母，因此，用于解析对象关键词的数据库中无需存储中文，从而，用于解析对象关键词的数据库需要存储的数据较少、所述数据库对存储资源占用少。在此基础上，由于在获取播放列表后，根据对象关键词字母对所述音频信息进行检索，获取检索结果。因此，一方面，能够实现终端在本地通过语音指令确定播放列表中的音频的功能，从而，通过语音指令确定音频的过程不受终端通信信号影响、流畅度高，进而提高了用户体验；另一方面，相比于根据中文的对象关键词进行检索和匹配的方式，通过对象关键词字母进行的检索扩大了检索结果的范围，从而，降低了确定音频的过程中，由于发音问题导致的无法匹配的风险，进而提高了用户体验。综上，所述确定音频的方法，不仅在存储较少数据的同时，实现终端在本地通过语音指令确定播放列表中的音频的功能，并且，还降低了确定音频的过程中，语音指令与音频无法匹配的风险，从而，提高了用户体验。
附图说明
11.图1是本发明一实施例的确定音频的方法的流程示意图；
12.图2为图1中步骤s100的流程示意图；
13.图3为图1中步骤s500的流程示意图；
14.图4为图3中步骤s510的流程示意图；
15.图5为图1中步骤s600的流程示意图；
16.图6为图5中步骤s610的流程示意图。
具体实施方式
17.如背景技术所述，一方面，在将语音指令解析为中文的过程中，由于需要较大的数据库，以对各种非常用中文的汉字字符也进行存储，因此，需要存储的数据量大，导致大量占用了终端的存储资源。现有技术中提出了一种方法以解决上述问题，该方法通过将该数据库单独存储在云端或者专用服务器上，同时，通过终端与所述云端或专用服务器之间的通信，使终端发送语音指令，并自云端或专用服务器获取到解析后的中文信息，然而，所述方法仅通过终端本地无法实现语音指令在播放列表中指定音频，因此，当终端处于信号较差的位置时，难以流畅的发送语音指令和接收中文信息，导致不能将中文信息与播放列表进行匹配、或是匹配不流畅，造成了用户的使用体验差。另一方面，由于在将语音指令解析为中文的过程中，对语音指令中的发音要求较高，导致语音指令中的语调、发音与标准语调和发音有区别时容易解析错误，使得与播放列表间容易出现无法匹配的情况，也造成了用户的使用体验差。
18.为了解决所述技术问题，本发明实施例提供一种确定音频的方法、计算机存储介质和电子设备，其中，由于在所述确定音频的方法中，将语音指令中的对象关键词直接解析为相应的对象关键词字母，根据对象关键词字母对所述音频信息进行检索，获取检索结果，并且，根据所述检索结果确定相应的音频。因此，不仅需要存储的数据更少，同时，在确定音
频的过程中降低了语音指令与音频无法匹配的风险，从而，用户体验得到提高。
19.为使本发明的上述目的、特征和有益效果能够更为明显易懂，下面结合附图对本发明的具体实施例做详细的说明。
20.图1是本发明一实施例的确定音频的方法的流程示意图。
21.请参考图1，所述确定音频的方法包括：
22.步骤s100，获取播放列表，所述播放列表包括与若干音频对应的音频信息，所述音频信息包括音频名称、歌手姓名和专辑名称中的至少一者；
23.步骤s200，获取确定音频的语音指令；
24.步骤s300，识别所述语音指令中的对象关键词，所述对象关键词用于确定所述音频信息；
25.步骤s400，将所述对象关键词解析为相应的对象关键词字母；
26.步骤s500，根据对象关键词字母对所述音频信息进行检索，获取检索结果；
27.步骤s600，在所述若干音频中，根据所述检索结果确定相应的音频。
28.由于将语音指令中的对象关键词解析为相应的对象关键词字母，因此，用于解析对象关键词的数据库中无需存储中文，从而，用于解析对象关键词的数据库需要存储的数据较少、所述数据库对存储资源占用少。
29.在此基础上，由于在获取播放列表后，根据对象关键词字母对所述音频信息进行检索，获取检索结果。因此，一方面，能够实现终端在本地通过语音指令确定播放列表中的音频的功能，从而，通过语音指令确定音频的过程不受终端通信信号影响、流畅度高，进而提高了用户体验。另一方面，相比于根据包含中文的对象关键词进行检索和匹配的方式，通过对象关键词字母进行的检索扩大了检索结果的范围，从而，降低了确定音频的过程中，由于发音问题导致的无法匹配的风险，进而提高了用户体验。
30.综上，所述确定音频的方法，不仅在存储较少数据的同时，实现终端在本地通过语音指令确定播放列表中的音频的功能，并且，还降低了确定音频的过程中，语音指令与音频无法匹配的风险，从而，提高了用户体验。
31.在本实施例中，所述获取确定音频的语音指令之后，所述确定音频的方法还包括：获取所述语音指令中的动作关键词。所述动作关键词用于确定相应的音频时的方式。例如，当获取动作关键词“听”时，则对所述相应的音频进行播放。当获取动作关键词“显示”时，则对相应的音频所对应的音频信息显示。
32.具体而言，在获取所述语音指令后，对所述语音指令进行语义识别，识别出语音指令中的对象关键词和动作关键词。
33.在另一个实施例中，不获取语音指令中的动作关键词。因此，降低了语义识别的难度，减少了用于进行语义识别的数据库所需要存储的数据，进一步减少了对存储资源的占用。在该实施例中，确定相应的音频时的方式是预设的，例如，直接对步骤s600中所确定的相应的音频进行播放。
34.在本实施例中，将所述对象关键词解析为对象关键词字母是指：将语音的对象关键词中的英语单词或字母解析为字母，将语音的对象关键词中的中文解析为与该中文的拼音对应的字母。
35.在一个场景下，语音指令为“我要听王力宏的歌”，其中，“王力宏”为对象关键词，
解析获得的对象关键词字母为“wanglihong”。
36.在另一个场景下，语音指令为“我要听love story”，其中，“love story”为对象关键词，解析获得的对象关键词字母为“lovestory”。
37.在又一个场景下，语音指令为“我要听李ab的歌”，其中，“李ab”为对象关键词，解析获得的对象关键词字母为“liab”。
38.请参考图2，图2为图1中步骤s100的流程示意图，所述获取播放列表的步骤包括：
39.步骤s110，与外部终端或外部u盘中的至少一者建立连接，其中，与外部u盘建立的连接为有线连接，与外部终端建立的连接包括有线连接或无线连接中的至少一种；
40.步骤s120，当建立有线连接时，读取所述外部终端或外部u盘中的播放列表；
41.步骤s130，当建立无线连接时，确认是否支持读取外部终端、外部终端的音频播放应用中的播放列表；
42.步骤s140，在确认支持读取后，获取来自外部终端的播放列表。
43.所述外部终端包括手机、平板电脑、电脑等电子设备。
44.在一个场景中，外部终端为外部u盘，用户使车载终端与外部u盘建立有线连接，此时，车载终端遍历整个外部u盘的盘符，获取外部u盘中的播放列表。
45.在另一个场景中，外部终端为手机，用户使车载终端与手机基于avrcp(audio video remote cortrol profile)协议建立蓝牙连接。用户使车载终端与手机的蓝牙连接，此时，根据手机反馈的信息(supports browsing)，确认手机是否支持车载终端的读取。当手机支持车载终端的读取时，通过用户在手机上打开音频播放应用，直接调用获得支持功能(get supported feature)接口，以确认音频播放应用是否支持车载终端的读取。当音频播放应用支持车载终端的读取时，确认支持车载终端对音频播放应用的播放列表的读取，接着，车载终端获取来自手机的播放列表。
46.请参考图3，图3为图1中步骤s500的流程示意图，所述根据对象关键词字母对所述音频信息进行检索，获取检索结果的步骤包括：
47.步骤s510，根据所述音频信息获取音频信息字母；
48.步骤s520，比较所述音频信息字母和所述对象关键词字母，获取检索结果，其中，所述检索结果为包含了所述对象关键词字母的音频信息字母所对应的音频信息。
49.请参考图4，图4为图3中步骤s510的流程示意图，所述根据所述音频信息获取音频信息字母的步骤包括：
50.步骤s511，当所述音频信息为字母时，所述音频信息字母等于所述音频信息；
51.步骤s512，当所述音频信息包括中文时，将所述中文解析为拼音，获取所述音频信息对应的音频信息字母。
52.具体而言，音频信息为音频名称“ab”时，相应的，音频信息字母为“ab”。音频信息为音频名称“三千里”时，则将“三千里”解析为拼音，获取与该音频名称对应的音频信息字母“sanqianli”。音频信息为专辑名称“花duo”时，则将“花”解析为拼音，获取与该专辑名称对应的音频信息字母“huaduo”。
53.在一个场景中，车机与手机建立无线连接，并获取播放列表a。当所述车机获取播放列表a后，向用户语音提示已获取播放列表a。接着，用户向所述车机下达语音指令“我要听王力的歌”。在该场景中，语音指令中的对象关键词为“王力”。相应的，对象关键词字母为“wangli”。播放列表a包括歌手姓名“王力”、歌手姓名“汪林”、歌手姓名“王li”、音频名称“wangli”、专辑名称“谁是亡灵”、歌手姓名“周杰伦”等音频信息。相应的，与“王力”对应的音频信息字母为“wangli”，与“汪林”对应的音频信息字母为“wanglin”，与“王li”对应的音频信息字母为“wangli”，与“wangli”对应的音频信息字母为“wangli”，为“谁是亡灵”对应的音频信息字母为“sheishiwangling”，与“周杰伦”对应的音频信息字母为“zhoujielun”。其中，歌手姓名“王力”、歌手姓名“汪林”、歌手姓名“王li”、音频名称“wangli”、专辑名称“谁是亡灵”各自所对应的对象关键词字母均包含所述对象关键词字母“wangli”，因此，通过将对象关键词字母“wangli”，与播放列表a中的音频信息对应的各音频信息字母进行比较后，所获取的检索结果包括：歌手姓名“王力”、歌手姓名“汪林”、歌手姓名“王li”、音频名称“wangli”、专辑名称“谁是亡灵”。
54.在另一个场景中，车载终端与u盘建立有线连接，并显示获取的整个播放列表b。接着，用户向所述车载终端下达语音指令“显示歌名是尘埃的歌”。相应的，识别出的对象关键词为“尘埃”，解析获得的对象关键词字母为“chenai”。在该场景中，播放列表b包括音频名称“再见尘埃”、音频名称“尘埃的最后”、音频名称“chenai”、音频名称“陈gai”、歌手姓名“陈爱”、歌手姓名“蔡徐坤”等音频信息。相应的，“再见尘埃”对应的音频信息字母为“zaijianchenai”、“尘埃的最后”对应的音频信息字母为“chenaidezuihou”，“chenai”对应的音频信息字母为“chenai”，“陈gai”对应的音频信息字母为“chengai”，“陈爱”对应的音频信息字母为“chenai”、“蔡徐坤”对应的音频信息字母为“caixukun”。
55.在该场景中，根据语义识别的内容还能够确定对象关键词对应的音频信息类型。相应的，在该场景中比较所述音频信息字母和所述对象关键词字母，获取检索结果的方法为：根据对象关键词对应的音频信息类型，比较对象关键词字母和音频信息字母，获取检索结果。从而，提高了检索结果的准确性。
56.具体的，在该场景中，对语音指令“显示歌名是尘埃的歌”进行语义识别后，识别出对象关键词“尘埃”是一首“歌”，从而，根据识别出的“歌”，确定对象关键词“尘埃”对应的音频信息类型为音频名称。由此，将对象关键词字母“chenai”分别与音频名称“再见尘埃”所对应的音频信息字母“zaijianchenai”、音频名称“尘埃的最后”所对应的音频信息字母“chenaidezuihou”、音频名称“chenai”对应的音频信息字母“chenai”、音频名称“陈gai”对应的音频信息字母“chengai”进行比较，获取检索结果。其中，音频信息字母“zaijianchenai”、音频信息字母“chenaidezuihou”、音频信息字母“chenai”包含了对象关键词字母“chenai”。因此，获取的检索结果包括音频名称“再见尘埃”、音频名称“尘埃的最后”和音频名称“chenai”。
57.在另一个实施例中，步骤s520，比较所述音频信息字母和所述对象关键词字母，获取检索结果，其中，所述检索结果为包含了所述对象关键词字母的音频信息字母所对应的音频信息，且对象关键词字母位于该音频信息字母的起始。从而，降低了实现步骤s520中，音频信息字母和对象关键词字母的比较程序的复杂度和难度。在一个场景中，对象关键词为“一”，相应的，对象关键词字母为“yi”。播放列表中包括音频名称“一二”和音频名称“而已”，相应的，音频名称“一二”所对应的音频信息字母为“yier”，音频名称“而已”所对应的音频信息字母为“eryi”。在该场景中，将对象关键词字母为“yi”分别与音频信息字母为“yier”、音频信息字母为“eryi”比较，获取检索结果，所述检索结果为音频名称“一二”。
58.在一个其他实施例中，所述在所述若干音频中，根据所述检索结果确定相应的音频的方法包括：显示所述检索结果。
59.在一个场景中，检索结果包括：音频名称“龙的传人”、专辑名称“龙龙龙”和歌手“龙”，相应的，车载终端显示：音频名称“龙的传人”、专辑名称“龙龙龙”和歌手“龙”。
60.进一步的，显示所述检索结果的方法包括：显示检索结果中的音频信息、以及与检索结果中的音频信息相关联的音频信息。其中，与检索结果中的音频信息相关联的音频信息为：与检索结果中的音频信息对应了至少部分相同音频的音频信息。
61.在一个场景中，对象关键词为“龙”。播放列表包括：音频名称“龙一”、音频名称“龙的传人”、专辑名称“龙龙龙”、歌手姓名“龙”、歌手姓名“王一”和音频名称“三三”等音频信息。其中，专辑名称“龙龙龙”对应的音频包括了音频名称“三三”所对应的音频，音频名称“龙一”与歌手姓名“王一”对应同样的音频。在该场景中，检索结果包括：音频名称“龙一”、音频名称“龙的传人”、专辑名称“龙龙龙”和歌手“龙”。此时，音频名称“三三”是与专辑名称“龙龙龙”关联的音频信息，歌手姓名“王一”是与音频名称“龙一”关联的音频信息。相应的，显示检索结果的方法为：显示音频名称“龙一”、音频名称“龙的传人”、专辑名称“龙龙龙”、歌手“龙”、音频名称“三三”和歌手姓名“王一”。
62.在另一个其他实施例中，所述在所述若干音频中，根据所述检索结果确定相应的音频的方法包括：播放所述检索结果对应的音频。
63.在一个场景中，检索结果包括：音频名称“龙的传人”、专辑名称“龙龙龙”和歌手“龙”，相应的，车机播放音频名称“龙的传人”对应的音频、专辑名称“龙龙龙”对应的音频、歌手“龙”对应的音频。
64.请参考图5，图5为图1中步骤s600的流程示意图，所述在所述若干音频中，根据所述检索结果确定相应的音频的步骤包括：
65.步骤s610，根据所述对象关键词字母，在所述检索结果中获取匹配结果；
66.步骤s620，突出显示所述匹配结果。
67.通过突出显示所述匹配结果，使用户更易看到匹配结果，提升了用户的使用体验。
68.具体而言，可以通过高亮、放大字体等方式实现对匹配结果的突出显示。
69.在其他实施例中，在获取匹配结果后，还可以单独显示匹配结果。
70.请参考图6，图6为图5中步骤s610的流程示意图，所述根据对象关键词字母，在所述检索结果中获取匹配结果的步骤包括：
71.步骤s611，将所述对象关键词字母和检索结果中的每个音频名称、歌手姓名和专辑名称，转换为预设字符编码对应的对象关键词数据、音频名称数据、歌手姓名数据和专辑名称数据；
72.步骤s612，根据所述预设字符编码中对于中文和字母的区分规则，将对象关键词数据分别与每个音频名称数据、每个歌手姓名数据和每个专辑名称数据逐字比对，获取所述匹配结果。
73.为了便于理解，以下以预设字符编码为utf-8字符集，比较对象关键词数据和1个歌手姓名数据的情况为例进行说明。
74.在一个实施例中，所述预设字符编码为utf-8字符集。首先，将对象关键词字母转换为utf-8字符集对应的对象关键词数据a1，将1个音频名称转换为utf-8字符集对应的歌
手姓名数据b1，并且，将对象关键词数据a1和歌手姓名数据b1统一转换为大写或小写，获取相应的对象关键词数据a2和歌手姓名数据b2。
75.接着，对象关键词数据a2和歌手姓名数据b2进行若干次循环比较流程，直至完成对象关键词数据a2中最后一位字节的数据的比较。
76.第n次所述循环比较流程包括：比较对象关键词数据a2的第一个字节和歌手姓名数据b2的第一个字节的数据；根据utf-8字符集的规则，当歌手姓名数据b2的第一个字节的数据与对象关键词数据a2的第一个字节的数据相同时，歌手姓名数据b2的第一个字节的数据代表字母，此时，将歌手姓名数据b2的第一个字节的数据转换为字母并存储；当第n次循环比较流程中存储的是字母时，自对象关键词数据a2的第一个字节起去除一个字节的数据，形成第n+1次循环比较流程中的对象关键词数据a2，并且，自歌手姓名数据b2的第一个字节起去除一个字节的数据，形成第n+1次循环比较流程中的歌手姓名数据b2；根据utf-8字符集的规则，当歌手姓名数据b2的第一个字节的数据与对象关键词数据a2的第一个字节的数据不同时，歌手姓名数据b2的前三个字节的数据代表中文，此时，将歌手姓名数据b2的前三个字节的数据转换为中文并存储；当第n次所述循环比较流程中存储的是中文时，自对象关键词数据a2的第一个字节起去除三个字节的数据，形成第n+1次循环比较流程中的对象关键词数据a2，并且，自歌手姓名数据b2的第一个字节起去除三个字节的数据，形成第n+1次循环比较流程中的歌手姓名数据b2。所述n为大于1的自然数。
77.在一个场景中，对象关键词是“王力”，对象关键词字母是“wangli”，检索结果包括：歌手姓名“王力宏”。此时，所述循环比较流程的次数为2次。第1次循环比较流程存储中文“王”，第二次循环比较流程存储中文“力”。接着，通过所述中文“王”和“力”，在歌手姓名“王力宏”中，获取匹配结果“王力”。
78.在本实施例中，所述匹配结果包括精确匹配结果和模糊匹配结果中的至少一者，所述精确匹配结果转换的精确匹配结果字母等于所述对象关键词字母，所述模糊匹配结果转换的模糊匹配结果字母包含了所述对象关键词字母。
79.在一个场景中，对象关键词是“王力”，对象关键词字母是“wangli”，检索结果包括：歌手姓名“王力宏”、歌手姓名“王li宏”、歌手姓名“汪林林”、音频名称“wangling”。此时，匹配结果包括：歌手姓名“王力宏”中的“王力”、歌手姓名“王li宏”中的“王li”、歌手姓名“汪林林”中的“汪林”、音频名称“wanglin”中的“wangli”。其中，歌手姓名“王力宏”中的“王力”、歌手姓名“王li宏”中的“王li”、音频名称“wangling”中的“wangli”为精确匹配结果，相应的，“王力”、“王li”、“wangli”转换的精确匹配结果字母均为“wangli”，该精确匹配结果字母“wangli”等于对象关键词字母“wangli”。同时，歌手姓名“汪林林”中的“汪林”为模糊匹配结果，相应的，“汪林”转换的模糊匹配结果字母为“wanglin”，该模糊匹配结果字母“wanglin”包含了对象关键词字母“wangli”。
80.相应的，本发明一实施例还提供一种计算机存储介质，存储有包括程序指令的计算机程序，所述程序指令被处理器执行时，执行如上所述的确定音频的方法的步骤。
81.相应的，本发明一实施例还提供一种电子设备，包括处理器、存储器、通信接口、一个或多个程序，所述通信接口用于获取如上所述的播放列表，所述一个或多个程序被存储在所述存储器中，并且被配置由所述处理器执行，所述程序包括用于执行如上所述的方法中的步骤的指令。
82.虽然本发明披露如上，但本发明并非限定于此。任何本领域技术人员，在不脱离本发明的精神和范围内，均可作各种更动与修改，因此本发明的保护范围应当以权利要求所限定的范围为准。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李佳霖
技术所有人：博泰车联网科技（上海）股份有限公司
我是此专利的发明人

上一篇：一种金属窄带电镀用带有绝缘防护效果的龙骨支架的制作方法
上一篇：一种钢管内外防腐喷涂机的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。