一种亲子幼教用音频生成与处理方法与装置与流程

文档序号：11178734阅读：1063来源：国知局

本发明涉及幼教领域，更具体地，特别是指一种亲子用幼教音频生成与处理方法与装置。

背景技术：

由于工作繁忙、缺乏时间陪伴孩子，有父母选择使用非接触方式与孩子进行亲情互动，如录音给孩子讲故事、进行幼儿教育等。然而，现有技术中的幼教软件不提供可选择的故事，需要父母亲自花时间选择；不提供快速定位录制的文本内容与其音轨的实际位置快速匹配的功能，录音不便且修改困难；同时也不具备针对特定文本录音的一键美化功能，不方便后期剪辑处理。

针对现有技术中的幼教软件不提供可选故事、录音不便且修改困难、不方便后期剪辑处理等问题，目前尚未有有效的解决方案。

技术实现要素：

有鉴于此，本发明实施例的目的在于提出一种亲子用幼教音频生成与处理方法与装置，能够针对不同用户或不同类型的用户进行亲子用幼教音频生成与处理，方便父母选择故事、录制与修改音频、以及后期剪辑处理，允许父母在工作繁忙时不影响孩子的亲情互动。

基于上述目的，本发明实施例的一方面提供了一种亲子用幼教音频生成与处理方法，应用于终端，包括以下步骤：

为用户推荐故事文本、或由用户提供所述故事文本；

引导父母分段朗读所述故事文本，并录制为音频剪辑；

分段编辑所述音频剪辑，生成可收听的音频文件。

在一些实施方式中，为用户推荐所述故事文本包括：

从用户处采集用户信息；

对所述用户信息进行分析，产生用户的标签分类；

查找具有所述标签分类的所述故事文本，并推荐给用户。

在一些实施方式中，所述从用户处采集用户信息指的是在终端对用户进行测试以采集用户信息；查找具有所述标签分类的所述故事文本指的是预先获取故事文本集合、为故事文本集合中的每个故事文本生成标签分类、根据用户的标签分类与故事文本的标签分类的对应关系确定查找所述故事文本。

在一些实施方式中，引导父母分段朗读所述故事文本，并录制为音频剪辑包括：

将所述故事文本分段；

引导父母朗读所述故事文本，并在每朗读一段后手动添加剪辑标识；

将所述剪辑标识添加的时间点记载入录制的音频剪辑中。

在一些实施方式中，将所述故事文本分段指的是将所述故事文本按照预先设定的方式分段；引导父母在每朗读一段后手动添加剪辑标识指的是以指定的方式手动添加剪辑标识。

在一些实施方式中，每段所述故事文本对应两个所述剪辑标识之间的一音轨片段；当父母录制错误时，引导父母删除与出错的所述故事文本对应的所述音轨片段，并重新录制所述音轨片段；当父母录制中断时，引导父母从最后一个所述剪辑标识对应的下一个所述故事文本开始恢复录制。

在一些实施方式中，调整音轨片段时，选定对应段的故事文本；选定一段故事文本时，反向标记对应的音轨片段；当所述音轨片段与对应的所述故事文本之间存在误差时，引导父母手动微调所述剪辑标识，并记载所述剪辑标识调整后的时间点。

在一些实施方式中，分段编辑所述音频剪辑包括：

分别调节每个音轨片段的音量；

为一个或多个所述音轨片段添加背景音乐；

为一个或多个所述音轨片段添加音效；

降低每个所述音轨片段的噪声；

其中，所述编辑为用户手动编辑或终端自动编辑。

本发明实施例的另一方面，还提供了一种亲子用幼教音频生成与处理装置，使用了上述方法。

本发明实施例的另一方面，还提供了一种计算机设备，包括存储器、至少一个处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述程序时执行上述的方法。

本发明具有以下有益技术效果：本发明实施例提供的亲子用幼教音频生成与处理方法与装置，通过推荐故事文本、引导父母分段朗读所述故事文本并录制为音频剪辑、分段编辑生成可收听的音频文件的技术方案，方便父母选择故事、录制与修改音频、以及后期剪辑处理，允许父母在工作繁忙时不影响孩子的亲情互动。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明提供的亲子用幼教音频生成与处理方法的第一个实施例的流程示意图；

图2为本发明提供的执行所述亲子用幼教音频生成与处理方法的计算机设备的一个实施例的硬件结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白，以下结合具体实施例，并参照附图，对本发明实施例进一步详细说明。

需要说明的是，本发明实施例中所有使用“第一”和“第二”的表述均是为了区分两个相同名称非相同的实体或者非相同的参量，可见“第一”和“第二”仅为了表述的方便，不应理解为对本发明实施例的限定，后续实施例对此不再一一说明。

基于上述目的，本发明实施例的第一个方面，提出了一种能够针对不同用户或不同类型的用户进行亲子用幼教音频生成与处理的亲子用幼教音频生成与处理方法的第一个实施例。图1示出的是本发明提供的亲子用幼教音频生成与处理方法的第一个实施例的流程示意图。

亲子用幼教音频生成与处理方法，可选地，应用于终端，包括以下步骤：

步骤s101，为用户推荐故事文本、或由用户提供故事文本；

步骤s103，引导父母分段朗读故事文本，并录制为音频剪辑；

步骤s105，分段编辑音频剪辑，生成可收听的音频文件。

其中，可选地，终端向用户推荐故事文本的同时，也允许用户自行提供满足用户自身需求的故事文本。在本发明实施例中，接受或提供故事文本的、以及编辑音频剪辑的可以是父母，也可以是其他用户，如保姆等。但朗读录制故事文本的用户必须是父母本人朗读。若由其他人代为朗读录制，则幼儿听不到亲生父母的声音，失去亲情互动的效果；另一方面，若允许他人代为朗读录制，则可以直接面对幼儿朗读，不需要使用本发明实施例所述的录制方案。

在一些可选实施方式中，为用户推荐故事文本包括：

从用户处采集用户信息；

对用户信息进行分析，产生用户的标签分类；

查找具有标签分类的故事文本，并推荐给用户。

其中，可选地，终端用户(例如父母本人或其他用户)提供用户信息用于推荐故事。通过简单的问答类测试生成用户的标签分类，并推荐与标签分类相关的故事。这使得推荐的故事更适宜、更具有针对性。

在一些可选实施方式中，从用户处采集用户信息指的是在终端对用户进行测试以采集用户信息；查找具有标签分类的故事文本指的是预先获取故事文本集合、为故事文本集合中的每个故事文本生成标签分类、根据用户的标签分类与故事文本的标签分类的对应关系确定查找故事文本。

其中，可选地，用户信息可以包括幼儿的年龄、性别、父母的文化程度等，基于上述信息可以更准确地定位标签分类，以及对应的故事文本。

在一些可选实施方式中，引导父母分段朗读故事文本，并录制为音频剪辑包括：

将故事文本分段；

引导父母朗读故事文本，并在每朗读一段后手动添加剪辑标识；

将剪辑标识添加的时间点记载入录制的音频剪辑中。

其中，可选地，分段允许父母更方便的朗读与录制音频。考虑到父母可能工作繁忙，缺乏一次性录制大量内容的时间，分段允许父母利用零碎时间进行朗读与录制工作；另一方面，考虑到需要与文字内容相匹配，分段也便于播放与编辑。

在一些可选实施方式中，将故事文本分段指的是将故事文本按照预先设定的方式分段；引导父母在每朗读一段后手动添加剪辑标识指的是以指定的方式手动添加剪辑标识。

其中，可选地，故事分段可以按照自然的段落或句子分段。对于特殊的长句或短剧，也可以进行段落内或句子内分段，或进行段落间或句子间合并。父母每朗读一段后，可以点击屏幕上的“下一段”按钮，或者以其他任何终端能感知的方式添加剪辑标识。

在一些可选实施方式中，每段故事文本对应两个剪辑标识之间的一音轨片段；当父母录制错误时，引导父母删除与出错的故事文本对应的音轨片段，并重新录制该音轨片段；当父母录制中断时，引导父母从最后一个剪辑标识对应的下一个故事文本开始恢复录制。

其中，可选地，有效地设置剪辑标识允许父母利用零碎时间进行朗读与录制工作。

在一些可选实施方式中，调整音轨片段时，选定对应段的故事文本；选定一段故事文本时，反向标记对应的音轨片段；当音轨片段与对应的故事文本之间存在误差时，引导父母手动微调剪辑标识，并记载剪辑标识调整后的时间点。

其中，可选地，用户可以方便地根据音轨片段与每段故事文本的对应关系相互切换选择，提高用户使用的便利性。

在一些可选实施方式中，分段编辑音频剪辑包括：

分别调节每个音轨片段的音量；

为一个或多个音轨片段添加背景音乐；

为一个或多个音轨片段添加音效；

降低每个音轨片段的噪声；

其中，编辑为用户手动编辑或终端自动编辑。

其中，可选地，对于追求编辑效果的终端用户(例如父母本人或其他用户)，可以选择手动编辑方式分别编辑每个音轨片段；对于缺乏时间或编辑能力的终端用户，可以选择自动编辑方式，由终端套用固定方法编辑音频剪辑。

从上述实施例可以看出，本发明实施例提供的亲子用幼教音频生成与处理方法，通过推荐故事文本、引导父母分段朗读故事文本并录制为音频剪辑、分段编辑生成可收听的音频文件的技术方案，方便父母选择故事、录制与修改音频、以及后期剪辑处理，允许父母在工作繁忙时不影响孩子的亲情互动。

本发明实施例还提出了一种能够针对不同用户或不同类型的用户进行亲子用幼教音频生成与处理的亲子用幼教音频生成与处理方法的第二个实施例。

所述亲子用幼教音频生成与处理方法，可选地，应用于终端，包括：

步骤s101，为用户推荐故事文本、或由用户提供故事文本。

用户登陆终端后，平台随即在后台数据库建立用户资料表单，通过询问用户一系列问题(即对用户进行测试)对用户的特征进行分析并初步为用户进行标签分类，方便为用户提供后续服务。平台根据用户的特征，为用户推荐适宜的内容，例如针对用户的孩子的年龄以及性别推荐相应的故事或者消息等。平台根据一定的标准对平台上的内容进行分类分级以及标签化处理，使得故事具有多维属性。

用户也可以选择跳过该步骤，直接提供故事文本。

步骤s103，引导父母分段朗读故事文本，并录制为音频剪辑。

用户可选择自动检测分隔或半自动设置分隔或纯手动进行分隔的方式对文档进行分隔。自动分隔时，程序按照内置规则对文字进行内容自动分隔。半自动分隔时，按照用户的规则协助用户对内容进行分隔。手动分隔时，用户手动对文档内容进行分隔。

一种自动分隔方法为，首先设置分隔间隔，分隔间距可以设置为一句至文稿所能容纳的最大句子数量(在本实施例中为300句)，分隔后文档将按照一定的方式进行分隔。分隔方式包括但不限于：利用包括回行符、文字特殊符号等方式进行分隔，分行显示(即文本按照分隔间距分隔后，分隔后的单位之间显示在不同的行上)、分页显示(即文本按照分隔间距分隔后，分隔后的单位之间显示在不同的页面上)、滚动列表。

当用户开始进行录制时，利用包括自动化、半自动化、手动方式协助用户对文件进行标记。对多媒体文件的内容进行标记，一种典型的方式是对多媒体文件的时间顺序进行标记，当文件的记录以及生成按照时间顺序排布时，则可利用上述方式标记文件的时间点，便于回溯。当文件的记录或生成并非按照时间顺序排布时，依然可以利用此方式对文件以与内容对应的方式进行标记。

完成上述步骤后，可得到一个关于文件数据的映射，该映射按照一定的映射法则生成，反映了文件分隔标记与文件数据之间的对应关系，用户可以对标记后的文件数据进行定位，利用文档分隔后形成的标记回溯对应的文件数据位置。

步骤s105，分段编辑音频剪辑，生成可收听的音频文件。

平台可以分析出文本所对应的音效。用户可以点击一键美化，程序自动配置推荐的音效与背景音乐，使得用户可以迅速获得一个经过初步编辑的音频文件，同时，用户也可以使用编辑功能再具体调整音效对应的位置。最终，输出音频文件播放给幼儿。

本发明实施例提供的亲子用幼教音频生成与处理方法帮助用户在制作多媒体文件过程中对多媒体文件的时间位置进行标记，并与相应的文本或其他提示性信息建立联系，使得用户能够在回放时快速找到所需要的音频视频等多媒体文件片段所在的时间位置，方便用户进行多媒体片段的浏览、比对、替换、删除、修饰、合成以及“一键美化”操作，大幅节约用户编辑多媒体文件时耗费的时间并提升其体验。

需要特别指出的是，上述亲子用幼教音频生成与处理方法的各个实施例中的各个步骤均可以相互交叉、替换、增加、删减，因此，这些合理的排列组合变换之于亲子用幼教音频生成与处理方法也应当属于本发明的保护范围，并且不应将本发明的保护范围局限在所述实施例之上。

基于上述目的，本发明实施例的第二个方面，提出了一种能够针对不同用户或不同类型的用户进行亲子用幼教音频生成与处理的亲子用幼教音频生成与处理装置的第一个实施例。所述亲子用幼教音频生成与处理装置使用了上述的亲子用幼教音频生成与处理方法。

本发明实施例提供的亲子用幼教音频生成与处理装置，通过推荐故事文本、引导父母分段朗读故事文本并录制为音频剪辑、分段编辑生成可收听的音频文件的技术方案，方便父母选择故事、录制与修改音频、以及后期剪辑处理，允许父母在工作繁忙时不影响孩子的亲情互动。

需要特别指出的是，上述亲子用幼教音频生成与处理装置的实施例采用了所述亲子用幼教音频生成与处理方法的实施例来具体说明各模块的工作过程，本领域技术人员能够很容易想到，将这些模块应用到所述亲子用幼教音频生成与处理方法的其他实施例中。当然，由于所述亲子用幼教音频生成与处理方法实施例中的各个步骤均可以相互交叉、替换、增加、删减，因此，这些合理的排列组合变换之于所述亲子用幼教音频生成与处理装置也应当属于本发明的保护范围，并且不应将本发明的保护范围局限在所述实施例之上。

基于上述目的，本发明实施例的第三个方面，提出了一种执行所述亲子用幼教音频生成与处理方法的计算机设备的一个实施例。

所述执行所述亲子用幼教音频生成与处理方法的计算机设备包括存储器、至少一个处理器以及存储在存储器上并可在处理器上运行的计算机程序，处理器执行程序时执行上述任意一种方法。

如图2所示，为本发明提供的执行所述亲子用幼教音频生成与处理方法的计算机设备的一个实施例的硬件结构示意图。

以如图2所示的计算机设备为例，在该计算机设备中包括一个处理器201以及一个存储器202，并还可以包括：输入装置203和输出装置204。

处理器201、存储器202、输入装置203和输出装置204可以通过总线或者其他方式连接，图2中以通过总线连接为例。

存储器202作为一种非易失性计算机可读存储介质，可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块，如本申请实施例中的所述亲子用幼教音频生成与处理方法对应的程序指令/模块。处理器201通过运行存储在存储器202中的非易失性软件程序、指令以及模块，从而执行服务器的各种功能应用以及数据处理，即实现上述方法实施例的亲子用幼教音频生成与处理方法。

存储器202可以包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需要的应用程序；存储数据区可存储根据亲子用幼教音频生成与处理装置的使用所创建的数据等。此外，存储器202可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中，存储器202可选包括相对于处理器201远程设置的存储器，这些远程存储器可以通过网络连接至本地模块。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

输入装置203可接收输入的数字或字符信息，以及产生与亲子用幼教音频生成与处理装置的用户设置以及功能控制有关的键信号输入。输出装置204可包括显示屏等显示设备。

所述一个或者多个亲子用幼教音频生成与处理方法对应的程序指令/模块存储在所述存储器202中，当被所述处理器201执行时，执行上述任意方法实施例中的亲子用幼教音频生成与处理方法。

所述执行所述亲子用幼教音频生成与处理方法的计算机设备的任何一个实施例，可以达到与之对应的前述任意方法实施例相同或者相类似的效果。

最后需要说明的是，本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，可以通过计算机程序来指令相关硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体(read-onlymemory，rom)或随机存储记忆体(randomaccessmemory，ram)等。所述计算机程序的实施例，可以达到与之对应的前述任意方法实施例相同或者相类似的效果。

此外，典型地，本发明实施例公开所述的装置、设备等可为各种电子终端设备，例如手机、个人数字助理(pda)、平板电脑(pad)、智能电视等，也可以是大型终端设备，如服务器等，因此本发明实施例公开的保护范围不应限定为某种特定类型的装置、设备。本发明实施例公开所述的客户端可以是以电子硬件、计算机软件或两者的组合形式应用于上述任意一种电子终端设备中。

此外，根据本发明实施例公开的方法还可以被实现为由cpu执行的计算机程序，该计算机程序可以存储在计算机可读存储介质中。在该计算机程序被cpu执行时，执行本发明实施例公开的方法中限定的上述功能。

此外，上述方法步骤以及系统单元也可以利用控制器以及用于存储使得控制器实现上述步骤或单元功能的计算机程序的计算机可读存储介质实现。

此外，应该明白的是，本文所述的计算机可读存储介质(例如，存储器)可以是易失性存储器或非易失性存储器，或者可以包括易失性存储器和非易失性存储器两者。作为例子而非限制性的，非易失性存储器可以包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦写可编程rom(eeprom)或快闪存储器。易失性存储器可以包括随机存取存储器(ram)，该ram可以充当外部高速缓存存储器。作为例子而非限制性的，ram可以以多种形式获得，比如同步ram(dram)、动态ram(dram)、同步dram(sdram)、双数据速率sdram(ddrsdram)、增强sdram(esdram)、同步链路dram(sldram)以及直接rambusram(drram)。所公开的方面的存储设备意在包括但不限于这些和其它合适类型的存储器。

本领域技术人员还将明白的是，结合这里的公开所描述的各种示例性逻辑块、模块、电路和算法步骤可以被实现为电子硬件、计算机软件或两者的组合。为了清楚地说明硬件和软件的这种可互换性，已经就各种示意性组件、方块、模块、电路和步骤的功能对其进行了一般性的描述。这种功能是被实现为软件还是被实现为硬件取决于具体应用以及施加给整个系统的设计约束。本领域技术人员可以针对每种具体应用以各种方式来实现所述的功能，但是这种实现决定不应被解释为导致脱离本发明实施例公开的范围。

结合这里的公开所描述的各种示例性逻辑块、模块和电路可以利用被设计成用于执行这里所述功能的下列部件来实现或执行：通用处理器、数字信号处理器(dsp)、专用集成电路(asic)、现场可编程门阵列(fpga)或其它可编程逻辑器件、分立门或晶体管逻辑、分立的硬件组件或者这些部件的任何组合。通用处理器可以是微处理器，但是可替换地，处理器可以是任何传统处理器、控制器、微控制器或状态机。处理器也可以被实现为计算设备的组合，例如，dsp和微处理器的组合、多个微处理器、一个或多个微处理器结合dsp和/或任何其它这种配置。

结合这里的公开所描述的方法或算法的步骤可以直接包含在硬件中、由处理器执行的软件模块中或这两者的组合中。软件模块可以驻留在ram存储器、快闪存储器、rom存储器、eprom存储器、eeprom存储器、寄存器、硬盘、可移动盘、cd-rom、或本领域已知的任何其它形式的存储介质中。示例性的存储介质被耦合到处理器，使得处理器能够从该存储介质中读取信息或向该存储介质写入信息。在一个替换方案中，所述存储介质可以与处理器集成在一起。处理器和存储介质可以驻留在asic中。asic可以驻留在用户终端中。在一个替换方案中，处理器和存储介质可以作为分立组件驻留在用户终端中。

在一个或多个示例性设计中，所述功能可以在硬件、软件、固件或其任意组合中实现。如果在软件中实现，则可以将所述功能作为一个或多个指令或代码存储在计算机可读介质上或通过计算机可读介质来传送。计算机可读介质包括计算机存储介质和通信介质，该通信介质包括有助于将计算机程序从一个位置传送到另一个位置的任何介质。存储介质可以是能够被通用或专用计算机访问的任何可用介质。作为例子而非限制性的，该计算机可读介质可以包括ram、rom、eeprom、cd-rom或其它光盘存储设备、磁盘存储设备或其它磁性存储设备，或者是可以用于携带或存储形式为指令或数据结构的所需程序代码并且能够被通用或专用计算机或者通用或专用处理器访问的任何其它介质。此外，任何连接都可以适当地称为计算机可读介质。例如，如果使用同轴线缆、光纤线缆、双绞线、数字用户线路(dsl)或诸如红外线、无线电和微波的无线技术来从网站、服务器或其它远程源发送软件，则上述同轴线缆、光纤线缆、双绞线、dsl或诸如红外线、无线电和微波的无线技术均包括在介质的定义。如这里所使用的，磁盘和光盘包括压缩盘(cd)、激光盘、光盘、数字多功能盘(dvd)、软盘、蓝光盘，其中磁盘通常磁性地再现数据，而光盘利用激光光学地再现数据。上述内容的组合也应当包括在计算机可读介质的范围内。

以上是本发明公开的示例性实施例，但是应当注意，在不背离权利要求限定的本发明实施例公开的范围的前提下，可以进行多种改变和修改。根据这里描述的公开实施例的方法权利要求的功能、步骤和/或动作不需以任何特定顺序执行。此外，尽管本发明实施例公开的元素可以以个体形式描述或要求，但除非明确限制为单数，也可以理解为多个。

应当理解的是，在本文中使用的，除非上下文清楚地支持例外情况，单数形式“一个”(“a”、“an”、“the”)旨在也包括复数形式。还应当理解的是，在本文中使用的“和/或”是指包括一个或者一个以上相关联地列出的项目的任意和所有可能组合。

上述本发明实施例公开实施例序号仅仅为了描述，不代表实施例的优劣。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

所属领域的普通技术人员应当理解：以上任何实施例的讨论仅为示例性的，并非旨在暗示本发明实施例公开的范围(包括权利要求)被限于这些例子；在本发明实施例的思路下，以上实施例或者不同实施例中的技术特征之间也可以进行组合，并存在如上所述的本发明实施例的不同方面的许多其它变化，为了简明它们没有在细节中提供。因此，凡在本发明实施例的精神和原则之内，所做的任何省略、修改、等同替换、改进等，均应包含在本发明实施例的保护范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：田城宇;廖思琦
技术所有人：绮语（北京）文化传媒有限公司
我是此专利的发明人

上一篇：一种全组装式平板法测混凝土早期开裂的实验装置的制造方法
上一篇：一种汉语在线教学终端及方法与流程