本发明涉及音转文及多格式文档整合处理技术领域,更具体的说是涉及一种记录讲授过程的系统及方法。
背景技术:
目前,记录讲授过程的方法有视频录制、音频录制以及人工攥写文档三种方式,上述三种方法均能实现对讲师授课过程记录的功能,但是,也均存在不同方面的缺陷。具体地,采用视频录制的方法记录讲授过程,由于视频资源占用存储量大,对设备的内存要求相对较高、且视频数据的传输不便,限制了视频录制方法的普及。采用音频录制的方法记录讲授过程,如果音频资源丢失,讲授者对图片、文档内容理解会更加困难和不便。同时,通过上述两种方法得到的记录讲授过程的资源,后期都需要专业人士才能编辑,且定位到目标内容过程耗时长,查阅不便。采用人工攥写文档的方法记录讲授过程,需要专业人士操作,不仅费时费力,且成本会大大提高。不难发现,现有的记录讲授过程的方法存在效率低下、耗时耗利的问题。
因此,如何提供一种高效便捷、精准可靠的实现记录讲授过程的系统及方法是本领域技术人员亟需解决的问题。
技术实现要素:
有鉴于此,本发明提供了一种记录讲授过程的方法及系统,
为了实现上述目的,本发明采用如下技术方案:
一方面,本发明提供了一种记录讲授过程的系统,该系统包括:至少两个客户端和至少三个服务器,两个所述客户端分别为讲师客户端和学习者客户端,三个所述服务器分别为:转档服务器、文档处理服务器以及音频转译服务器;
所述讲师客户端用于上传授课相关的图片、文档及视频数据,还用于采集授课过程的音频信息及文档页面展示信息;
所述转档服务器用于将上传至所述讲师客户端的文档数据进行转档,生成相应的文档图片数据;
所述音频转译服务器用于将所述讲师客户端采集到的音频信息进行音频转译,得到对应的译文句子;
所述文档处理服务器用于对所述音频转译服务器得到的译文句子进行分段处理,对文档页面展示信息进行冗余清理处理,并将处理后得到的文字段落、处理后的文档页面展示信息与所述转档服务器生成的文档图片数据以及上传至所述讲师客户端的图片和视频数据进行整合处理,得到组合文档,并将所述组合文档进行存储和二维码分享;
所述学习者客户端用于根据二维码信息链接至所述文档处理服务器,并将所述组合文档内容进行播放展示。
在上述方案的基础上,对本发明提供的方案做进一步解释说明。
进一步地,所述文档处理服务器包括:
接收模块,用于接收所述讲师客户端上传的授课相关的图片、文档及视频数据,并接收所述讲师客户端采集的授课过程的音频信息及文档页面展示信息;
文档处理模块,用于将所述文档数据上传至所述转档服务器,并接收所述转档服务器回传的文档图片数据;
音频处理模块,用于将所述音频信息上传至所述音频转译服务器,并接收所述音频转译服务器回传的译文句子;
分段模块,用于对所述音频转译服务器得到的译文句子进行分段;
冗余清理模块,根据文档页面停留时间以及文档页面展示期间有意义文字数量,剔除冗余文档页面;
文档组合模块,用于将文字段落、处理后的文档页面展示信息与所述转档服务器生成的文档图片数据以及上传至所述讲师客户端的图片和视频数据进行整合处理,得到组合文档;
数据库,用于对所述组合文档进行存储;
分享模块,用于生成所述组合文档对应的二维码,并将所述二维码图片分享至所述学习者客户端;
链接模块,用于在接收到所述学习者客户端发出的二维码信息获取请求时,链接至所述数据库,为所述学习者客户端提供组合文档展示服务。
更进一步地,所述文档处理服务器还包括编辑模块,所述编辑模块用于对所述音频处理模块接收到的译文句子进行自定义编辑。
经由上述的技术方案可知,与现有技术相比,本发明公开提供了一种记录讲授过程的系统,该系统将授课用的音、文、图、视频等各种资源进行整合,方便学习者查阅,且由于记录讲授过程的资源已被高度整合,不在零散,传输起来也更加便捷,同时,该系统可嵌入于现有的智能终端设备使用,成本低廉,更适合推广应用。
另一方面,本发明还提供了一种记录讲授过程的方法,该方法包括以下步骤:
上传授课相关的图片、文档及视频数据,并采集授课过程的音频信息及文档页面展示信息;
将上传的文档数据进行转档,生成相应的文档图片数据;
将所述讲师客户端采集到的音频信息进行音频转译,得到对应的译文句子;
对所述译文句子进行分段处理,;
对文档页面展示信息进行冗余清理处理;
将处理后得到的文字段落、处理后的文档页面展示信息与文档图片数据以及上传的图片和视频数据进行整合处理,得到组合文档,并将所述组合文档进行存储和二维码分享。
进一步地,得到译文句子后还可以进行编辑。考虑到讲师普通话不标准的情况,音频转译后的译文句子可能存在有误内容,编辑后,能增加文字的准确率。
进一步地,对所述译文句子进行分段处理,具体包括以下步骤:
对译文句子中各个句子逐一进行分析,判定译文句子中存在的拆分句;
根据拆分句所在位置,对译文句子进行分段。
更进一步地,判定译文句子中存在的拆分句,具体包括以下步骤:
标定译文句子中的完结句;
逐一判断标定出的完结句与上句的间隔时长是否大于的句子平均间隔时长的预设倍数,提取出满足时间间隔条件的句子;
判断满足时间间隔条件的句子起始过程中是否存在文档页面展示动作,提取出存在文档页面展示动作的句子;
判断存在文档页面展示动作的句子与上一个拆分句间间隔的句数是否大于预设句数阈值,若大于预设句数阈值,则判定其为拆分句,否则,则判定其为普通句。
更进一步地,标定译文句子中的完结句过程中,所述完结句的判定依据为:句子以句号、感叹号或疑问号结尾。
进一步地,对文档页面展示信息进行冗余清理处理,具体包括以下步骤:
将文档页面展示过程中各个文档页面的展示时间与预设的时间阈值进行逐一比对,找出展示时间小于时间阈值的文档页面并将其剔除;
判别各个文档页面展示期间对应的译文句子中是否存在有意义文字,若不存在有意义的文字,则将对应的文档页面剔除。
更进一步地,所述有意义的文字为句子中的主语或名词。
进一步地,获得组合文档的过程,具体包括以下步骤:
循环每个文档页面展示,从文字段落中找出各个文档页面停留时间内对应的段落,并将文档页面以新段落的形式插入对应段落后面;
将音频按照文字段落中各个段落进行拆分,并与对应的段落进行关联。
经由上述的技术方案可知,与现有技术相比,本发明公开提供了一种记录讲授过程的方法,该方法通过对讲师讲授过程中的音频进行采集,将其转译为文本信息,并与上传的授课相关的其他文档、图片或视频进行整合,得到多种资源整合到一体的授课资料,学习者通过上述资料可以查阅文档及视频信息,还可以播放文档对应的音频,该方法记录的授课资源更方便学习者查阅学习,更加方便便捷。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1附图为本发明提供的一种记录讲授过程的系统的网络架构示意图;
图2附图为本发明提供的一种记录讲授过程的系统的结构模块示意图;
图3附图为本发明提供的一种记录讲授过程的方法的流程示意图;
图4附图为本发明实施例中分段过程的流程示意图;
图5附图为本发明实施例中拆分句判定的流程示意图;
图6附图为本发明实施例中对文档页面进行冗余清理的流程示意图;
图7附图为本发明实施例中获得组合文档过程的流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
一方面,参见附图1,本发明实施例公开了一种记录讲授过程的系统,该系统包括:至少两个客户端和至少三个服务器,两个客户端分别为讲师客户端1和学习者客户端5,三个服务器分别为:转档服务器3、文档处理服务器2以及音频转译服务器4;
讲师客户端1用于上传授课相关的图片、文档及视频数据,还用于采集授课过程的音频信息及文档页面展示信息;
转档服务器3用于将上传至讲师客户端1的文档数据进行转档,生成相应的文档图片数据;
音频转译服务器4用于将讲师客户端1采集到的音频信息进行音频转译,得到对应的译文句子;
文档处理服务器2用于对音频转译服务器4得到的译文句子进行分段处理,对文档页面展示信息进行冗余清理处理,并将处理后得到的文字段落、处理后的文档页面展示信息与转档服务器3生成的文档图片数据以及上传至讲师客户端1的图片和视频数据进行整合处理,得到组合文档,并将组合文档进行存储和二维码分享;
学习者客户端5用于根据二维码信息链接至文档处理服务器2,并将组合文档内容进行播放展示。
参见附图2,在一个具体的实施例中,文档处理服务器2包括:
接收模块21,用于接收讲师客户端1上传的授课相关的图片、文档及视频数据,并接收讲师客户端1采集的授课过程的音频信息及文档页面展示信息;
文档处理模块22,用于将文档数据上传至转档服务器3,并接收转档服务器3回传的文档图片数据;
音频处理模块23,用于将音频信息上传至音频转译服务器4,并接收音频转译服务器4回传的译文句子;
分段模块24,用于对音频转译服务器4得到的译文句子进行分段;
冗余清理模块25,根据文档页面停留时间以及文档页面展示期间有意义文字数量,剔除冗余文档页面;
文档组合模块26,用于将文字段落、处理后的文档页面展示信息与转档服务器生成的文档图片数据以及上传至讲师客户端1的图片和视频数据进行整合处理,得到组合文档;
数据库27,用于对组合文档进行存储;
分享模块28,用于生成组合文档对应的二维码,并将二维码图片分享至学习者客户端5;
链接模块29,用于在接收到学习者客户端5发出的二维码信息获取请求时,链接至数据库27,为学习者客户端5提供组合文档展示服务。
在一个具体的实施例中,文档处理服务器2还包括编辑模块20,编辑模块20用于对音频处理模块23接收到的译文句子进行自定义编辑。
由上述内容可知,本发明实施例公开提供了一种记录讲授过程的系统,该系统将授课用的音、文、图、视频等各种资源进行整合,方便学习者查阅,且由于记录讲授过程的资源已被高度整合,不在零散,传输起来也更加便捷,同时,该系统可嵌入于现有的智能终端设备使用,成本低廉,更适合推广应用。
另一方面,参见附图3,本发明实施例还公开了一种记录讲授过程的方法,该方法包括以下步骤:
s1:上传授课相关的图片、文档及视频数据,并采集授课过程的音频信息及文档页面展示信息;
s2:将上传的文档数据进行转档,生成相应的文档图片数据;
s3:将讲师客户端采集到的音频信息进行音频转译,得到对应的译文句子;
s4:对译文句子进行分段处理;
s5:对文档页面展示信息进行冗余清理处理;
s6:将处理后得到的文字段落、处理后的文档页面展示信息与文档图片数据以及上传的图片和视频数据进行整合处理,得到组合文档,并将组合文档进行存储和二维码分享。
在一些实施例中,得到译文句子后还可以进行编辑。考虑到讲师普通话不标准的情况,音频转译后的译文句子可能存在有误内容,编辑后,能增加文字的准确率。
参见附图4,在一个具体的实施例中,步骤s4中对译文句子进行分段处理,具体包括以下步骤:
s41:对译文句子中各个句子逐一进行分析,判定译文句子中存在的拆分句;
s42:根据拆分句所在位置,对译文句子进行分段。
参见附图5,在一个具体的实施例中,步骤s41中判定译文句子中存在的拆分句,具体包括以下步骤:
s411:标定译文句子中的完结句;
s412:逐一判断标定出的完结句与上句的间隔时长是否大于预设的句子平均间隔时长的2倍,提取出满足时间间隔条件的句子;
s413:判断满足时间间隔条件的句子起始过程中是否存在文档页面展示动作,提取出存在文档页面展示动作的句子;
s414:判断存在文档页面展示动作的句子与上一个拆分句间间隔的句数是否大于6句,若大于6句,则判定其为拆分句,否则,则判定其为普通句。此处设置的句数阈值为经验阈值,是经过多次测试得到的最优值。
具体地,标定译文句子中的完结句过程中,完结句的判定依据为:句子以句号、感叹号或疑问号结尾。
参见附图6,在一个具体的实施例中,步骤s5中对文档页面展示信息进行冗余清理处理,具体包括以下步骤:
s51:将文档页面展示过程中各个文档页面的展示时间与预设的时间阈值1.5秒进行逐一比对,找出展示时间小于1.5秒的文档页面并将其剔除;
s52:判别各个文档页面展示期间对应的译文句子中是否存在有意义文字,若不存在有意义的文字,则将对应的文档页面剔除。
具体地,有意义的文字为句子中的主语或名词。
参见附图7,在一个具体的实施例中,步骤s6中获得组合文档的过程,具体包括以下步骤:
s61:循环每个文档页面展示,从文字段落中找出各个文档页面停留时间内对应的段落,并将文档页面以新段落的形式插入对应段落后面;
s62:将音频按照文字段落中各个段落进行拆分,并与对应的段落进行关联。
由上述内容可知,本发明实施例公开提供了一种记录讲授过程的方法,该方法通过对讲师讲授过程中的音频进行采集,将其转译为文本信息,并与上传的授课相关的其他文档、图片或视频进行整合,得到多种资源整合到一体的授课资料,学习者通过上述资料可以查阅文档及视频信息,还可以播放文档对应的音频,该方法记录的授课资源更方便学习者查阅学习,更加方便便捷。
下面对上述实施例中公开的记录授课过程的方法在实际应用过程的流程做大概的介绍:
1.讲师先提前上传讲授过程所需要的图片、文档(pdf、ppt或word)和视频。其中文档(pdf、ppt或word)会进行预处理成图片,文档的每一页处理为一张图片;
2.讲师使用移动设备(如手机),进行讲授,一边讲,一边将文档页面投到大屏(如电视、拼接屏或电脑屏等),而移动设备(手机)则收集文档页面展示信息和音频;
3.讲师完成讲授后,移动设备(手机)将收集到的文档页面展示信息和音频上传到文档处理服务器;
4.文档处理服务器接受到处理数据后,先将音频交由音频转译服务器转译为文字;
5.对从音频转译服务器传回的文字进行分段:
a)判断句子期间是否有文档页面展示,如果有,则标志为“拆分句”
b)计算本句的和下句的间隔和平均间隔时长的倍数,首句此值为0,如倍数超过2,则标志为“拆分句”;
c)判断句子是否是完结句,如果不是,则取消其“拆分句”的标志。如果此句有文档页面展示,则将下一个完结句标志为“拆分句”;
d)判断句子和上个拆分句间隔超过6句话,如是完结句,则标志为拆分句;
e)根据句子中被标志为“拆分句”的名子将所有句子分段落,其中“拆分句”句子作为段落的最后一句;
6.对文档页面展示进行去除冗余:
a)通过和上下页面时间对比,计算每个文档页面展示计算其停留时间;
b)从文字句子中,计算出每个文档页面期间的有意义文字(保留主语,名词);
c)判断每个文档页面展示,如果停留时间少于1.5秒,或无有意义文字,则删除;
7.将文档页面展示插入段落中:
a)循环每个文档页面展示,找出其停留时间内的每一个段落,插入此段落后面作为一个新段落;
8.将音频按段落拆分,并和对应的段落关联上;
9.将文档页面展示、文字段落、音频以固定格式存储至数据库;
最后将此种文档以二维码方式交回给讲师。
具体地,本实施例中涉及的三个服务器:转档服务器3、文档处理服务器2以及音频转译服务器4,均可以是服务器集群,比如可以包括:前端网关服务器集群、连接服务器集群、核心业务服务器集群、数据库服务集群和文件服务器;其中:前端网关服务器集群,分别与至少1个客户端,比如讲师客户端以及核心业务服务器集群连接;用于转发客户端的请求以及将服务器的响应返回给对应的客户端;
连接服务器集群,用于处理客户端的服务请求的接受、连接会话的建立、维持和中断服务;核心业务服务器集群,用于对用户登录进行认证、对用户权限进行验证、需求执行的发布、推送、回应以及实施的逻辑,并在必要时对数据库进行读写操作;数据库集群,用于持久化存储智能管理系统的所有数据;文件服务器,用于存储智能实验管理系统的所有文件。
上述连接服务器集群还可以包括:pc连接服务器集群和移动终端连接服务器集群;上述pc连接服务器集群用于为运行于pc上的客户端提供服务;上述移动终端连接服务器集群用于为运行于移动终端上的客户端提供服务。集群化操作可以减少单点故障数量,并且实现了群集化资源的高可用性,实现负载均衡。本公开实施例对服务器之间的网络连接、硬件配置均不做限定。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。