基于视频直播的互动控制方法、装置及服务器与流程

文档序号:11881561阅读:237来源:国知局
基于视频直播的互动控制方法、装置及服务器与流程

本发明涉及多媒体数据处理领域,特别涉及一种基于视频直播的互动控制方法及装置,相应的,还涉及一种基于视频直播的互动控制方法的服务器。



背景技术:

近年来,随着互联网应用的兴起,用户越来越倾向于选择在线视频实时直播的方式,与他人分享一些趣闻或进行现场个人才艺表演。

主播用户通常是指视频内容发布者,主播用户通过摄像装置、麦克风输入视频和语音信息,在通过主播客户端将音视频信息融合之后向服务器发送直播内容,服务器获取登陆到主播用户创建的频道的用户ID,并向对应的观众客户端推送直播内容,由观众客户端输出给观众用户。其中,频道是指主播用户通过主播客户端创建的一种虚拟空间或虚拟房间,位于该虚拟空间的观众客户端不仅可以观看主播客户端的直播内容,还可以和主播客户端进行语音或文字的交互。

但是,现有视频直播平台的互动仅限于应用本身提供的一些功能控件,如送礼物、关注、分享等,这种互动是纯网络平台提供的操作,在用户体验上比较虚拟,并且有些控件不是很明显,用户操作的便捷程度较低,体验度也不高。



技术实现要素:

本发明的一个目的旨在解决上述至少一个问题,提供了一种基于视频直播的互动控制方法、装置及服务器。

为实现该目的,本发明采用如下技术方案:

本发明提供了一种基于视频直播的互动控制方法,其包括以下步骤:

根据接收到的直播视频流显示包含有至少一个特征图像的直播视频画面;

获取作用于任意一个所述的特征图像所在区域的操作事件;

响应于该操作事件,依据所述操作事件所作用的区域信息确定被选定的特征图像;

执行与被选定的特征图像相对应的控制指令。

具体的,所述操作事件包括触控操作事件。

进一步的,所述执行与被选定的特征图像相对应的控制指令的步骤,还包括:

调用远程接口向直播视频流提供方发送与所述被选定的特征图像相对应的通信指令。

更进一步的,所述方法还包括步骤:

接收推送的后续的直播视频流,所述后续的直播视频流对应的直播视频画面上显示有与所述通信指令对应的反馈信息。

具体的,所述响应于该操作事件,依据所述操作事件所作用的区域信息确定被选定的特征图像的步骤中,还包括:依据所述特征图像的颜色特征信息和/或分布特征信息来确定该特征图像。

本方案还提供了一种基于视频直播的互动控制方法,其包括以下步骤:

推送包含有至少一个特征图像的直播视频流;

调用远程接口接收对应于所述任意一个特征图像的通信指令;

推送所述通信指令所对应的反馈信息。

具体的,所述推送所述通信指令所对应的反馈信息的步骤,包括:随附后续的直播视频流推送所述反馈信息。

本方案还提供了一种基于视频直播的互动控制装置,其包括有:

视频显示模块,用于根据接收到的直播视频流显示包含有至少一个特征图像的直播视频画面;

用户交互模块,用于获取作用于任意一个所述的特征图像所在区域的操作事件;

图像确定模块,用于响应于该操作事件,依据所述操作事件所作用的区域信息确定被选定的特征图像;

执行模块,用于执行与被选定的特征图像相对应的控制指令。

具体的,所述操作事件包括触控操作事件。

具体的,所述执行模块,还用于调用远程接口向直播视频流提供方发送与所述被选定的特征图像相对应的通信指令。

具体的,所述执行模块,还用于接收推送的后续的直播视频流,所述后续的直播视频流对应的直播视频画面上显示有与所述通信指令对应的反馈信息。

具体的,所述图像确定模块,还用于依据所述特征图像的颜色特征信息和/或分布特征信息来确定该特征图像。

本方案还提供了一种服务器,其包括有:

视频推送模块,推送包含有至少一个特征图像的直播视频流;

指令接收模块,用于调用远程接口接收对应于所述任意一个特征图像的通信指令;

反馈模块,用于推送所述通信指令所对应的反馈信息。

进一步的,所述反馈模块,还用于随附后续的直播视频流推送所述反馈信息。

与现有技术相比,本发明具备如下优点:

1、在本方案中依据作用在直播视频画面的任意一个特征图像所在区域的操作事件,来确定该被选定的特征图像;并执行与该被选定的特征图像相对应的控制指令;即用户可以通过选定直播视频画面上的特征图像来与主播实现互动,扩展了基于视频直播的互动方式,方便用户操作,提高用户体验;

2、本方案中,针对作用在直播视频画面的某一视频帧的操作事件所在的区域确定被选定的特征图像;即只对被选定区域的特征图像进行识别,可依据所述特征图像的颜色特征信息和/或分布特征信息来确定该特征图像,相比视频自动检索和识别,节约系统资源,提高对特征图像的识别效率。

本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实践了解到。

【附图说明】

本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:

图1是本发明中基于视频直播的互动控制方法的一个实施例的程序流程图;

图2是本发明中基于视频直播的互动控制方法的一个实施例的程序流程图;

图3是本发明中一个实施例中直播视频画面的界面示意图;

图4是本发明中一个实施例中直播视频画面的界面示意图;

图5是本发明中基于视频直播的互动控制装置的一个实施例的结构框图;

图6是本发明中服务器的一个实施例的结构框图;

图7是本发明一个实施例中终端的结构框图。

【具体实施方式】

下面结合附图和示例性实施例对本发明作进一步地描述,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。此外,如果已知技术的详细描述对于示出本发明的特征是不必要的,则将其省略。

本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。

本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。

本技术领域技术人员可以理解,这里所使用的“终端”、“终端设备”既包括无线信号接收器的设备,其仅具备无发射能力的无线信号接收器的设备,又包括接收和发射硬件的设备,其具有能够在双向通信链路上,执行双向通信的接收和发射硬件的设备。这种设备可以包括:蜂窝或其他通信设备,其具有单线路显示器或多线路显示器或没有多线路显示器的蜂窝或其他通信设备;PCS(Personal Communications Service,个人通信系统),其可以组合语音、数据处理、传真和/或数据通信能力;PDA(Personal Digital Assistant,个人数字助理),其可以包括射频接收器、寻呼机、互联网/内联网访问、网络浏览器、记事本、日历和/或GPS(Global Positioning System,全球定位系统)接收器;常规膝上型和/或掌上型计算机或其他设备,其具有和/或包括射频接收器的常规膝上型和/或掌上型计算机或其他设备。这里所使用的“终端”、“终端设备”可以是便携式、可运输、安装在交通工具(航空、海运和/或陆地)中的,或者适合于和/或配置为在本地运行,和/或以分布形式,运行在地球和/或空间的任何其他位置运行。这里所使用的“终端”、“终端设备”还可以是通信终端、上网终端、音乐/视频播放终端,例如可以是PDA、MID(Mobile Internet Device,移动互联网设备)和/或具有音乐/视频播放功能的移动电话,也可以是智能电视、机顶盒等设备。

有必要先对本发明的应用场景及其原理进行如下的先导性说明。

本方案提供的一种基于视频直播的互动控制方法、装置及服务器,是基于包括服务器以及多个客户端的网络架构进行描述的。其中,所述服务端可以通过互联网与多个客户端进行通信连接。且所述多个客户端中的部分客户端可以作为主播客户端,其余客户端可以作为观众客户端接入任一主播客户端所创建的频道。本发明实施例中,频道简单来讲就是主播客户端创建的一种虚拟空间(或虚拟房间),位于该虚拟空间内的观众客户端可以不仅观看主播客户端的直播内容,还可以和主播客户端进行交互。本发明实施例中,主播客户端、观众客户端均可以是包括集合群聊、视频直播、频道K歌、在线游戏、在线影视等功能为一体的客户端。

下面将详细说明利用上述的网络架构实现本发明的若干技术方案的具体实施方式。需要说明的是,本发明提供了一种基于视频直播的互动控制方法,是先从观众客户端的视角来描述该互动控制方法,即可以通过编程将该互动控制方法实现为计算机程序在终端设备上实现。

请参阅图1,本发明的一种基于视频直播的互动控制方法的一个典型实施例,具体包括以下步骤:

S11,根据接收到的直播视频流显示包含有至少一个特征图像的直播视频画面。

具体的,在观众客户端启动后,通过加载视频引擎即可接收来自主播客户端的直播视频流,且在该直播视频流中包括有主播客户端发布的包含有多个特征图像的互动信息,例如在本方案的一个实施例中,所述包含有多个特征图像的互动信息可以是不同颜色特征和/或分布特征的选项卡图片或实物图片信息。

进一步的,在本方案的一个实施例中,所述直播视频流为方便在网络之间进行传输的二进制码流,视频引擎不断接收直播视频流的过程中,读取到的视频码流转换成视频帧;得到的视频帧再通过视频渲染技术,即通过特定引擎将视频帧从内存中加载到当前的直播视频画面;且所述直播视频画面中包含有多个特征图像的互动信息,例如在本方案的一个实施例中,所述包含有多个特征图像的互动信息可以是不同颜色特征和/或分布特征的选项卡图片或实物图片信息。

例如,在本方案的一个实施例中,所述包含有多个特征图像的互动信息可以是选项卡图片,请参见附图3,图中为显示有选项卡图片的直播视频画面,A主播提供对与错选项、B主播提供有两张牌、C主播提供YES选项及D主播提供NO选项;以及附图4中所示的字母选项、对错选项、数字选项和扑克牌选项。在本方案的又一个实施例中,所述包含有多个特征图像的互动信息还可以是表征特定功能的选项,例如附图4中,所述包含多个特征图像的互动信息可以是分享、关注或点赞等功能选项;不难理解,该实施例并不能构成对本方案的限制。

进一步的,请参见附图1,本方案所述基于视频直播的互动控制方法,还包括步骤:

S12,获取作用于任意一个所述的特征图像所在区域的操作事件。

具体的,当前述步骤中,在观众客户端的终端设备的显示界面上显示有包含多个特征图像的直播视频画面。具体的,请参见附图3和附图4所示的直播视频画面的显示界面。用户面对该直播视频画面上的选项卡图片或功能选项卡图片,想要选定某一特征图像的选项卡时,选中该直播视频画面上特征图像所在区域即可。具体的,用户可以通过鼠标等控件点击被选定的特征图像所在区域,也可以直接触碰所述显示界面上该特征图像所在区域,观众客户端的终端设备上感应并获取作用在任意一个所述特征图像所在区域的操作事件,其中,在本方案的一个实施例中,所述操作事件可以包括作用在所述直播视频画面上的触控操作事件。

进一步的,请参见附图1,本方案所述基于视频直播的互动控制方法,还包括步骤:

S13,响应于该操作事件,依据所述操作事件所作用的区域信息确定被选定的特征图像。

具体的,前述步骤S12中,观众客户端的终端设备上感应并获取作用在任意一个所述特征图像所在区域的操作事件。该步骤中,进一步的,依据所述操作事件所作用的区域信息确定被选定的特征图像。具体的,可以通过检测点击或触摸等触控操作事件所作用的区域信息,获取该当前视频帧上直播视频画面中对应区域的x,y坐标值,提取该x,y坐标值所对应区域所显示的图片信息。

在本方案的一个实施例中,观众客户端依据所述区域信息所对应的特征图像的颜色特征信息和/或分布特征信息来确定该特征图像。

具体的,本方案中,观众客户端利用了待识别的特征图像的颜色和/或形状和/或纹理特征,实现了对当前视频关键帧所对应的特征图像进行识别。不难理解,在视频图像识别技术中,关键帧,是用于描述一个镜头的关键图像帧,通常会反映一个镜头内的主要内容,依据镜头内容的复杂程度,可以基于一定的算法从镜头中提取该特征图像所对应的关键帧,并基于颜色特征、纹理特征和形状特征等静态特征,来识别该特征图像。例如,请参见附图3和附图4,用户选定图中视频关键帧上某一特征图像所对应的选项卡图片后,观众客户端检测到该点击或触摸等触控操作事件所作用的区域信息,获取该区域所对应的x,y坐标值,并提取该x,y坐标值所对应区域所显示的图片信息,再依据该图片的颜色特征信息和/或分布特征信息来确定该特征图像。

进一步的,当观众客户端确定了被选定的特征图像后,会提示用户是否选择该选项卡。在本方案的一个实施例中,会在直播视频画面上显示提示窗口,该提示窗口中显示有“是”和“否”的用户选项,以供用户选择;防止用户误操作,提高方案实施的有效性和用户体验度。

不难理解,本方案中,针对作用在直播视频画面的某一视频帧的操作事件所在的区域确定被选定的特征图像;即只对被选定区域的特征图像进行识别,可依据所述特征图像的颜色特征信息和/或分布特征信息来确定该特征图像,相比视频自动检索和识别,节约系统资源,提高对特征图像的识别效率。

进一步的,请参见附图1,本方案所述基于视频直播的互动控制方法,还包括步骤:

S14,执行与被选定的特征图像相对应的控制指令。

具体的,前述步骤中,观众客户端依据所述操作事件所作用的区域信息确定被选定的特征图像,并识别该特征图像;则该步骤中观众客户端会执行与该被选定的特征图像相对应的控制指令。

在本方案的一个实施例中,观众客户端确定了被选定的特征图像后,调用远程接口向直播视频流提供方发送与所述被选定的特征图像相对应的通信指令。不难理解,所述直播视频提供方为主播客户端,观众客户端可以通过服务器与主播客户端实现通信,则所述远程接口为观众客户端向服务器发送数据的接口。具体的,在本发明的示例性实施例中,当所述用户选定了功能选项卡,例如用户选定了表征“分享”、“关注”或“赞”的选项卡时,观众客户端会调用远程接口向服务器发送对应于上述功能特征图像的通信指令,并接收服务器端返回的对应于该通信指令的控制指令,依照该控制指令执行相应操作;或者,在本方案的一个实施例中,用户选定了字母、数字或对错的选项卡后,观众客户端会调用远程接口向服务器发送对应于所述选项卡的通信指令,并接收服务器端返回的对应于该通信指令的反馈信息。

进一步的,在本方案的一个实施例中,在观众客户端确定了被选定的特征图像,调用远程接口向直播视频流提供方发送与所述被选定的特征图像相对应的通信指令的步骤之后,还包括步骤:接收推送的后续的直播视频流,所述后续的直播视频画面上显示有与所述通信指令对应的反馈信息。例如,在本方案的一个示例性实施例中,用户调用远程接口向服务器发送对应于对错选项卡的控制指令后,服务器随附后续的直播视频流返回该选项卡所对应的反馈信息;不难理解,在服务器端预存有包含通信指令与反馈信息的对应关系表。

综上所述,在本方案中依据作用在直播视频画面的任意一个特征图像所在区域的操作事件,来确定该被选定的特征图像;并执行与该被选定的特征图像相对应的控制指令;即用户可以通过选定直播视频画面上的特征图像来与主播实现互动,扩展了基于视频直播的互动方式,方便用户操作,提高用户体验。

进一步的,本发明还提供了一种基于视频直播的互动控制方法,是从服务器的视角来描述该互动控制方法,即可以通过编程将该互动控制方法实现为计算机程序在服务器端实现。可以通过编程将基于视频直播的互动控制方法实现为计算机程序在远端网络设备上实现,其包括但不限于计算机、网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云。

请参阅图2,本发明的一种基于视频直播的互动控制方法的一个典型实施例,具体包括以下步骤:

S21,推送包含有至少一个特征图像的直播视频流。

具体的,服务器端接收到主播客户端所上传的包含有至少一个特征图像的直播视频流后,可以向特定的观众客户端推送该带有特征图像的直播视频流,以使得观众客户端能够与主播客户端实现互动。

作为一种可选的实施方式,服务器向特定观众客户端推送直播视频流可以包括:

服务端向预设的特定频道中所有或部分观众客户端推送该包括有至少一个特征图像的直播视频流。

具体的,在本发明实施例中,服务器接收到主播客户端发送的直播视频流后,可以向预设的特定频道中满足预设条件的观众客户端推送该直播视频流。其中,所述预设条件可以包括但不限于对应的用户为VIP用户,或观众客户端对应的用户的等级不低于预设等级,或观众客户端对应的用户与上述特定频道的主播客户端对应的主播用户的亲密度不低于预设值中的一个或多个。

作为另一种可选的实施方式,服务器向特定观众客户端推送包含有特征图像的直播视频流可以包括:服务器向包括预设频道在内的多个不同频道中的所有或部分客户端推送所述直播视频流。

具体的,服务器端接收到包含有特征图像的直播视频流后,可以向包括上述预设频道在内的多个不同频道中满足预设条件的观众客户端推送该直播视频流。其中,所述预设条件包括但不限于观众客户端对应的用户为VIP用户,或观众客户端对应的用户的等级不低于预设等级,或观众客户端对应的用户与上述特定频道的主播客户端对应的主播用户的亲密度不低于预设值中的一个或多个。

其中,所述包括上述特定频道在内的多个不同频道可以为上述特定频道,以及任意一个或多个其它正在进行视频直播的频道。

不难理解,所述直播视频画面中包含有多个特征图像的互动信息,例如在本方案的一个实施例中,所述包含有多个特征图像的互动信息可以是不同颜色特征和/或分布特征的选项卡图片或实物图片信息。具体的,请参见附图3,图中为显示有选项卡图片的直播视频画面,A主播提供对与错选项、B主播提供有两张牌、C主播提供YES选项及D主播提供NO选项;以及附图4中所示的字母选项、对错选项、数字选项和扑克牌选项。在本方案的又一个实施例中,所述包含的多个特征图像还可以是表征特定功能的选项,例如附图4中,所述包含多个特征图像的互动信息可以是分享、关注或点赞等功能选项;不难理解,该实施例并不能构成对本方案的限制。

进一步的,请参见附图2,本方案所述基于视频直播的互动控制方法,还包括步骤:

S22,调用远程接口接收对应于所述任意一个特征图像的通信指令;

S23,推送所述通信指令所对应的反馈信息。

具体的,观众客户端确定了被选定的特征图像后,调用远程接口向服务器发送与所述被选定的特征图像相对应的通信指令。不难理解,所述观众客户端可以通过服务器与主播客户端实现通信,则所述远程接口为服务器与观众客户端实现通信的接口。具体的,在本发明的一个示例性实施例中,当所述用户选定了功能选项卡,例如用户选定了表征“分享”、“关注”或“赞”的选项卡时,观众客户端会向服务器发送对应于上述功能特征图像的通信指令,并接收服务器端返回的对应于该通信指令的控制指令,依照该控制指令执行相应的“分享”、“关注”等操作;或者,在本方案的一个实施例中,用户选定了字母、数字或对错的选项卡后,观众客户端会调用远程接口向服务器发送对应于所述选项卡的通信指令,并接收服务器端返回的对应于该通信指令的反馈信息。

进一步的,在本方案的一个实施例中,所述推送所述通信指令所对应的反馈信息的步骤中,还包括步骤:随附后续的直播视频流推送所述反馈信息。例如,在本方案的一个示例性实施例中,观众客户端调用远程接口向服务器发送特征图像对应的选项卡的控制指令后,服务器随附后续的直播视频流返回该选项卡所对应的反馈信息;不难理解,在服务器端预存有包含通信指令与反馈信息的对应关系表。

综上所述,在本方案中依据作用在直播视频画面的任意一个特征图像所在区域的操作事件,来确定该被选定的特征图像;并执行与该被选定的特征图像相对应的控制指令;即用户可以通过选定直播视频画面上的特征图像来与主播实现互动,扩展了基于视频直播的互动方式,方便用户操作,提高用户体验。

进一步,依据计算机软件的功能模块化思维,本发明还提供了一种基于视频直播的互动控制装置,请参阅图5。该基于视频直播的互动控制装置包括视频显示模块11、用户交互模块12、图像确定模块13和执行模块14,利用该视频显示模块11、用户交互模块12、图像确定模块13和执行模块14来搭建起整个装置的原理框架,从而实现模块化实施方案。以下具体揭示各模块实现的具体功能。

所述视频显示模块11,用于根据接收到的直播视频流显示包含有至少一个特征图像的直播视频画面。

具体的,在观众客户端启动后,所述视频显示模块11通过加载视频引擎即可接收来自主播客户端的直播视频流,且在该直播视频流中包括有主播客户端发布的包含有多个特征图像的互动信息,例如在本方案的一个实施例中,所述包含有多个特征图像的互动信息可以是不同颜色特征和/或分布特征的选项卡图片或实物图片信息。

进一步的,在本方案的一个实施例中,所述直播视频流为方便在网络之间进行传输的二进制码流,视频引擎不断接收直播视频流的过程中,所述视频显示模块11将读取到的视频码流转换成视频帧;得到的视频帧再通过视频渲染技术,即通过特定引擎将视频帧从内存中加载到当前的直播视频画面;且所述直播视频画面中包含有多个特征图像的互动信息,例如在本方案的一个实施例中,所述包含有多个特征图像的互动信息可以是不同颜色特征和/或分布特征的选项卡图片或实物图片信息。

例如,在本方案的一个实施例中,所述包含有多个特征图像的互动信息可以是选项卡图片,请参见附图3,图中为显示有选项卡图片的直播视频画面,A主播提供对与错选项、B主播提供有两张牌、C主播提供YES选项及D主播提供NO选项;以及附图4中所示的字母选项、对错选项、数字选项和扑克牌选项。在本方案的又一个实施例中,所述包含有多个特征图像的互动信息还可以是表征特定功能的选项,例如附图4中,所述包含多个特征图像的互动信息可以是分享、关注或点赞等功能选项;不难理解,该实施例并不能构成对本方案的限制。

进一步的,请参见附图5,所述用户交互模块12,用于获取作用于任意一个所述的特征图像所在区域的操作事件。

具体的,当前述视频显示模块11中显示有包含多个特征图像的直播视频画面。具体的,请参见附图3和附图4所示的直播视频画面的显示界面。用户面对该直播视频画面上的选项卡图片或功能选项卡图片,想要选定某一特征图像的选项卡时,选中该直播视频画面上特征图像所在区域即可。具体的,用户可以通过鼠标等控件点击被选定的特征图像所在区域,也可以直接触碰所述显示界面上该特征图像所在区域,所述用户交互模块12感应并获取作用在任意一个所述特征图像所在区域的操作事件,其中,在本方案的一个实施例中,所述操作事件可以包括作用在所述直播视频画面上的触控操作事件。

进一步的,请参见附图5,所述图像确定模块13,用于响应于该操作事件,依据所述操作事件所作用的区域信息确定被选定的特征图像。

具体的,前述用户交互模块12中,观众客户端的终端设备上感应并获取作用在任意一个所述特征图像所在区域的操作事件。进一步的,所述图像确定模块13依据所述操作事件所作用的区域信息确定被选定的特征图像。具体的,所述图像确定模块13可以通过检测点击或触摸等触控操作事件所作用的区域信息,获取该当前视频帧上直播视频画面中对应区域的x,y坐标值,提取该x,y坐标值所对应区域所显示的图片信息。

在本方案的一个实施例中,所述图像确定模块13依据所述区域信息所对应的特征图像的颜色特征信息和/或分布特征信息来确定该特征图像。

具体的,本方案中,所述图像确定模块13利用了待识别的特征图像的颜色和/或形状和/或纹理特征,实现了对当前视频关键帧所对应的特征图像进行识别。不难理解,在视频图像识别技术中,关键帧,是用于描述一个镜头的关键图像帧,通常会反映一个镜头内的主要内容,依据镜头内容的复杂程度,可以基于一定的算法从镜头中提取该特征图像所对应的关键帧,并基于颜色特征、纹理特征和形状特征等静态特征,来识别该特征图像。例如,请参见附图3和附图4,用户选定图中视频关键帧上某一特征图像所对应的选项卡图片后,所述图像确定模块13检测到该点击或触摸等触控操作事件所作用的区域信息,获取该区域所对应的x,y坐标值,并提取该x,y坐标值所对应区域所显示的图片信息,再依据该图片的颜色特征信息和/或分布特征信息来确定该特征图像。

进一步的,当所述图像确定模块13确定了被选定的特征图像后,会提示用户是否选择该选项卡。在本方案的一个实施例中,所述图像确定模块13会在直播视频画面上显示提示窗口,该提示窗口中显示有“是”和“否”的用户选项,以供用户选择;防止用户误操作,提高方案实施的有效性和用户体验度。

不难理解,本方案中,针对作用在直播视频画面的某一视频帧的操作事件所在的区域确定被选定的特征图像;即只对被选定区域的特征图像进行识别,可依据所述特征图像的颜色特征信息和/或分布特征信息来确定该特征图像,相比视频自动检索和识别,节约系统资源,提高对特征图像的识别效率。

进一步的,请参见附图5,所述执行模块14,用于执行与被选定的特征图像相对应的控制指令。

具体的,前述图像确定模块13中依据所述操作事件所作用的区域信息确定被选定的特征图像,并识别该特征图像;则该执行模块14中会执行与该被选定的特征图像相对应的控制指令。

在本方案的一个实施例中,所述图像确定模块13确定了被选定的特征图像后,所述执行模块14调用远程接口向直播视频流提供方发送与所述被选定的特征图像相对应的通信指令。不难理解,所述直播视频提供方为主播客户端,观众客户端可以通过服务器与主播客户端实现通信,则所述远程接口为观众客户端向服务器发送数据的接口。具体的,在本发明的示例性实施例中,当所述用户选定了功能选项卡,例如用户选定了表征“分享”、“关注”或“赞”的选项卡时,所述执行模块14会调用远程接口向服务器发送对应于上述功能特征图像的通信指令,并接收服务器端返回的对应于该通信指令的控制指令,依照该控制指令执行相应操作;或者,在本方案的一个实施例中,用户选定了字母、数字或对错的选项卡后,所述执行模块14会调用远程接口向服务器发送对应于所述选项卡的通信指令,并接收服务器端返回的对应于该通信指令的反馈信息。

进一步的,在本方案的一个实施例中,在所述图像确定模块13确定了被选定的特征图像,所述执行模块14调用远程接口向直播视频流提供方发送与所述被选定的特征图像相对应的通信指令之后,还用于接收推送的后续的直播视频流,所述后续的直播视频画面上显示有与所述通信指令对应的反馈信息。例如,在本方案的一个示例性实施例中,用户调用远程接口向服务器发送对应于对错选项卡的控制指令后,服务器随附后续的直播视频流返回该选项卡所对应的反馈信息;不难理解,在服务器端预存有包含通信指令与反馈信息的对应关系表。

综上所述,在本方案中所述图像确定模块13依据作用在直播视频画面的任意一个特征图像所在区域的操作事件,来确定该被选定的特征图像;并通过执行模块14执行与该被选定的特征图像相对应的控制指令;即用户可以通过选定直播视频画面上的特征图像来与主播实现互动,扩展了基于视频直播的互动方式,方便用户操作,提高用户体验。

同理,依据计算机软件的功能模块化思维,本发明还提供了一种服务器,请参阅图6。该服务器包括视频推送模块21、指令接收模块22和反馈模块23,利用该视频推送模块21、指令接收模块22和反馈模块23来搭建起整个服务器的原理框架,从而实现模块化实施方案。以下具体揭示各模块实现的具体功能。

所述视频推送模块21,用于推送包含有至少一个特征图像的直播视频流。

具体的,服务器端接收到主播客户端所上传的包含有至少一个特征图像的直播视频流后,所述视频推送模块21可以向特定的观众客户端推送该带有特征图像的直播视频流,以使得观众客户端能够与主播客户端实现互动。

作为一种可选的实施方式,所述视频推送模块21向特定观众客户端推送直播视频流可以包括:

所述视频推送模块21向预设的特定频道中所有或部分观众客户端推送该包括有至少一个特征图像的直播视频流。

具体的,在本发明实施例中,接收到主播客户端发送的直播视频流后,所述视频推送模块21可以向预设的特定频道中满足预设条件的观众客户端推送该直播视频流。其中,所述预设条件可以包括但不限于对应的用户为VIP用户,或观众客户端对应的用户的等级不低于预设等级,或观众客户端对应的用户与上述特定频道的主播客户端对应的主播用户的亲密度不低于预设值中的一个或多个。

作为另一种可选的实施方式,所述视频推送模块21向特定观众客户端推送包含有特征图像的直播视频流可以包括:所述视频推送模块21向包括预设频道在内的多个不同频道中的所有或部分客户端推送所述直播视频流。

具体的,所述视频推送模块21接收到包含有特征图像的直播视频流后,可以向包括上述预设频道在内的多个不同频道中满足预设条件的观众客户端推送该直播视频流。其中,所述预设条件包括但不限于观众客户端对应的用户为VIP用户,或观众客户端对应的用户的等级不低于预设等级,或观众客户端对应的用户与上述特定频道的主播客户端对应的主播用户的亲密度不低于预设值中的一个或多个。

其中,所述包括上述特定频道在内的多个不同频道可以为上述特定频道,以及任意一个或多个其它正在进行视频直播的频道。

不难理解,所述直播视频画面中包含有多个特征图像的互动信息,例如在本方案的一个实施例中,所述包含有多个特征图像的互动信息可以是不同颜色特征和/或分布特征的选项卡图片或实物图片信息。具体的,请参见附图3,图中为显示有选项卡图片的直播视频画面,A主播提供对与错选项、B主播提供有两张牌、C主播提供YES选项及D主播提供NO选项;以及附图4中所示的字母选项、对错选项、数字选项和扑克牌选项。在本方案的又一个实施例中,所述包含的多个特征图像还可以是表征特定功能的选项,例如附图4中,所述包含多个特征图像的互动信息可以是分享、关注或点赞等功能选项;不难理解,该实施例并不能构成对本方案的限制。

进一步的,请参见附图6,所述指令接收模块22,用于调用远程接口接收对应于所述任意一个特征图像的通信指令;

所述反馈模块23,用于推送所述通信指令所对应的反馈信息。

具体的,观众客户端确定了被选定的特征图像后,调用远程接口向服务器发送与所述被选定的特征图像相对应的通信指令。不难理解,所述观众客户端可以通过服务器与主播客户端实现通信,则所述远程接口为服务器与观众客户端实现通信的接口。具体的,在本发明的一个示例性实施例中,当所述用户选定了功能选项卡,例如用户选定了表征“分享”、“关注”或“赞”的选项卡时,所述指令接收模块22接收到观众客户端发送对应于上述功能特征图像的通信指令,并通过反馈模块23返回对应于该通信指令的控制指令,以使得观众客户端依照该控制指令执行相应的“分享”、“关注”等操作;或者,在本方案的一个实施例中,观众客户端的对应用户选定了字母、数字或对错的选项卡后,指令接收模块22会接收到观众客户端调用远程接口发送的对应于所述选项卡的通信指令,并通过反馈模块23返回对应于该通信指令的反馈信息。

进一步的,在本方案的一个实施例中,所述反馈模块23推送所述通信指令所对应的反馈信息时,随附后续的直播视频流推送所述反馈信息。例如,在本方案的一个示例性实施例中,观众客户端调用远程接口向服务器发送特征图像对应的选项卡的控制指令后,所述反馈模块23随附后续的直播视频流返回该选项卡所对应的反馈信息;不难理解,在服务器端预存有包含通信指令与反馈信息的对应关系表。

综上所述,在本方案中依据作用在直播视频画面的任意一个特征图像所在区域的操作事件,来确定该被选定的特征图像;并执行与该被选定的特征图像相对应的控制指令;即用户可以通过选定直播视频画面上的特征图像来与主播实现互动,扩展了基于视频直播的互动方式,方便用户操作,提高用户体验。

不难理解,上述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上,可以根据实际的需要选择其中的部分或者全部模块来实现不方案实施例的目的。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。

进一步的,请参考图7,其示出了本发明的一个实施例的终端的结构方框图,该终端用于实现上述基于视频直播的互动控制方法。为了便于说明,仅仅示出了与本发明实施例相关的部分,具体技术细节未揭示的,请参照本发明实施例方法部分。该终端可以为包括终端、平板电脑、PDA(Personal Digital Assistant,个人数字助理)、POS(Point of Sales,销售终端)、车载电脑等任意终端设备。

所述终端包括有:射频(Radio Frequency,RF)电路1210、存储器1220、输入单元1230、显示单元1240、传感器1250、音频电路1260、无线模块1270、处理器1280、以及电源1290等部件,其中无线模块1270可以但不限于是红外模块、蓝牙模块、无线保真(wireless fidelity,WiFi)模块等。本领域技术人员可以理解,图7中示出的终端结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

下面结合图7对终端的各个构成部件进行具体的介绍:

RF电路1210可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,给处理器1180处理;另外,将设计上行的数据发送给基站。通常,RF电路包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(Low Noise Amplifier,LNA)、双工器等。此外,RF电路1210还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯系统(Global System of Mobile communication,GSM)、通用分组无线服务(General Packet Radio Service,GPRS)、码分多址(Code Division Multiple Access,CDMA)、宽带码分多址(Wideband Code Division Multiple Access,WCDMA)、长期演进(Long Term Evolution,LTE))、电子邮件、短消息服务(Short Messaging Service,SMS)等。

存储器1220可用于存储软件程序以及模块,处理器1280通过运行存储在存储器1220的软件程序以及模块,从而执行终端的各种功能应用以及数据处理。存储器1220可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据终端的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器1220可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

输入单元1230可用于接收输入的数字或字符信息,以及产生与终端1200的用户设置以及功能控制有关的键信号输入。具体地,输入单元1230可包括触控面板1231以及其他输入设备1232。触控面板1231,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板1231上或在触控面板1231附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触控面板1231可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器1280,并能接收处理器1280发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板1231。除了触控面板1231,输入单元1230还可以包括其他输入设备1232。具体地,其他输入设备1232可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。

显示单元1240可用于显示由用户输入的信息或提供给用户的信息以及终端的各种菜单。显示单元1240可包括显示面板1241,可选的,可以采用液晶显示器(Liquid Crystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板1241。进一步的,触控面板1231可覆盖显示面板1241,当触控面板1231检测到在其上或附近的触摸操作后,传送给处理器1280以确定触摸事件的类型,随后处理器1280根据触摸事件的类型在显示面板1241上提供相应的视觉输出。虽然在图7中,触控面板1231与显示面板1241是作为两个独立的部件来实现终端的输入和输入功能,但是在某些实施例中,可以将触控面板1231与显示面板1241集成而实现终端的输入和输出功能。

终端1200还可包括至少一种传感器1250,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板1241的亮度,接近传感器可在终端移动到耳边时,关闭显示面板1241和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别终端姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于终端还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。

音频电路1260、扬声器1261,传声器1262可提供用户与终端之间的音频接口。音频电路1260可将接收到的音频数据转换后的电信号,传输到扬声器1261,由扬声器1261转换为声音信号输出;另一方面,传声器1262将收集的声音信号转换为电信号,由音频电路1160接收后转换为音频数据,再将音频数据输出处理器1280处理后,经RF电路1210以发送给比如另一终端,或者将音频数据输出至存储器1220以便进一步处理。

终端通过无线模块1270可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图7示出了无线模块1270,但是可以理解的是,其并不属于终端1200的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。

处理器1280是终端的控制中心,利用各种接口和线路连接整个终端的各个部分,通过运行或执行存储在存储器1220内的软件程序和/或模块,以及调用存储在存储器1220内的数据,执行终端的各种功能和处理数据,从而对终端进行整体监控。可选的,处理器1280可包括一个或多个处理单元;优选的,处理器1280可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器1280中。

终端1100还包括给各个部件供电的电源1290(比如电池),优选的,电源可以通过电源管理系统与处理器1280逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。

尽管未示出,终端1200还可以包括摄像头、蓝牙模块等,在此不再赘述。

在本发明实施例中,该终端所包括的处理器1280还具有以下功能:

根据接收到的直播视频流显示包含有至少一个特征图像的直播视频画面;

获取作用于任意一个所述的特征图像所在区域的操作事件;

响应于该操作事件,依据所述操作事件所作用的区域信息确定被选定的特征图像;

执行与被选定的特征图像相对应的控制指令。

具体的,所述操作事件包括触控操作事件。

进一步的,所述执行与被选定的特征图像相对应的控制指令的步骤,还包括:

调用远程接口向直播视频流提供方发送与所述被选定的特征图像相对应的通信指令。

更进一步的,所述方法还包括步骤:

接收推送的后续的直播视频流,所述后续的直播视频流对应的直播视频画面上显示有与所述通信指令对应的反馈信息。

具体的,所述响应于该操作事件,依据所述操作事件所作用的区域信息确定被选定的特征图像的步骤中,还包括:依据所述特征图像的颜色特征信息和/或分布特征信息来确定该特征图像。

进一步的,本实施例的处理器1280还可实现上述实施例的方法的其他步骤,处理器的具体作用和实现方式可参见上述方法部分的实施例,在此不做赘述。

在此处所提供的说明书中,虽然说明了大量的具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实施例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。

虽然上面已经示出了本发明的一些示例性实施例,但是本领域的技术人员将理解,在不脱离本发明的原理或精神的情况下,可以对这些示例性实施例做出改变,本发明的范围由权利要求及其等同物限定。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1