一种视频彩铃的处理方法、设备及计算机可读存储介质与流程

文档序号：23426649发布日期：2020-12-25 11:57阅读：166来源：国知局

本发明涉及通信技术领域，尤其涉及一种视频彩铃的处理方法、设备及计算机可读存储介质。

背景技术：

视频彩铃业务是一项由被叫用户定制，为主叫用户提供一段悦耳、多彩或有趣的视频媒体来替代普通网络回铃音的业务。在用户开通长期演进语音承载(voiceoverlong-termevolution，简称volte)功能后称为volte用户，volte用户在申请开通视频彩铃功能之后，可以自行设定个性化的视频彩铃，在其做被叫时的振铃阶段，系统为主叫用户播放其个性化设置的视频彩铃媒体。当被叫用户处于忙、不在服务区、关机等非空闲状态情况下时，仍播放原网络系统提供的通知。

目前，用户设置的视频彩铃，都是围绕自己的手机体验进行设置的，即用户都是从自己手机上测试的视频彩铃，而拨打电话时，主叫终端是不可预知的，存在无法保证视频彩铃在主叫终端中的播放效果的问题。

技术实现要素：

本发明实施例提供一种视频彩铃的处理方法、设备及计算机可读存储介质，以解决现有技术中无法保证视频彩铃在主叫终端上的播放效果的问题。

第一方面，本发明实施例提供了一种视频彩铃的处理方法，应用于彩铃平台，包括：

在接收到用户选择或上传的视频内容的情况下，获得所述视频内容对应的多个播放形式的彩铃文件；

在接收到主叫终端的呼叫请求的情况下，获取所述呼叫请求中携带的所述主叫终端的信息，所述主叫终端的信息包括设备类型信息和网络信号信息中的至少一种；

根据所述主叫终端的信息，从所述多个播放形式的彩铃文件中，确定与所述主叫终端的信息相适配的目标彩铃文件；

向所述主叫终端播放所述目标彩铃文件。

可选的，所述多个播放形式的彩铃文件包括以下至少一项：

所述视频内容对应的横屏格式视频文件；

所述视频内容对应的竖屏格式视频文件；

所述横屏格式视频文件对应的高清视频文件；

所述竖屏格式视频文件对应的高清视频文件；

所述视频内容对应的高清视频文件；

所述视频内容对应的非高清视频文件；

所述视频内容对应的音频文件。

可选的，所述彩铃平台包括中心节点和分布式节点；所述多个播放形式的彩铃文件包括所述视频内容对应的音频文件；

所述获得所述视频内容对应的多个播放形式的彩铃文件的步骤，包括：

通过中心节点，将所述视频内容进行音视频拆分，获得所述视频内容对应的音频文件和视频文件；

将所述音频文件存储在所述分布式节点。

可选的，所述彩铃平台包括中心节点和分布式节点；所述多个播放形式的彩铃文件包括所述视频内容对应的高清视频文件；

所述获得所述视频内容对应的多个播放形式的彩铃文件的步骤，包括：

通过所述中心节点，将所述视频内容进行音视频拆分，获得所述视频内容对应的音频文件和视频文件；

在所述分布式节点中，对所述视频文件进行预处理，获得所述视频内容的组成元素；

对所述组成元素进行高清化处理，获得所述视频内容的高清元素；

所述中心节点根据所述视频内容的高清元素，生成所述视频内容对应的高清视频文件。

可选的，所述高清化处理包括：人物高清化处理、动作高清化处理、场景高清化处理和情感组件高清化处理中的至少一项。

可选的，所述多个播放形式的彩铃文件包括所述视频内容对应的竖屏视频文件；

在所述视频内容为横屏格式的情况下，所述获得所述视频内容对应的多个播放形式的彩铃文件的步骤，包括：

将所述视频内容进行音视频拆分，获得所述视频内容对应的视频文件；

获取所述视频文件中的连续每帧视频图像的竖屏中心坐标和所述视频文件的目标视频片段的时间区间；

根据所述竖屏中心坐标和所述目标视频片段的时间区间，生成所述视频文件对应的竖屏格式视频文件。

可选的，所述获取所述视频文件的目标视频片段的时间区间的步骤，包括：

对所述视频文件进行镜头切换检测，获得所述视频文件的完整镜头的时间区间；

根据所述完整镜头的时间区间，通过预设算法获得所述视频文件的目标视频片段的时间区间；

其中，所述预设算法包括人物识别、动作识别、情感识别、场景识别和视频显著性检测中的至少一项。

可选的，所述获取所述视频文件中的连续每帧视频图像的竖屏中心坐标的步骤，包括：

对所述视频文件进行镜头切换检测，获得所述视频文件的完整镜头的时间区间；以及

获取用户偏好参数；

根据所述完整镜头的时间区间和所述用户偏好参数，获得所述视频文件对应的跟踪轨迹坐标；

对所述跟踪轨迹坐标进行拟合，获得所述视频文件中的连续每帧视频图像的竖屏中心坐标。

可选的，根据所述完整镜头的时间区间和所述用户偏好参数，获得所述视频文件对应的跟踪轨迹坐标的步骤，包括：

对所述视频文件中与所述用户偏好参数相关的目标人物和/或目标物体进行检测，获得所述视频文件中的所述目标人物和/或所述目标物体的跟踪轨迹坐标。

可选的，根据所述完整镜头的时间区间和所述用户偏好参数，获得所述视频文件对应的跟踪轨迹坐标的步骤，包括：

在所述视频文件中不包括与所述用户偏好参数相关的目标人物和/或目标物体的情况下，对所述视频文件进行显著性检测，获得所述视频文件中的图像动态显著区域的跟踪轨迹坐标。

可选的，所述根据所述主叫终端的信息，从所述多个播放形式的彩铃文件中，确定与所述主叫终端的信息相适配的目标彩铃文件的步骤，包括：

根据第一信息和/或第二信息，从所述多个播放形式的彩铃文件中，确定与所述主叫终端的信息相适配的目标彩铃文件；

其中，所述第一信息是根据所述设备类型信息确定的，所述第一信息用于指示所述主叫终端是否支持竖屏视频播放；

所述第二信息是根据所述网络信号信息确定的，所述第二信息用于指示所述主叫终端当前的网络信号是否满足高清播放条件。

可选的，所述根据所述主叫终端的信息，从所述多个播放形式的彩铃文件中，确定与所述主叫终端的信息相适配的目标彩铃文件的步骤，包括以下任意一项：

在根据所述设备类型信息，确定所述主叫终端支持竖屏视频播放的情况下，确定所述目标彩铃文件为所述视频内容对应的竖屏格式视频文件和所述视频内容对应的音频文件；

在根据所述设备类型信息，确定所述主叫终端不支持竖屏视频播放的情况下，确定所述目标彩铃文件为所述视频内容对应的横屏格式视频文件和所述视频内容对应的音频文件；

在根据所述设备类型信息，确定所述主叫终端不支持视频彩铃播放的情况下，确定所述目标彩铃文件为所述视频内容对应的音频文件；

在根据所述设备类型信息，确定所述主叫终端支持竖屏视频播放，且根据所述网络信号信息，确定所述主叫终端当前的网络信号满足高清播放条件的情况下，确定所述目标彩铃文件为所述竖屏格式视频文件对应的高清视频文件和所述视频内容对应的音频文件；

在根据所述设备类型信息，确定所述主叫终端支持竖屏视频播放，且根据所述网络信号信息，确定所述主叫终端当前的网络信号不满足高清播放条件的情况下，确定所述目标彩铃文件为所述视频内容对应的竖屏格式视频文件和所述视频内容对应的音频文件；

在根据所述设备类型信息，确定所述主叫终端不支持竖屏视频播放，且根据所述网络信号信息，确定所述主叫终端当前的网络信号满足高清播放条件的情况下，确定所述目标彩铃文件为所述横屏格式视频文件对应的高清视频文件和所述视频内容对应的音频文件；

在根据所述设备类型信息，确定所述主叫终端不支持竖屏视频播放，且根据所述网络信号信息，确定所述主叫终端当前的网络信号不满足高清播放条件的情况下，确定所述目标彩铃文件为所述视频内容对应的横屏格式视频文件和所述视频内容对应的音频文件；

在根据所述设备类型信息，确定所述主叫终端不支持视频彩铃播放条件的情况下，确定所述目标彩铃文件为所述视频内容对应的音频文件；

在所述网络信号信息，确定所述主叫终端当前的网络信号不满足视频彩铃播放条件的情况下，确定所述目标彩铃文件为所述视频内容对应的音频文件。

在根据所述网络信号信息，确定所述主叫终端当前的网络信号满足高清播放条件的情况下，确定所述目标彩铃文件为所述视频内容对应的高清视频文件和所述视频内容对应的音频文件；

在根据所述网络信号信息，确定所述主叫终端当前的网络信号不满足高清播放条件的情况下，确定所述目标彩铃文件为所述视频内容对应的非高清视频文件和所述视频内容对应的音频文件；

在根据所述网络信号信息，确定所述主叫终端当前的网络信号不满足视频彩铃播放条件的情况下，确定所述目标彩铃文件为所述视频内容对应的音频文件。

第二方面，本发明实施例还提供一种视频彩铃的处理设备，包括：收发机、存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序；所述处理器，用于读取存储器中的程序实现如上所述的视频彩铃的处理方法中的步骤。

第三方面，本发明实施例还提供一种计算机可读存储介质，所述计算机可读存储介质上存储计算机程序，所述计算机程序被处理器执行时实现如上所述的视频彩铃的处理方法中的步骤。

在本发明实施例中，在接收到用户选择或上传的视频内容的情况下，获得所述视频内容对应的多个播放形式的彩铃文件；在接收到主叫终端的呼叫请求的情况下，获取所述呼叫请求中携带的所述主叫终端的信息，所述主叫终端的信息包括设备类型信息和网络信号信息中的至少一种；根据所述主叫终端的信息，从所述多个播放形式的彩铃文件中，确定与所述主叫终端的信息相适配的目标彩铃文件；并向所述主叫终端播放所述目标彩铃文件。因此，本发明实施例的方案，可以根据主叫终端的信息，从多个播放形式的彩铃文件中，选择与主叫终端适配的目标彩铃文件，从而保证了用户设置的视频彩铃在主叫终端中的播放效果，有利于提升用户体验。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的横屏视频彩铃播放实景示意图；

图2是本发明实施例提供的竖屏视频彩铃播放实景示意图；

图3是本发明实施例提供的视频彩铃的处理方法的流程图之一；

图4是本发明实施例提供的视频彩铃的处理方法的流程图之二；

图5是本发明实施例提供的生成高清竖屏视频文件的流程图之一；

图6是本发明实施例提供的生成高清竖屏视频文件的流程图之二；

图7是本发明实施例提供的播放视频彩铃的处理流程图；

图8是本发明实施例提供的视频彩铃平台处理和准备待播放的彩铃的流程图；

图9是本发明实施例提供的视频彩铃的处理装置的结构图；

图10是本发明实施例提供的视频彩铃的处理设备的结构图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

为了便于理解本发明实施例，首先对视频彩铃和彩铃进行说明。

1)从功能范围的角度来说，视频彩铃和彩铃的功能范围是包含关系。具体的，视频彩铃是彩铃的升级，除了可以满足彩铃的所有功能之外，还可以支持视频的播放等。

2)从技术支撑的角度来说，视频彩铃和彩铃的技术支撑是不一样的。在主叫端寻呼被叫端的过程中，相比于彩铃的信令流程，视频彩铃的信令流程中至少增加了媒体资源能力协商和资源预留这两个过程。

3)从终端支撑的角度来说，视频彩铃的播放要求相应终端支持视频播放的能力，而彩铃的播放仅要求相应终端支持音频播放的能力即可。

4)从核心网承载的角度来说，视频彩铃可以分配带宽为974kbps的视频承载以及带宽为146kbps的音频承载；而彩铃仅分配了带宽为146kbps的音频承载。

综上可知，视频彩铃可以满足彩铃的所有要求，但是彩铃无法满足视频彩铃的所有要求。

需要说明的是，当用户订购volte视频彩铃业务后，不同场景下音、视频彩铃的播放情况具体可如下表1所示：

表1视频彩铃的播放场景

当用户通过手机终端拨打电话过程中播放视频彩铃，会基于主叫用户手机的设备机型显示，如显示方式可根据终端设备可分为横屏和竖屏。

如图1所示，其示出的是横屏视频彩铃播放实景示意图。横屏视频彩铃播放是在手机终端屏幕中间播放一段视频，视频格式是h.264格式，分辨率可以是720p，也可以是480p的。在手机终端屏幕上方视频外空白处是拨打的手机号码，在手机终端屏幕下方视频外空白处是拨打键盘如联系人、静音、拨号盘等。

如图2所示，其示出的是竖屏视频彩铃播放实景示意图，竖屏视频彩铃播放是在手机终端屏幕全屏播放一段视频，视频格式是h.264格式，分辨率可以是720p，也可以是480p的。在手机终端屏幕的该视频上方是拨打的手机号码，在手机终端屏幕该视频下方是拨打键盘如联系人、静音、拨号盘等。

目前，一般用户在设置视频彩铃时，都是围绕自己手机体验进行设置的，即用户都是从自己手机上测试视频彩铃，这就有一个问题，在接通电话时，对端的手机是不可预知的，这里有两种情况，一是用户自己的手机属于高端机型，对端的是比较陈旧的手机，二是用户自己的手机比较陈旧，对端的手机属于较新机型，可以得知，对端的视频彩铃肯定存在适配问题，从而不能保证视频彩铃在主叫终端上的播放效果。

基于上述问题，本发明实施例提供了一种视频彩铃的处理方法、设备及计算机可读存储介质，以解决现有技术中无法保证视频彩铃在主叫终端上的播放效果的问题。

具体的，参见图3，其示出的是本发明实施例提供的视频彩铃的处理方法的流程图。如图3中，该方法包括以下步骤：

步骤11，在接收到用户选择或上传的视频内容的情况下，获得所述视频内容对应的多个播放形式的彩铃文件；

例如，用户选择或上传的视频内容可以为用户通过手机终端内上的app(application，应用程序)上传的本地视频内容，或者用户选择的app内的某段视频内容。

其中，播放形式包括：横屏格式播放形式、竖屏格式播放形式、高清格式播放形式、音频格式播放形式等。

在本发明实施例中，所述多个播放形式的彩铃文件包括以下至少一项：

所述视频内容对应的横屏格式视频文件；

所述视频内容对应的竖屏格式视频文件；

所述横屏格式视频文件对应的高清视频文件；

所述竖屏格式视频文件对应的高清视频文件；

所述视频内容对应的高清视频文件；

所述视频内容对应的非高清视频文件；

所述视频内容对应的音频文件。

需要说明的是，多个播放形式的彩铃文件的共同来源都是用户选择或上传的视频内容。其中，横屏格式视频文件、竖屏格式视频文件、横屏格式视频文件对应的高清视频文件、竖屏格式视频文件对应的高清视频文件、视频内容对应的高清视频文件和视频内容对应的非高清视频文件均指不包括音频部分(拆分了音频部分)的视频文件。即本申请中获得的视频内容对应的音频文件只有一份，而不同播放形式的视频文件包括上述类型中的至少一种。

其中，非高清视频文件指分辨率低于一定阈值的视频文件，如物理分辨率在720p以下的普清视频文件等。

这样，有利于避免现有技术中为适配各种对端终端(被叫终端)而存储多套不同分辨率的同源视频彩铃、导致的存储资源浪费、效率较低、利用率不高且成本较大的问题，同时还能够解决储存冗余音频文件的问题，节省了大量的存储硬件资源。

步骤12，在接收到主叫终端的呼叫请求的情况下，获取所述呼叫请求中携带的所述主叫终端的信息，所述主叫终端的信息包括设备类型信息和网络信号信息中的至少一种；

在本发明实施例中，设备类型信息可以反映设备机型和屏幕参数等信息；网络信号信息用于反映主叫终端当前所处的网络的信号质量。

步骤13，根据所述主叫终端的信息，从所述多个播放形式的彩铃文件中，确定与所述主叫终端的信息相适配的目标彩铃文件；

步骤14，向所述主叫终端播放所述目标彩铃文件。

在本发明实施例中，在接收到用户选择或上传的视频内容的情况下，通过获得所述视频内容对应的多个播放形式的彩铃文件；进一步在接收到主叫终端的呼叫请求的情况下，通过获取所述呼叫请求中携带的所述主叫终端的信息，所述主叫终端的信息包括设备类型信息和网络信号信息中的至少一种；能够实现根据所述主叫终端的信息，从所述多个播放形式的彩铃文件中，确定与所述主叫终端的信息相适配的目标彩铃文件；并向所述主叫终端播放所述目标彩铃文件。这样，能够使主叫终端播放与主叫终端的信息相适配的彩铃文件，从而保证用户设置的视频彩铃在主叫终端中的播放效果，避免出现因彩铃文件与主叫终端不适配时产生的图像播放失真、播放卡顿等播放质量下降的情况，有利于提升用户体验。同时还能够解决现有视频彩铃为适配各种对端终端而存储多套不同分辨率的同源视频彩铃，导致的存储资源浪费、效率较低、利用率不高且成本较大的问题。

下面对上述步骤11进行介绍。

一、视频内容对应的音频文件的获得方式

在发明一实施例中，所述彩铃平台包括中心节点和分布式节点；所述多个播放形式的彩铃文件包括所述视频内容对应的音频文件；

上述步骤11，包括：

通过中心节点，将所述视频内容进行音视频拆分，获得所述视频内容对应的音频文件和视频文件；将所述音频文件存储在所述分布式节点。

在本发明实施例中，分布式节点为布置在用户所在地周边的节点，中心节点为彩铃中央平台。该实施例中，将视频内容对应的音频文件和视频文件分开，并将音频文件存储在分布式节点，待拨打过程中唤起。这样，在主叫终端的网络信号不佳，或者主叫终端不支持视频彩铃播放的情况下，可以通过分布式节点播放与视频内容同源的音频彩铃，一方面避免了由彩铃系统切换到传统待机振铃音系统的耗时，另一方面也避免播放用户不可自定义的传统振铃音，所带来的用户体验不高的问题；还一方面，能够满足用户实时秀出真我的需求，相比当前，有时会降为普通振铃音的方式，本申请所带来的用户体验提升较高。

二、视频内容对应的非高清视频文件的获得方式

在一实施例中，通过将所述视频内容进行音视频拆分，获得所述视频内容对应的音频文件和视频文件；

例如，可通过中心节点将所述视频内容进行音视频拆分。

进一步的，可根据该视频文件生成所述视频内容对应的非高清视频文件。

三、视频内容对应的竖屏视频文件的获得方式

在发明一实施例中，所述彩铃平台包括中心节点和分布式节点；所述多个播放形式的彩铃文件包括所述视频内容对应的竖屏视频文件；

如图4中，在所述视频内容为横屏格式的情况下，上述步骤11中，获得视频内容对应的竖屏视频文件，包括：

步骤111，将所述视频内容进行音视频拆分，获得所述视频内容对应的视频文件；

步骤112，获取所述视频文件中的连续每帧视频图像的竖屏中心坐标和所述视频文件的目标视频片段的时间区间；

步骤113，根据所述竖屏中心坐标和所述目标视频片段的时间区间，生成所述视频文件对应的竖屏格式视频文件。

本实施例中，根据输出的竖屏中心坐标与目标视频片段的时间区间进行抽帧、裁剪、合成、智能防抖等处理输出最终的视频内容对应的竖屏视频文件。其中，目标视频片段可以包括：精彩视频片段，或者满足一定条件的视频片段。

其中，上述步骤112中，获取所述视频文件的目标视频片段的时间区间的步骤，包括：

对所述视频文件进行镜头切换检测，获得所述视频文件的完整镜头的时间区间；根据所述完整镜头的时间区间，通过预设算法获得所述视频文件的目标视频片段的时间区间；其中，所述预设算法包括人物识别、动作识别、情感识别、场景识别和视频显著性检测中的至少一项。

本实施例中，完整镜头指一个完整场景或完整情节下的视频片段。基于完整镜头的时间区间获得的目标视频文件，能够保证目标视频文件的内容和情节不跳跃，有利于提高用户体验。

其中，上述步骤112中，获取所述视频文件中的连续每帧视频图像的竖屏中心坐标的步骤，包括：

对所述视频文件进行镜头切换检测，获得所述视频文件的完整镜头的时间区间；以及获取用户偏好参数；

根据所述完整镜头的时间区间和所述用户偏好参数，获得所述视频文件对应的跟踪轨迹坐标；

对所述跟踪轨迹坐标进行拟合，获得所述视频文件中的连续每帧视频图像的竖屏中心坐标。

本实施例中，用户偏好参数用于反映用户喜好的视频内容类型，示例性的，如游戏类内容，动漫真人秀类内容等。完整镜头指一个完整场景或完整情节下的视频片段。该实施例中，通过结合完整镜头的时间区间和用户偏好参数，能够从视频内容中获得用户喜好的且为完整的视频内容区间内的连续每帧视频图像的竖屏中心坐标，在保证用户喜好的同时，还能够保证视频情节不跳跃，有利于提升用户体验。

具体的，为了便于实现，可以将用户偏好参数转化为标识参数数据进行应用。

进一步的，上述根据所述完整镜头的时间区间和所述用户偏好参数，获得所述视频文件对应的跟踪轨迹坐标的步骤，包括以下两种方式：

方式一：

方式二：

这样，通过上述实施例中的两种方式，能够实现结合用户偏好参数，来获取视频文件对应的跟踪轨迹坐标，为获得用户喜好和期待的竖屏视频提供了基础，有利于提高用户体验。

进一步的，在生成竖屏视频文件后，所述方法还包括：

对生成的竖屏视频文件进行画面特效处理，以提高用户的使用体验。

具体的，画面特效处理包括：抖动、滤镜、迷幻、印象派、倒放和慢放等；以及通过目标分割，对特定的物体、局部画面实现美化效果。提供图像修复技术去除视频中不需要的物体或者文字；提供ocr技术对视频中的文字提供各种变幻效果，例如字幕自动填充颜色、高亮等；利用生成网络实现替换人脸等特效。

基于上述实施例，对于音频文件部分，所述方法还包括：

对生成的音频文件进行特效处理，以提高用户的使用体验。

具体的，音频特效处理包括：通过音频情感识别技术，增强重低音和高音等音频播放的效果，并根据识别结果自动加入一些dj特效音效。同时通过音乐风格识别提供相似风格的背景音乐供用户备选和替换。

四、对于视频内容对应的横屏视频文件的获得方式，需要说明的是，目前视频内容默认的一般为横屏格式，因此，本申请中对横屏视频文件的生成过程不做具体说明，具体可参考现有技术。

五、视频内容对应的高清视频文件以及横屏视频文件和竖屏视频文件对应的高清视频文件的获得方式

在一实施例中，所述彩铃平台包括中心节点和分布式节点；所述多个播放形式的彩铃文件包括所述视频内容对应的高清视频文件；

所述获得所述视频内容对应的多个播放形式的彩铃文件的步骤，包括：

通过所述中心节点，将所述视频内容进行音视频拆分，获得所述视频内容对应的音频文件和视频文件；

在所述分布式节点中，对所述视频文件进行预处理，获得所述视频内容的组成元素；

对所述组成元素进行高清化处理，获得所述视频内容的高清元素；

所述中心节点根据所述视频内容的高清元素，生成所述视频内容对应的高清视频文件。

具体的，所述高清化处理包括：人物高清化处理、动作高清化处理、场景高清化处理和情感组件高清化处理中的至少一项。

该实施例中，通过中心节点将所述视频内容进行音视频拆分，获得所述视频内容对应的音频文件和视频文件；进一步的，在分布式节点对该视频文件进行预处理及高清化处理，生成高清元素；在中心节点利用高清元素生成视频内容对应的高清视频文件。这样，利用分布式节点对视频文件进行异步预处理，智能异步生成高清视频元素，能够加快中心节点对视频进行高清化的处理效率，避免视频彩铃传输量大、耗时长、对端等待时间长的问题，在优化了视频品质的同时，大幅提升了用户体验。

在一实施例中，可利用分布式节点智能异步生成的高清视频元素(高清元素)，对视频内容对应的非高清视频文件、横屏和竖屏视频文件进行高清增强处理，获得视频内容对应的高清视频文件以及横屏视频文件和竖屏视频文件对应的高清视频文件。这样，能够加快中心节点对视频进行高清化的处理效率，避免视频彩铃传输量大、耗时长、对端等待时间长的问题，在优化了视频品质的同时，大幅提升了用户体验。

进一步的，对视频内容对应的非高清视频文件、横屏视频文件和竖屏视频文件进行高清增强的步骤，还包括：

采用超分辨率技术和增加每帧图像的尺寸的方式，生成对应的高清视频文件。

例如，对于竖屏视频文件来说，通过采用超分辨率技术，对视频内容对应的竖屏视频文件进行分辨率提升，并分别增加视频内容对应的竖屏视频文件中的每帧图像的尺寸，同时保证画面质量基本不下降，最后生成竖屏视频文件对应的高清视频文件。

下面对上述步骤13进行介绍，其中，步骤13包括：

根据第一信息和/或第二信息，从所述多个播放形式的彩铃文件中，确定与所述主叫终端的信息相适配的目标彩铃文件；

其中，所述第一信息是根据所述设备类型信息确定的，所述第一信息用于指示所述主叫终端是否支持竖屏视频播放；所述第二信息是根据所述网络信号信息确定的，所述第二信息用于指示所述主叫终端当前的网络信号是否满足高清播放条件。

该实施例中，能够根据主叫终端的设备类型和网络信号中的至少一项，来确定视频彩铃的播放形式，在主叫终端和网络信号具备相应条件时，优先播放体验更好的目标彩铃文件，例如，在主叫终端支持竖屏视频播放且主叫终端当前的网络信号满足高清播放条件时，可优先播放高清竖屏视频文件。这样，能够具有良好的适应能力，并有利于大幅提升用户体验。

具体的，主要上述步骤13可以包括以下三种方式：

方式a：根据设备类型信息，确定与主叫终端相匹配的目标彩铃文件，该方式具体可以包括以下3种情况的任意一种：

情况1：

情况2：

情况3：

在根据所述设备类型信息，确定所述主叫终端不支持视频彩铃播放的情况下，确定所述目标彩铃文件为所述视频内容对应的音频文件；

例如，主叫手机终端uea向被叫手机终端ueb所在的被叫域的视频彩铃平台，请求申请视频彩铃播放时，通过最近的视频彩铃分布式节点分析传递的呼叫请求中携带的主叫手机终端的设备类型信息。视频彩铃分布式节点处理和准备待播放的音频文件。同时，对支持竖屏播放格式的终端，自动播放视频内容对应的竖屏格式视频文件和视频内容对应的音频文件；对不支持竖屏播放格式的终端，自动播放视频内容对应的横屏格式视频文件和视频内容对应的音频文件；对不支持视频彩铃的终端，自动播放视频内容对应的音频文件。

其中，根据所述设备类型信息，确定所述主叫终端是否支持竖屏视频播放，可以包括：根据预设的不同设备类型与横屏格式和竖屏格式的对应关系，确定当前主叫终端的设备类型是否支持竖屏视频播放。可以理解，不同的设备类型，对应不同的屏幕参数(如屏幕分辨率)，从而匹配不同的播放形式(横屏形式/竖屏形式)。

上述实施例中，能根据主叫终端的设备类型来选择适配播放形式的目标彩铃文件，在主叫终端具备相应条件时，优先播放体验更好的目标彩铃文件，如满足条件时可优先播放竖屏视频文件。这样，能够具有良好的适应能力，并有利于大幅提升用户体验。

方式b：根据设备类型信息和网络信号信息，确定与主叫终端相匹配的目标彩铃文件，该方式具体可以包括以下6中情况中的任意一种：

情况1：

情况2：

情况3：

情况4：

情况5：

在根据所述设备类型信息，确定所述主叫终端不支持视频彩铃播放条件的情况下，确定所述目标彩铃文件为所述视频内容对应的音频文件；

情况6：

在所述网络信号信息，确定所述主叫终端当前的网络信号不满足视频彩铃播放条件的情况下，确定所述目标彩铃文件为所述视频内容对应的音频文件。

例如，主叫手机终端uea向被叫手机终端ueb所在的被叫域的视频彩铃平台，请求申请视频彩铃播放时，视频彩铃分布式节点处理和准备待播放的音频。同时，通过最近的视频彩铃分布式节点，根据网络信号信息，判断主叫端的网络信号情况，并分析传递的呼叫请求中的主叫手机终端的设备类型信息。根据主叫终端的设备类型和网络信号情况，选择合适的目标彩铃文件。

其中，判断当前网络信号满足高清播放的具体判断依据包括：主叫终端当前的网络信号为5g信号，或者主叫终端当前的网络信号为4g信号，且信号强度在-75dbm到-85dbm之间。

其中，判断当前的网络信号不满足视频彩铃播放条件的具体判断依据包括：主叫终端当前的网络信号为4g信号，且在-100dbm到-110dbm之间；或者主叫终端当前的网络信号为3g、2g等早期信号。

上述实施例中，能够根据主叫终端的设备类型和网络信号来选择视频彩铃播放形式，在主叫终端具备相应条件时，优先播放体验更好的目标彩铃文件，如满足条件时可优先播放高清竖屏视频文件。这样，能够具有良好的适应能力，并有利于大幅提升用户体验。

方式c：根据网络信号信息，确定与主叫终端相匹配的目标彩铃文件，该方式具体可以包括以下3中情况中的任意一种：

情况1：

情况2：

情况3：

例如，主叫手机终端uea向被叫手机终端ueb所在的被叫域的视频彩铃平台，请求申请视频彩铃播放时，分布式节点处理和准备待播放的音频。同时通过终端当前的网络信号情况，选择合适的目标彩铃文件。具体的，对支持高清播放条件的终端，自动播放视频内容对应的高清视频文件和视频内容对应的音频文件；对不支持高清播放格式的终端，自动播放视频内容对应的非高清视频文件和视频内容对应的音频文件；对不满足视频彩铃播放条件的终端，自动播放视频内容对应的音频文件。

上述实施例中，能够根据主叫终端当前的网络信号来选择视频彩铃播放形式，在主叫终端具备相应条件时，优先播放体验更好的目标彩铃文件，如满足条件时可优先播放高清视频文件。这样，能够具有良好的适应能力，并有利于大幅提升用户体验。

下面结合具体实施例，对生成高清竖屏视频文件的过程进行介绍。

如图5中，生成高清竖屏视频文件的过程主要包括以下流程：

流程1，用户通过手机终端内app上传本地视频内容，或选择app内某段视频内容，并传递用户喜好。

流程2，彩铃中央平台拆分用户上传的音视频文件，把音频文件转送至用户归属地的视频彩铃节点系统存储。

流程3，彩铃中央平台传递视频文件至分布式节点，请求对视频内容分析和高清预处理；

流程4，彩铃分布式节点中视频彩铃元素主系统对视频彩铃文件预处理，分析视频主要组成元素。

其中，彩铃分布式节点分为若干专业化功能单元组成，分为人物高清化处理单元，动作高清化处理单元，场景高清化处理单元，情感组件高清化处理等单元组成，可以基于时间维度，空间维度，特征元素边缘进行像素叠加，融合处理。

流程5，视频彩铃中央平台将剪辑后竖屏内容文件打标签，入库。

流程6，手机终端内app给用户展示处理后的视频彩铃内容效果。

上述实施例中，通视频彩铃中央平台针对用户选择或上传的视频内容进行音视频拆分，音频文件存储在就近的视频彩铃系统节点上，待拨打过程唤起；通过视频彩铃各分布式节点进行的高清元素识别和处理的流程，实现智能异步生成高清竖屏视频元素，能够丰富竖屏视频彩铃的素材，节约人工成本，简化用户操作，优化视频品质，同时也能够提高视频内容的处理效率，解决了视频彩铃传输量大、耗时长、对端等待时间长的问题，大幅的提升了用户体验。

具体的，如图6中，生成高清竖屏视频文件的详细过程可以包括如下步骤：

步骤1，彩铃中央平台接收用户上传的视频内容或选择的网上某段视频内容，接收用户喜好数据。

步骤2，视频彩铃文件预处理，将内容文件校验，并将用户喜好数据转为标识参数数据；

步骤3，请求视频内容处理，传递用户偏好数据对应的标识参数数据；

进一步的，视频彩铃中央平台调用算法原子能力,智能生成竖屏视频，并提供视频增强和特效功能。具体的，包括以下步骤：

步骤4.1，判断视频是否为竖屏标准格式视频，已经是竖屏标准格式的视频，则按照已设置的内容正常作为当前用户的视频彩铃版本，直接跳转到步骤6。

步骤4.2，对非竖屏标准格式的视频进行镜头切换检测，输出完整镜头的时间区间。

步骤4.3，根据步骤4.2得到的镜头时间区间和用户喜好参数，对人物、物体等进行识别检测确定要跟踪的目标人物、物体等，分别输出目标人物、物体、人脸/人头、运动物体变化的轨迹坐标；对于没有显著人物、物体的视频采用显著性检测，输出图像动态显著区域轨迹坐标。实现喜好跟踪。

步骤4.4，通过滤波算法对坐标进行拟合，最终输出连续每帧图片的中心坐标。

步骤4.5，根据镜头信息及人物识别、动作识别、情感识别、场景识别、视频显著性检测等基础算法能力的输出结果，综合分析预测视频中精彩片段的时间区间。

步骤4.6，根据输出的竖屏中心坐标与精彩片段的时间轴进行抽帧、裁剪、合成、智能防抖等处理输出最终的精彩竖屏短视频。

步骤4.7，根据用户的需要进行视频增强和特效操作，如果用户不需要这个操作，则跳转至步骤5。步骤4.7具体包括：

步骤4.7.1，对需要进行视频增强的视频进行超高清增强，对步骤4.6得到的视频采用超分辨率技术进行分辨率提升，增加每帧图像的尺寸，同时保证画面质量基本不下降。处理完成后重新合成竖屏短视频。

步骤4.7.2，对需要增加特效的视频进行画面特效处理，为步骤5.6得到的视频画面整体提供特定的播放效果，如：抖动，滤镜，迷幻，印象派，倒放，慢放等。并通过目标分割，对特定的物体、局部画面实现美化效果。提供图像修复技术去除视频中不需要的物体或者文字。提供ocr技术对视频中的文字提供各种变幻效果，例如字幕自动填充颜色、高亮等。利用生成网络实现替换人脸等特效。也可以不进行操作直接进入步骤4.7.3。

步骤4.7.3，对需要增加特效的音频进行音频特效处理，通过音频情感识别技术，增强重低音、高音等音频播放的效果，并根据识别结果自动加入一些dj特效音效。同时通过音乐风格识别提供相似风格的背景音乐供用户备选和替换。也可以不进行操作，处理完成后重新合成竖屏短视频。

步骤5，对文件内容、场景与喜好参数符合度、文件格式进行校验。

步骤6，内容文件打标签，入库。

步骤7，给用户展示预处理后的视频彩铃内容效果。

步骤8，用户确认。用户确认机器合成的高清竖屏视频彩铃内容是否符合期望。若是，则处理完成。若不是，用户可点击继续优化，处理流程将从第1步骤开始优化迭代。

上述实施例中，视频彩铃中央平台(中心节点)针对用户选择或上传的视频内容进行音视频拆分，视频彩铃的分布式节点对拆分后的视频文件进行的高清元素识别和处理的流程。通过彩铃分布式节点中的视频彩铃元素主系统对视频彩铃文件预处理，分析视频主要组成元素，能够自动化的、可根据用户喜好的、具有轨迹跟踪的完成高清竖屏彩铃生成。

下面结合具体实施例，对主叫终端拨打被叫终端时，彩铃平台的处理过程进行介绍。

需要指出，被叫终端ueb所在的被叫域的视频彩铃平台向主叫终端uea同步视频彩铃文件申请成功和准备好的响应的流程，与已现有流程一致。

其中，如图7中，用户拨打电话过程中播放视频彩铃的处理流程，主要包括以下流程：

流程1，主叫终端uea向被叫终端ueb建立拨打请求，传递主叫终端uea的网络参数；

流程2，被叫终端ueb向主叫终端uea进行资源预留响应；

流程3，主叫终端uea向被叫域的彩铃系统申请播放视频彩铃，传递主叫终端uea的机型和屏幕参数；

流程4，彩铃系统准备和处理待播放的视频彩铃；

流程5，彩铃系统向主叫终端uea进行视频彩铃文件协商响应；

流程6，彩铃系统向主叫终端uea发送播放视频彩铃指令；

流程7，在被叫摘机时，被叫终端ueb向主叫终端uea发送停止播放视频彩铃的指令；

流程8，主叫终端uea向被叫域的彩铃系统进行响应，彩铃系统停止彩铃播放。

具体的，如图8中，视频彩铃中央平台处理和准备待播放的彩铃文件的流程可以包括：

步骤a，视频彩铃分布式节点接收主叫终端uea的设备类型(机型、屏幕参数等)和网络信号信息。

步骤b，彩铃中央平台检查当前被叫号设置生效且要播放的视频彩铃是否为高清竖屏视频。

其中，若待播放的视频彩铃文件不是高清竖屏格式视频，且对端具备播放高清视频的条件，则进行步骤d1；

步骤c，若用户设置的待播放的视频彩铃文件是竖屏格式视频，彩铃中央平台检查当前主叫终端的设备类型是否支持竖屏格式视频。

其中，若当前主叫终端型号不支持竖屏视频，则进行步骤d2；若当前主叫终端型号支持竖屏视频，则进行步骤d3；若当前主叫终端型号不支持视频彩铃或者判断当前网络信号是否不满足视频彩铃播放，则进行步骤d4；

步骤d1,利用前期分布式节点生成的分析数据为该视频进行高清增益处理，生成竖屏格式视频文件对应的高清视频文件。应该指出，高清视频文件也可在用户设置视频彩铃时，提前生成并存储。

步骤d2，播放当前视频内容的横屏版本视频；

步骤d3，播放当前视频内容的竖屏版本视频；

步骤d4，发送指令到视频彩铃分布式节点，让归属地彩铃分布式节点播放当前视频内容的音频彩铃。

步骤e，将视频文件传递给主叫终端播放。

本发明实施例还提供了一种视频彩铃的处理装置。参见图9，图9是本发明实施例提供的视频彩铃的处理装置的结构图。由于视频彩铃的处理装置解决问题的原理与本发明实施例中视频彩铃的处理方法相似，因此该视频处理装置的实施可以参见方法的实施，重复之处不再赘述。

如图9所示，视频彩铃的处理装置900包括：

第一处理模块901，用于在接收到用户选择或上传的视频内容的情况下，获得所述视频内容对应的多个播放形式的彩铃文件；

获取模块902，用于在接收到主叫终端的呼叫请求的情况下，获取所述呼叫请求中携带的所述主叫终端的信息，所述主叫终端的信息包括设备类型信息和网络信号信息中的至少一种；

确定模块903，用于根据所述主叫终端的信息，从所述多个播放形式的彩铃文件中，确定与所述主叫终端的信息相适配的目标彩铃文件；

第二处理模块904，用于向所述主叫终端播放所述目标彩铃文件。

可选的，所述多个播放形式的彩铃文件包括以下至少一项：

所述视频内容对应的横屏格式视频文件；

所述视频内容对应的竖屏格式视频文件；

所述横屏格式视频文件对应的高清视频文件；

所述竖屏格式视频文件对应的高清视频文件；

所述视频内容对应的高清视频文件；

所述视频内容对应的非高清视频文件；

所述视频内容对应的音频文件。

可选的，所述彩铃平台包括中心节点和分布式节点；所述多个播放形式的彩铃文件包括所述视频内容对应的音频文件；

所述第一处理模块901包括：

第一处理子模块，用于通过中心节点，将所述视频内容进行音视频拆分，获得所述视频内容对应的音频文件和视频文件；

第二处理子模块，用于将所述音频文件存储在所述分布式节点。

可选的，所述彩铃平台包括中心节点和分布式节点；所述多个播放形式的彩铃文件包括所述视频内容对应的高清视频文件；

所述第一处理模块901包括：

第三处理子模块，用于通过所述中心节点，将所述视频内容进行音视频拆分，获得所述视频内容对应的音频文件和视频文件；

第四处理子模块，用于在所述分布式节点中，对所述视频文件进行预处理，获得所述视频内容的组成元素；

第五处理子模块，用于对所述组成元素进行高清化处理，获得所述视频内容的高清元素；

第六处理子模块，用于所述中心节点根据所述视频内容的高清元素，生成所述视频内容对应的高清视频文件。

可选的，所述高清化处理包括：人物高清化处理、动作高清化处理、场景高清化处理和情感组件高清化处理中的至少一项。

可选的，所述多个播放形式的彩铃文件包括所述视频内容对应的竖屏视频文件；在所述视频内容为横屏格式的情况下，所述第一处理模块801包括：

第七处理子模块，用于获取所述视频文件中的连续每帧视频图像的竖屏中心坐标和所述视频文件的目标视频片段的时间区间；第八处理子模块，用于根据所述竖屏中心坐标和所述目标视频片段的时间区间，生成所述视频文件对应的竖屏格式视频文件。

可选的，所述第七处理子模块包括：

第一处理单元，用于对所述视频文件进行镜头切换检测，获得所述视频文件的完整镜头的时间区间；

第二处理单元，用于根据所述完整镜头的时间区间，通过预设算法获得所述视频文件的目标视频片段的时间区间；其中，所述预设算法包括人物识别、动作识别、情感识别、场景识别和视频显著性检测中的至少一项。

可选的，所述第七处理子模块还包括：

第三处理单元，用于对所述视频文件进行镜头切换检测，获得所述视频文件的完整镜头的时间区间；以及

第四处理单元，用于获取用户偏好参数；

第五处理单元，用于根据所述完整镜头的时间区间和所述用户偏好参数，获得所述视频文件对应的跟踪轨迹坐标；

第六处理单元，用于对所述跟踪轨迹坐标进行拟合，获得所述视频文件中的连续每帧视频图像的竖屏中心坐标。

可选的，所述第五处理单元具体用于：对所述视频文件中与所述用户偏好参数相关的目标人物和/或目标物体进行检测，获得所述视频文件中的所述目标人物和/或所述目标物体的跟踪轨迹坐标。

可选的，所述第五处理单元还具体用于：在所述视频文件中不包括与所述用户偏好参数相关的目标人物和/或目标物体的情况下，对所述视频文件进行显著性检测，获得所述视频文件中的图像动态显著区域的跟踪轨迹坐标。

可选的，确定模块903包括：

第一确定子模块，用于根据第一信息和/或第二信息，从所述多个播放形式的彩铃文件中，确定与所述主叫终端的信息相适配的目标彩铃文件；

可选的，第一确定子模块包括：

第一确定单元，用于在根据所述设备类型信息，确定所述主叫终端支持竖屏视频播放的情况下，确定所述目标彩铃文件为所述视频内容对应的竖屏格式视频文件和所述视频内容对应的音频文件；

第二确定单元，用于在根据所述设备类型信息，确定所述主叫终端不支持竖屏视频播放的情况下，确定所述目标彩铃文件为所述视频内容对应的横屏格式视频文件和所述视频内容对应的音频文件；

第三确定单元，用于在根据所述设备类型信息，确定所述主叫终端不支持视频彩铃播放的情况下，确定所述目标彩铃文件为所述视频内容对应的音频文件；

可选的，第一确定子模块包括：

第四确定单元，用于在根据所述设备类型信息，确定所述主叫终端支持竖屏视频播放，且根据所述网络信号信息，确定所述主叫终端当前的网络信号满足高清播放条件的情况下，确定所述目标彩铃文件为所述竖屏格式视频文件对应的高清视频文件和所述视频内容对应的音频文件；

第五确定单元，用于在根据所述设备类型信息，确定所述主叫终端支持竖屏视频播放，且根据所述网络信号信息，确定所述主叫终端当前的网络信号不满足高清播放条件的情况下，确定所述目标彩铃文件为所述视频内容对应的竖屏格式视频文件和所述视频内容对应的音频文件；

第六确定单元，用于在根据所述设备类型信息，确定所述主叫终端不支持竖屏视频播放，且根据所述网络信号信息，确定所述主叫终端当前的网络信号满足高清播放条件的情况下，确定所述目标彩铃文件为所述横屏格式视频文件对应的高清视频文件和所述视频内容对应的音频文件；

第七确定单元，用于在根据所述设备类型信息，确定所述主叫终端不支持竖屏视频播放，且根据所述网络信号信息，确定所述主叫终端当前的网络信号不满足高清播放条件的情况下，确定所述目标彩铃文件为所述视频内容对应的横屏格式视频文件和所述视频内容对应的音频文件；

第八确定单元块，用于在根据所述设备类型信息，确定所述主叫终端不支持视频彩铃播放条件的情况下，确定所述目标彩铃文件为所述视频内容对应的音频文件；

第九确定单元，用于在所述网络信号信息，确定所述主叫终端当前的网络信号不满足视频彩铃播放条件的情况下，确定所述目标彩铃文件为所述视频内容对应的音频文件。

可选的，第一确定子模块包括：

第十确定单元，用于在根据所述网络信号信息，确定所述主叫终端当前的网络信号满足高清播放条件的情况下，确定所述目标彩铃文件为所述视频内容对应的高清视频文件和所述视频内容对应的音频文件；

第十一确定单元，用于在根据所述网络信号信息，确定所述主叫终端当前的网络信号不满足高清播放条件的情况下，确定所述目标彩铃文件为所述视频内容对应的非高清视频文件和所述视频内容对应的音频文件；

第十二确定单元，用于在根据所述网络信号信息，确定所述主叫终端当前的网络信号不满足视频彩铃播放条件的情况下，确定所述目标彩铃文件为所述视频内容对应的音频文件。

本发明实施例提供的装置，可以执行上述方法实施例，其实现原理和技术效果类似，本实施例此处不再赘述。

如图10所示，本发明实施例的视频彩铃的处理设备，包括：收发机1010、处理器1000、存储器1020及存储在所述存储器1020上并可在所述处理器1000上运行的计算机程序，所述处理器1000执行所述计算机程序时实现上述的视频处理方法的步骤。具体的，处理器1000用于读取存储器1020中的程序，执行下列过程：

在接收到用户选择或上传的视频内容的情况下，获得所述视频内容对应的多个播放形式的彩铃文件；

根据所述主叫终端的信息，从所述多个播放形式的彩铃文件中，确定与所述主叫终端的信息相适配的目标彩铃文件；

向所述主叫终端播放所述目标彩铃文件。

收发机1010，用于在处理器1000的控制下接收和发送数据。

其中，在图7中，总线架构可以包括任意数量的互联的总线和桥，具体由处理器1000代表的一个或多个处理器和存储器1020代表的存储器的各种电路链接在一起。总线架构还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起，这些都是本领域所公知的，因此，本文不再对其进行进一步描述。总线接口提供接口。收发机1010可以是多个元件，即包括发送机和收发机，提供用于在传输介质上与各种其他装置通信的单元。处理器1000负责管理总线架构和通常的处理，存储器1020可以存储处理器1000在执行操作时所使用的数据。

处理器1000负责管理总线架构和通常的处理，存储器1020可以存储处理器1000在执行操作时所使用的数据。

可选的，所述多个播放形式的彩铃文件包括以下至少一项：

所述视频内容对应的横屏格式视频文件；

所述视频内容对应的竖屏格式视频文件；

所述横屏格式视频文件对应的高清视频文件；

所述竖屏格式视频文件对应的高清视频文件；

所述视频内容对应的高清视频文件；

所述视频内容对应的非高清视频文件；

所述视频内容对应的音频文件。

可选的，所述彩铃平台包括中心节点和分布式节点；所述多个播放形式的彩铃文件包括所述视频内容对应的音频文件；处理器1000还用于读取所述计算机程序，执行如下步骤:

通过中心节点，将所述视频内容进行音视频拆分，获得所述视频内容对应的音频文件和视频文件；

将所述音频文件存储在所述分布式节点。

可选的，所述彩铃平台包括中心节点和分布式节点；所述多个播放形式的彩铃文件包括所述视频内容对应的高清视频文件；处理器1000还用于读取所述计算机程序，执行如下步骤:

通过所述中心节点，将所述视频内容进行音视频拆分，获得所述视频内容对应的音频文件和视频文件；

在所述分布式节点中，对所述视频文件进行预处理，获得所述视频内容的组成元素；

对所述组成元素进行高清化处理，获得所述视频内容的高清元素；

所述中心节点根据所述视频内容的高清元素，生成所述视频内容对应的高清视频文件。

可选的，所述高清化处理包括：人物高清化处理、动作高清化处理、场景高清化处理和情感组件高清化处理中的至少一项。

可选的，所述多个播放形式的彩铃文件包括所述视频内容对应的竖屏视频文件；在所述视频内容为横屏格式的情况下，处理器1000还用于读取所述计算机程序，执行如下步骤:

将所述视频内容进行音视频拆分，获得所述视频内容对应的视频文件；

获取所述视频文件中的连续每帧视频图像的竖屏中心坐标和所述视频文件的目标视频片段的时间区间；

根据所述竖屏中心坐标和所述目标视频片段的时间区间，生成所述视频文件对应的竖屏格式视频文件。

处理器1000还用于读取所述计算机程序，执行如下步骤:

对所述视频文件进行镜头切换检测，获得所述视频文件的完整镜头的时间区间；

根据所述完整镜头的时间区间，通过预设算法获得所述视频文件的目标视频片段的时间区间；

其中，所述预设算法包括人物识别、动作识别、情感识别、场景识别和视频显著性检测中的至少一项。

处理器1000还用于读取所述计算机程序，执行如下步骤:

对所述视频文件进行镜头切换检测，获得所述视频文件的完整镜头的时间区间；以及

获取用户偏好参数；

根据所述完整镜头的时间区间和所述用户偏好参数，获得所述视频文件对应的跟踪轨迹坐标；

对所述跟踪轨迹坐标进行拟合，获得所述视频文件中的连续每帧视频图像的竖屏中心坐标。

处理器1000还用于读取所述计算机程序，执行如下步骤:

根据第一信息和/或第二信息，从所述多个播放形式的彩铃文件中，确定与所述主叫终端的信息相适配的目标彩铃文件；

其中，所述第一信息是根据所述设备类型信息确定的，所述第一信息用于指示所述主叫终端是否支持竖屏视频播放；

所述第二信息是根据所述网络信号信息确定的，所述第二信息用于指示所述主叫终端当前的网络信号是否满足高清播放条件。

处理器1000还用于读取所述计算机程序，执行如下步骤:

在根据所述设备类型信息，确定所述主叫终端不支持视频彩铃播放的情况下，确定所述目标彩铃文件为所述视频内容对应的音频文件；

处理器1000还用于读取所述计算机程序，执行如下步骤:

在根据所述设备类型信息，确定所述主叫终端不支持视频彩铃播放条件的情况下，确定所述目标彩铃文件为所述视频内容对应的音频文件；

在所述网络信号信息，确定所述主叫终端当前的网络信号不满足视频彩铃播放条件的情况下，确定所述目标彩铃文件为所述视频内容对应的音频文件。

处理器1000还用于读取所述计算机程序，执行如下步骤:

本发明实施例提供的设备，可以执行上述方法实施例，其实现原理和技术效果类似，本实施例此处不再赘述。

此外，本发明实施例的计算机可读存储介质，用于存储计算机程序，所述计算机程序可被处理器执行实现以下步骤：

在接收到用户选择或上传的视频内容的情况下，获得所述视频内容对应的多个播放形式的彩铃文件；

根据所述主叫终端的信息，从所述多个播放形式的彩铃文件中，确定与所述主叫终端的信息相适配的目标彩铃文件；

向所述主叫终端播放所述目标彩铃文件。

其中，所述多个播放形式的彩铃文件包括以下至少一项：

所述视频内容对应的横屏格式视频文件；

所述视频内容对应的竖屏格式视频文件；

所述横屏格式视频文件对应的高清视频文件；

所述竖屏格式视频文件对应的高清视频文件；

所述视频内容对应的高清视频文件；

所述视频内容对应的非高清视频文件；

所述视频内容对应的音频文件。

其中，所述彩铃平台包括中心节点和分布式节点；所述多个播放形式的彩铃文件包括所述视频内容对应的音频文件；所述获得所述视频内容对应的多个播放形式的彩铃文件的步骤，包括：

通过中心节点，将所述视频内容进行音视频拆分，获得所述视频内容对应的音频文件和视频文件；

将所述音频文件存储在所述分布式节点。

其中，所述彩铃平台包括中心节点和分布式节点；所述多个播放形式的彩铃文件包括所述视频内容对应的高清视频文件；

所述获得所述视频内容对应的多个播放形式的彩铃文件的步骤，包括：

通过所述中心节点，将所述视频内容进行音视频拆分，获得所述视频内容对应的音频文件和视频文件；

在所述分布式节点中，对所述视频文件进行预处理，获得所述视频内容的组成元素；

对所述组成元素进行高清化处理，获得所述视频内容的高清元素；

所述中心节点根据所述视频内容的高清元素，生成所述视频内容对应的高清视频文件。

其中，所述高清化处理包括：人物高清化处理、动作高清化处理、场景高清化处理和情感组件高清化处理中的至少一项。

其中，所述多个播放形式的彩铃文件包括所述视频内容对应的竖屏视频文件；在所述视频内容为横屏格式的情况下，所述获得所述视频内容对应的多个播放形式的彩铃文件的步骤，包括：

将所述视频内容进行音视频拆分，获得所述视频内容对应的视频文件；

获取所述视频文件中的连续每帧视频图像的竖屏中心坐标和所述视频文件的目标视频片段的时间区间；

根据所述竖屏中心坐标和所述目标视频片段的时间区间，生成所述视频文件对应的竖屏格式视频文件。

其中，所述获取所述视频文件的目标视频片段的时间区间的步骤，包括：

对所述视频文件进行镜头切换检测，获得所述视频文件的完整镜头的时间区间；

根据所述完整镜头的时间区间，通过预设算法获得所述视频文件的目标视频片段的时间区间；其中，所述预设算法包括人物识别、动作识别、情感识别、场景识别和视频显著性检测中的至少一项。

其中，所述获取所述视频文件中的连续每帧视频图像的竖屏中心坐标的步骤，包括：

对所述视频文件进行镜头切换检测，获得所述视频文件的完整镜头的时间区间；以及

获取用户偏好参数；

根据所述完整镜头的时间区间和所述用户偏好参数，获得所述视频文件对应的跟踪轨迹坐标；

对所述跟踪轨迹坐标进行拟合，获得所述视频文件中的连续每帧视频图像的竖屏中心坐标。

其中，根据所述完整镜头的时间区间和所述用户偏好参数，获得所述视频文件对应的轨迹坐标的步骤，包括：

其中，根据所述完整镜头的时间区间和所述用户偏好参数，获得所述视频文件对应的跟踪轨迹坐标的步骤，包括：

其中，所述根据所述主叫终端的信息，从所述多个播放形式的彩铃文件中，确定与所述主叫终端的信息相适配的目标彩铃文件的步骤，包括：

根据第一信息和/或第二信息，从所述多个播放形式的彩铃文件中，确定与所述主叫终端的信息相适配的目标彩铃文件；

其中，所述第一信息是根据所述设备类型信息确定的，所述第一信息用于指示所述主叫终端是否支持竖屏视频播放；

所述第二信息是根据所述网络信号信息确定的，所述第二信息用于指示所述主叫终端当前的网络信号是否满足高清播放条件。

其中，所述根据所述主叫终端的信息，从所述多个播放形式的彩铃文件中，确定与所述主叫终端的信息相适配的目标彩铃文件的步骤，包括以下任意一项：

在根据所述设备类型信息，确定所述主叫终端不支持视频彩铃播放的情况下，确定所述目标彩铃文件为所述视频内容对应的音频文件；

在根据所述设备类型信息，确定所述主叫终端不支持视频彩铃播放条件的情况下，确定所述目标彩铃文件为所述视频内容对应的音频文件；

在所述网络信号信息，确定所述主叫终端当前的网络信号不满足视频彩铃播放条件的情况下，确定所述目标彩铃文件为所述视频内容对应的音频文件。

上述方案，相较于现有技术至少具备以下优势：

1.解决了现有技术中，因多数视频彩铃的全屏视频播放像素低，导致的模糊不清的问题。

2.解决了现有技术中，视频彩铃为适配各种对端终端而存储多套不同分辨率的同源视频彩铃文件的问题以及储存冗余音频文件的问题，能够节省大量的存储硬件资源。

3.解决了现有技术中，视频彩铃传输量大，耗时长，对端等待时间长的问题，大幅提升用户体验。

4.解决了现有技术中，视频彩铃传在网络不佳，或者对端终端不支持视频彩铃而为之播放传统振铃音的问题，满足实时秀出真我的用户需求，大幅提升用户体验。

5.避免了现有技术中，为解决终端适配而大量存量视频彩铃文件的问题，因此能够避免为所有对端终端提供离线处理的过程，而该过程耗时巨大，耗费资源巨大，并且这么多适配性的视频彩铃文件的利用率不高，但成本投入巨大。

6.主叫拨打被叫过程中，本提案的视频彩铃中央平台能根据主叫终端的类型来选择视频彩铃的播放形式，所以在主叫终端具备相应条件时，能够优先播放体验更好的高清竖屏视频彩铃。

7.本提案在用户设置过程中，利用视频彩铃的分布式节点，智能异步生成高清竖屏视频元素，丰富了竖屏视频彩铃的素材，节约了人工成本，简化了用户操作，优化了视频品质；在主叫拨打被叫过程中，因能根据主叫手机型号来选择播放形式，所以具有良好的适应能力。

在本申请所提供的几个实施例中，应该理解到，所揭露方法和装置，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理包括，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

上述以软件功能单元的形式实现的集成的单元，可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述收发方法的部分步骤。而前述的存储介质包括：u盘、移动硬盘、只读存储器(read-onlymemory，简称rom)、随机存取存储器(randomaccessmemory，简称ram)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明所述原理的前提下，还可以作出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李琳;周效军;苏毅;吴耀华;李鹏飞
技术所有人：咪咕文化科技有限公司;中国移动通信集团有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。