一种基于摘机时长预测算法的视频彩铃播放方法与流程

文档序号：31205096发布日期：2022-08-20 02:28阅读：155来源：国知局

1.本发明属于视频彩铃提取技术领域，具体的说是一种基于摘机时长预测算法的视频彩铃播放方法。

背景技术：

2.目前电信通话存在以下不足：
3.1、缺乏对被叫摘机时长的预测(过去直接拿某次的接通时长或多次的均值作为了对应用户的摘机时长)；
4.2、基于传统数据清洗算法解决数据中的缺失值、异常值、无数据等数据质量问题；
5.3、特征的选择是至关重要的，对预测结果影响巨大；
6.4、主叫用户无法完整播放整个视频彩铃、无法接受到视频彩铃关键片段，接收到的信息并不完整。

技术实现要素：

7.为了解决现有技术的不足，本发明提出的一种基于摘机时长预测算法的视频彩铃播放方法，采用视频精彩片段提取技术，根据被叫用户摘机时长预测编制新的视频彩铃内容，让用户观接受到更多的关键视频内容信息。
8.本发明所述的一种基于摘机时长预测算法的视频彩铃播放方法，包括如下步骤：
9.s1、数据获取步骤，从用户数据后台获取所有的必要数据特征信息并输出为csv数据格式；
10.s2、对获取的用户特征数据完成质量控制，通过传统数据清洗算法解决用户数据信息的空缺值、异常值、无数据的问题，获得经过质量控制的用户数据信息；
11.s3、对获取的质量控制数据进行关键特征筛选，并提取对应的关键特征数据作为回归拟合数据；
12.s4、被叫用户摘机时长预测算法的计算；
13.s5、根据预测的被叫用户摘机时长对视频彩铃进行精彩片段提取播放。
14.优选的，s1的具体步骤如下：
[0015]ⅰ、首先打开数据库查询窗口，输出需要导出数据的结构化查询语言structured query language语句；
[0016]ⅱ、检索的结果中复制所有查询出来的数据并将结果另存为comma-separated valuescsv文本文件并导出。
[0017]
优选的，s2获得经过质量控制的用户数据信息方法如下：
[0018]ⅰ、利用邻近插值和平均值插值的方法解决空缺值，邻近插值是利用相邻的数据值进行插值，平均值插值为利用该维特征的平均值进行插；
[0019]ⅱ、利用自设计阈值判断异常值，电话拨打时长最大长度为54s若超过该阈值则为异常值，同时负值与非正常数值都为异常值；
[0020]ⅲ、通过整体用户的接通时长的均值或中值完成对无数据用户的电话接通时长填充。
[0021]
优选的，s3中关键特征数据包含：1、摘机时长；2、当日的时间节点；3、性别；4、周一至周末；5、用户的电话接通时长的真值。
[0022]
优选的，s4中被叫用户摘机时长预测算法步骤如下：
[0023]ⅰ、通过在通信方面的多年经验、和对大数据的观察与分析，进行了用户摘机时长的关键特征信息的筛选，并建立摘机时长预测的多维特征数据集，同时某些语义特征要转换为对应的数字特征；
[0024]ⅱ、将建立的用户多维特征数据集分别打上对应的标签，让每个特征向量都有对应的摘机时长真值标签，数据集包含四个维度的特征、并对应一个电话接通时长的真值；
[0025]ⅲ、数据集作为lassoregression回归模型的输入，经过对模型的训练学习与参数更新获得最终模型参数，并获得回归预测结果，回归结果即为对用户电话接通时长的预测结果；回归模型是从多维特征数据中获取经过训练的参数模型，lassoregression的回归误差公式如下:
[0026][0027]ⅳ、将测试集送入训练好的模型预测，判断模型回归效果，主要通过均方误差meansquarederror，mse、均方根误差rootmeansquarederror，rmse、或者r-square系数进行评估，公式如下：
[0028][0029][0030][0031]
优选的，s5具体步骤如下：
[0032]ⅰ、通过将短视频拆帧，利用降维算法对每一帧画面进行数据降维后放入数组，得到代表整个视频数据的二维特征向量，并根据每一帧的时序信息为该特征向量添加一个代表时间的维度得到三维特征向量，这个三维特征向量代表了短视频的特征信息；
[0033]ⅱ、针对短视频特征基于k-means算法即k均值算法，根据时间特征，在保留时序信息的基础上对该三维特征向量进行无监督聚类，其聚类类别的数量也是自适应的，从而提取出多个视频片段，这些片段就是该短视频的精彩片段；
[0034]ⅲ、在预测出用户接通电话时长的基础上，对视频片段按时序进行拼接，根据各视频片段的时长整合出不少于且最近预测时长的精彩视频，通过对视频彩铃内容的压缩和提取可以让电话拨通方的用户在有限的时间获取尽可能多的视频信息。
[0035]
优选的，k-means算法步骤如下：
[0036]ⅰ、在时间序列上均匀选取n个聚类中心点，n是总帧数的三分之一；
[0037]ⅱ、计算每个聚类中心点t邻域内的平均值，t是中心点间距的二分之一；
[0038]ⅲ、若相邻簇的平均值差值的绝对值小于设置的阈值t，则合并这两个簇；
[0039]ⅳ、迭代重复步骤ⅱ、ⅲ直至不再产生新的簇；
[0040]
ⅴ
、根据各个簇内样本点的数量，取top k的簇作为短视频的精彩片段。
[0041]
本发明的有益效果如下：
[0042]
本发明利用传统数据清洗技术，解决了由于数据采集错误和用户信息缺陷造成的视频彩铃用户数据质量问题，并获得良好的用户数据信息；为了解决用户摘机时长预测问题，选取了关键的多维特征并结合机器学习回归模型完成了拟合预测；基于对用户摘机时长的估计实现，解决了对视频彩铃推送时长的估计问题，在彩铃推送过程中可以根据视频内容语义生成新的视频彩铃内容，向主叫推送含义丰富的视频内容信息。
[0043]
首次基于数据清洗与机器学习回归算法完成对接通时长的预测；经大数据分析选择了四种关键的特征，对提升预测精度起着重要作用；lasso regressiong具有较强的稀疏性，利用该算法解决了对相关性较强的特征系数处理；利用k-means算法解决对视频精彩片段的提取，该算法计算速度较快，实际提取效果也较好。
附图说明
[0044]
下面结合附图对本发明作进一步说明。
[0045]
图1是本发明的流程图。
具体实施方式
[0046]
为使本发明实施例的目的、技术手段和优点更加清楚，对本发明实施例中的技术方案进行清楚、完整的描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
[0047]
本发明实施例通过提供一种基于摘机时长预测算法的视频彩铃播放方法，采用视频精彩片段提取技术，根据被叫用户摘机时长预测编制新的视频彩铃内容，让用户观接受到更多的关键视频内容信息。
[0048]
为了更好的理解上述技术方案，下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。
[0049]
如图1所示，本发明所述的一种基于摘机时长预测算法的视频彩铃播放方法，包括如下步骤：
[0050]
s1、数据获取步骤，从用户数据后台获取所有的必要数据特征信息并输出为csv数据格式。具体步骤:首先打开数据库查询窗口，输出需要导出数据的structured querylanguage(结构化查询语言，sql)语句，接下来在检索的结果中复制所有查询出来的数据并将结果另存为comma-separated values(csv)文本文件并导出。
[0051]
(2)对获取的用户特征数据完成质量控制，通过传统数据清洗算法解决用户数据信息的空缺值、异常值、无数据的问题，获得经过质量控制的用户数据信息步骤如下：
[0052]
1、利用邻近插值和平均值插值的方法解决空缺值，邻近插值是利用相邻的数据值
进行插值，平均值插值为利用该维特征的平均值进行插值；
[0053]
2、利用自设计阈值判断异常值，电话拨打时长最大长度为54s若超过该阈值则为异常值，同时负值与非正常数值都为异常值。
[0054]
3、通过整体用户的接通时长的均值或中值完成对无数据用户的电话接通时长填充。
[0055]
s3、对获取的质量控制数据进行关键特征筛选，并提取对应的关键特征数据作为回归拟合数据。关键特征数据包含：1、摘机时长；2、当日的时间节点(上午6-12、下午12-19、晚上&凌晨19-6)；3、性别；4、周一至周末(工作日或者周末)；5、用户的电话接通时长的真值。
[0056]
s4、被叫用户摘机时长预测算法的具体步骤如下：
[0057]
首先，通过我们在通信方面的多年经验、和对大数据的观察与分析，我们进行了用户摘机时长的关键特征信息的筛选，并建立摘机时长预测的多维特征数据集。同时某些语义特征要转换为对应的数字特征。可参见下表。
[0058]
用户数据质控数表
[0059]
用户x1(通话)x2(性别)x3(时间点)x4(是否工作日)y(接通)a050s1115sa130s23110sa2120s12220s
[0060]
然后，将建立的用户多维特征数据集分别打上对应的标签，让每个特征向量都有对应的摘机时长真值标签。数据集包含四个维度的特征、并对应一个电话接通时长的真值。
[0061]
接下来，数据集作为lassoregression回归模型的输入，经过对模型的训练学习与参数更新获得最终模型参数，并获得回归预测结果，回归结果即为对用户电话接通时长的预测结果。回归模型是从多维特征数据中获取经过训练的参数模型。lassoregression的回归误差公式如下:
[0062][0063]
最后，将测试集送入训练好的模型预测。判断模型回归效果，主要通过均方误差(meansquarederror，mse)、均方根误差(rootmeansquarederror，rmse)、或者r-square系数进行评估。公式如下：
[0064][0065][0066][0067]
s5、根据预测的被叫用户摘机时长对视频彩铃进行精彩片段提取，具体步骤如下：
[0068]
首先，本发明通过将短视频拆帧，利用降维算法对每一帧画面进行数据降维后放入数组，得到代表整个视频数据的二维特征向量。并根据每一帧的时序信息为该特征向量添加一个代表时间的维度得到三维特征向量。这个三维特征向量代表了短视频的特征信息。
[0069]
其次，针对短视频特征基于k-means(k均值)算法，对算法进行改进，传统k-means 算法是根据到样本点到簇内中心的距离进行迭代聚类，但该方法应用到短视频数据中会打乱其时序信息。改进后的聚类算法可根据时间特征，在保留时序信息的基础上对该三维特征向量进行无监督聚类，其聚类类别的数量也是自适应的，从而提取出多个视频片段，这些片段就是该短视频的精彩片段。
[0070]
k-means算法改进后的具体步骤如下：
[0071]
1、在时间序列上均匀选取n个聚类中心点，n是总帧数的三分之一；
[0072]
2、计算每个聚类中心点t邻域内的平均值，t是中心点间距的二分之一；
[0073]
3、若相邻簇的平均值差值的绝对值小于设置的阈值t，则合并这两个簇；
[0074]
4、迭代重复步骤2、3直至不再产生新的簇；
[0075]
5、根据各个簇内样本点的数量，取top k的簇作为短视频的精彩片段。
[0076]
最后，在预测出用户接通电话时长t的基础上，对视频片段按时序进行拼接，根据各视频片段的时长整合出不少于且最近预测时长t的精彩视频。通过对视频彩铃内容的压缩和提取可以让电话拨通方的用户在有限的时间获取尽可能多的视频信息。
[0077]
以上显示和描述了本发明的基本原理、主要特征和优点。本行业的技术人员应该了解，本发明不受上述实施例的限制，上述实施例和说明书中描述的只是说明本发明的原理，在不脱离本发明精神和范围的前提下，本发明还会有各种变化和改进，这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李韩张晶晶庞文刚乔治邹西山李雪欣罗岚弋翔陈星林泽涛罗志亮张杰辉温雪阳张寒
技术所有人：联通沃音乐文化有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。