一种用户分类方法及系统与流程

文档序号：12628612阅读：501来源：国知局

本发明涉及互联网技术领域，特别涉及一种用户分类方法及系统。

背景技术：

随着互联网技术的发展，交互变的越来越重要。在线的交互，已经成为日益重要的沟通模式。为了满足广大用户信息交互的需要，各种交互软件或者沟通软件应运而生。

微信是腾讯公司推出的一个为智能终端提供即时通讯服务的免费应用程序，微信支持跨通信运营商、跨操作系统平台通过网络快速发送免费(需消耗少量网络流量)语音短信、视频、图片和文字，同时，也可以使用通过共享流媒体内容的资料和基于位置的社交插件等服务插件。微信提供公众平台、朋友圈、消息推送等功能，用户可以通过“摇一摇”、“搜索号码”、“附近的人”、扫二维码方式添加好友和关注公众平台，同时微信将内容分享给好友以及将用户看到的精彩内容分享到微信朋友圈。

微信作为时下最热门的社交信息平台，也是移动端的一大入口，正在演变成为一大商业交易平台，其对营销行业带来的颠覆性变化开始显现。微信商城的开发也随之兴起，微信商城是基于微信而研发的一款社会化电子商务系统，消费者只要通过微信平台，就可以实现商品查询、选购、体验、互动、订购与支付的线上线下一体化服务模式。

微信目前推出了摇一摇搜索歌曲或搜索电视功能，打开微信→朋友们→摇一摇,然后开启摇一摇搜歌或电视，然后把手机放到能听到歌曲或电视的地方，等待一会就能搜到该歌曲了，或者，可以搜索电视节目。

摇动手机的时候会触动手机内的振动传感器，振动传感器发送信号给微信程序，程序会自动调用手机听筒进行语音识别，然后通过与服务器之间的对比来搜索相同的歌曲，再反馈给用户的手机上。

现有技术中，直播的音视频节目在互动过程中，通常需要用户的参与，而用户参与的方式对用户来说，越简单越好。因而，亟需要一种可以让用户快速简单的参与节目互动的方案，以提高用户体验度。

技术实现要素：

本发明提供一种用户分类方法及系统，用以解决现有技术中用户无法快速而简单的参与节目互动的问题。

本发明提供一种用户分类方法，包括：

获取摇一摇用户信息；

接收所述用户的音频信息，确定所述用户收看当前直播音视频节目时，执行如下步骤：

根据预设分类比例，将所述用户分类。

所述方法还包括：

当确定所述用户没有收看当前直播音视频节目时，删除所述用户信息。

所述方法还包括：

在预设时间段内，获取开启微信摇一摇功能并参与互动的用户信息。

所述方法还包括：

用户开启微信摇一摇搜索歌曲或搜索电视功能，在收看当前直播音视频节目时通过摇一摇参与互动。

所述方法还包括：

所述用户分类采用随机数分类。

所述方法还包括：

将获取的用户音频信息与当前直播音视频节目音频品信息比对，若相似度高于预设阈值，则所述用户在收看当前直播音视频节目；否则，用户没有收看当前音视频节目。

一种用户分类系统，包括：

用户信息获取单元，用于获取摇一摇用户信息；

音视频直播判断单元，用于接收所述用户的音频信息，确定所述用户是否在收看当前直播音视频节目；若是，将所述用户信息发送分类单元；

分类单元，用于根据预设分类比例，将所述用户分类。

所述音视频直播判断单元，还用于：

当确定所述用户没有收看当前直播音视频节目时，删除所述用户信息。

所述音视频直播判断单元，还用于：

所述用户信息获取单元，还用于：

在预设时间段内，获取开启微信摇一摇功能并参与互动的用户信息。

本发明实施例中，通过获取摇一摇用户信息；接收所述用户的音频信息，确定所述用户收看当前直播音视频节目时，根据预设分类比例，将所述用户分类。本发明实施例的方案，能够利用摇一摇功能让用户快速而简单的参与直播音视频节目的互动环节，通过对用户的分类，可以让参与互动的用户有不同的参与内容和结果，丰富了用户参与互动的体验，极大的提高了用户体验度。

本发明的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。

附图说明

附图用来提供对本发明的进一步理解，并且构成说明书的一部分，与本发明的实施例一起用于解释本发明，并不构成对本发明的限制。在附图中：

图1为本发明实施例1提供的一种用户分类方法原理流程图；

图2为本发明实施例2提供的一种用户分类系统结构示意图。

具体实施方式

以下结合附图对本发明的优选实施例进行说明，应当理解，此处所描述的优选实施例仅用于说明和解释本发明，并不用于限定本发明。

如图1所示，为本发明实施例1提供的一种用户分类方法原理流程图，其中，

步骤11，获取摇一摇用户信息。

摇一摇是微信推出的一个互动功能，一个随机交友应用，通过摇手机或点击按钮模拟摇一摇，可以匹配到同一时段触发该功能的微信用户，从而增加用户间的互动和微信粘度。微信摇一摇功能增加了传图功能，可将电脑网页中的图片轻松传送到手机。还有微信摇一摇搜歌功能,能识别歌曲。微信摇一摇传图书签功能等。

进入摇一摇界面，轻摇手机，微信会帮您搜寻同一时刻摇晃手机的人——聚会上一起摇，会快速帮您列出一起摇的朋友；千里摇一摇，可以为您匹配这个世界上同时也在手机的朋友。摇到的朋友，直接点击就可以开始聊天。点击设置，可以查看到上一次摇到的人群，也可以更换背景图片。点击头像还可以查看摇到好友的一些基本信息和一些状态。在摇到的人中基本是按照距离你方位远近来排列的。在微信聚合效应下同一段时间内可能摇到同一个人的可能性大些。

对于微信摇一摇的功能，目前还有很多其他的应用，本申请实施例就在于利用微信摇一摇功能的搜索歌曲或搜索电视功能，来进行用户与直播音视频节目的互动。

首先，用户在收看音视频节目的时候，可以打开微信摇一摇功能，利用其中的搜索歌曲或搜索电视功能，可以将用户的信息和当时的音频信息都上传给微信服务器，微信服务器通过接口发送给后台服务器。当然，为了与特定的直播音视频节目互动，获取用户信息需要在音视频节目直播的时间段内，或者，可以设定一个预设时间段，在这个预设时间段内摇一摇手机的用户才可以采集用户信息。

摇动手机的时候会触动手机内的振动传感器，振动传感器发送信号给微信程序，程序会自动调用手机听筒进行语音识别，然后通过与服务器之间的对比来确认用户状态。

当然，对于用户信息的获取，不仅包括用户的基本信息，还可以包括用户的特征信息。用户特征信息可以辅助对用户进行分类。

用户特征信息包括用户行为特征信息和用户自定义信息等，也就是包括了用户自身的信息、用户使用应用的行为信息、用户自行定义的自定义信息等。首先需要获取这些信息。通常，获取用户信息的方法包括了要求用户自行上传、在用户使用过程中提取特征信息等方式，或者，在用户使用应用的日志信息中，通过文本分析的方法获取用户特征信息。

特征提取如果基于用户行为的日志数据进行文本提取的话，就要用到文本特征提取。文本挖掘是一门交叉性学科，涉及数据挖掘、机器学习、模式识别、人工智能、统计学、计算机语言学、计算机网络技术、信息学等多个领域。文本挖掘就是从大量的文档中发现隐含知识和模式的一种方法和工具,它从数据挖掘发展而来,但与传统的数据挖掘又有许多不同。文本挖掘的对象是海量、异构、分布的文档(web)；文档内容是人类所使用的自然语言,缺乏计算机可理解的语义。传统数据挖掘所处理的数据是结构化的,而文档(web)都是半结构或无结构的。所以,文本挖掘面临的首要问题是如何在计算机中合理地表示文本,使之既要包含足够的信息以反映文本的特征,又不至于过于复杂使学习算法无法处理。在浩如烟海的网络信息中,80％的信息是以文本的形式存放的，WEB文本挖掘是WEB内容挖掘的一种重要形式。

文本的表示及其特征项的选取是文本挖掘、信息检索的一个基本问题，它把从文本中抽取出的特征词进行量化来表示文本信息。将它们从一个无结构的原始文本转化为结构化的计算机可以识别处理的信息，即对文本进行科学的抽象，建立它的数学模型，用以描述和代替文本。使计算机能够通过对这种模型的计算和操作来实现对文本的识别。由于文本是非结构化的数据,要想从大量的文本中挖掘有用的信息就必须首先将文本转化为可处理的结构化形式。目前人们通常采用向量空间模型来描述文本向量,但是如果直接用分词算法和词频统计方法得到的特征项来表示文本向量中的各个维,那么这个向量的维度将是非常的大。这种未经处理的文本矢量不仅给后续工作带来巨大的计算开销,使整个处理过程的效率非常低下,而且会损害分类、聚类算法的精确性,从而使所得到的结果很难令人满意。因此,必须对文本向量做进一步净化处理,在保证原文含义的基础上,找出对文本特征类别最具代表性的文本特征。为了解决这个问题,最有效的办法就是通过特征选择来降维。

目前有关文本表示的研究主要集中于文本表示模型的选择和特征词选择算法的选取上。用于表示文本的基本单位通常称为文本的特征或特征项。特征项必须具备一定的特性:1)特征项要能够确实标识文本内容；2)特征项具有将目标文本与其他文本相区分的能力；3)特征项的个数不能太多；4)特征项分离要比较容易实现。在中文文本中可以采用字、词或短语作为表示文本的特征项。相比较而言，词比字具有更强的表达能力，而词和短语相比，词的切分难度比短语的切分难度小得多。因此，目前大多数中文文本分类系统都采用词作为特征项，称作特征词。这些特征词作为文档的中间表示形式，用来实现文档与文档、文档与用户目标之间的相似度计算。如果把所有的词都作为特征项，那么特征向量的维数将过于巨大，从而导致计算量太大，在这样的情况下，要完成文本分类几乎是不可能的。特征抽取的主要功能是在不损伤文本核心信息的情况下尽量减少要处理的单词数，以此来降低向量空间维数，从而简化计算，提高文本处理的速度和效率。文本特征选择对文本内容的过滤和分类、聚类处理、自动摘要以及用户兴趣模式发现、知识发现等有关方面的研究都有非常重要的影响。通常根据某个特征评估函数计算各个特征的评分值，然后按评分值对这些特征进行排序，选取若干个评分值最高的作为特征词，这就是特征抽取(Feature Selection)。

特征选取的方式有4种：(I)用映射或变换的方法把原始特征变换为较少的新特征；(2)从原始特征中挑选出一些最具代表性的特征；(3)根据专家的知识挑选最有影响的特征；(4)用数学的方法进行选取，找出最具分类信息的特征，这种方法是一种比较精确的方法，人为因素的干扰较少，尤其适合于文本自动分类挖掘系统的应用。

实际上，在提取用户特征的过程中，需要对用户信息以及行为信息全面分析，并设定合理的提取特征数量和具体内容，以更全面的反应用户实际的行为特征，从而为后续的分类处理奠定基础。

步骤12，接收用户的音频信息，确定用户是否收看当前直播音视频节目。

微信摇一摇搜索歌曲或搜索电视功能，通常会自动调用手机的话筒获取用户手机当前的音频信息，将所述音频信息与后台服务器上的当前直播音视频节目的音频信息比对，如果相似度大于一定的预设阈值，则认为用户当前在收看直播音视频节目，否则，用户没有收看当前直播音视频节目。

这里的预设阈值，是根据经验获得的，因为用户手机话筒功能不一样，用户所处环境的嘈杂度也不一样，通常用户的音频信息不会完全与后台服务器上的当前直播音视频节目的音频信息相同，而是会有一定的差别。只要可以模糊比对出相同的信息，或者可以提取出相同的信息，则认为用户的音频信息与当前直播的音视频信息是一致的。

当确定用户当前收看音视频直播节目时，需要继续执行后续步骤，而如果确定用户没有收看当前直播音视频节目，则说明用户摇一摇并非是为了参与节目互动，那么，需要从后台服务器删除用户信息，避免用户参与到节目互动中来。

步骤13，根据预设分类比例，将用户分类。

预设分类比例，就是预先设定将用户分为几类以及每一类的占比。例如，可以将用户分为两类，各占50％。或者，在抽奖或者砸金蛋等应用场景下，按照抽奖中奖的比例设定一定的中奖概率，然后将分类用户分为两类，一类是中奖用户，一类是没中奖的用户。砸金蛋的应用同样如此，用户通过摇一摇参与砸金蛋的互动环节，在用户摇动手机后，系统自动将用户分类，一类为砸中金蛋的用户，另一类为未砸中金蛋的用户。

当然，用户分类的依据与抽奖环节类似，可以采用随机数分类方法。在统计学的不同技术中需要使用随机数，比如在从统计总体中抽取有代表性的样本的时候，或者在将实验动物分配到不同的试验组的过程中，或者在进行蒙特卡罗模拟法计算的时候等等。

产生随机数有多种不同的方法。这些方法被称为随机数发生器。随机数最重要的特性是：它所产生的后面的那个数与前面的那个数毫无关系。真正的随机数是使用物理现象产生的：比如掷钱币、骰子、转轮、使用电子元件的噪音、核裂变等等。这样的随机数发生器叫做物理性随机数发生器，它们的缺点是技术要求比较高。

在实际应用中往往使用伪随机数就足够了。这些数列是“似乎”随机的数，实际上它们是通过一个固定的、可以重复的计算方法产生的。计算机或计算器产生的随机数有很长的周期性。它们不真正地随机，因为它们实际上是可以计算出来的，但是它们具有类似于随机数的统计特征。这样的发生器叫做伪随机数发生器。

在真正关键性的应用中，比如在密码学中，人们一般使用真正的随机数。

C语言、C++、C#、Java、Matlab等程序语言和软件中都有对应的随机数生成函数，如rand等。

本实施例中，可以让用户在摇一摇的时候即产生一个随机数，例如，产生一个0～1之间的随机数，然后根据预设分类比例，根据用户产生的随机数而分类。例如，用户产生一个0～1之间的随机数，分类比例是2:8时，则可以设定随机数在0～0.2之间的用户与随机数在0.2～1之间的用户分为两类。

当然，随机数的产生不一定需要在用户摇一摇的时候，而是可以在分类过程中的任意时刻，只要满足用户分类需求即可。另外，分类的方式有很多种，并不一定限于随机数分类方式，只要满足分类需求即可，本实施例对此不做限定。

如图2所示，为本发明实施例2提供的一种用户分类系统结构示意图，其中，

用户信息获取单元21，用于获取摇一摇用户信息；

音视频直播判断单元22，用于接收所述用户的音频信息，确定所述用户是否在收看当前直播音视频节目；若是，将所述用户信息发送分类单元23；

分类单元23，用于根据预设分类比例，将所述用户分类。

进一步的，上述音视频直播判断单元22，还用于：

当确定所述用户没有收看当前直播音视频节目时，删除所述用户信息。

进一步的，上述音视频直播判断单元22，还用于：

进一步的，上述用户信息获取单元21，还用于：

在预设时间段内，获取开启微信摇一摇功能并参与互动的用户信息。

综上所述，本发明实施例中，通过获取摇一摇用户信息；接收所述用户的音频信息，确定所述用户收看当前直播音视频节目时，根据预设分类比例，将所述用户分类。本发明实施例的方案，能够利用摇一摇功能让用户快速而简单的参与直播音视频节目的互动环节，通过对用户的分类，可以让参与互动的用户有不同的参与内容和结果，丰富了用户参与互动的体验，极大的提高了用户体验度。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：朱红磊;
技术所有人：天脉聚源（北京）科技有限公司;
我是此专利的发明人

上一篇：一种U型计量螺旋输送机的制作方法与工艺
上一篇：一种多色机可自由编程的中子控制方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。