用于移动终端的用户画像建立方法及装置与流程

文档序号：13004792阅读：396来源：国知局

本发明涉及互联网应用技术领域，特别是涉及一种用于移动终端的用户画像建立方法及装置。

背景技术：

随着互联网应用技术的发展，移动终端(如智能手机、平板电脑、智能手表等)已大量地出现在人们的日常生活中，其已成为人们日常生活、工作和学习不可缺少的工具。例如，用户可以通过移动终端来通话、拍照、阅读、听音乐、玩游戏，还可以实现包括定位、信息处理、指纹扫描、身份证扫描、条码扫描以及酒精含量检测等丰富的功能。

但是，在实际生活中，人们无法通过移动终端来直观地获取更多与自身相关的信息，使得用户无法与移动终端进行更好地交互。比如，目前移动终端仅仅能够通过用户的活动统计出其行走步数，而无法获取与用户相关的其他信息。因此，现有技术中，移动终端还无法为用户提供与其自身活动密切相关的各种信息。

因此，现在亟需一种能够全面、立体地获取与用户自身相关的信息进而为用户建立画像的方法。

技术实现要素：

鉴于上述问题，提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的用于移动终端的用户画像的建立方法和相应的装置。

依据本发明实施例的一个方面，提供了一种用于移动终端的用户画像的建立方法，包括：

基于用户随身携带的移动终端获取所述用户的历史活动状态；

根据所述移动终端的历史数据查找所述用户在不同活动状态下的用户行为以及所述用户行为的相关信息；

根据所述用户行为的相关信息抽象分析出所述用户行为所体现的用户属性；

结合所述用户的不同活动状态、用户行为以及用户属性为所述用户建立用户画像。

可选地，所述基于用户随身携带的移动终端获取所述用户的历史活动状态，包括：

在指定时长内，基于所述移动终端的传感器持续获取所述用户的行为所产生的传感器数据；

根据所述传感器数据确定所述用户在所述指定时长内的不同活动状态。

可选地，所述基于用户随身携带的移动终端获取所述用户的历史活动状态，还包括：

进一步获取所述移动终端的辅助识别信息，其中，所述辅助识别信息包括网络数据、位置信息和/或应用数据；

在所述传感器数据的基础上结合所述辅助识别信息，确定所述用户的不同活动状态。

可选地，所述移动终端的网络数据包括蓝牙数据和/或wifi数据；所述移动终端的位置信息包括gps信息。

可选地，根据所述移动终端的历史数据查找所述用户在不同活动状态下的用户行为以及所述用户行为的相关信息，包括：

所述用户处于任一活动状态下时，获取所述用户在该活动状态下所处的地理位置；

确定所述地理位置的商业类型；

基于所述移动终端的历史数据查找与所述商业类型相关的用户信息；

根据与所述商业类型相关的用户信息确定所述用户在该商业类型发生的用户行为。

可选地，根据所述用户行为的相关信息抽象分析出所述用户行为所体现的用户属性，包括：

获取所述用户在该商业类型发生的用户行为的相关信息；

根据所述相关信息抽象分析出所述用户在该商业类型发生的商业行为所体现的用户属性。

可选地，所述用户在该商业类型发生的商业行为所体现的用户属性包括下列至少之一：所述用户的用户社会属性、生活习惯属性和消费行为属性。

可选地，根据所述移动终端的历史数据查找所述用户在不同活动状态下的用户行为以及所述用户行为的相关信息，包括：

根据所述用户的静止状态确定所述用户的常停留地点；

在所述移动终端的历史数据中查找所述用户在所述常停留地点的用户行为以及相关信息。

可选地，根据所述移动终端的历史数据查找所述用户在不同活动状态下的用户行为以及所述用户行为的相关信息，包括：所述用户处于运动活动状态时，根据所述移动终端的历史数据查找所述用户的运行轨迹。

可选地，还包括：根据所述移动终端的历史数据在所述运行轨迹上标识不同的暂停点，其中，所述暂停点包括公交、地铁站、收费站点中的任意之一。

可选地，结合所述用户的不同活动状态、用户行为以及用户属性为所述用户建立用户画像，包括：

为所述用户建立初始模型；

根据所述用户的不同活动状态、用户行为以及用户属性依次在所述用户的初始模型上添加相应的标签，直至所述用户画像建立成功。

可选地，所述用于移动终端的用户画像的建立方法还包括：

若增加新的用户属性，则继续在已完成的用户画像上增加新的用户属性的标签。

可选地，结合所述用户的不同活动状态、用户行为以及用户属性为所述用户建立用户画像之后，还包括：根据所述用户画像的标签为所述用户推送相关的推荐信息。

可选地，所述基于用户随身携带的移动终端获取所述用户的历史活动状态，包括：

收集所述移动终端传感器采集的传感器数据，得到数据序列；

将所述数据序列作为训练样本提取其中的特征向量，将特征向量映射到用户活动状态的类别，使用机器学习算法训练从特征向量到用户活动状态的类别的分类模型。

可选地，所述传感器采集的数据包括多个方向上的数据，所述数据序列包括相应的各个方向上的数据序列。

可选地，当所述传感器包括多种类型的传感器时，收集所述移动终端传感器采集的传感器数据，得到数据序列包括：

对所述多种类型的传感器进行组合，得到多组传感器，其中，各组传感器中包含一类或多类传感器；

收集移动终端上的各组传感器采集的数据，得到各组传感器中各类传感器对应的数据序列。

可选地，将所述数据序列作为训练样本提取其中的特征向量，将特征向量映射到用户活动状态的类别，使用机器学习算法训练从特征向量到用户活动状态的类别的分类模型，包括：

将所述各组传感器中各类传感器对应的数据序列作为训练样本提取其中的特征向量，将特征向量映射到用户活动状态的类别，使用机器学习算法训练所述各组传感器的从特征向量到用户活动状态的类别的分类模型。

依据本发明实施例的另一个方面，还提供了一种用于移动终端的用户画像的建立装置，包括：

获取模块，适于基于用户随身携带的移动终端获取所述用户的历史活动状态；

查找模块，适于根据所述移动终端的历史数据查找所述用户在不同活动状态下的用户行为以及所述用户行为的相关信息；

抽象分析模块，适于根据所述用户行为的相关信息抽象分析出所述用户行为所体现的用户属性；

画像建立模块，适于结合所述用户的不同活动状态、用户行为以及用户属性为所述用户建立用户画像。

可选地，所述获取模块还适于：

在指定时长内，基于所述移动终端的传感器持续获取所述用户的行为所产生的传感器数据；

根据所述传感器数据确定所述用户在所述指定时长内的不同活动状态。

可选地，所述获取模块还适于：

进一步获取所述移动终端的辅助识别信息，其中，所述辅助识别信息包括网络数据、位置信息和/或应用数据；

在所述传感器数据的基础上结合所述辅助识别信息，确定所述用户的不同活动状态。

可选地，所述移动终端的网络数据包括蓝牙数据和/或wifi数据；所述移动终端的位置信息包括gps信息。

可选地，所述查找模块还适于：

所述用户处于任一活动状态下时，获取所述用户在该活动状态下所处的地理位置；

确定所述地理位置的商业类型；

基于所述移动终端的历史数据查找与所述商业类型相关的用户信息；

根据与所述商业类型相关的用户信息确定所述用户在该商业类型发生的用户行为。

可选地，所述抽象分析模块还适于：

获取所述用户在该商业类型发生的用户行为的相关信息；

根据所述相关信息抽象分析出所述用户在该商业类型发生的商业行为所体现的用户属性。

可选地，所述用户在该商业类型发生的商业行为所体现的用户属性包括下列至少之一：所述用户的用户社会属性、生活习惯属性和消费行为属性。

可选地，所述查找模块还适于：

根据所述用户的静止状态确定所述用户的常停留地点；

在所述移动终端的历史数据中查找所述用户在所述常停留地点的用户行为以及相关信息。

可选地，所述查找模块还适于：所述用户处于运动活动状态时，根据所述移动终端的历史数据查找所述用户的运行轨迹。

可选地，所述查找模块还适于：根据所述移动终端的历史数据在所述运行轨迹上标识不同的暂停点，其中，所述暂停点包括公交、地铁站、收费站点中的任意之一。

可选地，所述画像建立模块还适于：

为所述用户建立初始模型；

根据所述用户的不同活动状态、用户行为以及用户属性依次在所述用户的初始模型上添加相应的标签，直至所述用户画像建立成功。

可选地，所述画像建立模块还适于：

若增加新的用户属性，则继续在已完成的用户画像上增加新的用户属性的标签。

可选地，所述用于移动终端的用户画像的建立装置还包括：

推荐模块，适于结合所述用户的不同活动状态、用户行为以及用户属性为所述用户建立用户画像之后，根据所述用户画像的标签为所述用户推送相关的推荐信息。

可选地，所述获取模块还适于：

收集所述移动终端传感器采集的传感器数据，得到数据序列；

可选地，所述传感器采集的数据包括多个方向上的数据，所述数据序列包括相应的各个方向上的数据序列。

可选地，所述获取模块还适于：当所述传感器包括多种类型的传感器时，对所述多种类型的传感器进行组合，得到多组传感器，其中，各组传感器中包含一类或多类传感器；

收集移动终端上的各组传感器采集的数据，得到各组传感器中各类传感器对应的数据序列。

可选地，所述获取模块还适于：将所述各组传感器中各类传感器对应的数据序列作为训练样本提取其中的特征向量，将特征向量映射到用户活动状态的类别，使用机器学习算法训练所述各组传感器的从特征向量到用户活动状态的类别的分类模型。

本发明实施例提供的用于移动终端的用户画像的建立方法，基于用户随身携带的移动终端获取用户的历史活动状态，该历史活动状态为用户画像的建立提供了必要基础。用户随身携带的移动终端能够随时随地获取用户的活动状态，实时性、准确性和全面性较强，其较现有技术中仅能通过移动终端获取用户的步数统计信息有了极大提高。进一步，为了能够建立更加全面、准确的用户画像，在获取到用户的历史活动状态之后，还可以根据移动终端的历史数据查找用户在不同活动状态下的用户行为以及用户行为的相关信息。移动终端的历史数据可以包括用户基于移动终端以及移动终端上所具备的多种应用所产生的任何行为的参数，这一数据的获取基于用户行为的大数据性，用户信息量得到极大的提升。进而，根据用户行为的相关信息抽象分析出用户行为所体现的用户属性。随之，本发明实施例可以结合用户的不同活动状态、用户行为以及用户属性为用户建立用户画像。用户画像利用随身携带移动终端所获取的活动状态作为成像基准，使得用户画像能够根据不同的活动状态生成相应的标签，保证了用户画像与用户自身的活动的匹配程度。且由于用户不同的活动状态通常具备一定的持续性，用户画像上的任意一个标签也会相应具备一定的时效性，保证了用户画像的稳定。基于用户画像自身所具备的“给用户贴标签”这一特性，利用用户画像能够得到对用户信息分析而来的高度精炼的特征标识。进一步，本发明实施例就可以根据用户画像为用户实时推荐符合其需求的信息，实现精准营销和用户统计，甚至可以完成用户挖掘，对产品进行运营上的完善，提升服务质量。由于用户画像的标签化的精确性，更能够提升服务质量，对服务或产品进行私人定制，给用户的生活带来极大便利，提升了用户体验。从企业侧，用户画像的生成可以参与到业务经营分析以及竞争分析，影响企业的发展战略。

上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的具体实施方式。

根据下文结合附图对本发明具体实施例的详细描述，本领域技术人员将会更加明了本发明的上述以及其他目的、优点和特征。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本发明的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1是根据本发明一个实施例的用于移动终端的用户画像的建立方法的处理流程图；

图2是根据本发明一个实施例的用于移动终端的用户活动状态识别方法的处理流程图；

图3是根据本发明一个实施例的分类模型的训练方法的处理流程图；

图4是根据本发明一个实施例的常停留地点作为搜索建议词进行推荐的示意图；

图5是根据本发明一个实施例的用户画像的第一种示意图；

图6是根据本发明一个实施例的用户画像的第二种示意图；

图7是根据本发明一个实施例的用户画像的第三种示意图；

图8是根据本发明一个实施例的用户画像的第四种示意图；

图9是根据本发明一个实施例的用户画像的第五种示意图；

图10是根据本发明一个实施例的用户画像的第六种示意图；

图11是根据本发明一个实施例的用户画像的第七种示意图；

图12是根据本发明一个实施例的用于移动终端的用户画像建立装置的示意性框图；以及

图13是根据本发明一个实施例的用于移动终端的用户画像建立装置的另一个示意性框图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

为解决上述技术问题，本发明实施例提供了一种用于移动终端的用户画像的建立方法。图1是根据本发明一个实施例的用于移动终端的用户画像的建立方法的处理流程图。如图1所示，该方法至少包括步骤s102至步骤s108：

步骤s102、基于用户随身携带的移动终端获取用户的历史活动状态；

步骤s104、根据移动终端的历史数据查找用户在不同活动状态下的用户行为以及用户行为的相关信息；

步骤s106、根据用户行为的相关信息抽象分析出用户行为所体现的用户属性；

步骤s108、结合用户的不同活动状态、用户行为以及用户属性为用户建立用户画像。

用户画像是根据用户社会属性、生活习惯和消费行为等信息而抽象出的一个标签化的用户模型。用户画像建立的过程就是添加相应的标签，在数据挖掘领域称为标签化。标签是通过对用户信息分析而得到的高度精炼的特征标识。本发明实施例所提供的用户画像建立方法，能够从用户的海量信息中发掘每个用户的社交特性、潜在能力以及兴趣等有用信息，进而根据该有用信息为用户建立画像。

在本发明实施例中，首先，执行步骤s102，基于用户随身携带的移动终端获取用户的历史活动状态。此处提及的移动终端可以包括智能手机、平板电脑、智能手表、笔记本电脑、移动pos机等，其目前已在人们的日常生活中得到了广泛地运用。根据本发明实施例，可以基于用户随身携带的移动终端获取用户的历史活动状态信息。

相应地，在执行步骤s102时，可以在指定时长内，基于移动终端的传感器持续获取用户的行为所产生的传感器数据，进一步，可以根据获取的传感器数据确定用户在指定时长内的不同活动状态。

具体地，移动终端的传感器可以是加速度计(accelerometer)、磁力计(magnetometer)、陀螺仪(gyroscope)等，本发明实施例不限于此。这些传感器使得移动终端具备多种多样的功能，其中，本发明实施例对用户历史活动状态的识别获取即用到了移动终端中各传感器的测量数据。相应地，加速度计是测量运载体线加速度的仪表，其是活动识别最主要的传感器，其测量作用于设备的三个轴方向(x，y，z)的加速度(m/s²)，包含了重力加速度。磁力计测量作用于设备三个轴方向(x，y，z)的磁场强度值(a/m)。陀螺仪测量设备绕三个轴(x，y，z)旋转的速度(rad/s)。移动终端的各传感器能够对用户的不同行为进行数据的测量和收集。

在根据移动终端的传感器获取到用户的行为所产生的传感器数据后，可以根据获取的传感器数据确定用户的活动状态信息。具体地，图2示出了根据本发明一个实施例的用于移动终端的用户活动状态识别方法的流程示意图，在图2中，该方法至少可以包括以下步骤s202至步骤s204：

步骤s202、提取传感器数据中的特征向量，并输入从特征向量到用户活动状态的类别的分类模型；

步骤s204、利用上述分类模型识别出传感器数据对应的用户活动状态的类别。

可以看到，本发明实施例充分利用了移动终端本身具备的传感器，读取传感器采集的传感器数据，并基于传感器数据和分类模型能够识别出使用该移动终端的用户的活动状态。并且，本发明实施例在对传感器数据处理时，针对性地提取其中的特征向量，能够提高识别结果的精确度。

本发明实施例，在读取到传感器数据之后，执行步骤s202，从读取的传感器数据中提取特征向量，然后将提取的特征向量输入分类模型中进而识别用户活动状态的类别，如静止、步行、骑行、跑步、登山、驾车、坐公交、坐地铁、坐火车等等。分类模型中的特征向量与提取的特征向量是对应的，因此，本发明实施例首先介绍分类模型的训练步骤，图3示出了根据本发明一个实施例的分类模型的训练方法的流程示意图，在图3中，该方法至少可以包括以下步骤s302至步骤s304：

步骤s302、收集移动终端上传感器采集的数据，得到数据序列；

步骤s304、将数据序列作为训练样本提取其中的特征向量，将特征向量映射到用户活动状态的类别，使用机器学习算法训练从特征向量到用户活动状态的类别的分类模型。

上述的步骤s302和步骤s304主要可以包括数据收集、预处理、数据分割、特征提取以及机器学习，详细介绍如下。

在数据收集步骤中，收集移动终端上传感器采集的数据，得到数据序列。即，从前面介绍的各传感器中可以获得用户活动期间的传感器数据序列，具体可以以恒定采样频率(如50赫兹等)来采样得到数据。并且，传感器采集的数据可以包括多个方向上的数据，这样，数据序列也可以包括相应的各个方向上的数据序列。例如，加速度计、地磁传感器、陀螺仪都有三个轴的读数，因而对于每个传感器，都会得到三个轴x、y、z的信号值序列。在数据收集过程中，本发明实施例对前述的各个类别的用户活动状态都需要收集充分的样本，同一类别的用户活动状态，也可以考虑移动终端的姿态等各种不同的情况。

在预处理步骤中，有些移动终端不一定支持所有的传感器，因此，本发明实施例从收集的数据中，提取不同传感器组合的数据。即，对多种类型的传感器进行组合，得到多组传感器。其中，各组传感器中包含一类或多类传感器，进而收集移动终端上的各组传感器采集的数据，得到各组传感器中各类传感器对应的数据序列。由于加速度计是最主要的传感器，本发明实施例选择以下三种可能的组合：(1)加速度计；(2)加速度计和地磁传感器；(3)加速度计、地磁传感器和陀螺仪，对这三种情况的数据将分别进行训练。

在数据分割步骤中，将传感器数据序列分割成子序列，每个子序列映射到一个对应的活动标签。对于加速度计、地磁传感器和陀螺仪这些以恒定采样频率采样的数据，本发明实施例将整个传感器数据序列分割为时间间隔相等的子序列。选择最佳的时间窗口大小或时间间隔是影响识别效果的关键因素之一，因此，本发明实施例分别选择1至6秒的不同间隔进行分割得到子序列，后面通过机器学习分类时，对不同尺度的数据分别进行学习，得到基于不同时间窗口大小的识别模型，然后对不同的模型评测其识别效果，以选择最佳的分割间隔。需要说明的是，这里选取的1至6秒的时间间隔仅是示意性的，并不对本发明实施例进行限制，在实际应用中，还可以选取7或8秒等时间间隔来对序列进行分割。

数据分割完毕后得到的样本集中，可以选取一部分作为后续机器学习的输入，剩下的部分作为测试集，用来评测分类模型的分类效果。

在本发明的可选实施例中，在利用各个时间窗口对数据序列进行分割处理时，每个时间窗口生成一个子序列，子序列之间互不重叠，得到该时间窗口对应的多个子序列作为训练样本；或者，将各个时间窗口在数据序列上进行滑动，每滑动指定时长生成当前时间窗口对应的子序列，得到各个时间窗口各自对应的多个子序列作为训练样本。

在特征提取步骤中，对于分割后的传感器数据子序列，本发明实施例举例以下公式来计算以下特征量来得到序列的特征向量，但需要说明的是，本发明保护的技术方案并不局限以下及说明书中列的各个公式实现的方案，本领域技术人员能够想到通过合理变化、增减比例、调整系数、增加权重等方式依然可以实现本发明技术方案，而这些未穷举的方案也都在本发明保护范围内。

1)均值(mean)

对于大小为n的序列s，其均值为n个信号值相加的总和除以序列大小，计算公式如下：

mean(s)＝sum(s)/n

2)标准差(standarddeviation)

标准差是各信号值与均值离差平方的算术平均数的平方根，可以反映样本的变化度。

对于大小为n的序列x1,x2...xn，其均值为μ，标准差公式为：

3)中位数(median)

中位数为数据序列按顺序排列后位于中间位置的数。对于大小为n的序列，将该序列按升序排序，如果n为奇数，则取(n+1)/2个数为中位数；如果n为偶数，则取第n/2个数和第n/2+1个数的平均数为中位数。

4)中位数绝对偏差(medianabsolutedeviation)

当存在异常值可能影响平均值的一些情况下，中位数绝对偏差相对标准差可以提供更好的变化度测量。将序列的各项减去序列的中位数后求绝对值，得到新序列，对于新序列求中位数，即可以得到中位数绝对偏差。

对于序列x1,x2...xn，中位数绝对偏差为：

mad＝median(|xi-median(x)|)

5)零交叉(zerocrossing)

零交叉为信号值与中位置相交的次数，这个特征量用于区分快运动和慢运动。计算方法是遍历序列的各项值，如果中位数大于当前项且小于后一项，或者小于当前项且大于后一项，则零交叉次数加1。

6)相关性(correlation)

多分量的传感器，其各个分量之间存在相关性，如加速度计的x、y、z三个方向相互之间的相关性。不同的活动状态各分量的相关性可能存在差异。对于大小为n的序列x和y，其相关性的计算公式如下：

7)峰-峰振幅

该值表示信号的峰值到谷值之差，即数据序列的最大值与最小值之差，计算公式如下：

p2pa(s)＝max(s)-min(s)

8)信号能量

信号能量指信号曲线与时间轴之间构成的区域的面积，对于传感器数值序列，信号能量可以表示为平方值之和：

以上介绍了本发明实施例从数据序列或子序列中主要提取的特征向量，当然本发明并不限于此。

接下来，在机器学习步骤中，本发明实施例使用监督学习方法，将特征向量映射到用户活动状态的类别，建立从特征向量到用户活动状态的类别的分类模型。这里，如前文介绍，数据序列对应有用户活动状态的类别的标签，这样在将特征向量映射到用户活动状态的类别时，可以将数据序列对应的用户活动状态的类别的标签作为其特征向量的标签，从而将数据序列的特征向量映射到用户活动状态的类别。

针对不同的传感器组合，本发明实施例将训练不同的分类模型，之后就可以利用这些分类模型，识别新的样本对应的用户活动状态的类别。

不同的监督学习算法对活动的识别效果有明显的差异，本发明实施例选取支持向量机(supportvectormachine，svm)作为主要的监督学习方法。svm的目标是使预测精度最大化而又不会引起数据的过拟合，对于二元分类，svm算法在特征空间里建立一个区域模型，将数据(特征向量)在多维空间中分隔成两个不同的类别，使分类边界离最近的数据点的距离尽量远。对活动进行分类属于多类别问题，多类别问题可以分解为多个二元分类问题，本发明实施例选择一对一方法，即最大赢选举法(maximum-winsvoting)来处理活动分类问题，对每对不同的活动类别，训练一个svm模型，最终得到k(k-1)/2个svm分类器，对新样本分类时，每个分类器将得出一个分类，记录每个类别的得票数，得票最多的分类胜出，即确定为新样本对应的用户活动状态的类别。

需要说明的是，此处列举的机器学习svm算法仅是示意性的，本发明实施例还可以使用决策树、人工神经网络、朴素贝叶斯等算法来实现分类，并且还可以对比评估不同学习算法的效果，从而选择合适的学习算法。具体地，利用测试样本集可以实现学习效果的评测，本发明实施例选择召回率、准确率、f-score作为评测指标，通过不断调整训练样本、特征向量等相关参数以达到更佳的标准，优化识别效果。

在训练得到分类模型之后，接下来就可以利用分类模型来识别用户活动状态的类别。即，在步骤s202中从读取的传感器数据中提取特征向量，并输入从特征向量到用户活动状态的类别的分类模型，在步骤s204中利用上述分类模型识别读取的传感器数据对应的用户活动状态的类别。这里，在读取传感器数据时，可以以固定时间间隔生成样本，有以下两种生成样本的方式：

第一，假设样本所需持续时间为5秒，每5秒生成一个样本，样本之间互相不重叠；

第二，假设样本所需持续时间为5秒，每1秒生成一个样本，取之前5秒内的数据，样本之间会相互重叠。

在提取特征向量时，提取的特征向量与训练时相同，即，可以利用上文特征提取步骤中提及的方法计算数据序列或子序列的均值、标准差、中位数、中位数绝对偏差、零交叉、相关性、峰-峰振幅、信号能量，将这些特征值作为序列的特征向量。接下来，根据移动终端支持的传感器，选择合适的分类模型，使得训练好的分类模型对样本进行分类，识别出读取的传感器数据对应的用户活动状态的类别。

在本发明的可选实施例中，为了进一步提高识别的准确率，可以在确定用户的当前活动状态信息之前，进一步获取移动终端的辅助识别信息，进而利用辅助识别信息来调整识别出的用户活动状态的类别。本发明实施例中，辅助识别信息可以是网络数据、位置信息和/或应用数据。更多地，移动终端的网络数据可以是蓝牙数据和/或wifi数据，移动终端的位置信息可以是gps信息等，本发明实施例对此不做具体限定。同时，本发明实施例所提供的方法，将利用分类模型识别用户活动状态的类别称为初步识别，进而，还可以利用辅助识别信息来调整初步识别的识别结果。

在利用辅助识别信息来调整识别出的用户活动状态的类别时，本发明实施例可以判断移动终端上的指定通信模块(如蓝牙、wifi等，本发明实施例不限于此)是否接入相应协议类型的通信设备。若是，则获取移动终端上的通信模块接入的通信设备的相关信息，进而基于获取的相关信息来调整识别出的用户活动状态的类别。下面通过几个实例来详细介绍。

情况一，蓝牙连接状态

本发明实施例可以获取蓝牙连接状态及连接的蓝牙设备类型，查看连接的蓝牙设备类型可以识别车载蓝牙设备，当确认移动终端连接了车载蓝牙设备，且初步识别的用户活动状态为驾车或与驾车接近的状态，则可以确认或纠正为驾车状态。

情况二，周边蓝牙设备

通过蓝牙扫描可以得到周边的蓝牙设备列表，分析其中的设备类型及数量，统计发现驾车时扫描到的蓝牙设备数量通过不会太多。因此，可以设定数量阈值，如果该数量超过了数量阈值且无车载蓝牙设备，而初步识别为驾车，则认为是误识别。

情况三，gps

通过gps可以获得当前的位置及移动速度，通过设定速度阈值，可以确认是否在行驶的车辆上。由于gps长时间使用功耗较高，因此，本发明实施例仅在用户活动状态可能发生切换，进行确认时才使用gps辅助判断。

情况四，wifi

目前，许多公交车上都会安装wifi，这些wifi通常都有较明显的特征(如名称等)，通过数据收集与分析可以提取这些特征，如果移动终端连接了wifi，通过判断当前连接的wifi的特征，可以辅助判断是否在公交车上。

情况五，历史状态

历史状态用于状态切换，在判断是否可以切换到新的状态时，需要考察历史状态，确认新的状态是否已经持续了指定时长，若是，则确认切换到新的状态；若否，则不认为切换到新的状态。

在利用辅助识别信息来调整识别出的用户活动状态的类别时，本发明实施例还可以获取移动终端上的指定应用程序的业务数据，进而基于获取的业务数据来调整识别出的用户活动状态的类别。例如，用户开启指定应用程序，利用指定应用程序打开自行车车锁，然后进入骑行状态，该指定应用程序从开锁到关锁一直会记录用户的骑行时间，本发明实施例从指定应用程序获取到这些业务数据时，则确认用户活动状态为骑行状态。又例如，用户开启刷公共交通卡功能，刷卡之后，该公共交通卡功能会记录用户乘坐公共交通的时间或站点，本发明实施例从公共交通卡功能处获取到这些业务数据时，则确认用户活动状态为乘坐公共交通状态。

在本发明的可选实施例中，当发生调整识别出的用户活动状态的类别的事件时，获取调整后的用户活动状态的类别，进而利用传感器数据中的特征向量与调整后的用户活动状态的类别对分类模型进行训练，以修正分类模型。

在步骤s102执行结束之后，可以获取到较为精确的用户的历史活动状态信息，其中，用户的历史活动状态的类别可以包括静止、步行、跑步、驾车、乘坐公共交通等，本发明不限于此。此外，本发明实施例，在获取用户的历史活动状态信息过程中，还可以确定用户的每一次活动状态是否发生切换。具体地，在识别出用户活动状态的类别之后，可以判断本次识别是否为初次识别操作。若是，则将本次识别出的用户活动状态的类别作为本次确定的用户活动状态的类别。若否，则获取上一次确定的用户活动状态的类别，并基于上一次确定的用户活动状态的类别与本次识别出的用户活动状态的类别，确定本次用户的活动状态是否发生切换。

进一步地，若上一次确定的用户活动状态的类别与本次识别出的用户活动状态的类别相同，则确定本次用户活动状态未发生切换。若上一次确定的用户活动状态的类别与本次识别出的用户活动状态的类别不相同，则将上一次确定的用户活动状态的类别称为第一类别，本次识别出的用户活动状态的类别称为第二类别，并继续进行上述的读取、识别操作。当后续识别出的用户活动状态的类别为第二类别的次数超出阈值，则确定超出阈值时对应的用户活动状态发生切换。

比如，通过上述步骤识别出用户的活动状态的类别为静止状态，为了确定用户活动状态是否发生切换，首先判断本次识别是否为初次识别操作，若是，则将本次识别出的用户活动状态的类别作为本次确定的用户活动状态的类别；若否，则获取到上一次确定的用户活动状态的类别为步行，此时不会立即确定用户活动状态切换为静止状态，而是继续执行上述步骤识别出用户活动状态的类别，若通过多次识别用户活动状态的类别为静止，则确定用户活动状态切换为静止状态。

在本发明的可选实施例中，当确定用户活动状态为第一活动状态后，从移动终端的传感器处读取当前的传感器数据，并基于当前的传感器数据识别出用户活动状态为第二活动状态；若第二活动状态与第一活动状态不相同、且用户活动状态为第二活动状态的持续时长大于第一指定时间阈值，则确定用户活动状态从第一活动状态切换为第二活动状态。这里的第一指定时间阈值可以基于第一活动状态和第二活动状态来确定。

若第二活动状态与第一活动状态不相同、且用户活动状态为第二活动状态的持续时长小于第一指定时间阈值，则继续从移动终端的传感器处读取当前的传感器数据，并基于当前的传感器数据识别出用户活动状态为第三活动状态。若第三活动状态与第一活动状态、第二活动状态不相同，并且用户活动状态为第三活动状态的持续时长大于第二指定时间阈值，则确定用户活动状态从第一活动状态切换为第三活动状态。这里的第二指定时间阈值可以基于第一活动状态和第三活动状态来确定，也可以基于第一活动状态、第二活动状态以及第三活动状态来确定。

通过上面介绍可以看到，本发明实施例在状态发生变化时，进入新的状态前，需要一段时间进行确认，以确保状态的准确性，以下是状态切换时的基本策略。

首先是初始状态。在初次识别之前，由于还无法确定状态，可以将状态设为未知。

其次是状态进入。无论原先是未知状态或其它已识别的状态，进入新的状态都需要持续一段时间的稳定状态，才确认切换到新的状态。

再次是状态退出。通常有三种情况会退出原来的状态：

a.进入新的状态；

b.未确认进入新状态，但已经连续有一段时间识别的状态不符合旧的状态。对于简单的状态，这个时间相对较短(如30秒)；对于复杂的状态(如驾车、公交等)，这些状态持续期间通常会包含其它状态，如等红绿灯时静止，因此只有持续较长时间(如5分钟)未识别为原来的状态才退出；

c.系统或应用退出。

最后是状态维持。进入新的状态之后，将一直维持该状态，直到满足退出条件。

接下来针对各种状态，详细描述其切换条件。

1)关于静止状态

从未知、步行、跑步等状态到静止状态，只需要静止状态持续稳定一段时间(如5-15秒)，即可确认切换到静止状态。

从驾车状态到静止状态，为避免等红绿灯这类情况下状态变化，需要静止的稳定持续时间更长(如超过2分钟)才会切换状态。

从坐公交状态到静止状态，通常不应该从坐公交状态直接切换到静止状态，为避免异常情况，设置一个较长的确认时间即可(如5分钟以上)。

2)关于步行、跑步状态

从未知、静止等状态到步行或跑步状态，只需步行或跑步状态持续稳定一段时间(如5-15秒)，即可确认切换到新状态。

步行和跑步之间的切换，为避免像快走和慢跑等这类很接近的状态导致状态来回变化，步行与跑步之间的状态切换需要的确认时间更长(如15-30秒)。

从驾车状态到步行、跑步状态，因驾车状态较为复杂，而且驾车过程中经过颠簸道路时，有可能误识别为步行等其它状态，因此从驾车状态切换到步行或跑步状态，需要确保新状态稳定持续了较长时间(如30秒以上)。在驾车和步行之间通常存在停车静止状态(时间较短未切换到静止)，如果步行状态之前存在静止状态，可适当降低确认时间。为了确保准确性，还可以利用gps确认当前速度没有超过步行的速度。

从坐公交状态到步行、跑步状态，乘坐公交时，因可能在车厢内走动，还可能站立，因此进入步行、跑步状态需要确保新状态持续较长时间(如30秒以上)。为了确保准确性，还可以利用gps确认当前速度没有超过步行的速度。

3)关于驾车状态

从未知、静止状态到驾车状态，需要驾驶状态稳定持续较长的时间(如30秒以上)，且在确认期间开启gps获取当前速度，如果连续一段时间(如15秒内)速度太低(如小于10千米每小时)或无gps信号，则不进入驾车状态。

从步行、跑步状态到驾车状态，进入的条件类似从未知或静止进入驾车，但相比上一种情况，从步行或跑步到驾车状态之间，刚进入车内还未开动时，通常会有一段时间的静止状态(时间太短未切换到静止)，因此需额外再增加驾车状态前的静止状态判断，如不存在静止状态，需要适当增加确认时间。

从坐公交到驾车状态，通常不允许从坐公交状态直接切换为驾车状态。

4)坐公交、地铁

坐公交相比驾车是更复杂的状态，因其状态相对更不稳定，比如乘客可坐可站，也可能频繁操作移动终端等，因此仅仅通过初步识别的状态结合wifi、gps等，还不足以准确识别，需要进一步结合公交站点及线路数据来进行判断。

具体地，在本发明的可选实施例中，当基于移动终端的传感器数据识别出用户活动状态为预设状态时，获取移动终端用户所在的第一位置信息；随后，将第一位置信息与公共交通站点和线路数据进行匹配，若匹配上，则在指定时长后获取移动终端用户所在的第二位置信息和移动速度；之后，将第二位置信息与公共交通站点和线路数据进行匹配，若匹配上，且移动速度符合预设条件，则确定用户活动状态为乘坐公共交通状态。

在确定上述的指定时长时，若第一位置信息匹配上公共交通站点，则基于匹配上的公共交通站点的类型确定指定时长，其中，公共交通站点的类型包括起始站点、中间站点以及结束站点中任意之一；若第一位置信息匹配上公共交通线路，则基于匹配上的公共交通线路的相关信息确定指定时长，其中，公共交通线路的相关信息包括红绿灯情况和/或实时路况。

从未知、步行、跑步状态到乘坐公共交通状态，上车时通常会识别为步行，因此从步行状态切换为乘坐公共交通是进入乘坐公共交通状态比较普遍的方式。在确认是否进入乘坐公共交通状态期间，本发明实施例开启移动终端上的gps，通过开启的gps获取移动终端用户所在的第一位置信息。接着，将第一位置信息与公共交通站点和线路数据进行匹配，判断当前是否在公共交通站点或其附近，或者是否沿公共交通线路行驶，若匹配上，则在指定时长后获取移动终端用户所在的第二位置信息和移动速度，若匹配上，且移动速度符合预设条件，则确定用户活动状态为乘坐公共交通状态。

从静止到乘坐公共交通状态，通过定位位置结合公共交通站点和线路数据，判断当前是否在公共交通站点附近及站点是否为始发站，如果不是从始发站上车，通常不会存在静止状态，即便存在，也可能持续时间很短，因此设定阈值，静止时间超过阈值则不认为是乘坐公共交通状态；如果是始发站，则该阈值可以设为较长的时间，同时还需要判断静止之前的历史状态，需存在步行状态才可以识别为乘坐公共交通状态。

在确定用户活动状态是否发生切换时，本发明实施例还可以基于移动终端的状态变化来确定。具体地，当移动终端的状态发生变化时，获取移动终端上的用于识别用户活动状态的相关数据，并基于获取的相关数据识别用户活动状态为待定活动状态；接着，判断在待定活动状态之前是否存在已确定的第一活动状态；若存在，则基于待定活动状态与第一活动状态，确定用户的第二活动状态。这里，移动终端的状态发生变化可以是多种情况，例如，从移动终端的传感器处读取传感器数据，若读取的传感器数据的振幅变化大于幅度阈值，则确定移动终端的状态发生变化；又例如，当监测到移动终端上的指定通信模块接入相应协议类型的通信设备，则确定移动终端的状态发生变化，等等，本发明实施例不限于此。

进一步，在基于待定活动状态与第一活动状态确定用户的第二活动状态时，若用户活动状态为待定活动状态的持续时长大于时间阈值，则将待定活动状态确定为用户的第二活动状态。若用户活动状态为待定活动状态的持续时长小于时间阈值，则继续监测移动终端的状态是否发生变化。

举例来说，若从移动终端的传感器处读取传感器数据，若读取的传感器数据的振幅变化大于幅度阈值，此时移动终端的状态发生变化，则获取移动终端上的用于识别用户活动状态的相关数据，并基于获取的相关数据识别用户活动状态为待定活动状态，具体为静止状态。若在静止状态之前存在已确定的第一活动状态，具体为步行状态。如果用户活动状态为静止状态的持续时长大于时间阈值(如15秒)，则确定用户的第二活动状态为静止状态。如果用户活动状态为静止状态的持续时长小于15秒，则继续监测移动终端的状态是否发生变化。若监测到移动终端上的指定通信模块接入相应协议类型的通信设备，此时移动终端的状态发生变化，则基于接入的通信设备的相关信息识别出用户活动状态为待定活动状态，具体为驾车状态。如果用户活动状态为驾车状态的持续时长大于时间阈值(如30秒)，则确定用户的第二活动状态为驾车状态。如果用户活动状态为驾车状态的持续时长小于30秒，则继续监测移动终端的状态是否发生变化，以此类推。

基于用户随身携带的移动终端获取到用户的历史活动状态之后，可以进一步执行步骤s104，根据移动终端的历史数据查找用户在不同活动状态下的用户行为以及用户行为的相关信息。移动终端的历史数据可以包括用户基于移动终端以及移动终端上所具备的多种应用所产生的任何行为的参数，这一数据的获取基于用户行为的大数据性。大数据(bigdata，megadata)，又称巨量资料，指的是需要新处理模式才能具有更强的决策力、洞察力和流程化能力的海量、高增长率和多样化的信息资产。大数据通常是以多元形式，自许多来源搜集而来的庞大数据组，往往具有实时性，本发明实施例即需要从大数据中提取出有用的信息并高效利用这些信息，使得用户信息量得到极大的提升。

具体地，在本发明实施例中，当用户处于任一活动状态下时，可以首先获取用户在该活动状态下所处的地理位置，进而确定该地理位置的商业类型。例如，当获取到用户处于步行状态时，通过用户随身携带的移动终端获取到用户所处的地理位置为“永旺商场”，确定用户所处地理位置的商业类型为营利型商业。又例如，当用户处于跑步状态时，通过用户随身携带的移动终端获取到用户所处的地理位置为“北京市昌平中学”，确定用户所处地理位置的商业类型为非营利型商业。

进一步，本发明实施例在获取到用户所处地理位置的商业类型后，可以基于移动终端的历史数据查找与所获取的商业类型相关的用户信息，进而，根据获取的用户信息确定用户在该商业类型发生的用户行为。例如，在获取到用户的地理位置为营利型商业“永旺商场”时，可以通过移动终端获取该用户在该商场所进行的具体操作，比如该用户在该商场通过手机上的支付宝应用支付了200元。本发明实施例可以根据用户的支付交易确定用户在“永旺商场”进行了消费行为。

此外，本发明实施例在执行步骤s104时，除了可以确定用户在不同活动状态下的用户行为及用户行为的相关信息外，还可以更加直接地根据用户的静止状态确定用户的常停留地点，并且在移动终端的历史数据中查找用户在常停留地点的用户行为及相关信息。例如，本发明实施例根据用户的静止状态确定出用户的一个常停留地点为“加州牛肉面”，进而在移动终端的历史数据中查找到用户每天早上八点在“加州牛肉面”通过“支付宝”应用进行支付以购买早餐。更多地，在确定了用户的常停留地点之后，本发明实施例还可以在搜索框中将这些常停留地点作为搜索建议词进行推荐，如图4所示，“输入地点”所在位置为搜索框，“搜索发现”部分为推荐的常停留点，当光标置于“输入地点”时，用户点击“加州牛肉面”，则将“加州牛肉面”复制到搜索框中，再点击“搜索”按钮就可以进行相关搜索，同时，还可以针对搜索的地点发起路线搜索。

此外，本发明实施例中，当用户处于运动活动状态时，可以根据移动终端的历史数据查找用户的运行轨迹，并且在该运行轨迹上为用户标识不同的暂停点。本发明实施例中的暂停点可以是公交站、地铁站以及收费站等等。

进一步，在根据移动终端的历史数据查找到用户在不同活动状态下的用户行为以及用户行为的相关信息后，执行步骤s106，可以首先根据用户行为获取用户在该商业类型发生的用户行为的相关信息，该相关信息能够真实、全面地反映用户的日常生活轨迹。然后，根据该相关信息抽象分析出用户在该商业类型发生的商业行为所体现的用户属性。本发明实施例中的用户属性可以为用户的社会属性、生活习惯属性以及消费行为属性等等。例如，在某次记录中，通过用户随身携带的移动终端获取到用户在“永旺商场”通过“支付宝”应用进行了200元的支付交易，进而确定用户在“永旺商场”进行了消费行为。进一步，本发明实施例所提供的方法还可以通过用户使用“支付宝”应用直接获取用户在“支付宝”平台所填写或上传的个人资料，比如姓名、年龄、性别等等。此外，本发明实施例提供的方法，在确定用户进行了消费行为之后，还可以基于获取的基本信息进一步获取与该消费行为相关的具体信息。比如，还可以获取到用户在“永旺商场”的本次支付交易中购买了护肤套装以及零食。本例仅仅为移动终端上所记录的用户的单次消费行为，本发明实施例所提供的用户画像的建立方法基于对移动终端记录的用户历史数据进行分析，该历史数据可以记录用户在一个月，甚至一年内的相关信息，本发明实施例对此不做具体限定。例如，通过该用户移动终端，结合历史数据中记录的该用户的购买频次及数量，可以发现该用户在进行消费行为时所购买的商品大多都是护肤品与零食，可以判断出该用户日常比较注重护肤，此外还比较喜欢吃零食。本例所提供的信息仅为例举，本发明实施例对此不做具体限定。

步骤s106执行结束之后，可以执行步骤s108，结合用户的不同活动状态、用户行为以及用户属性为用户建立用户画像。具体地，在为用户建立用户画像之前，可以首先为用户建立初始模型，进而，根据用户的不同活动状态、用户行为以及用户属性依次在用户的初始模型上添加相应的标签，直至用户画像建立成功，图5示出了根据本发明一个实施例的用户画像的第一种示意图。此外，还可以根据具体的实施例为用户建立具体画像。例如，从上述例子中可以获知用户比较注重护肤，并且比较喜欢吃零食，可以为该用户贴上“护肤达人”、“吃货”等标签，如图6所示。此外，随着用户行为的不断变化，若增加新的用户属性，本发明实施例，还可以继续在已完成的用户画像上增加新的用户属性标签。

步骤s108执行结束之后，可以成功地完成用户画像的建立。本发明实施例所建立的用户画像可以是立体的，还可以是平面的，本发明对此不做具体限定。用户画像可以在相对较高的程度上对用户进行近似描述，通过建立的用户画像可以直观地获取根据用户信息分析而来的高度精炼的用户特征标识。此外，在用户画像建立完成之后，本发明实施例还可以根据用户画像的标签为用户推送相关的推荐信息。比如，可以根据用户的“吃货”标签，为其推荐最近评价较好的各种美食，还可以根据用户的“健身达人”标签，为其推荐各种健身教程等等，以实现更加精准的营销和用户统计，甚至可以完成用户挖掘，对产品进行运营上的完善，进而提升服务质量，提升用户体验。

采用上述提供的用于移动终端的用户画像的建立方法，除了上述几个例子外，还存在许多不同的应用场景。现提供出几个具体的实施例对本发明实施例所提供的用于移动终端的用户画像的建立方法进行详细阐述。

实施例一

本例中，用户a的移动终端记录了用户a的历史活动状态以及基于用户行为的大数据性所获取的用户a的多种历史数据，例如该历史数据可以包括用户a使用移动终端上所安装的“keep”应用定时定点打卡的数据，还可以包括用户a在消费时所使用的移动终端上所安装的支付应用(支付宝、微信等)进行交易而生成的交易数据等等。本例中，用户a的移动终端所记录的历史数据显示，用户a半年内通过“keep”应用完成打卡170次，在大数据统计中，半年内10次未通过“keep”应用打卡的情况可以统计为误差，在历史数据分析中可忽略，并选择以分布性平衡的数据(打卡170次)为参考。

此外，用户a的移动终端记录数据还显示用户a在通过“keep”应用打卡的相应时间段内的地理位置为“坤宇健身房”，且移动速度为10公里/小时，从而识别出用户a处于跑步状态。

此时，可根据用户a行为的相关信息抽象分析出用户a的行为所体现的用户a的属性，并结合用户a的历史活动状态以及用户a的行为，为用户a贴标签，以建立用户画像。本例中，用户a半年内坚持跑步并通过“keep”应用打卡，可以将用户a标签为“跑步坚持者”，如图7所示。

更多地，本例中，用户a移动终端上的“keep”应用还显示用户a每天必做的锻炼为“马甲线养成训练”。根据本发明实施例所提供的方法，可以根据上述与用户a相关的信息分析出用户a在日常生活中比较热衷健身，尤其比较喜欢马甲线训练。因此，如图8所示，本例还可以为用户a增加“马甲线狂热者”的标签以完成对用户a画像的建立。

此外，随着用户a活动状态的变化，其移动终端的历史数据也发生变化，从而使得用户a的标签也具备可变化性。比如，根据移动终端的历史数据发现用户a在近两个月内经常泡在“国家图书馆”，而不再去健身房健身，此时，可以对已完成的用户画像进行修改，将用户a“跑步坚持者”以及“马甲线狂热者”的标签删除，同时为用户a建立新的标签“书迷”，如图9所示。

更多地，在建立完用户a的画像之后，还可以根据用户a画像的标签为其推送相关的推荐信息。本例中，可以为用户a定时或不定时地推送最新出版的书籍或者近期评价较高的文刊等。

实施例二

本例中，基于用户b随身携带的移动终端获取到其两个月内基本每天早上七点到晚上七点一直处于驾驶状态，进而根据用户b的上述纯历史活动状态进一步判断出用户b的身份可能是司机，根据本发明的用户画像方法，可以将用户b标签为“司机”，如图10所示。

进一步，还可以将标签与移动终端的历史数据结合以对用户进行更深层地分析。本例中，可以将用户b的标签“司机”与其移动终端中有关数据进行结合，例如，用户b移动终端显示的车辆保养数据为：宝马5系、4s店、定期保养，进而判断出用户b所开的是比较豪华的车，进一步更加精细地分析出用户b是一家待遇不错的单位的司机，进而在已经建立的用户b标签(参见图10)基础上，为用户b增加新的标签“待遇不错的单位司机”，如图11所示。

更多地，若用户b移动终端显示的车辆保养数据为：捷达、无定期保养数据，进而可判断出用户b可能为出租车司机，并为用户b生成相应的标签。

因此，本发明实施例提供的用于移动终端的用户画像的建立方法，利用随身携带移动终端所获取的活动状态作为成像基准，使得用户画像能够根据不同的活动状态生成相应的标签，保证了用户画像与用户自身的活动的匹配程度。且由于用户不同的活动状态通常具备一定的持续性，用户画像上的任意一个标签也会相应具备一定的时效性，保证了用户画像的稳定。基于用户画像自身所具备的“给用户贴标签”这一特性，利用用户画像能够得到对用户信息分析而来的高度精炼的特征标识。进一步，本发明实施例就可以根据用户画像为用户实时推荐符合其需求的信息，实现精准营销和用户统计，甚至可以完成用户挖掘，对产品进行运营上的完善，提升服务质量。由于用户画像的标签化的精确性，更能够提升服务质量，对服务或产品进行私人定制，给用户的生活带来极大便利，提升了用户体验。从企业侧，用户画像的生成可以参与到业务经营分析以及竞争分析，影响企业的发展战略。

需要说明的是，实际应用中，上述所有可选实施方式可以采用结合的方式任意组合，形成本发明的可选实施例，在此不再一一赘述。

基于同一发明构思，本发明实施例还提供了一种用于移动终端的用户画像的建立装置。图12是根据本发明一个实施例的用于移动终端的用户画像的建立装置的第一种示意性框图。如图12所示，用于移动终端的用户画像的建立装置至少包括：

获取模块1210，适于基于用户随身携带的移动终端获取用户的历史活动状态；

查找模块1220，与获取模块1210耦合，适于根据移动终端的历史数据查找用户在不同活动状态下的用户行为以及用户行为的相关信息；

抽象分析模块1230，与查找模块1220耦合，适于根据用户行为的相关信息抽象分析出用户行为所体现的用户属性；

画像建立模块1240，与抽象分析模块1230耦合，适于结合用户的不同活动状态、用户行为以及用户属性为用户建立用户画像。

在一个优选的实施例中，获取模块1210还适于：

在指定时长内，基于移动终端的传感器持续获取用户的行为所产生的传感器数据；

根据传感器数据确定用户在指定时长内的不同活动状态。

在一个优选的实施例中，获取模块1210还适于：

进一步获取移动终端的辅助识别信息，其中，辅助识别信息包括网络数据、位置信息和/或应用数据；

在传感器数据的基础上结合辅助识别信息，确定用户的不同活动状态。

在一个优选的实施例中，移动终端的网络数据包括蓝牙数据和/或wifi数据；移动终端的位置信息包括gps信息。

在一个优选的实施例中，查找模块1220还适于：

用户处于任一活动状态下时，获取用户在该活动状态下所处的地理位置；

确定地理位置的商业类型；

基于移动终端的历史数据查找与商业类型相关的用户信息；

根据与商业类型相关的用户信息确定用户在该商业类型发生的用户行为。

在一个优选的实施例中，抽象分析模块1230还适于：

获取用户在该商业类型发生的用户行为的相关信息；

根据相关信息抽象分析出用户在该商业类型发生的商业行为所体现的用户属性。

在一个优选的实施例中，用户在该商业类型发生的商业行为所体现的用户属性包括下列至少之一：用户的用户社会属性、生活习惯属性和消费行为属性。

在一个优选的实施例中，查找模块1220还适于：

根据用户的静止状态确定用户的常停留地点；

在移动终端的历史数据中查找用户在常停留地点的用户行为以及相关信息。

在一个优选的实施例中，查找模块1220还适于：用户处于运动活动状态时，根据移动终端的历史数据查找用户的运行轨迹。

在一个优选的实施例中，查找模块1220还适于：根据移动终端的历史数据在运行轨迹上标识不同的暂停点，其中，暂停点包括公交、地铁站、收费站点中的任意之一。

在一个优选的实施例中，画像建立模块1240还适于：

为用户建立初始模型；

根据用户的不同活动状态、用户行为以及用户属性依次在用户的初始模型上添加相应的标签，直至用户画像建立成功。

在一个优选的实施例中，画像建立模块1240还适于：

若增加新的用户属性，则继续在已完成的用户画像上增加新的用户属性的标签。

在一个优选的实施例中，如图13所示，用于移动终端的用户画像建立装置还包括：

推荐模块1250，适于结合用户的不同活动状态、用户行为以及用户属性为用户建立用户画像之后，根据用户画像的标签为用户推送相关的推荐信息。

在一个优选的实施例中，获取模块1210还适于：

收集移动终端传感器采集的传感器数据，得到数据序列；

将数据序列作为训练样本提取其中的特征向量，将特征向量映射到用户活动状态的类别，使用机器学习算法训练从特征向量到用户活动状态的类别的分类模型。

在一个优选的实施例中，传感器采集的数据包括多个方向上的数据，数据序列包括相应的各个方向上的数据序列。

在一个优选的实施例中，获取模块1210还适于：当传感器包括多种类型的传感器时，对多种类型的传感器进行组合，得到多组传感器，其中，各组传感器中包含一类或多类传感器；

收集移动终端上的各组传感器采集的数据，得到各组传感器中各类传感器对应的数据序列。

在一个优选的实施例中，获取模块1210还适于：将各组传感器中各类传感器对应的数据序列作为训练样本提取其中的特征向量，将特征向量映射到用户活动状态的类别，使用机器学习算法训练各组传感器的从特征向量到用户活动状态的类别的分类模型。

采用本发明实施例提供的用于移动终端的用户画像的建立方法及装置能够达到如下有益效果：

在此处所提供的说明书中，说明了大量具体细节。然而，能够理解，本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。

类似地，应当理解，为了精简本公开并帮助理解各个发明方面中的一个或多个，在上面对本发明的示例性实施例的描述中，本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而，并不应将该公开的方法解释成反映如下意图：即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说，如下面的权利要求书所反映的那样，发明方面在于少于前面公开的单个实施例的所有特征。因此，遵循具体实施方式的权利要求书由此明确地并入该具体实施方式，其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员可以理解，可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件，以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外，可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述，本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外，本领域的技术人员能够理解，尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征，但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如，在权利要求书中，所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

本发明的各个部件实施例可以以硬件实现，或者以在一个或者多个处理器上运行的软件模块实现，或者以它们的组合实现。本领域的技术人员应当理解，可以在实践中使用微处理器或者数字信号处理器(dsp)来实现根据本发明实施例的用于移动终端的用户画像建立设备中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如，计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上，或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到，或者在载体信号上提供，或者以任何其他形式提供。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制，并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中，不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中，这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

至此，本领域技术人员应认识到，虽然本文已详尽示出和描述了本发明的多个示例性实施例，但是，在不脱离本发明精神和范围的情况下，仍可根据本发明公开的内容直接确定或推导出符合本发明原理的许多其他变型或修改。因此，本发明的范围应被理解和认定为覆盖了所有这些其他变型或修改。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：耿显志;杨建东
技术所有人：北京奇虎科技有限公司
我是此专利的发明人

上一篇：一种动力电池方形钢壳的制作方法与工艺
上一篇：一种基于粗糙集的适用于不完备决策表的规则提取方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。