点触行为数据处理方法、装置、设备及存储介质与流程

文档序号:32844804发布日期:2023-01-06 22:00阅读:63来源:国知局
点触行为数据处理方法、装置、设备及存储介质与流程

1.本技术涉及数据处理技术领域,具体涉及一种点触行为数据处理方法及装置、电子设备及计算机可读存储介质。


背景技术:

2.随着大数据相关技术的发展,机器学习的应用已经和行业结合并逐步落地,在机器学习的研究及应用过程中,数据质量是影响机器学习模型准确性的关键因素,决定了机器学习模型的上限。例如,在点触行为数据处理中,由于机器学习模型所依赖的特征数据集有限,其自身又难以构造出更多的数据,因而缺乏海量的点触数据作为学习样本,从而挖掘出准确有价值的特征,同时,由于特征构造的维度有限,导致机器学习模型很难学到有用的数据结构,这将导致人机识别过程中出现明显的人机轨迹差异,造成机器学习模型的识别准确率差。


技术实现要素:

3.为解决上述技术问题,本技术的实施例提供了一种点触行为数据处理方法及装置、电子设备、计算机可读存储介质以及计算机程序产品。
4.根据本技术实施例的一个方面,提供了一种点触行为数据处理方法,包括:获取待处理的点触行为的特征数据集,其中,所述特征数据集包括传感器特征数据集;对所述传感器特征数据集进行去噪处理;根据去噪后的传感器特征数据集构造所述点触行为的时间特征、高维特征和融合特征;输出处理后的点触行为的特征数据集,所述处理后的点触行为的特征数据集包括所述点触行为的时间特征、高维特征以及融合特征。
5.根据本技术实施例的一个方面,所述传感器特征数据集包括按压力度和按压面积;所述根据去噪后的传感器特征数据集构造所述点触行为的时间特征、高维特征和融合特征,包括:根据所述按压力度和按压面积确定所述点触行为所对应的多个按键及多个按键各自对应的按压时长;基于所述多个按键及多个按键各自对应的按压时长构造所述点触行为的时间特征。
6.根据本技术实施例的一个方面,所述按压时长包括下压时间点和抬起时间点;所述基于所述多个按键及多个按键各自对应的按压时长构造所述点触行为的时间特征,包括:基于所述多个按键中各个按键对应的下压时间点和抬起时间点构造所述点触行为的时间特征。
7.根据本技术实例的一个方面,所述基于所述多个按键中各个按键对应的下压时间点和抬起时间点构造所述点触行为的时间特征,包括:计算所述多个按键中的各个按键对应的下压时间点和抬起时间点之间的时间差,以构造所述点触行为对应的第一时间特征;计算所述多个按键中的相邻时间被按压的两个按键对应的两个下压时间点之间的时间差,以构造所述点触行为的第二时间特征;计算所述多个按键中第一按键的抬起时间点和第二按键的下压时间点之间的时间差,以构造所述点触行为的第三时间特征,其中,所述第一按
键和所述第二按键为所述多个按键中相邻时间被按压的两个按键。
8.根据本技术实施例的一个方面,所述传感器特征数据集包括加速传感器坐标数据和旋转速率传感器坐标数据;所述根据去噪后的传感器特征数据集构造所述点触行为的时间特征、高维特征和融合特征,包括:计算所述加速传感器坐标数据对应的向量的模,以构造所述加速传感器的高维特征;计算所述旋转速率传感器坐标数据对应的向量的模,以构造所述旋转速率传感器的高维特征;基于所述加速传感器的高维特征和所述旋转速率传感器的高维特征构造所述点触行为的融合特征。
9.根据本技术实施例的一个方面,在对所述传感器特征数据集进行去噪处理之前,所述方法还包括:计算所述传感器特征数据集中的异众比率,并判断所述异众比率是否大于预设的异众比率阈值;若所述异众比率小于或等于所述异众比率阈值,则保留异众特征数据,所述异众特征数据为与同类数值中的众值不同的数据;若所述异众比率大于所述异众比率阈值,则对所述异众特征数据进行剔除,并对剔除异众特征数据后的传感器特征数据集进行缺失值填充。
10.根据本技术实施例的一个方面,所述处理后的点触行为的特征数据集还包括所述点触行为的统计特征;所述方法还包括:计算所述待处理的点触行为的特征数据集中的数据对应的均值、中位数、异众比率、方差、变异系数、偏度系数、峰度系数以及均方递差中的一项或者多项,以得到所述点触行为的统计特征。
11.根据本技术实施例的一个方面,提供了一种点触行为数据处理装置,包括:获取模块,用于获取待处理的点触行为的特征数据集,其中,所述特征数据集包括传感器特征数据集;去噪模块,用于对所述传感器特征数据集进行去噪处理;特征工程模块,用于根据去噪后的传感器特征数据集构造所述点触行为的时间特征、高维特征和融合特征;输出模块,用于输出处理后的点触行为的特征数据集,所述处理后的点触行为的特征数据集包括所述点触行为的时间特征、高维特征以及融合特征。
12.根据本技术实施例的一个方面,提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述电子设备实现如前所述的点触行为数据处理方法。
13.根据本技术实施例的一个方面,提供了一种计算机可读存储介质,其上存储有计算机可读指令,当所述计算机可读指令被计算机的处理器执行时,使计算机执行如上所述的点触行为数据处理方法。
14.根据本技术实施例的一个方面,还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现如上所述的点触行为数据处理方法中的步骤。
15.在本技术的实施例所提供的技术方案中,通过获取待处理的点触行为数据集,并对点触行为数据集中包括的传感器特征数据集进行去噪处理,以剔除原始传感器特征数据采集时的噪声影响,并根据去噪后的传感器特征数据集构造点触行为的时间特征、高维特征和融合特征,以挖掘出多个维度的特征,并输出处理后的包括时间特征、高维特征和融合特征的点触行为数据集,以经过特征工程处理后生成多个维度的点触行为特征,减少人机识别过程中的人机轨迹差异,并且使得提供给机器学习的特征维度更丰富,有利于提高机器学习模型的性能。
16.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不
能限制本技术。
附图说明
17.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本技术的实施例,并与说明书一起用于解释本技术的原理。显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术者来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。在附图中:
18.图1是本技术的一示例性实施例示出的点触行为数据处理的实施环境示意图;
19.图2是本技术的一示例性实施例示出的点触行为数据处理的流程图;
20.图3是图2所示实施例中的步骤s230在一示例性实施例中的流程图;
21.图4是本技术的一示例性实施例示出的用户在终端设备上的按键信息图;
22.图5是图3所示实施例中的步骤s320在一示例性实施例中的流程图;
23.图6是图2所示实施例中的步骤s230在另一实施例中的流程图;
24.图7是本技术的一示例性实施例示出的在终端设备上加速传感器采集到的原始点触信号与用户的点触信号的轨迹分布图;
25.图8是本技术的一示例性实施例示出的在终端设备上经过处理后得到的加速传感器的信号与用户的点触信号的轨迹分布图;
26.图9是本技术的一示例性实施例示出的对传感器特征数据集中的异众数据进行处理的过程流程图;
27.图10是在一示例性的应用场景下终端设备将点触行为数据记录为数据表的示意图;
28.图11是本技术在一示例性的应用场景下示出的点触数据处理的服务流程图;
29.图12是本技术的一示例性实施例示出的点触行为数据处理装置的框图;
30.图13示出了适于用来实现本技术实施例的电子设备的计算机系统的结构示意图。
具体实施方式
31.这里将详细地对示例性实施例执行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本技术相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本技术的一些方面相一致的装置和方法的例子。
32.附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
33.附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
34.在本技术中提及的“多个”是指两个或者两个以上。“和/或”描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
35.首先需要说明的是,特征工程是机器学习中不可或缺的一部分,在机器学习领域中占有非常重要的地位。特征工程是将原始数据转换为特征的过程,这些特征能更好地代表预测模型的潜在问题,从而提高不可见数据的模型精度。可见,数据和特征决定了机器学习的上限,而模型和算法是在逼近这个上限而已。故,好的数据和特征是机器学习模型和算法发挥更大的作用的前提。
36.其中,机器学习(machine learning,ml)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
37.本技术实施例的技术方案具体涉及特征工程中的数据处理技术,具体是针对采集到的点触行为数据进行处理。以下对本技术实施例的技术方案进行详细介绍:
38.相关技术中,由于没有公开海量数据,机器学习模型所依赖的特征数据集有限,难以构造出更多的数据来分析,挖掘出有价值的特征,并且由于特征构造的维度有限,导致机器学习模型很难学到有用的数据结构,特别是在人机识别场景下,由于机器学习模型所依赖的特征数据集有限,并且特征维度有限,这导致机器学习模型的对用户的点触行为的识别准确性差。基于此,本技术的实施例提供了一种点触数据处理方法、装置、电子设备以及计算机可读存储介质,以提升机器学习模型的准确性。
39.请参阅图1,图1是本技术涉及的一种实施环境的示意图。该实施环境包括终端110和服务器120。其中,终端110与服务器120之间通过有线或者无线网络进行通信。
40.终端110用于接收用户的点触行为的特征数据集,用户在终端110中输入相应的点触行为数据,终端110采集用户输入的点触行为数据并按照相应的存储形式将用户输入的点触行为数据进行存储,且终端110将采集到的用户输入的点触行为数据发送给服务器120。
41.服务器120根据接收到的用户输入的点触行为数据,并对点触行为数据中的传感器特征数据集通过相应的去噪方式进行去噪触控,以得到去噪后的传感器特征数据集,并进一步的根据去噪后的传感器特征数据集构造用点触行为对应的时间特征、高维特征以及融合特征。服务器120输出处理后的点触行为的特征数据集,其中,处理后的点触行为的特征数据集包括点触行为的时间特征、高维特征以及融入特征。
42.需要说明的是,终端110可以是智能手机、平板电脑、笔记本电脑或者可穿戴设备等任意支持点触行为控制的电子设备,但是并不限制于此,例如,终端110还可以是车载终端、飞行器等应用于特殊领域的设备。终端110可通过3g(第三代的移动信息技术)、4g(第四代的移动信息技术)、5g(第五代的移动信息技术)等无线网络与服务器120进行通信,或者通过有线网络与服务器120通信,本处也不对此进行限制。
43.服务器120例如可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、cdn(content delivery network,内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器,在此也不进行限制。
44.应理解,云技术(cloud technology)是指在广域网或局域网内将硬件、软件、网络等系列资源统一起来,实现数据的计算、储存、处理和共享的一种托管技术。云技术也是基于云计算商业模式应用的网络技术、信息技术、整合技术、管理平台技术、应用技术等的总称,可以组成资源池,按需所用,灵活便利。
45.图2是本技术的一示例性实施例示出的一种点触行为数据处理方法的流程图。该方法适用于图1所示的实施环境,并由图1中的服务器120具体执行。该方法也可以适用于其它的实施环境,并由其它的实施环境中的设备执行,本实施例并不对此进行限制。
46.下面将以服务器作为示例性的执行主体对本技术实施例提出的方法进行详细描述。如图2所示,在一示例性实施例中,该方法包括步骤s210至步骤s240,详细介绍如下:
47.步骤s210,获取待处理的点触行为的特征数据集,其中,特征数据集包括传感器特征数据集。
48.在本技术的一个实施例中,点触行为数据处理方法可以适用于很多的触控交互场景。具体而言,当用户在终端触摸屏上进行与终端设备的触控交互时,都需要对触控交互行为所产生的点触行为数据进行处理,也可以是实施在其它的场景中,比如实时监测用户身份真实性的场景。更进一步的,在现有的一些场景中,用户在登陆完账号或者设备之后,就不再需要验证其用户身份的真实性,这种情况就有可能带来一些严重的问题,例如,当用户的账号在设备处于登陆状态时,而设备又不在用户的可控制范围之内,那么对于非法用户而言,就有可能对设备进行控制或者操作,进一步可能导致的结果就是给真实用户带来损失。鉴于此,用户在终端触摸屏上进行触控交互时有必要对用户所产生的点触行为数据进行处理。
49.具体的,在用户与终端设备执行人机交互时,终端设备采集到大量的用户所产生的点触行为的特征数据,例如:交互触控的序号id、交互触控点的坐标、触控的面积、触控的力度以及触控的时长等等触控数据。且,在终端设备上设置多个传感器,当产生人机交互操作时,终端设备上的多个传感器也将采集到对应的点触行为数据。
50.用户在与终端界面进行交互的过程中,根据实际需要会在终端界面中进行点触操作,进而实现用户的目的,具体地,由于每一个用户在操作终端界面过程中的操作行为和操作习惯的不同,会使得在终端界面中进行点触时对终端界面的按压压力和在终端界面中停留的点触时间有所区别,因而,在本实施例中,可以采集用户在终端界面中所产生的多个维度的特征数据集,其中就包括用户在终端界面中任意位置进行点触时的点触压力值和点触时间值以及终端界面传感器所采集到的数据的集合。
51.需要注意的是,对于本领域技术人员而言,应当理解,对于同一个用户而言,由于不同单元在终端界面中的位置不同,用户点触不同单元格的难易程度也有所不同,进而使得用户在终端界面中不同单元格点触时所产生的点触压力值和点触时间值不同。
52.步骤s220,对传感器特征数据集进行去噪处理。
53.为了保证人机识别结果的可靠性,对用户在终端界面上所产生的传感器特征数据集进行去噪处理,由于人体运动频带宽度小于终端界面上的加速度计的噪声带宽,所以在本实施例中选取ι型切比雪夫低通滤波器对终端采集到的传感器特征数据集进行去噪,其中,在通带(或称“通频带”)上频率响应幅度等波纹波动的滤波器称为“i型切比雪夫滤波器”。以得到去噪后的传感器特征数据集。具体的,可以采用以下i型切比雪夫数字低通滤波
数据模型:
[0054][0055]
以此,对终端设备采集到的传感器特征数据集进行去噪处理,得到去噪后的传感器特征数据集。
[0056]
步骤s230,根据去噪后的传感器特征数据集构造点触行为的时间特征、高维特征和融合特征。
[0057]
为了保证提高人机识别模型的准确性,对经过去噪处理后的传感器特征数据集构造点触行为对应的特征,其中,包括构造点触行为对应的时间特征、高维特征以及融合特征。
[0058]
需要说明的是,特征工程是利用数据领域的相关知识来创建能够使机器学习算法达到最佳性能的特征的过程。简而言之,特征工程就是一个把原始数据转变成特征的过程,这些特征可以很好的描述这些数据,并且利用它们建立的模型在未知数据上的表现性能可以达到最优(或者接近最佳性能)。从数学的角度来看,特征工程就是人工地去设计输入变量。
[0059]
步骤s240,输出处理后的点触行为的特征数据集,处理后的点触行为的特征数据集包括点触行为的时间特征、高维特征以及融合特征。
[0060]
输出进行上述处理后的点触行为的特征数据集,并且在输出的点触行为的特征数据集中包括经过处理后的点触行为的时间特征、高维特征以及融合特征。经过特征处理后的点触行为的特征,可以直接被机器学习模型训练所使用,省去了用户手动信息特征工程的操作,提高了机器学习模型的性能。
[0061]
在本实施例中,通过获取用户在与终端界面交互时所产生的点触行为的特征数据集,并对特征数据集中的传感器特征进行去噪处理,以此避免了终端所采集得到的数据中的噪声对机器学习性能的影响,再根据去噪后的传感器特征数据集构造点触行为的特征工程,以经过特征工程处理后生成高质量的点触行为特征,不仅省去了用户手动进行特征工程的操作,还有利于提高机器学习模型的性能。
[0062]
进一步的,基于上述实施例,请参照图3,在本技术所提供的其中一个示例性实施例中,传感器特征数据集包括按压力度和按压面积,上述步骤s230的实现步骤还可以具体包括步骤s310和步骤s320,详细介绍如下:
[0063]
步骤s310,根据按压力度和按压面积确定点触行为所对应的多个按键及多个按键各自对应的按压时长。
[0064]
可选的,在用户与终端设备界面进行交互过程中,终端界面上的传感器会根据用户的触摸操作计算出用户的按压力度和按压面积,并根据用户的按压力度和按压面积确定用户在终端设备界面上按压时的按压面积大小,并根据终端界面不同区域所设置的按压力度和按压面积,针对终端的加速传感器坐标数据和旋转速率传感器坐标数据确定用户在终端界面的按压区域,并进一步查找出该按压区域对应的预设按压力度和按压面积的阈值,以此针对不同区域的预设按压力度和按压面积与用户在该区域的按压力度和按压面积确定用户点触行为对应的按键以及各按键对应的按压时长。
[0065]
具体的,终端采集的传感器特征数据集中包括用户在终端界面上的不同区域进行
点触时产生的按压面积以及按压力度。且,根据对比用户在终端界面上的不同区域进行点触时产生的按压面积以及按压力度与该区域对应的预设按压面积和按压力度的阈值的对比结果确定用户在终端界面上的点触行为对应的多个按键以及多个按键各自对应的按压时长。如下表1:
[0066][0067][0068]
表1
[0069]
具体的,例如根据查找得到1号位置的预设按压面积的阈值为12mm*14mm,预设按压面积为0.004n,根据在终端界面采集到的用户在1号位置的按压面积和按压力度确定用户在1号位置的按键的按压为有效按压,并以此方法确定终端界面上其余位置的按键的按压是否为有效按压,并以此进一步确定用户在终端上的点触行为对应的按键以及各按键各自对应的按压时长。
[0070]
步骤s320,基于多个按键及多个按键各自对应的按压时长构造点触行为的时间特征。
[0071]
当确定了用户在与终端界面进行交互时的点触行为所接触的多个按键以及多个按键各自对应的按压时长构造用户点触行为对应的时间特征。例如,根据两个在时间上相邻的按键之间的时间差确定滑动事件对应的时间特征,根据按键的按压时长确定触摸事件对应的时间特征等等。
[0072]
首先需要说明的是,事件是视图层到逻辑层的通讯方式,事件可以将用户的行为反馈到逻辑层进行处理,并且事件可以绑定在组件上,当达到触发事件时,就会执行逻辑层中对应的事件处理函数。此外,事件对象中可以携带额外的信息,例如:身份id。
[0073]
用户在终端界面上的点触行为可能构成对应的点触行为事件,其中点触行为事件就包括:触摸事件、点击事件以及滑动事件。具体地,触摸事件的触发条件包括:手指触摸到屏幕时就会触发,当手指在屏幕上移动时也会触发,当手指离开屏幕时也会触发;tap事件(点击事件),tap事件的触发条件包括:手指碰一下屏幕会触发,手指长按屏幕会触发以及手指双击屏幕会触发;滑动事件,滑动事件的触发条件包括:手指在屏幕上滑动时会触发,例如,手指在屏幕上向左滑动、向右滑动时会触发或者向下滑动时均会触发。
[0074]
在本实施例中,根据终端采集的用户点触行为对应的传感器特征数据中的按压力度和按压面积与预设的按压力度和按压面积阈值进行对比确定用户在终端屏幕上对应的多个按压键值以及多个按压键值各自对应的按压时长来构造点触行为对应的时间特征,剔除了用户误触发的点触行为,保证用户点触行为时间特征的精确性,以提供高质量的点触行为对应的时间特征给机器学习模型。
[0075]
进一步的,基于上述实施例,在本技术实施例所提供的其中一个示例性实施例中,
按压时长包括下压时间点和抬起时间点;上述步骤s320的实现过程还可以具体包括步骤s321,详细介绍如下:
[0076]
步骤s321,基于多个按键中各个按键对应的下压时间点和抬起时间点构造点触行为的时间特征。
[0077]
具体的,请参照图4,图4是用户与终端界面点触交互时所产生的按键信息图,其中各个按键的按压时长可以根据该按键的下压时间点和抬起时间点之间的时间差确定。具体的,如图4所示,可知用户在终端界面的点触行为产生了4个按键信息,其中,1号位置的按键的下压时间点为t1,抬起时间点为t2,2号位置的按键下压时间点为t3,抬起时间点为t4,3号位置的按键下压时间点为t5,抬起时间点为t6,4号位置的按键下压时间点为t7,抬起时间点为t8。由此根据多个按键中各个按键对应的下压时间点和抬起时间点构造点触行为对应的时间特征。
[0078]
进一步的,基于上述实施例,请参照图5,在本技术所提供的其中一个示例性实施例中,上述基于多个按键中各个按键对应的下压时间点和抬起时间点构造点触行为的时间特征的实现过程还可以具体包括步骤s410至步骤s430,详细介绍如下:
[0079]
步骤s410,计算多个按键中的各个按键对应的下压时间点和抬起时间点之间的时间差,以构造点触行为对应的第一时间特征。
[0080]
具体的,请继续参照图4,根据传感器特征数据集中的加速传感器的坐标信息和旋转速率传感器的坐标信息确定用户点触行为构成的多个位置的按键分别在终端界面上对应的区域,并根据多个按键各自对应的下压时间点和抬起时间点之间的时间差,也即各个按键按压时长,以构造该用户对应的触摸事件对应的时间特征,例如,1号位置按键的抬起时间点为t2,下压时间点为t1,故t2与t1的时间差就为1号位置按键触摸事件对应的时间特征、t4与t3的时间差就为2号位置按键触摸事件对应的时间特征、t6与t5的时间差就为3号位置按键触摸事件对应的时间特征、t8与t7的时间差就为4号位置按键触摸事件对应的时间特征。
[0081]
步骤s420,计算多个按键中的相邻时间被按压的两个按键对应的两个下压时间点之间的时间差,以构造点触行为的第二时间特征。
[0082]
具体的,继续参照图4,根据传感器特征数据集中的加速传感器的坐标信息和旋转速率传感器的坐标信息确定多个按键分别在终端界面上对应的区域,并根据点触行为所产生的多个位置的按键信息中多个按键各自对应的下压时间点和抬起时间点,由此,可以根据多个按键中的相邻时间被按压的两个按键对应的两个下压时间点之间的时间差,也即计算两个连续按键下压的时长,以构造点触行为中滑动事件对应的时间特征。例如,图4中的1号位置按键的下压时间为t1,2号位置按键的下压时间为t3,其中通过计算t3和t1之间的时间差可以确定点触行为中滑动事件对应的时间特征。
[0083]
步骤s430,计算多个按键中第一按键的抬起时间点和第二按键的下压时间点之间的时间差,以构造点触行为的第三时间特征,其中,第一按键和第二按键为多个按键中相邻时间被按压的两个按键。
[0084]
具体的,根据传感器特征数据集中的加速传感器的坐标信息和旋转速率传感器的坐标信息确定用户点触行为构成的多个按键分别在终端界面上对应的区域,并根据多个按键各自对应的下压时间点和抬起时间点构造点触行为对应的点击事件的时间特征,具体
的,通过计算多个按键中第一按键的抬起时间点和第二按键的下压时间点之间的时间差,也即为两个连续按键的间隔时长,以构造点触行为中的点击行为对应的时间特征,其中,第一按键和第二按键为多个按键中相邻时间内被连续按压的两个按键。例如,图4中的1号位置按键的下压时间点为t1,相邻时间被按压的2号位置按键的抬起时间点为t3,根据t3与t1之间的时间差构造点触行为中点击事件对应的时间特征。
[0085]
在本实施例中,通过计算用户点触行为中对应的多个按键中各个按键的按压时长,构造出点触行为对应的触摸事件对应的时间特征,以提高用户在终端界面中的抬起事件数据的真实性;并通过多个按键中两个连续按键下压时长,以构造点触行为对应的滑动事件的时间特征;通过计算两个连续按键的间隔时长,以构造点触行为中滑动事件对应的时间特征。以此,不仅提高了对构造点触行为对应的事件的时间特征的精确性,还为后续机器学习提供了高质量的数据。
[0086]
基于上述实施例,请参见图6,在本技术所提供的其中一个示例性实施例中,传感器特征数据集包括加速传感器坐标数据和旋转速率传感器坐标数据;其中,根据去噪后的传感器特征数据集构造点触行为的时间特征、高维特征和融合特征的实现过程还可以具体包括步骤s510至步骤s530,详细介绍如下:
[0087]
步骤s510,计算加速传感器坐标数据对应的向量的模,以构造加速传感器的高维特征。
[0088]
具体的,用户在终端界面进行点触操作时,终端的加速传感器记录下用户的点触操作在加速传感器上对应的坐标数据,其中,当用户在终端界面进行点触操作时,加速传感器的x轴、y轴以及z轴记录点触操作对应的坐标数据,例如,用户在终端界面进行点触操作时,终端加速传感器记录下的坐标数据为(accx,accy,accz),并计算加速传感器坐标数据对应的向量的摸,具体计算加速传感器的坐标数据对应的向量的模如下:
[0089][0090]
以此,根据加速传感器的坐标数据对应的向量的模构造点触行为对应的加速传感器的高维特征。
[0091]
步骤s520,计算旋转速率传感器坐标数据对应的向量的模,以构造旋转速率传感器的高维特征。
[0092]
具体的,用户在终端界面进行点触操作时,终端的旋转速率传感器记录下用户的点触操作在旋转速率传感器上对应的坐标数据,其中,当用户在终端界面进行点触操作时,旋转速率传感器的x轴、y轴以及z轴记录点触操作对应的坐标数据,例如,用户在终端界面进行点触操作时,终端旋转速率传感器记录下的坐标数据为(gyrox,gyroy,gyroz),并计算旋转速率传感器坐标数据对应的向量的摸,具体计算旋转速率传感器的坐标数据对应的向量的模如下:
[0093][0094]
以此,根据旋转速率传感器的坐标数据对应的向量的模构造点触行为对应的旋转速率传感器的高维特征。
[0095]
步骤s530,基于加速传感器的高维特征和旋转速率传感器的高维特征构造点触行为的融合特征。
[0096]
进一步的,在一些可实现的实施例中,根据上述加速传感器的高维特征和旋转速率传感器的高维特征进行交叉融合构造点触行为的融合特征,具体的,根据上述加速传感器坐标数据对应的向量的模和旋转速率传感器坐标数据对应的向量的模构造该点触行为对应的融合特征,具体计算点触行为的融合特征如下:
[0097][0098]
以此,计算得到该点触行为对应的融合特征。
[0099]
此外,请参见图7和图8,图7是用户在终端界面上进行点触交互时,终端加速传感器采集到的原始点触信号与用户的实际点触信号的轨迹分布图,在图7中可以看到明显的人机轨迹的差异;图8是对加速传感器数据进行去噪以及特征处理后得到的加速传感器高维特征信号与用户的点触行为对应的融合特征信号的轨迹分布图,在图8中可见,经过去噪和特征工程处理后的传感器数据已经消除了与用户实际点触行为之间的轨迹差异。
[0100]
在本实施例中,根据去噪后的传感器特征数据集构造用户点触行为对应的加速传感器高维特征、旋转速率传感器高维特征以及融合特征,并且将传感器高维特征进行交叉融合形成新的特征,不仅增加了特征的维度,还挖掘出了更有价值的交叉融合特征,丰富了机器学习模型中数据的维度。
[0101]
进一步的,请参照图9,基于上述实施例,在本技术所提供的其中一个示例性实施例中,在上述对传感器特征数据集进行去噪处理之前,该点触行为数据处理方法还包括步骤s610至步骤s630,详细介绍如下:
[0102]
步骤s610,计算传感器特征数据集中的异众比率,并判断异众比率是否大于预设的异众比率阈值。
[0103]
具体的,用户在终端设备界面上进行交互时所进行的触摸操作产生的待处理的点触行为数据一般是用于机器学习训练的样本数据,一般为结构化数据,通常以表格形式进行存储(如图10所示),其中,表中的每一行代表一个样本,列包括特征列和标签列,每一个特征列代表一个特征,标签列标识样本的类别。在一些可行的方案中,当对待处理的点触行为的特征数据集中的传感器特征数据集进行数据清洗,其中,数据清洗包括对传感器特征数据集中的异常值处理,首先判断传感器特征数据集中的数据是否为异常值,在确定异常值后,再计算异常值与非异常值之间的比率,也即异众比率;并进一步判断该传感器特征数据集中的异众比率是否大于预设的异众比率阈值。
[0104]
步骤s620,若异众比率小于或等于异众比率阈值,则保留异众特征数据,异众特征数据为与同类数值中的众值不同的数据。
[0105]
具体的,计算如图10所示的数据表中的特征列中的异常值与非异常值之间的比率,当特征列中的异常值与非异常值之间的比率小于或等于预设的异常值与非异常值之间的比率时,则保留该特征列中的异常值,此外,在一些可实现的方案中异常值也称为异众特征数据为与同类数值中的众值不同的数据。
[0106]
步骤s630,若异众比率大于异众比率阈值,则对异众特征数据进行剔除,并对剔除异众特征数据后的传感器特征数据集进行缺失值填充。具体的,计算如图10所示的数据表中的特征列中的异常值与非异常值之间的比率,当特征列中的异常值与非异常值之间的比率大于预设的异常值与非异常值之间的比率时。则将该特征列中的异常值进行剔除,并对
剔除异常值后的特征列中的空位进行填充,其中填充的方法包括但不限制于众值填充、固定值填充、线性填充、中位数填充以及近邻数填充等。例如,可以采用众值对剔除异常值后的特征列进行缺失值填充,具体的,若x1特征列中包含的数据为:x1,x2,x3,x1,其中,x2为异常值,则将异常值x2进行剔除,并对剔除异常值后的x1特征列进行填充,其中,可以通过该数列中的众值x1进行填充,得到填充后的x1特征数列为:x1,x1,x3,x1;当然,也可以通过x2的近邻值x3进行填充,得到填充后的x1特征数列为x1,x3,x3,x1,在此本实施例不对填充方法进行限制。
[0107]
在本实施例中,在对待处理的传感器特征数据集进行去噪预处理之前,计算传感器特征数据集中的特征列中的异众比率,并判断异众比率是否大于预设的异众比率阈值,以保证终端设备所采集到的数据的质量,并且若异众比率小于或等于异众比率阈值,则保留异众特征数据,减少服务器对异众进行处理的负担;并在若异众比率大于异众比率阈值,则对异众特征数据进行剔除,对剔除异众特征数据的特征列中的空位进行填充,以此进一步的保证了传感器特征数据集中数据的质量和有效性,并进一步提高机器学习模型的精确性。
[0108]
进一步的,基于上述实施例,在本技术所提供的其中一个示例性实施例中,处理后的点触行为的特征数据集还包括点触行为的统计特征;点触行为数据处理方法还包括以下步骤:
[0109]
计算待处理的点触行为的特征数据集中的数据对应的均值、中位数、异众比率、方差、变异系数、偏度系数、峰度系数以及均方递差中的一项或者多项,以得到点触行为的统计特征。
[0110]
具体的,用户在终端设备界面上进行交互时所进行的触摸操作产生的待处理的点触行为数据一般是用于机器学习训练的样本数据,一般为结构化数据,通常以表格形式进行存储(如图10所示),其中,表中的每一行代表一个样本,列包括特征列和标签列,每一个特征列代表一个特征,标签列标识样本的类别。并计算每一特征列中的样本对应的均值、中位数、异众比率、方差、变异系数、偏度系数、峰度系数以及均方递差中的一项或者多项,以得到点触行为对应的统计特征。
[0111]
示例性的,终端设备采集到的传感器数据其中的一个特征列为x1,且x1特征列中包含的数据为:x1,x2,x3

xn,则计算x1特征列的平均值如下:
[0112][0113]
示例性的,终端界面采集用户在触摸操作所产生的参数的待处理的点触行为数据,该点触行为数据一般为结构化的数据,并且,为了进一步的提高用于机器学习训练的样本数据的质量,需要计算上述采集到的点触数据的描述性统计特征并以结构化表格的形式存储。例如,以终端界面的加速传感器所采集的信息为示例,如下表所示:
[0114]
序号字段名数据类型描述说明1idstring样本唯一标签2avg-acc-xdouble加速传感器x轴采集信息的均值3avg-acc-ydouble加速传感器y轴采集信息的均值
4avg-acc-zdouble加速传感器z轴采集信息的均值
[0115]
并进一步的计算上述实施例中的各个按键按压(触摸事件)时长对应的均值、方差、最大值以及最小值;计算上述实施例中两个连续下压(滑动事件)时长对应的均值、方差、最大值以及最小值;计算上述实施例中两个连续按键(点击事件)的间隔时长对应的均值以及方差;计算上述加速传感器高维特征(加速度聚合)对应的均值、方差、最大值、最小值、偏度均值、峰度均值、均方递差均值、异众比率均值、变异系数均值。
[0116]
并将所有采集到的特征用唯一样本标签来做关联,合并到最终的特征表中,如下表所示:
[0117]
[0118]
[0119][0120]
在本实施例中,通过计算用户点触行为中的特征数据集中的数据对应的均值、中位数、异众比率、方差、变异系数、偏度系数、峰度系数以及均方递差中的一项或者多项,得到多个维度的点触行为的统计特征,不仅增加了点触行为数据的维度,而且丰富了机器训练样本的维度,提高了机器学习的精确度。
[0121]
图11是以示例性实际应用的人机识别场景下的点触行为数据梳理流程示意图,如图11所示,以用户在开放银行服务系统下进行人机识别为例,用户根据登录需求终端界面上进行点触交互。当用户点击“人机交互登录”字样时,终端采集用户在登录场景下的原始点触数据,其中包括采集用户的id标签,以及终端上的传感器所采集到的原始数据,并对采集到的传感器数据进行去噪处理,以根据去噪后的传感器数据构造该用户点触行为对应的时间特征、高维特征以及融合特征。具体的,根据去噪后的传感器数据构造用户点触行为对应的时间特征,其中包括计算用户点触行为对应的各个按键按压时长、两个连续按键下压时长以及两个连续按键的间隔时长;并进一步计算各按键按压时长、两个连续按键下压时长以及两个连续按键的间隔时长对应的均值、方差以及极值等描述性统计特征;以及根据去噪后的传感器数据计算传感器对应的高维特征组合,并进一步的根据传感器的高维特征组合构造该用户点触行为对应的融合特征,以使得根据去噪以及特征构造后得到的用户点触行为数据在人机识别过程中得到的识别结果更准确可靠。
[0122]
如图12所示,本技术的另一示例性实施例提供了一种点触行为数据处理装置。该示例性的点触行为数据处理装置1200,具体包括:
[0123]
获取模块1210,用于获取待处理的点触行为的特征数据集,其中,特征数据集包括传感器特征数据集;去噪模块1220,用于对传感器特征数据集进行去噪处理;特征工程模块1230,用于根据去噪后的传感器特征数据集构造点触行为的时间特征、高维特征和融合特征;输出模块1140,用于输出处理后的点触行为的特征数据集,处理后的点触行为的特征数据集包括点触行为的时间特征、高维特征以及融合特征。
[0124]
在另一示例性实施例中,传感器特征数据集包括按压力度和按压面积,特征工程模块1230包括:确定单元,用于根据按压力度和按压面积确定点触行为所对应的多个按键及多个按键各自对应的按压时长;特征构造单元,用于基于多个按键及多个按键各自对应的按压时长构造点触行为的时间特征。
[0125]
在另一示例性实施例中,按压时长包括下压时间点和抬起时间点;特征构造单元具体包括:时间特征构造子单元,基于多个按键中各个按键对应的下压时间点和抬起时间点构造点触行为的时间特征。
[0126]
在另一示例性实施例中,时间特征构造子单元可用于:
[0127]
计算多个按键中的各个按键对应的下压时间点和抬起时间点之间的时间差,以构造点触行为对应的第一时间特征;计算多个按键中的相邻时间被按压的两个按键对应的两个下压时间点之间的时间差,以构造点触行为的第二时间特征;计算多个按键中第一按键的抬起时间点和第二按键的下压时间点之间的时间差,以构造点触行为的第三时间特征,其中,第一按键和第二按键为多个按键中相邻时间被按压的两个按键。
[0128]
在另一示例性实施例中,传感器特征数据集包括加速传感器坐标数据和旋转速率传感器坐标数据;特征工程模块1230可用于:
[0129]
计算加速传感器坐标数据对应的向量的模,以构造加速传感器的高维特征;计算旋转速率传感器坐标数据对应的向量的模,以构造旋转速率传感器的高维特征;基于加速传感器的高维特征和旋转速率传感器的高维特征构造点触行为的融合特征。
[0130]
在另一示例性实施例中,点触行为数据处理装置1200还包括:
[0131]
计算模块,用于计算传感器特征数据集中的异众比率,并判断异众比率是否大于预设的异众比率阈值;第一判断模块,用于若异众比率小于或等于异众比率阈值,则保留异众特征数据,异众特征数据为与同类数值中的众值不同的数据;第二判断模块,用于若异众比率大于异众比率阈值,则对异众特征数据进行剔除,并对剔除异众特征数据后的传感器特征数据集进行缺失值填充。
[0132]
在另一示例性实施例中,点触行为数据处理装置1200还包括:
[0133]
统计特征构造模块,用于计算待处理的点触行为的特征数据集中的数据对应的均值、中位数、异众比率、方差、变异系数、偏度系数、峰度系数以及均方递差中的一项或者多项,以得到点触行为的统计特征。
[0134]
需要说明的是,上述实施例所提供的点触行为数据处理装置与上述实施例所提供的点触行为数据处理方法属于同一构思,其中各个模块和单元执行操作的具体方式已经在方法实施例中进行了详细描述,此处不再赘述。上述实施例所提供的点触行为数据处理装置在实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能,本处也不对此进行限制。
[0135]
本技术的实施例还提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行时,使得电子设备实现上述各个实施例中提供的点触行为数据处理方法。
[0136]
图13示出了适于用来实现本技术实施例的电子设备的计算机系统的结构示意图。需要说明的是,图13示出的电子设备的计算机系统1200仅是一个示例,不应对本技术实施例的功能和使用范围带来任何限制。
[0137]
如图13所示,计算机系统1300包括中央处理单元(central processing unit,cpu)1301,其可以根据存储在只读存储器(read-only memory,rom)1302中的程序或者从储存部分1308加载到随机访问存储器(random access memory,ram)1303中的程序而执行各种适当的动作和处理,例如执行上述实施例中的方法。在ram 1303中,还存储有系统操作所需的各种程序和数据。cpu 1301、rom 1302以及ram 1303通过总线1304彼此相连。输入/输出(input/output,i/o)接口1305也连接至总线1304。
[0138]
以下部件连接至i/o接口1305:包括键盘、鼠标等的输入部分1306;包括诸如阴极射线管(cathode ray tube,crt)、液晶显示器(liquid crystal display,lcd)等以及扬声器等的输出部分1307;包括硬盘等的储存部分1308;以及包括诸如lan(local area network,局域网)卡、调制解调器等的网络接口卡的通信部分1309。通信部分1309经由诸如因特网的网络执行通信处理。驱动器1310也根据需要连接至i/o接口1305。可拆卸介质1311,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1310上,以便于从其上读出的计算机程序根据需要被安装入储存部分1308。
[0139]
特别地,根据本技术的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本技术的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的计算机程序。在这样的实施例中,该计算机程序可以通过通信部分1309从网络上被下载和安装,和/或从可拆卸介质1311被安装。在该计算机程序被中央处理单元(cpu)1301执行时,执行本技术的系统中限定的各种功能。
[0140]
需要说明的是,本技术实施例所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(erasable programmable read only memory,eprom)、闪存、光纤、便携式紧凑磁盘只读存储器(compact disc read-only memory,cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本技术中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的计算机程序。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的计算机程序可以用任何适当的介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
[0141]
附图中的流程图和框图,图示了按照本技术各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。其中,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0142]
描述于本技术实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
[0143]
本技术的另一方面还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如前的点触行为数据处理方法。该计算机可读存储介质可以是上述实施例中描述的电子设备中所包含的,也可以是单独存在,而未装配入该电子设备中。
[0144]
本技术的另一方面还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各个实施例中提供的点触行为数据处理方法。
[0145]
上述内容,仅为本技术的较佳示例性实施例,并非用于限制本技术的实施方案,本领域普通技术人员根据本技术的主要构思和精神,可以十分方便地进行相应的变通或修改,故本技术的保护范围应以权利要求书所要求的保护范围为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1