一种数据分箱方法、装置、电子设备和存储介质与流程

文档序号:37623704发布日期:2024-04-18 17:38阅读:28来源:国知局
一种数据分箱方法、装置、电子设备和存储介质与流程

所属的技术人员能够理解,本技术的各个方面可以实现为系统、方法或程序产品。因此,本技术的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。与上述方法实施例基于同一发明构思,本技术实施例中还提供了一种电子设备。在一种实施例中,该电子设备可以是服务器,如图1所示的服务器120。在该实施例中,电子设备的结构可以如图8所示,包括存储器801,通讯模块803以及一个或多个处理器802。存储器801,用于存储处理器802执行的计算机程序。存储器801可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统,以及运行即时通讯功能所需的程序等;存储数据区可存储各种即时通讯信息和操作指令集等。存储器801可以是易失性存储器(volatile memory),例如随机存取存储器(random-access memory,ram);存储器801也可以是非易失性存储器(non-volatilememory),例如只读存储器,快闪存储器(flash memory),硬盘(hard disk drive,hdd)或固态硬盘(solid-state drive,ssd);或者存储器801是能够用于携带或存储具有指令或数据结构形式的期望的计算机程序并能够由计算机存取的任何其他介质,但不限于此。存储器801可以是上述存储器的组合。处理器802,可以包括一个或多个中央处理单元(central processing unit,cpu)或者为数字处理单元等等。处理器802,用于调用存储器801中存储的计算机程序时实现上述数据分箱方法。通讯模块803用于与终端设备和其他服务器进行通信。本技术实施例中不限定上述存储器801、通讯模块803和处理器802之间的具体连接介质。本技术实施例在图8中以存储器801和处理器802之间通过总线804连接,总线804在图8中以粗线描述,其它部件之间的连接方式,仅是进行示意性说明,并不引以为限。总线804可以分为地址总线、数据总线、控制总线等。为便于描述,图8中仅用一条粗线描述,但并不描述仅有一根总线或一种类型的总线。存储器801中存储有计算机存储介质,计算机存储介质中存储有计算机可执行指令,计算机可执行指令用于实现本技术实施例的数据分箱方法。处理器802用于执行上述的数据分箱方法,如图2所示。在另一种实施例中,电子设备也可以是其他电子设备,如图1所示的终端设备110。在该实施例中,电子设备的结构可以如图9所示,包括:通信组件910、存储器920、显示单元930、摄像头940、传感器950、音频电路960、蓝牙模块970、处理器980等部件。通信组件910用于与服务器进行通信。在一些实施例中,可以包括电路无线保真(wireless fidelity,wifi)模块,wifi模块属于短距离无线传输技术,电子设备通过wifi模块可以帮助用户收发信息。存储器920可用于存储软件程序及数据。处理器980通过运行存储在存储器920的软件程序或数据,从而执行终端设备110的各种功能以及数据处理。存储器920可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。存储器920存储有使得终端设备110能运行的操作系统。本技术中存储器920可以存储操作系统及各种应用程序,还可以存储执行本技术实施例数据分箱方法的计算机程序。显示单元930还可用于显示由用户输入的信息或提供给用户的信息以及终端设备110的各种菜单的图形用户界面(graphical user interface,gui)。具体地,显示单元930可以包括设置在终端设备110正面的显示屏932。其中,显示屏932可以采用液晶显示器、发光二极管等形式来配置。显示单元930还可用于接收输入的数字或字符信息,产生与终端设备110的用户设置以及功能控制有关的信号输入,具体地,显示单元930可以包括设置在终端设备110正面的触控屏931,可收集用户在其上或附近的触摸操作,例如点击按钮,拖动滚动框等。其中,触控屏931可以覆盖在显示屏932之上,也可以将触控屏931与显示屏932集成而实现终端设备110的输入和输出功能,集成后可以简称触摸显示屏。本技术中显示单元930可以显示应用程序以及对应的操作步骤。摄像头940可用于捕获静态图像,用户可以将摄像头940拍摄的图像通过应用发布。摄像头940可以是一个,也可以是多个。物体通过镜头生成光学图像投射到感光元件。感光元件可以是电荷耦合器件(charge coupled device,ccd)或互补金属氧化物半导体(complementary metal-oxide-semiconductor,cmos)光电晶体管。感光元件把光信号转换成电信号,之后将电信号传递给处理器980转换成数字图像信号。终端设备还可以包括至少一种传感器950,比如加速度传感器951、距离传感器952、指纹传感器953、温度传感器954。终端设备还可配置有陀螺仪、气压计、湿度计、温度计、红外线传感器、光传感器、运动传感器等其他传感器。音频电路960、扬声器961、传声器962可提供用户与终端设备110之间的音频接口。音频电路960可将接收到的音频数据转换后的电信号,传输到扬声器961,由扬声器961转换为声音信号输出。终端设备110还可配置音量按钮,用于调节声音信号的音量。另一方面,传声器962将收集的声音信号转换为电信号,由音频电路960接收后转换为音频数据,再将音频数据输出至通信组件910以发送给比如另一终端设备110,或者将音频数据输出至存储器920以便进一步处理。蓝牙模块970用于通过蓝牙协议来与其他具有蓝牙模块的蓝牙设备进行信息交互。例如,终端设备可以通过蓝牙模块970与同样具备蓝牙模块的可穿戴电子设备(例如智能手表)建立蓝牙连接,从而进行数据交互。处理器980是终端设备的控制中心,利用各种接口和线路连接整个终端的各个部分,通过运行或执行存储在存储器920内的软件程序,以及调用存储在存储器920内的数据,执行终端设备的各种功能和处理数据。在一些实施例中,处理器980可包括一个或多个处理单元;处理器980还可以集成应用处理器和基带处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,基带处理器主要处理无线通信。可以理解的是,上述基带处理器也可以不集成到处理器980中。本技术中处理器980可以运行操作系统、应用程序、用户界面显示及触控响应,以及本技术实施例的数据分箱方法。另外,处理器980与显示单元930耦接。在一些可能的实施方式中,本技术提供的数据分箱方法的各个方面还可以实现为一种程序产品的形式,其包括计算机程序,当程序产品在电子设备上运行时,计算机程序用于使电子设备执行本说明书上述描述的根据本技术各种示例性实施方式的数据分箱方法中的步骤,例如,电子设备可以执行如图2中所示的步骤。程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。本领域内的技术人员应明白,本技术的实施例可提供为方法、系统、或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。本技术是参照根据本技术的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。显然,本领域的技术人员可以对本技术进行各种改动和变型而不脱离本技术的精神和范围。这样,倘若本技术的这些修改和变型属于本技术权利要求及其等同技术的范围之内,则本技术也意图包含这些改动和变型在内。


背景技术:

1、数据分箱是一种数据预处理技术,在数据处理之前,其将数据划分为若干个区间,从而简化数据复杂性,使数据更易处理。但当前,往往会出现需要多方共同参与数据处理的情况,一方面为了保证数据安全和隐私,需要各方对各自的数据进行保密,另一方面,数据分箱又需要各方共享数据,以得知各自的数据在数据分箱中的结果。

2、相关技术中,通常不对数据进行加密,直接将多方数据聚合并进行数据分箱,或者多方各自对自己的数据进行加密,并将加密后的数据与私钥发送至第三方(例如代理方),以在数据传输过程中减小数据泄露风险,并可以避免其他参与方获取到自身的数据,最后由第三方完成分箱并返回结果,但由于第三方持有私钥,因此该方法依旧有数据从第三方泄露风险。

3、因此,如何提高数据分箱的数据安全性是亟待解决的。


技术实现思路

1、本技术实施例提供一种数据分箱方法、装置、电子设备和存储介质,用以提高数据分箱的数据安全性。

2、本技术实施例提供的一种数据分箱方法,包括:

3、获取待分箱的各原始数据组,以及每个原始数据组所关联的对象,并将各对象各自拥有的公钥分别发送至其他对象;

4、对于每个对象,分别执行以下操作:

5、将所述对象作为目标对象,并在所述目标对象对应的个人公钥之外的其他公钥中,选取一个目标公钥;

6、基于所述目标公钥,分别对所述目标对象与其他对象各自对应的原始数据组进行同态加密,得到所述目标对象与其他对象各自对应的加密数据组;

7、对各加密数据组中的各加密数据统一进行数据分箱操作,得到数据分箱结果;

8、基于所述目标对象对应的加密数据在所述数据分箱结果中的位置,确定所述目标对象对应的原始数据组中的各原始数据所对应的数据分箱子结果。

9、本技术实施例提供的一种数据分箱装置,包括:

10、获取单元,用于获取待分箱的各原始数据组,以及每个原始数据组所关联的对象,并将各对象各自拥有的公钥分别发送至其他对象;

11、分箱单元,用于对于每个对象,分别执行以下操作:

12、将所述对象作为目标对象,并在所述目标对象对应的个人公钥之外的其他公钥中,选取一个目标公钥;

13、基于所述目标公钥,分别对所述目标对象与其他对象各自对应的原始数据组进行同态加密,得到所述目标对象与其他对象各自对应的加密数据组;

14、对各加密数据组中的各加密数据统一进行数据分箱操作,得到数据分箱结果;

15、基于所述目标对象对应的加密数据在所述数据分箱结果中的位置,确定所述目标对象对应的原始数据组中的各原始数据所对应的数据分箱子结果。

16、可选的,若数据分箱操作为等距分箱操作,则所述分箱单元具体用于:

17、基于数据大小,分别将各加密数据组各自包含的上界加密数据与下界加密数据发送至目标对象;

18、对各上界加密数据进行两两比较,以及对各下界加密数据进行两两比较,并基于比较结果确定共同上界加密数据与共同下界加密数据;

19、基于所述共同上界加密数据与所述共同下界加密数据,以及预设的分箱个数,确定所述数据分箱结果。

20、可选的,若数据分箱操作为等频分箱操作,则所述分箱单元具体用于:

21、将各加密数据组发送至目标对象;

22、对所述各组加密数据进行整体排序,得到排序结果;

23、基于所述排序结果和预设的分箱个数,确定所述数据分箱结果。

24、可选的,所述分箱单元具体用于通过以下方式对相应加密数组中的各加密数据进行两两比较得到所述上界加密数据与所述下界加密数据:

25、对于所述加密数据组中的每两个加密数据,基于第一加密数据和第二加密数据之和,与所述第一加密数据和所述第二加密数据的完全平方差的平方根结果,确定所述第一加密数据和所述第二加密数据之间的大小关系;

26、基于各大小关系确定所述上界加密数据与所述下界加密数据。

27、可选的,所述平方根结果是基于预设的开方近似运算规则得到的。

28、可选的,所述分箱单元还用于:

29、若所述目标对象对应的加密数据与其他对象对应的加密数据存在数据重复,则基于所述排序结果中,重复加密数据的排序首位或排序末位确定所述重复加密数据在数据分箱中的位置。

30、本技术实施例提供的一种电子设备,包括处理器和存储器,其中,所述存储器存储有计算机程序,当所述计算机程序被所述处理器执行时,使得所述处理器执行上述任意一种数据分箱方法的步骤。

31、本技术实施例提供一种计算机可读存储介质,其包括计算机程序,当所述计算机程序在电子设备上运行时,所述计算机程序用于使所述电子设备执行上述任意一种数据分箱方法的步骤。

32、本技术实施例提供一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序存储在计算机可读存储介质中;当电子设备的处理器从计算机可读存储介质读取所述计算机程序时,所述处理器执行所述计算机程序,使得所述电子设备执行上述任意一种数据分箱方法的步骤。

33、本技术有益效果如下:

34、本技术实施例提供了一种数据分箱方法、装置、电子设备和存储介质,由于本技术中各方在获取自身原始数据的数据分箱子结果的过程中,都是在对加密数据进行数据处理,且加密所使用的公钥并非自身公钥,使得各方均无法得知其他方的数据的明文,且加密过程使用同态加密,因此可以实现直接对加密数据进行分箱,对加密数据进行处理所得到的分箱结果可以与原始数据得到的分箱结果一致;进一步的整个数据分箱过程没有第三代理方参与,各方在各自本地即可完成数据分箱,可以保证数据安全性以及分箱过程的便捷性。

35、本技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本技术而了解。本技术的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1