数据压缩方法、数据压缩装置、介质及设备与流程

文档序号:35420491发布日期:2023-09-13 01:50阅读:23来源:国知局
数据压缩方法、数据压缩装置、介质及设备与流程

本申请涉及数据压缩,具体而言,涉及一种数据压缩方法、数据压缩装置、计算机可读存储介质及电子设备。


背景技术:

1、数据压缩(data compression,dc),是用更少的空间对原有数据进行编码的过程,在不丢失有用信息的前提下,缩减数据量以减少存储空间,提高其传输、存储和处理效率,或按照一定的算法对数据进行重新组织,减少数据的冗余和存储的空间的一种技术方法。通常,压缩率、压缩性能、解压性能等可以用作评价压缩效果的指标。

2、一般来说,数据压缩采用的手段在于:通过较少的数据位表示较多的数据位的数据,或者,应用压缩算法实现数据压缩。同一压缩算法对不同类型数据的压缩效果差别较大,而实际业务场景中,待压缩的数据通常不具备统一的特性,因此,对所有待压缩的数据都应用现有方式进行统一压缩,可能会出现压缩效果不佳的问题。

3、需要说明的是,在上述背景技术部分公开的信息仅用于加强对本申请的背景的理解,因此可以包括不构成对本领域普通技术人员已知的相关技术的信息。


技术实现思路

1、本申请的目的在于提供一种数据压缩方法、数据压缩装置、计算机可读存储介质及电子设备,可以基于待压缩数据中各字段对应的词频,为待压缩数据生成个性化的压缩标识集合,基于个性化的压缩标识集合对待压缩数据进行压缩,可以降低压缩率,并提升压缩性能和解压性能,即,相较于相关技术,可以实现更优越的压缩效果。

2、本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。

3、根据本申请的一方面,提供一种数据压缩方法,该方法包括:

4、获取待压缩数据,并确定待压缩数据中各字段对应的词频,得到词频集合;

5、基于词频集合,差异化生成针对待压缩数据中的字段的压缩标识,得到压缩标识集合;

6、基于压缩标识集合对待压缩数据进行压缩,得到第一压缩结果。

7、根据本申请的一方面,提供一种数据压缩装置,该装置包括:

8、词频获取单元,用于获取待压缩数据,并确定待压缩数据中各字段对应的词频,得到词频集合;

9、压缩标识生成单元,用于基于词频集合,差异化生成针对待压缩数据中的字段的压缩标识,得到压缩标识集合;

10、数据压缩单元,用于基于压缩标识集合对待压缩数据进行压缩,得到第一压缩结果。

11、根据本申请的一方面,提供一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述的各种可选实现方式中提供的方法。

12、根据本申请的一方面,提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述任意一项的方法。

13、根据本申请的一方面,提供一种电子设备,包括:处理器;以及存储器,用于存储处理器的可执行指令;其中,处理器配置为经由执行可执行指令来执行上述任意一项的方法。

14、本申请示例性实施例可以具有以下部分或全部有益效果:

15、在本申请的一示例实施方式所提供的数据压缩方法中,可以基于待压缩数据中各字段对应的词频,为待压缩数据生成个性化的压缩标识集合,基于个性化的压缩标识集合对待压缩数据进行压缩,可以降低压缩率,并提升压缩性能和解压性能,即,相较于相关技术,可以实现更优越的压缩效果。此外,由于本申请可以依据各字段对应的词频生成个性化的压缩标识集合,因此,个性化的压缩标识集合与待压缩数据的匹配度更高,在保证压缩率、压缩性能和解压性能的前提下,可以避免浪费设备资源,即,可以使用最少的设备资源实现最佳的压缩效果。

16、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。



技术特征:

1.一种数据压缩方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,基于所述词频集合,差异化生成针对所述待压缩数据中的字段的压缩标识,得到压缩标识集合,包括:

3.根据权利要求2所述的方法,其特征在于,确定各所述二类词频对应的压缩存储容量,包括:

4.根据权利要求1所述的方法,其特征在于,还包括:

5.根据权利要求4所述的方法,其特征在于,还包括:

6.根据权利要求5所述的方法,其特征在于,还包括:

7.根据权利要求6所述的方法,其特征在于,获取对应于所述待压缩数据的压缩算法,包括:

8.根据权利要求6所述的方法,其特征在于,还包括:

9.一种数据压缩装置,其特征在于,包括:

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-8中任一项所述的方法。

11.一种电子设备,其特征在于,包括:


技术总结
本申请提供一种数据压缩方法、数据压缩装置、计算机可读存储介质及电子设备,涉及数据压缩技术领域,该方法可以基于待压缩数据中各字段对应的词频,为待压缩数据生成个性化的压缩标识集合,基于个性化的压缩标识集合对待压缩数据进行压缩,可以降低压缩率,并提升压缩性能和解压性能,即,相较于相关技术,可以实现更优越的压缩效果。此外,由于本申请可以依据各字段对应的词频生成个性化的压缩标识集合,因此,个性化的压缩标识集合与待压缩数据的匹配度更高,在保证压缩率、压缩性能和解压性能的前提下,可以避免浪费设备资源,即,可以使用最少的设备资源实现最佳的压缩效果。

技术研发人员:汪忠祥
受保护的技术使用者:同盾网络科技有限公司
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1