本技术涉及数据处理技术的领域,尤其是涉及一种数据整理方法及系统。
背景技术:
1、数据整理是对调查、观察、实验等研究活动中所搜集到的资料进行检验、归类编码和数字编码的过程,其中所述的数据包括有图片数据、文字数据、数字数据等。
2、相关技术中,目前需要对图片数据进行整理的情况一般为用户外出时会于同一拍摄点拍摄较多类似的图片,在后期有时间对图片进行处理时,用户会针对相类似的图片选取满意的图片留下,其余进行删除操作,实现于手机中对图片进行整理。
3、针对上述中的相关技术,发明人认为在后期用户对图片进行处理之前,用户仍需要使用手机进行拍照,而相类似的图片会占用手机较大的存储空间,一旦手机存储空间被占用较大时,会出现手机卡顿的情况,影响用户体验。
技术实现思路
1、为了减少手机存储空间因类似图片而被占用较大的情况发生,本技术提供一种数据整理方法及系统。
2、第一方面,本技术提供一种数据整理方法,采用如下的技术方案:
3、一种数据整理方法,包括:
4、获取需求整理图片;
5、于需求整理图片中获取各像素点的像素位置以及像素灰度值;
6、于不同需求整理图片的同一像素位置下根据像素灰度值进行差值计算以确定差值灰度值;
7、将差值灰度值小于预设的相似阈值的像素点定义为相似像素点,并于需求整理图片中根据相似像素点进行计数以确定该需求整理图片相较于另一需求整理图片的相似数量;
8、根据相似数量以及预设的总像素数量进行计算以确定相似程度值;
9、将相似程度值大于预设的基准需求值的需求整理图片归纳于同一预设的初始为空的图片集合中,并于图片集合归纳后于各图片集合中选取一级代表图片;
10、于各图片集合中将除一级代表图片以外的需求整理图片进行压缩以生成图片一级压缩包,并将图片一级压缩包与相对应的一级代表图片相连接。
11、通过采用上述技术方案,对于需要进行整理的图片,通过灰度值情况分析各图片之间的相似程度,将相似程度高的归纳于同一集合中以进行压缩,实现存储空间上的释放,同时对于每个压缩包均设置代表图片,使得用户能够通过代表图片得知每个压缩包内压缩的图片情况,便于后期用户自行对图片进行整理。
12、可选的,于图片集合归纳后,数据整理方法还包括:
13、将图片集合中的需求整理图片定义为集内图片,并将处于该图片集合以外的需求整体图片定义为该图片集合相对应的集外图片;
14、于集外图片中将相较于任一集内图片的相似程度值大于预设的替补需求值的集外图片定义为替补图片,并将与该替补图片相对应的相似程度值最大的集内图片定义为相对图片;
15、于替补图片中将相较于相对图片而言不为相似像素点的像素点定义为异类像素点,并以任一异类像素点为圆心、预设的相邻像素距离为半径以划定相邻区域;
16、将处于同一相邻区域内的异类像素点归纳于同一预设的初始为空的像素点集合内,并于归纳完成后根据像素点集合内的异类像素点进行计数以确定异类数量;
17、根据预设的排序规则以确定数值最大的异类数量,并根据该异类数量以更新相似程度值,且于相似程度值更新后重新归纳图片集合。
18、通过采用上述技术方案,对照片中突然闯入物体以使照片相似程度判断较低的情况进行分析,以使得照片能够较好的进行管理。
19、可选的,于各像素点集合的异类数量确定后,数据整理方法还包括:
20、根据单个像素点集合内的异类像素点相互连线以确定异类外轮廓线,并将异类外轮廓线围合形成的区域定义为异类区域,且获取异类区域的异类面积;
21、将异类区域与预设的边缘区域重叠的区域确定为重叠区域,并根据重叠区域确定重叠面积;
22、根据重叠面积以及异类面积进行计算以确定边缘占比值;
23、判断边缘占比值是否大于预设的基准占比值;
24、若边缘占比值大于基准占比值,则定义该像素点集合为有效集合;
25、若边缘占比值不大于基准占比值,则定义该像素点集合为无效集合;
26、于所有的有效集合中根据排序规则确定数值最大的异类数量并更新相似程度值。
27、通过采用上述技术方案,对为突然入境的物体进行较为准确的确定,以便于后续对图片进行整理。
28、可选的,于各图片集合中选取一级代表图片的步骤包括:
29、于图片集合中取任一需求整理图片为原始图片,并将其余需求整理图片确定为判定图片,且将原始图片与判定图片之间的相似程度值定义为比较程度值;
30、根据排序规则以确定数值最大的比较程度值,并将该比较程度值定义为标准程度值;
31、根据比较程度值与标准程度值进行差值计算以确定差值程度值,并根据所有的差值程度值进行计算以确定偏差程度值;
32、根据排序规则以确定数值最小的偏差程度值,并将该偏差程度值相对应的原始图片确定为一级代表图片。
33、通过采用上述技术方案,可确定较为合适的一级代表图片以用于代表压缩包内的其余图片。
34、可选的,选取一级代表图片的步骤还包括:
35、判断是否存在至少两个偏差程度值数值最小的原始图片;
36、若不存在至少两个偏差程度值数值最小的原始图片,则将该原始图片确定为一级代表图片;
37、若存在至少两个偏差程度值数值最小的原始图片,则于单个原始图片中根据排序规则确定数值最大的差值程度值,并将根据该差值程度值以及偏差程度值进行计算以确定剩余程度值;
38、根据排序规则确定数值最小的剩余程度值,并根据该剩余程度值相对应的原始图片进行计数以确定符合数量;
39、判断符合数量是否大于一;
40、若符合数量不大于一,则根据该原始图片确定一级代表图片;
41、若符合数量大于一,则于剩余程度值对应的差值程度值中根据排序规则继续确定数值最大的差值程度值并更新剩余程度值,直至符合数量不大于一以根据原始图片确定一级代表图片。
42、通过采用上述技术方案,可对多个满足要求的原始图片进行筛选以确定较为合适的一级代表图片。
43、可选的,于图片一级压缩包与相对应的一级代表图片相连接后,数据整理方法还包括:
44、将所有一级代表图片之间的相似程度值定义为代表程度值;
45、根据一级代表图片所确定的偏差程度值进行均值计算以确定均值程度值;
46、根据预设的系数匹配关系以确定任意两个一级代表图片的均值程度值相对应的需求程度值;
47、判断两个一级代表图片的代表程度值是否大于需求程度值;
48、若两个一级代表图片的代表程度值不大于需求程度值,则无动作;
49、若两个一级代表图片的代表程度值大于需求程度值,则将两个一级代表图片归纳于预设的初始为空的代表集合中,直至所有的一级代表图片均进行代表集合分析;
50、于代表集合中确定二级代表图片,并对其余一级代表图片以及图片一级压缩包进行压缩以生成图片二级压缩包,且于图片二级压缩包生成后继续分析二级代表图片的代表程度值,直至不存在能够继续压缩的情况。
51、通过采用上述技术方案,可对压缩包进一步压缩以进一步缩小存储空间。
52、可选的,若两个一级代表图片的代表程度值大于需求程度值时,数据整理方法还包括:
53、于单个一级代表图片将相对应的代表程度值大于需求程度值的另一一级代表图片定义为相邻图片;
54、于单个一级代表图片下判断相邻图片是否唯一;
55、若相邻图片唯一,则将两个一级代表图片归纳于初始为空的代表集合中;
56、若相邻图片不唯一,则于相邻图片中根据排序规则以确定数值最大的代表程度值,并根据该代表程度值相对应的相邻图片以归纳于同一代表集合中。
57、通过采用上述技术方案,可确定较为合适的图片归纳于同一集合中进行压缩。
58、第二方面,本技术提供一种数据整理系统,采用如下的技术方案:
59、一种数据整理系统,包括:
60、获取模块,用于获取需求整理图片;
61、处理模块,与获取模块和判断模块连接,用于信息的存储和处理;
62、判断模块,与获取模块和处理模块连接,用于信息的判断;
63、获取模块于需求整理图片中获取各像素点的像素位置以及像素灰度值;
64、处理模块于不同需求整理图片的同一像素位置下根据像素灰度值进行差值计算以确定差值灰度值;
65、处理模块将判断模块判断出的差值灰度值小于预设的相似阈值的像素点定义为相似像素点,并于需求整理图片中根据相似像素点进行计数以确定该需求整理图片相较于另一需求整理图片的相似数量;
66、处理模块根据相似数量以及预设的总像素数量进行计算以确定相似程度值;
67、处理模块将判断模块判断出的相似程度值大于预设的基准需求值的需求整理图片归纳于同一预设的初始为空的图片集合中,并于图片集合归纳后于各图片集合中选取一级代表图片;
68、处理模块于各图片集合中将除一级代表图片以外的需求整理图片进行压缩以生成图片一级压缩包,并将图片一级压缩包与相对应的一级代表图片相连接。
69、通过采用上述技术方案,对于需要进行整理的图片,通过处理模块对灰度值情况分析各图片之间的相似程度,将相似程度高的归纳于同一集合中以进行压缩,实现存储空间上的释放,同时对于每个压缩包均设置代表图片,使得用户能够通过代表图片得知每个压缩包内压缩的图片情况,便于后期用户自行对图片进行整理。
70、综上所述,本技术包括以下至少一种有益技术效果:
71、在对图片进行整理时,根据图片的相似程度进行归纳并压缩,以减少手机存储空间因类似图片而被占用较大的情况发生;
72、对于异常入境的物体可进行识别以使得相似的图片尽可能准确的归纳;
73、可选取合适的代表图片对要压缩的图片进行代表,以便于后续用户较为方便的得知压缩包内的图片内容。