一种文件数量统计方法、装置、设备及存储介质与流程

文档序号:23846845发布日期:2021-02-05 12:31阅读:68来源:国知局
一种文件数量统计方法、装置、设备及存储介质与流程

[0001]
本发明涉及计算机技术领域,特别涉及一种文件数量统计方法、装置、设备及存储介质。


背景技术:

[0002]
在系统运行过程中,由于对目录规划设置不合理,或缺少文件清理机制,或出现程序异常情况,则可能会导致目录下文件大量堆积的异常情况,若文件持续堆积,当目录中的文件数目达到一定数量级(例如:百万级别),目录文件的物理存储结构就会变得过于庞大,会导致访问该目录时文件读写时延变大,系统输入和输出(io,input and output)时间变长,同时使得占用的中央处理器(cpu,central processing unit)资源增加,进而会导致处理时间缓慢和系统成功率下降等问题产生,严重时甚至会导致服务器夯死,造成损失。
[0003]
针对目录文件堆积导致的运行风险,迫切需要对目录文件数量进行有效的统计,但是由于对于大目录文件数量统计存在执行时间长、消耗系统资源大的突出问题,目前还没有有效的解决方案,现有的各种统计软件、产品均无法实现对目录文件数进行有效统计。


技术实现要素:

[0004]
本发明要解决的是现有统计目录文件时间长、系统资源消耗大的技术问题。
[0005]
为解决上述技术问题,本申请在一方面公开了一种文件数量统计方法,其包括:
[0006]
获取第一请求,该第一请求携带有第一待查目录文件的标识;
[0007]
根据该第一待查目录文件的标识确定该第一待查目录文件,并获取该第一待查目录文件的空间占用值;
[0008]
若该第一待查目录文件的空间占用值大于等于第一预设阈值,则确定第一文件数量统计模式;该第一文件数量统计模式包括文件采样规则和文件数量统计模型;
[0009]
利用该文件采样规则对该第一待查目录文件进行采样,得到文件采样信息;
[0010]
根据该文件采样信息和该第一待查目录文件的空间占用值按照该文件数量统计模型确定出该第一待查目录文件包含的文件数量。
[0011]
可选地,该利用该文件采样规则对该第一待查目录文件进行采样,得到文件采样信息,包括:
[0012]
对该第一待查目录文件进行采样,确定该第一待查目录文件上的多个采样点;该多个采样点中任意两个相邻的采样点之间的间距等于预设步长;该第一待查目录文件包括多个子文件;
[0013]
获取每个该采样点对应的子文件的文件信息,得到文件信息集;
[0014]
根据该文件信息集确定出该文件采样信息。
[0015]
可选地,该文件信息包括采样次数信息,次级文件存在信息和结构体体量信息;文件采样信息包括采样次数,次级文件存在次数和结构体体量值;
[0016]
该根据文件信息集确定出该文件采样信息,包括:
[0017]
根据该文件信息集中多个采样次数信息确定该该采样次数;
[0018]
根据该文件信息集中多个次级文件存在信息确定该次级文件存在次数;
[0019]
根据该文件信息集中多个结构体体量信息确定该结构体体量值。
[0020]
可选地,该根据该文件采样信息和该第一待查目录文件的空间占用值按照该文件数量统计模型确定出该第一待查目录文件包含的文件数量,包括:
[0021]
针对该文件数量统计模型根据该采样次数和该次级文件存在次数确定出文件填充率;
[0022]
根据多个该结构体体量值确定出平均结构体体量值;
[0023]
根据该文件填充率、该平均结构体体量值和该第一待查目录文件的空间占用值确定出该第一待查目录文件包含的文件数量。
[0024]
可选地,该根据该第一待查目录文件的标识确定该第一待查目录文件,并获取该第一待查目录文件的空间占用值之后,还包括:
[0025]
若该第一待查目录文件的空间占用值大于等于第二预设阈值且小于该第一预设阈值,则确定第二文件数量统计模式;
[0026]
基于该第二文件数量统计模式对该第一待查目录文件的文件内容信息进行遍历,得到遍历结果;
[0027]
根据该遍历结果确定出该第一待查目录文件包含的文件数量。
[0028]
可选地,该获取第一请求,该第一请求携带有第一待查目录文件的标识之前,还包括:
[0029]
获取第二请求,该第二请求携带有第二待查目录的标识;
[0030]
根据该第二待查目录文件的标识确定该第二待查目录文件,并获取该第二待查目录文件的空间占用值;
[0031]
若该第二待查目录文件的空间占用值大于等于该第二预设阈值,则确定该第二待查目录文件为第一待查目录文件。
[0032]
可选地,该获取第一请求,该第一请求携带有第一待查目录文件的标识之前,还包括:
[0033]
获取第三请求,该第三请求携带有待查文件系统的标识;
[0034]
根据该待查文件系统的标识确定该待查文件系统,并获取该待查文件系统的文件数量索引信息;
[0035]
根据该文件数量索引信息确定该待查文件系统的文件数量值;
[0036]
若该待查文件系统的文件数量值大于等于第三预设阈值,则确定该待查文件系统的目录文件为待查目录文件。
[0037]
本申请在另一方面还公开了一种文件数量统计装置,其包括:
[0038]
获取模块,用于获取第一请求,该第一请求携带有第一待查目录文件的标识;
[0039]
第一确定模块,用于根据该第一待查目录文件的标识确定该第一待查目录文件,并获取该第一待查目录文件的空间占用值;
[0040]
第二确定模块,用于若该第一待查目录文件的空间占用值大于等于第一预设阈值,则确定第一文件数量统计模式;该第一文件数量统计模式包括文件采样规则和文件数量统计模型;
[0041]
采样模块,用于利用该文件采样规则对该第一待查目录文件进行采样,得到文件采样信息;
[0042]
第三确定模块,用于根据该文件采样信息和该第一待查目录文件的空间占用值按照该文件数量统计模型确定出该第一待查目录文件包含的文件数量。
[0043]
本申请在另一方面还公开了一种设备,该设备包括处理器和存储器,该存储器中存储有至少一条指令、至少一段程序、代码集或指令集,该至少一条指令、该至少一段程序、该代码集或指令集由该处理器加载并执行以实现上述的文件数量统计方法。
[0044]
本申请在另一方面还公开了一种计算机存储介质,该计算机存储介质中存储有至少一条指令或至少一段程序,该至少一条指令或至少一段程序由处理器加载并执行以实现上述的文件数量统计方法。
[0045]
采用上述技术方案,本申请提供的文件数量统计方法具有如下有益效果:
[0046]
本申请提供的一种文件数量统计方法包括如下步骤:获取第一请求,该第一请求携带有第一待查目录文件的标识;根据该第一待查目录文件的标识确定该第一待查目录文件,并获取该第一待查目录文件的空间占用值;若该第一待查目录文件的空间占用值大于等于第一预设阈值,则确定第一文件数量统计模式;该第一文件数量统计模式包括文件采样规则和文件数量统计模型;利用该文件采样规则对该第一待查目录文件进行采样,得到文件采样信息;根据该文件采样信息和该第一待查目录文件的空间占用值按照该文件数量统计模型确定出该第一待查目录文件包含的文件数量。通过上述方法,能够在满足统计文件数量的低消耗和准确性的同时,还能够有效提高统计文件数量的速度。
附图说明
[0047]
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0048]
图1是本申请实施例提供的一种应用环境的示意图;
[0049]
图2是本申请实施例提供的一种文件数量统计方法的流程示意图;
[0050]
图3是本申请实施例提供的一种文件数量统计方法的流程示意图;
[0051]
图4是本申请实施例提供的一种基于第一文件数量统计模式的目录文件存储结构示意图;
[0052]
图5是本申请实施例提供的一种文件数量统计装置结构示意图;
[0053]
图6是本申请实施例提供的一种服务器结构示意图;
[0054]
图7是本申请实施例提供的一种计算机可读存储介质的结构框图。
具体实施方式
[0055]
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0056]
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0057]
请参阅图1,图1是本申请实施例提供的一种应用环境的示意图,该场景包括终端或者服务器01、位于该终端或者服务器01上的用户界面模块011和文件统计模块012,该用户界面模块011用于接收用户做出指令信息,并将该请求信息发送给文件统计模块012;该文件统计模块012用于接收用户在模块011上做出的指令信息,从而执行该指令;该终端或者服务器01可以将文件统计模块012在执行指令过程中的信息或者生成的数据存储起来,也可以为文件统计模块012在执行指令过程中提供信息(比如第一待查目录文件的空间占用值)。
[0058]
具体地,该用户界面模块011可以获取用户做出的对终端01的第一待查目录文件进行文件数量统计的第一请求后,并将该第一请求发送给文件统计模块012,该第一请求携带有第一待查目录文件的标识,文件统计模块012根据第一待查目录文件的标识确定出终端01上的第一待查目录文件,随后,文件统计模块012从终端01上获取第一待查目录文件的空间占用值,若该第一待查目录文件的空间占用值大于等于第一预设阈值,则确定第一文件数量统计模式;该第一文件数量统计模式包括文件采样规则和文件数量统计模型;随后,文件统计模块012利用文件采样规则对该第一待查目录文件进行采样,得到文件采样信息;随后,文件统计模块012根据该文件采样信息和该第一待查目录文件的空间占用值按照该文件数量统计模型统计出该第一待查目录文件包含的文件数量。
[0059]
本申请实施例中,该终端01可以是移动终端,也可以是计算机终端;用户界面模块011和文件统计模块012之间可以通过有线连接,也可以通过无线连接。
[0060]
以下介绍本申请一种文件数量统计方法的具体实施例,图2是本申请实施例提供的一种文件数量统计方法的流程示意图,本说明书提供了如实施例或流程图的方法操作步骤,但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的系统或服务器产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境)。具体的如图2所示,该方法可以包括:
[0061]
s201:获取第一请求,该第一请求携带有第一待查目录文件的标识。
[0062]
本申请实施例中,获取的该第一请求可以是获取用户发出的第一请求,具体地,用户通过在终端输入与统计该第一待查目录文件的文件数量相关的参数,从而形成相应的请求;也可以是获取设备自己通过预设的程序发出的请求,该第一请求携带有第一待查目录文件的标识或者路径信息。
[0063]
在一种可选地实施方式中,为了减少对不需要进行文件数量统计的第一待查目录文件进行统计的次数,进而提高统计效率,并减少相应的资源消耗,在步骤s201之前,该统计方法还包括:
[0064]
获取第二请求,该第二请求携带有第二待查目录的标识。本申请实施例中,获取的该第二请求可以是获取用户发出的第二请求;具体地,用户通过在终端输入与统计该第一待查目录文件的文件数量相关的参数,从而形成相应的请求;也可以是获取设备自己通过预设的程序发出的请求,该第二请求携带有第二待查目录文件的标识或者路径信息;根据该第二待查目录文件的标识确定该第二待查目录文件,并获取该第二待查目录文件的空间占用值;若该第二待查目录文件的空间占用值大于等于该第二预设阈值,则确定该第二待查目录文件为第一待查目录文件。
[0065]
在一种可选地实施方式中,在步骤s201之前,该方法还包括:
[0066]
获取第三请求,该第三请求携带有待查文件系统的标识。本申请实施例中,获取的该第三请求可以是获取用户发出的第三请求,具体地,用户通过在终端输入与统计该第一待查目录文件的文件数量相关的参数,从而形成相应的请求;也可以是获取设备自己通过预设的程序发出的请求,该第三请求携带有第三待查目录文件的标识或者路径信息;根据该待查文件系统的标识确定该待查文件系统,并获取该待查文件系统的文件数量索引信息;根据该文件数量索引信息确定该待查文件系统的文件数量值;若该待查文件系统的文件数量值大于等于第三预设阈值,则确定该待查文件系统的目录文件为待查目录文件。在本申请实施例中,通过先对多个文件系统进行排查判断出可疑文件系统个(即该文件系统中可能存在目录文件的文件数量较大的情况),从而后续可以直接对可疑文件系统中的目录文件的文件数量进行统计,而不需要对不需要进行统计的文件系统的文件数量进行统计,可以以降低的系统资源消耗,排出对无关文件系统的统计,避免无效统计执行。
[0067]
在一种可选地应用场景中,执行上述上述步骤的应用环境为linux环境(linux是一套免费试用且自由传播的操作系统),且用户需要对目录文件的文件数量超过30万个的目录文件进行统计。用户可以通过在终端执行“df

i”,检查每个文件系统的inode使用数量(文件系统的inode使用量是该文件系统下存在文件数的总和),如果文件系统inode使用数小于30万,则该文件系统下的目录必然不会存在疑似大目录文件(目录下文件数超过30万)的情况,则直接忽略对该文件系统的进一步检查。如果文件系统inode使用量大于等于30万,则可能存在大目录文件的情况,则执行步骤s201对该类大目录文件进行统计,从而可以以较低的系统消耗,排除对无关文件系统的统计,避免无效统计执行。
[0068]
在另一种可选地实施方式中,在执行完上述根据待查文件系统中确定出待查目录文件步骤后,可以接着执行根据第二待查目录文件中确定出第一待查目录文件的步骤,再执行上述s201,从而可以进一步地提高统计效率和进一步地降低系统资源的消耗。
[0069]
s202:根据该第一待查目录文件的标识确定该第一待查目录文件,并获取该第一待查目录文件的空间占用值。
[0070]
在本申请实施例中,获取该第一待查目录文件的空间占用值的方式有两种,一种是通过记录步骤s802中的第二待查目录文件的空间占用值,在执行本步骤中,可以直接读取上一次记录的对应的第二待查目录文件的空间占用值即可;另一种是对该第一待查目录文件的空间占用值进行重新获取,即再获取一次,从而提高了本申请文件数量统计的灵活性。
[0071]
在一种可选地实施方式中,可以基于以下步骤对第一待查目录文件的文件数量进行统计。
[0072]
s203:若该第一待查目录文件的空间占用值大于等于第一预设阈值,则确定第一文件数量统计模式;该第一文件数量统计模式包括文件采样规则和文件数量统计模型。
[0073]
在一种可选地实施方式中,该文件采样规则为对第一待查目录文件下的全样本采样,例如,第一待查目录文件的空间占用值为500kb,则对0-500kb的范围的子文件进行采样,具有采样结果准确度高的优点,适用于样本数较少的情况,当第一待查目录文件的文件数量很多时,采用完全采样的效率低。在另一种可选地实施方式中,该文件采样规则为对第一待查目录文件下的部分样本采样,例如,第一待查目录文件的空间占用值为5mb,则可以对0-3mb或者2-3kb,或者3-5mb范围的样本进行采样,其降低了对统计运算力的要求,并能够有效提高统计效率,可选地,该第一阈值为1亿字节。
[0074]
在本申请实施例中,该文件数量统计模型可以是一种直接代入预设公式进行计算的统计模型;该文件数量统计模型还可以是一种需要对上述预设公式进行调整,也就是乘以调整系数进行计算的统计模型,在一种可选地应用场景中,该第一待查目录文件为文件数量较大的目录文件,通过使用第一文件数量统计模型对该目录文件进行统计计算出的结果是为估计值,从而,该估计值与真实值可能存在一定的偏差,因此,可以通过记录多次估计值与真实值的偏差,从而得到一个调整系数,当将该调整系数乘上估计值后可以得到一个更接近真实值的值。
[0075]
s204:利用该文件采样规则对该第一待查目录文件进行采样,得到文件采样信息。
[0076]
在本申请实施例中,文件采样信息为一种具体的参数值,可选地,该文件采样信息包括采样次数,次级文件存在次数和结构体体量值,其中,采用次数为对第一待查目录文件中的采样点进行采样的次数;次级文件存在次数为对采样点对应的子文件进行判断,当该子文件存在次级文件时,判定该子文件存在次级文件,否则,则判定该子文件不存在次级文件,即为空文件,可选地,可以通过二值化对判断该子文件是否存在次级文件进行记录,当该子文件存在次级文件时,记录为1;当该子文件不存在次级文件时,记录为0,通过将记录的数据累加可以得到次级文件存在次数;该结构体体量值为采样点对应的子文件的结构体的占用空间值,需要说明的是,每个子文件均对应存在一个其的结构体。根据上述描述可知,该文件采样规则包括两种采样方式,在此不再赘述。
[0077]
在一种可选地实施方式中,如图3所示,图3是本申请实施例提供的一种文件数量统计方法的流程示意图。步骤s204包括:
[0078]
s2041:对该第一待查目录文件进行采样,确定该第一待查目录文件上的多个采样点;该多个采样点中任意两个相邻的采样点之间的间距等于预设步长;该第一待查目录文件包括多个子文件。
[0079]
可选地,图4是本申请实施例提供的一种基于第一文件数量统计模式的目录文件存储结构示意图。参考图4,该第一待查目录的多个子文件的排列顺序为无间隔排列,每个矩形代表一个具体的子文件的结构体,该预设步长的单位为字节;由于每个子文件的结构体大小不一,故两个相邻的采样点之间的预设步长内存在数量不一的子文件的结构体,在基于linux的环境系统中,以“offset=0”的采样点作为第一个采样点,通过执行“seek(dir,seek_offset)”可以到达指定的下一个采样点。
[0080]
s2042:获取每个该采样点对应的子文件的文件信息,得到文件信息集。
[0081]
可选地,文件信息包括采样次数信息,次级文件存在信息和结构体体量信息,其
中,采样次数信息是指该文件信息对应的采样点所属的采样次数;次级文件存在信息是指该文件信息所属的子文件的次级文件的是否存在,结构体体量信息是指子文件的结构体体量信息;文件信息集为存在采样次数信息,次级文件存在信息和结构体体量信息的信息集合。
[0082]
s2043:根据该文件信息集确定出该文件采样信息。
[0083]
可选地,根据多个采样次数信息,多个次级文件存在信息和多个结构体体量信息确定出采样次数,次级文件存在次数和结构体体量值。
[0084]
在一种可选地实施方式中,该s2043步骤包括:
[0085]
根据该文件信息集中多个采样次数信息确定该该采样次数;可选地,将该文件信息集中多个采样次数信息中次数最大的采样次数信息确定为该待查目录文件的采样次数,以图4中的第一调查目录文件为例,其采样次数为6;还可以是对每个采样点进行采样时,则记录一次1,累加每个采样点的记录数据,从而得到采样次数;根据该文件信息集中多个次级文件存在信息确定该次级文件存在次数;可选地,通过二值化法记录该文件信息集中多个次级文件存在信息,当该子文件存在次级文件时,记录为1;当该子文件不存在次级文件时,记录为0,再将上述记录的数量进行累加,得到次级文件存在次数,以图4中的第一调查目录文件为例,其次级文件存在次数为3;根据该文件信息集中多个结构体体量信息确定多个结构体体量值;可选地,计算出该文件信息集中多个结构体体量信息对应的多个结构体体量值,以图4中的第一调查目录文件为例,该文件信息集确定出的结构体体量值为3个,分别为a,b和c。
[0086]
s205:根据该文件采样信息和该第一待查目录文件的空间占用值按照该文件数量统计模型确定出该第一待查目录文件包含的文件数量。
[0087]
在一种可选地实施方式中,步骤s205包括:
[0088]
针对该文件数量统计模型根据该采样次数和该次级文件存在次数确定出文件填充率,例如:以图4中的第一调查目录文件为例,文件填充率为3/6=0.5;根据多个该结构体体量值确定出平均结构体体量值,例如:以图4中的第一调查目录文件为例,平均结构体体量值可以通过算术平均的方法计算得到,即为(a+b+c)/3=a;根据该文件填充率、该平均结构体体量值和该第一待查目录文件的空间占用值确定出该第一待查目录文件包含的文件数量,例如:以图4中的第一调查目录文件为例,该第一待查目录文件包含的文件数量=0.5a。
[0089]
以上为以第一阈值为判定条件,当第一待查目录文件的占用空间值大于第一阈值时,采用以上方法对第一待查目录文件的文件数量进行统计,该种方法是针对目录文件的文件数量非常大的情况,该第一待查目录文件的文件数量采用的一种抽样预估统计的方法,该统计方法能够在保证系统运行稳定的同时,可以提高统计效率和降低系统资源的消耗。
[0090]
在另一种可选地实施方式中,还可以基于以下步骤对第一待查目录文件的文件数量进行统计。
[0091]
可选地,在步骤s202之后,还包括:
[0092]
若该第一待查目录文件的空间占用值大于等于第二预设阈值且小于该第一预设阈值,则确定第二文件数量统计模式,可选地,该第一阈值为1亿字节,该第二预设阈值为5
百万字节;该第一待查目录文件为文件数量较少的目录文件,该第二数量统计模式为直接对第一待查目录文件的所有子文件依次进行统计的模式;基于该第二文件数量统计模式对该第一待查目录文件的文件内容信息进行遍历,得到遍历结果,可选地,该文件内容信息包括第一待查目录文件的所有子文件的结构体信息,基于linux环境系统,可以通过执行“opendir”打开目录文件,然后调用操作系统的内核函数,逐个读取目录文件中的多个子文件的数据结构,并将读取到的多个子文件的数据结构的次数信息记录下来;根据该遍历结果确定出该第一待查目录文件包含的文件数量,可选地,将上述多个子文件的数据结构的次数信息中次数最大的数据值作为该目录文件下的文件数量。
[0093]
本实施方式中的统计方法具有统计精确度高的优点。
[0094]
当系统内文件数量过多时,会造成系统夯死,从而影响用户的正常使用,以及造成一些损失,故在一种可选地实施方式中,步骤s205之后,还包括:
[0095]
若该第一待查目录文件包含的文件数量值大于等于第四预设阈值,则发出报警信息,在本实施例中,发出报警信息的方式可以是在屏幕上弹出警示信息,也可以是发出语音,从而对用户进行提醒。
[0096]
如图5所示,图5是本申请实施例提供的一种文件数量统计装置结构示意图。本申请在另一方面还公开了一种文件数量统计装置,其包括:
[0097]
获取模块501,用于获取第一请求,该第一请求携带有第一待查目录文件的标识;
[0098]
第一确定模块502,用于根据该第一待查目录文件的标识确定该第一待查目录文件,并获取该第一待查目录文件的空间占用值;
[0099]
第二确定模块503,用于若该第一待查目录文件的空间占用值大于等于第一预设阈值,则确定第一文件数量统计模式;该第一文件数量统计模式包括文件采样规则和文件数量统计模型;
[0100]
采样模块504,用于利用该文件采样规则对该第一待查目录文件进行采样,得到文件采样信息;
[0101]
第三确定模块505,用于根据该文件采样信息和该第一待查目录文件的空间占用值按照该文件数量统计模型确定出该第一待查目录文件包含的文件数量。
[0102]
在一种可选地实施方式中,该装置还包括:
[0103]
第四确定模块,用于对该第一待查目录文件进行采样,确定该第一待查目录文件上的多个采样点;该多个采样点中任意两个相邻的采样点之间的间距等于预设步长;该第一待查目录文件包括多个子文件;
[0104]
文件信息获取模块,用于获取每个该采样点对应的子文件的文件信息,得到文件信息集;
[0105]
第五确定模块,用于根据该文件信息集确定出该文件采样信息。
[0106]
在一种可选地实施方式中,该装置还包括:
[0107]
该文件信息包括采样次数信息,次级文件存在信息和结构体体量信息;
[0108]
文件采样信息包括采样次数,次级文件存在次数和结构体体量值;
[0109]
第六确定模块,用于根据该文件信息集中多个采样次数信息确定该该采样次数;
[0110]
第七确定模块,用于根据该文件信息集中多个次级文件存在信息确定该次级文件存在次数;
[0111]
第八确定模块,用于根据该文件信息集中多个结构体体量信息确定该结构体体量值。
[0112]
在一种可选地实施方式中,该装置还包括:
[0113]
第九确定模块,用于针对该文件数量统计模型根据该采样次数和该次级文件存在次数确定出文件填充率;
[0114]
第十确定模块,用于根据多个该结构体体量值确定出平均结构体体量值;
[0115]
第十一确定模块,用于根据该文件填充率、该平均结构体体量值和该第一待查目录文件的空间占用值确定出该第一待查目录文件包含的文件数量。
[0116]
在一种可选地实施方式中,该装置还包括:
[0117]
第十二确定模块,用于若该第一待查目录文件的空间占用值大于等于第二预设阈值且小于该第一预设阈值,则确定第二文件数量统计模式;
[0118]
遍历模块,用于基于该第二文件数量统计模式对该第一待查目录文件的文件内容信息进行遍历,得到遍历结果;
[0119]
第十三确定模块,用于根据该遍历结果确定出该第一待查目录文件包含的文件数量。
[0120]
在一种可选地实施方式中,该装置还包括:
[0121]
第二请求获取模块,用于获取第二请求,该第二请求携带有第二待查目录的标识;
[0122]
第十四确定模块,用于根据该第二待查目录文件的标识确定该第二待查目录文件,并获取该第二待查目录文件的空间占用值;
[0123]
第十五确定模块,用于若该第二待查目录文件的空间占用值大于等于该第二预设阈值,则确定该第二待查目录文件为第一待查目录文件。
[0124]
在一种可选地实施方式中,该装置还包括:
[0125]
第三请求获取模块,用于获取第三请求,该第三请求携带有待查文件系统的标识;
[0126]
第六确定模块,用于根据该待查文件系统的标识确定该待查文件系统,并获取该待查文件系统的文件数量索引信息;
[0127]
第十六确定模块,用于根据该文件数量索引信息确定该待查文件系统的文件数量值;
[0128]
第十七确定模块,用于若该待查文件系统的文件数量值大于等于第三预设阈值,则确定该待查文件系统的目录文件为待查目录文件。
[0129]
本申请实施例中的装置与方法实施例基于同样地申请构思。
[0130]
本申请实施例所提供的方法实施例可以在移动终端、计算机终端、服务器或者类似的运算装置中执行。以运行在服务器上为例,图6是本申请实施例提供的一种服务器结构示意图。如图6所示,该服务器600可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processing units,cpu)610(处理器610可以包括但不限于微处理器mcu或可编程逻辑器件fpga等的处理装置)、用于存储数据的存储器630,一个或一个以上存储应用程序623或数据622的存储介质620(例如一个或一个以上海量存储设备)。其中,存储器630和存储介质620可以是短暂存储或持久存储。存储在存储介质620的程序可以包括一个或一个以上模块,每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器610可以设置为与存储介质620通信,在服务器600上执行存储介质620
中的一系列指令操作。服务器600还可以包括一个或一个以上电源660,一个或一个以上有线或无线网络接口650,一个或一个以上输入输出接口640,和/或,一个或一个以上操作系统621,例如windows servertm,mac os xtm,unixtm,linuxtm,freebsdtm等等。
[0131]
输入输出接口640可以用于经由一个网络接收或者发送数据。上述的网络具体实例可包括服务器600的通信供应商提供的无线网络。在一个实例中,输入输出接口640包括一个网络适配器(network interface controller,nic),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,输入输出接口640可以为射频(radio frequency,rf)模块,其用于通过无线方式与互联网进行通讯。
[0132]
本领域普通技术人员可以理解,图6所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,服务器600还可包括比图6中所示更多或者更少的组件,或者具有与图6所示不同的配置。
[0133]
本申请的实施例还提供了一种文件数量统计设备,设备包括处理器和存储器,存储器中存储有至少一条指令、至少一段程序、代码集或指令集,至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现文件数量统计方法。
[0134]
如图7所示,图7是本申请实施例提供的一种计算机可读存储介质的结构框图。该计算机可读存储介质710可设置于服务器之中以保存用于实现方法实施例中一种文件数量统计方法相关的至少一条指令、至少一段程序、代码集或指令集711,该至少一条指令、该至少一段程序、该代码集或指令集1011由该处理器720加载并执行以统计文件数量方法。
[0135]
可选地,在本实施例中,上述存储介质可以位于计算机网络的多个网络服务器中的至少一个网络服务器。可选地,在本实施例中,上述存储介质可以包括但不限于:u盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
[0136]
由上述本申请提供的文件数量统计方法、装置、设备及存储介质的实施例可见,本申请通过获取携带有第一待查目录文件的标识的第一请求,从而可以根据该第一待查目录文件的标识确定该第一待查目录文件,并获取该第一待查目录文件的空间占用值。若该第一待查目录文件的空间占用值大于等于第一预设阈值,确定第一文件数量统计模式,具体的,该第一文件数量统计模式包括文件采样规则和文件数量统计模型;可以利用该文件采样规则对该第一待查目录文件进行采样,得到文件采样信息;将该文件采样信息和该第一待查目录文件的空间占用值输入到该文件数量统计模型确定出该第一待查目录文件包含的文件数量。以次可以实现降低统计文件数量过程中的资源消耗,并提高统计效率。
[0137]
需要说明的是:上述本申请实施例先后顺序仅仅为了描述,不代表实施例的优劣。且上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
[0138]
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于设备实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例
的部分说明即可。
[0139]
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,上述提到的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
[0140]
以上仅为本申请的较佳实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1