预测存储服务的制作方法
【专利说明】预测存储服务
[0001] 相关申请案的交叉参考
[0002] 本申请案主张2013年2月25日申请的标题为"预测存储服务(PREDICTIVE STORAGE SERVICE) "的第13/776, 498号美国专利申请案的优先权权益(代理人案号 90204-855763(061300US))。
【背景技术】
[0003] 文档已经成为工作流程的一个重要部分,它们起到各种功能,例如,跟踪、通知、教 示以及支付功能。例如,学生和老师用于讲义和报告。在另一实例中,机修工跟踪维修期间 的零部件、劳动力以及完成情况。使用这些文档可以允许工作流程继续进行,因为工作流程 的状态可以反映在文档中。
[0004] 文档和内容被构建出来之后,人们逐渐在各种装置上复查和编辑内容。例如,一个 主管用电子邮件将包含关键业绩指标的最新电子数据表发给她自己,这样一来,她就可以 在自己的智能电话上复查该电子数据表。在另一实例中,法律秘书将文件放到USB驱动器 中给到代理人,以便出行时可以在笔记本电脑上复查。在又一实例中,艺术家将资产和半成 品保存在预定的文件夹中,这个文件夹可以将更改同步到远程服务器。
[0005] 附图简述
[0006] 根据本发明的各项实施方案将参考附图进行描述,其中:
[0007] 图1示出根据至少一项实施方案的预测存储服务的说明性实例;
[0008] 图2示出根据至少一项实施方案的使用文件结构的预测存储服务的说明性实例;
[0009] 图3示出根据至少一项实施方案的可用来将文件与预测存储服务同步的过程的 说明性实例;
[0010] 图4示出根据至少一项实施方案的可用来确定选择预测存储服务中的哪些文件 的过程的说明性实例;
[0011] 图5示出根据至少一项实施方案的可用来确定选择预测存储服务中的哪些文件 的过程的说明性实例;
[0012] 图6示出根据至少一项实施方案的可用来使预测存储服务中的文件同步的过程 的说明性实例;
[0013] 图7示出根据至少一项实施方案的可用来将文件存储在预测存储服务中的过程 的说明性实例;
[0014] 图8示出根据至少一项实施方案的数据中心组织的说明性实例;以及
[0015] 图9示出可以实施各项实施方案的环境。
【具体实施方式】
[0016] 以下描述内容将描述各种实施方案。出于解释说明的目的,列出了具体配置和细 节,以便全面理解实施方案。然而,所属领域的技术人员将显而易见的认识到,这些实施方 案可在没有这些具体细节的情况下进行实践。此外,众所周知的特征可被忽略或简化,以便 不掩盖描述的实施方案。
[0017] 本文中描述和建议的技术包括选择性地确定要从文件结构发送到存储服务的文 件,从而使得文件可在另一位置使用。例如,用户可将计算系统(例如,台式计算机和移动 装置)注册到账户。用户可在台式计算机和/或移动装置上安装预测存储应用,该应用会 监控这些注册的计算系统上的活动。
[0018] 在一个说明性实例中,预测存储应用可确定用户在便携式计算机上下载并打开 PDF文件。当PDF文件在便携式计算机上打开时,预测存储应用可接收通知:用户还打开了 文字处理文档。随后,预测存储应用可接收到事件,其中在便携式计算机上,窗口焦点在TOF 与文字处理文档之间切换数次。在文字处理文档发生保存事件之后,至少部分基于用户与 文件互动并且致使PDF和文字处理文档被发送到预测存储服务的事实,预测存储应用可确 定PDF和文字处理文档足够重要。处于预测存储服务中之后,PDF和文字处理文档可被存 留或发送到注册的移动电话。便携式计算机上的PDF或文字处理文档发生的任何进一步变 化也可同步到预测存储服务和/或移动电话。当用户关闭便携式计算机时,用户可继续在 移动电话上复查PDF和编辑文字处理文档。
[0019] 预测存储应用可监控计算系统的文件结构。在一项实施方案中,作为服务提供的 虚拟桌面包括监控文件系统的预测存储应用。文件系统可基于容量、对象存储或其他数据 容器。监控信息可通过事件、通知、轮询或其他推送或拉取信息或者它们的组合进行确定。 监控信息可接收自应用、操作系统、管理程序、插件和/或其组合的监控信息的其他来源。 例如,应用可注册操作系统,以在源于一组文件类型的文件被打开、关闭、创建、更改和/或 破坏时接收到通知。在另一实例中,应用可在文字处理器中加入插件,所述插件在文件打 开、关闭、保存、自动保存和/或拒绝保存时通知应用。在又一实例中,应用可定期扫描一定 容量中的文件结构,以发现更改、打开、创建或者存储在文件结构中的其他日期和信息的最 近变化。在扫描过程中,可收集其他文件元数据,例如,作者、标题、主题、标签、分类、上次保 存用户名、修订号、版本号、应用名称、创建日期、上次保存日期、上次打印日期、上次访问日 期、拍摄日期、需求日期、版权、尺寸、宽度、高度、分辨率、压缩、相机、ISO速度、序列号、文件 结构路径、页码、文字、字符、分行、段落和/或大小。
[0020] 至少部分基于量化数据推理算法,预测存储应用可确定上传哪些文件。所述算法 可使用重要性指示符,例如,试探法,以确定上传文件的重要性。通过确定哪些文件是重要 的需要上传,可更有效地使用上传带宽和存储资源。例如,替代于上传整个文件结构(或其 部分),仅仅上传指定的文件。这种选择性的上传允许预测存储应用集中于同步具有相当 重要性的文件,而不是迫使用户将所有东西都存储在文件夹中。这种选择性的上传也避免 了上传无用文档,例如,临时文件或管理文件。使用有关文件结构和/或文件结构内的文件 的收集信息,基于重要性指示符,预测存储应用可确定将哪些文件上传到存储服务。例如, 重要性指示符可以是随着时间推移的用户与文件交互的次数。根据重要性指示符,一种算 法可用来评定文件。应用可被配置成将文件的前百分之X上传到服务(其中X为可配置变 量)。在另一配置中,算法可对文件进行评级,并且权衡每个文件的等级,以调整整体等级。 例如,监控程序可使用文档类型、文件最近打开情况、文件打开的时间长度、从文件被打开 到文件被关闭时的文件整体大小变化、关键字以及作者信息来确定重要性指示符,从而计 算文件的重要性等级。最近被匹配机器登录的作者打开的文件可接收较高的重要性等级, 所述文件具有文字处理类型。上传调度也可因确定的重要性而具有优先级。在另一实例中, 确定的重要性可至少部分基于计算系统上安装的应用。在一项实施方案中,如果图标与文 件的文件类型相关联,则可确定文件与安装的应用有关系。例如,由于文字处理程序为所有 的"txt"扩展文件提供一个图标,因此,"txt"文件扩展名可与图标相关联。如果计算系统 安装了文字处理器,但没有电子数据表,那么与文字处理相关的文件的重要性等级可能增 加,而与电子数据表相关的文件的重要性等级可能降低。
[0021] 在一项实施方案中,预测存储服务可存储文件。预测存储服务可从注册的计算系 统接收文件,例如,通过与注册的计算系统上的预测存储应用进行通信。注册的计算系统可 以是与客户账户相关联的计算系统。在一项实施方案中,客户可以注册预测存储服务,以接 收与客户账户相关的文件。例如,客户可以在计算系统上安装软件客户端。作为安装的一 部分,软件客户端可请求账户信息,例如,用户名和密码或密钥,并且注册预测存储服务。预 测存储服务随后可将标识符或密钥提供给软件客户端,所述标识符或密钥可用来识别未来 连接上的软件客户端。在另一实施方案中,预测存储服务可与虚拟桌面服务协作。虚拟桌 面服务的客户可通过服务的供应商来创建账户。包括带有软件客户端的操作系统的虚拟机 可由虚拟桌面服务供应,并且操作系统生成的图形用户界面可流向客户端装置。在此配置 中,软件客户端可被预先提供账户信息,以使得其能够与预测存储服务通信。
[0022] 预测存储服务随后可存储文件。在一项实施方案中,预测存储服务可提供与文件 相关的其他服务。例如,存储服务可检索文件,从而可执行搜索,以找到文件和/或文件中 的信息。搜索可返回文件中的片段,带有搜索信息之前和之后的内容。在另一实施方案中, 预测存储服务接收并存储加密文件。由于文件被发送装置加密,因此,预测存储服务可存储 文件,并将文件转送到可对文件解密的其他注册计算系统。由于存储服务无法访问数据,而 是只能存储加密负载,因此,可以减少破坏风险。在另一实施方案中,加密负载被存储时会 采用混合方法,但预测存储服务也具有加密密钥。在另一混合方法中,加密负载被存储,其 中带有该加密负载的索引。
[0023] 在一些实施方案中,存储的文件可被逐出预测文件服务。所述逐出可基于当前确 定的重要性、使用、空间和/或时间。例如,文件可依据时间过期模型被逐出。如果在一定 的时间跨度内,存储的文件在注册的计算系统上没有被访问,那么所述文件可被逐出预测 存储服务。在另一实例中,文件可依据最近最少使用(LRU)模型被逐出。如果预测存储服 务确定文件必须被逐出存储,那么预测存储服务可选择将自被访问之后具有最大时间跨度 的文件逐出。在其他实施方案中,针对存储在预测存储服务中的文件,预测存储服务可从注 册装置接收或请求重要性等级和/或重要性指示符。这些等级可用来确定(如果有的话) 哪些文件被逐出存储服务,例如,重要性等级没有通过阈值的文件,或者根据重要性等级的 分布的统计分析,成为低异常值的文件。
[0024] 在一些实施方案中,预测存储服务将文件转送到注册装置。预测存储服务可充当 中介,以分发文件。在一项实施方案中,预测存储服务可临时存储文件,同时注册装置接收 文件。在一项实施方案中,预测存储服务有助于对等连接,从而使得装置在彼此之间发送文 件,而预测存储服务不会存储文件。
[0025] 现在转到图1,示出根据至少一项实施方案的预测存储服务100的说明性实例。在 所示实施方案中,在第一计算系统上访问的文件102受到预测存储服务100的促进而被传 输到第二计算系统,以便用户进一步访问。预测存储服务100可使用重要性指示符来确定 传输哪些文件。例如,用户访问文件102,例如,文字处理文件,所述文件在台式计算机104 上被访问。位于台式计算机104上的预测存储应用确定被访问的文件102对用户来说比较 重要,因为文件的最近访问可以是重要性指示符。在一些实施方案中,重要性是根据使用若 干测量的算法或试探法计算的一组重要性指示符进行计算的。所述测量可包括监控信息和 /或文件元数据,如上所述。由于文件102具有足够高的确定重要性,因此,可联系预测存 储服务110。在一些实施方案中,文件可通过互联网108发送到预测存储服务110。使用一 个或多个服务器112,预测存储服务110可存储文件102。在一些实