PDF文档分割方法、装置及电子设备与流程

文档序号：17359162发布日期：2019-04-09 21:56阅读：182来源：国知局

本发明涉及电子文档编辑处理
技术领域：
：，尤其是涉及一种pdf文档分割方法、装置及电子设备。
背景技术：
：：pdf(portabledocumentformat，便携式文件格式)文档是常见、广泛使用的电子文档格式，其页面内容采用固定版式，不同页之间的内容在数据存储上没有任何联系。目前，通常按照固定的页面数量对pdf文档进行分割，如果用户存在特定的分割需求，则用户需要进行多次操作才可能完成其分割pdf文档的目的；同时，仅按照页面进行拆分，生成的文件大小与页面的内容有关，是未知的，不能够满足用户诸如对文件大小限制的特殊需求。这样的方式不能满足用户的个性化需求。技术实现要素：有鉴于此，本发明的目的在于提供一种pdf文档分割方法、装置及电子设备，能够提升pdf文档分割的个性化程度。第一方面，本发明实施例提供了一种pdf文档分割方法，包括：接收用户端上传的目标pdf源文档及输入的分割操作参数；根据分割操作参数，对目标pdf源文档进行分割，得到目标pdf源文档对应的输出子文档；将输出子文档发送至用户端。结合第一方面，本发明实施例提供了第一方面的第一种可能的实施方式，其中，分割操作参数为文档大小阈值；上述根据分割操作参数，对目标pdf源文档进行分割，得到目标pdf源文档对应的输出子文档的步骤包括：当目标pdf源文档大于文档大小阈值时，统计目标pdf源文档的页数；当目标pdf源文档的页数大于1时，将目标pdf源文档分割为第一目标文档和第二目标文档；其中，第一目标文档的页数等于第二目标文档的页数或者第二目标文档的页数加1；判断第一目标文档的大小是否大于文档大小阈值；如果是，当第一目标文档的页数大于1时，将第一目标文档作为目标pdf源文档，重新执行上述步骤：根据分割操作参数，对目标pdf源文档进行分割，得到目标pdf源文档对应的输出子文档；如果否，根据第一目标文档和第二目标文档，确定输出子文档。结合第一方面的第一种可能的实施方式，本发明实施例提供给了第一方面的第二种可能的实施方式，其中，上述根据第一目标文档和第二目标文档，确定输出子文档的步骤，包括：将第二目标文档中的前n个目标页面从第二目标文档中剔除，得到第二当前文档；其中，n的取值为第二目标文档的页数除以2后向上取整所确定的；将前n个目标页面加入第一目标文档，得到第一当前文档；判断第一当前文档的大小是否大于文档大小阈值；如果否，根据第二当前文档的页数，确定输出子文档；如果是，根据n的取值，确定输出子文档。结合第一方面的第二种可能的实施方式，本发明实施例提供了第一方面的第三种可能的实施方式，其中，上述根据第二当前文档的页数，确定输出子文档的步骤，包括：当第二当前文档的页数大于1时，将第一当前文档确定为第一目标文档，并将第二当前文档确定为第二目标文档后，重新执行上述步骤：根据第一目标文档和第二目标文档，确定输出子文档；当第二当前文档的页数为1时，将第一当前文档确定为第一输出子文档，并将第一输出子文档对应的页面从用户端上传的目标pdf源文档中剔除，得到第一pdf源文档；将第一pdf源文档作为目标pdf源文档，重新执行上述步骤：根据分割操作参数，对目标pdf源文档进行分割，得到目标pdf源文档对应的输出子文档。结合第一方面的第二种可能的实施方式，本发明实施例提供了第一方面的第四种可能的实施方式，其中，上述根据n的取值，确定输出子文档的步骤包括：当n的取值大于1时，将前n个目标页面整合在一起作为第二目标文档后，重新执行上述步骤：根据第一目标文档和第二目标文档，确定输出子文档；当n的取值为1时，将第一目标文档确定为第二输出子文档；将第二输出子文档对应的页面从用户端上传的目标pdf源文档中剔除，得到第二pdf源文档；将第二pdf源文档作为目标pdf源文档，重新执行上述步骤：根据分割操作参数，对pdf源文档进行分割，得到pdf源文档对应的输出子文档。结合第一方面的第一种可能的实施方式，本发明实施例提供了第一方面的第五种可能的实施方式，其中，在判断第一目标文档的大小是否大于文档大小阈值之前，上述方法还包括：当第一目标文档和第二目标文档满足第一预设条件时，将第一目标文档和第二目标文档均确定为输出子文档；其中，第一预设条件为：第一目标文档的大小和第二目标文档的大小均不大于文档大小阈值，且，第一目标文档的页数与第二目标文档的页数相加起来等于用户端上传的目标pdf源文档的页数。结合第一方面的第一种可能的实施方式，本发明实施例提供了第一方面的第六种可能的实施方式，上述方法还包括：当目标pdf源文档满足第二预设条件或者第一目标文档满足第三预设条件时，将预设的错误提示信息发送至用户端；其中，第二预设条件为：目标pdf源文档的大小大于文档大小阈值，且，目标pdf源文档的页数为1；第三预设条件为：第一目标文档大小大于文档大小阈值，且，第一目标文档的页数为1。第二方面，本发明实施例提供了一种pdf文档分割装置，包括：接收模块，用于接收用户端上传的目标pdf源文档及输入的分割操作参数；文档分割模块，用于根据分割操作参数，对目标pdf源文档进行分割，得到目标pdf源文档对应的输出子文档；发送模块，用于将输出子文档发送至用户端。第三方面，本发明实施例提供了一种电子设备，包括存储器和处理器，存储器中存储有可在处理器上运行的计算机程序，处理器执行计算机程序时实现第一方面至第一方面第六种可能的实施方式任一项所述的方法的步骤。第四方面，本发明实施例提供了一种计算机可读存储介质，计算机可读存储介质上存储有计算机程序，计算机程序被处理器运行时执行第一方面至第一方面的第六种可能的实施方式任一项所述的方法的步骤。本发明实施例带来了以下有益效果：本发明实施例提供了一种pdf文档分割方法、装置及电子设备，能够接收用户端上传的目标pdf源文档及输入的分割操作参数，然后根据分割操作参数，对目标pdf源文档进行分割，得到目标pdf源文档对应的输出子文档，再将输出子文档发送至用户端。本发明实施例提供的上述方式相较于现有技术中对pdf文档按固定页数进行分割的方式，能够按照用户自定义参数对pdf文档进行分割，更适于用户特定的分割需求，有效地提升了pdf文档分割的个性化程度。本发明的其他特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。为使本发明的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。附图说明为了更清楚地说明本发明具体实施方式或现有技术中的技术方案，下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施方式，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。图1为本发明实施例提供的一种pdf文档分割方法的流程图；图2为本发明实施例提供的另一种pdf文档分割方法的流程图；图3为本发明实施例提供的一种pdf文档分割装置的结构框图；图4为本发明实施例提供的一种电子设备的结构示意图。具体实施方式为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合附图对本发明的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。pdf文档是常见、广泛使用的电子文档格式，其页面内容采用固定版式，不同页之间的内容在数据存储上没有任何联系。目前，通常按照固定的页面数量对pdf文档进行分割，如果用户存在特定的分割需求，则用户需要进行多次操作才可能完成其分割pdf文档的目的；同时，仅按照页面进行拆分，生成的文件大小与页面的内容有关，是未知的，不能够满足用户诸如对文件大小限制的特殊需求。这样的方式不能满足用户的个性化需求。基于此，本发明实施例提供的一种pdf文档分割方法、装置及电子设备，可以提升pdf文档分割的个性化程度。为便于对本实施例进行理解，首先对本发明实施例所公开的pdf文档分割方法进行详细介绍，参见图1所示的一种pdf文档分割方法的流程图，该方法包括：步骤s102，接收用户端上传的目标pdf源文档及输入的分割操作参数；步骤s104，根据分割操作参数，对目标pdf源文档进行分割，得到目标pdf源文档对应的输出子文档；分割操作参数可以为指定页面的页码，根据用户自定义页码对目标pdf源文档分割得到用户所需要的指定页面，实际应用时，在提取该页面时可根据相应的设定调整pdf源文档中页面的顺序，若在pdf源文档中该页面含有书签信息，在分割时也可将该页面对应的书签信息一并提取出来；分割操作参数可以为具体的文档大小阈值，根据用户自定义的文档大小阈值对pdf源文档进行分割，使其对应的每个输出子文档的大小均不大于文档大小阈值。步骤s106，将输出子文档发送至用户端。在具体实施时，可预先构建一个在线分割管理系统，该系统包括用户交互界面，及分割管理后台；其中，用户交互界面上设置有上传文件接口及分割操作参数设置接口，分别用于接收用户上传的目标pdf源文档及输入的分割操作参数；分割管理后台用于通过用户交互界面获取目标pdf源文档及分割操作参数，在线实时根据分割操作参数对目标pdf源文档进行分割，并将分割的结果通过用户交互界面反馈给用户。通过这样的方式，在用户想要分割pdf文档时，无需安装额外的软件，即可在线获得pdf文档的多个子文档，相较于相关技术中基于安装软件分割pdf文档的方式，能够有效提升用户的体验度。本发明实施例提供了一种pdf文档分割方法，能够接收用户端上传的目标pdf源文档及输入的分割操作参数，然后根据分割操作参数，对目标pdf源文档进行分割，得到目标pdf源文档对应的输出子文档，再将输出子文档发送至用户端。本发明实施例提供的上述方式相较于现有技术中对pdf文档按固定页数进行分割的方式，能够按照用户自定义参数对pdf文档进行分割，更适于用户特定的分割需求，有效地提升了pdf文档分割的个性化程度。具体的，上述分割操作参数为文档大小阈值；本发明实施例还提供了另一种pdf文档分割方法的流程图，如图2所示，在图1的基础上，详细示出了上述步骤s104，也即根据分割操作参数，对目标pdf源文档进行分割，得到目标pdf源文档对应的输出子文档的步骤包括：步骤s202，当目标pdf源文档大于文档大小阈值时，统计目标pdf源文档的页数。若存在目标pdf源文档不大于文档大小阈值的情况时，则将目标pdf源文档作为输出子文档直接发送至用户端。步骤s204，当目标pdf源文档的页数大于1时，将目标pdf源文档分割为第一目标文档和第二目标文档；其中，第一目标文档的页数等于第二目标文档的页数或者第二目标文档的页数加1。考虑到用户端上传的目标pdf源文档的页数可能为奇数，在对目标pdf源文档二分，也即将目标pdf源文档分割为第一目标文档和第二目标文档时避免产生错误，统一设定第一目标文档的页数为目标pdf源文档的页数除以2后向上取整，也即第二目标文档的页数加1；当目标pdf源文档的页数为偶数时，第一目标文档的页数等于第二目标文档的页数。步骤s206，判断第一目标文档的大小是否大于文档大小阈值；如果是，执行步骤s208；如果否，执行步骤s210。步骤s208，当第一目标文档的页数大于1时，将第一目标文档作为目标pdf源文档，重新执行上述步骤：根据分割操作参数，对目标pdf源文档进行分割，得到目标pdf源文档对应的输出子文档；步骤s210，根据第一目标文档和第二目标文档，确定输出子文档。本发明实施例提供的上述另一种pdf文档分割方法，采用二分法对目标pdf源文档进行分割，并根据文档大小阈值判断第一目标文档是否大于文档大小阈值，在第一目标文档大于文档大小阈值时，将第一目标文档确定为目标pdf源文档后循环判断，直至第一目标文档不大于文档大小阈值时，根据此时的第一目标文档和第二目标文档确定输出子文档，通过这样的方式能够快速的确定第一个满足用户自定义的文档大小阈值的输出子文档。在一种可选的方式中，上述步骤s210，也即根据第一目标文档和第二目标文档，确定输出子文档，可参照以下步骤实施：步骤(1)，将第二目标文档中的前n个目标页面从第二目标文档中剔除，得到第二当前文档；其中，n的取值为第二目标文档的页数除以2后向上取整所确定的。步骤(2)，将前n个目标页面加入第一目标文档，得到第一当前文档。步骤(3)，判断第一当前文档的大小是否大于文档大小阈值；如果否，执行步骤(4)；如果是执行步骤(5)。步骤(4)，根据第二当前文档的页数，确定输出子文档；第二当前文档的页数可分为两种情况，对应这两种情况确定输出子文档的方式不同，具体的，如下：当所第二当前文档的页数大于1时，将第一当前文档确定为第一目标文档，并将第二当前文档确定为第二目标文档后，重新执行上述步骤：根据第一目标文档和第二目标文档，确定输出子文档；当第二当前文档的页数为1时，将第一当前文档确定为第一输出子文档，并将第一输出子文档对应的页面从用户端上传的目标pdf源文档中剔除，得到第一pdf源文档；将第一pdf源文档作为目标pdf源文档，重新执行上述步骤：根据分割操作参数，对目标pdf源文档进行分割，得到目标pdf源文档对应的输出子文档。步骤(5)，根据n的取值，确定输出子文档。n的取值可分为两种情况，对应这两种情况确定输出子文档的方式不同，具体的，如下：当n的取值大于1时，将前n个目标页面整合在一起作为第二目标文档后，重新执行上述步骤：根据第一目标文档和第二目标文档，确定输出子文档；当n的取值为1时，将第一目标文档确定为第二输出子文档；将第二输出子文档对应的页面从用户端上传的目标pdf源文档中剔除，得到第二pdf源文档；将第二pdf源文档作为目标pdf源文档，重新执行步骤：根据分割操作参数，对pdf源文档进行分割，得到pdf源文档对应的输出子文档。综上所述，本发明实施例提供的上述根据第一目标文档和第二目标文档，确定输出子文档的具体实施方式，通过不断更新第一目标文档或者第二目标文档，能够首先得到一个文档大小与文档大小阈值最为接近的输出子文档，然后再对用户端上传的目标pdf源文档中的剩余页面再次进行上述操作，得到多个与文档大小阈值接近的输出子文档，以使输出子文档都满足用户对于文档大小阈值的特定需求。进一步，考虑到可能存在对用户端上传的目标pdf源文档进行第一次二分分割操作时所得到的第一目标文档和第二目标文档的大小均不大于文档大小阈值的情况，为减少后续不必要的判断流程，提升上述方式的效率，在执行上述步骤步骤s206，也即判断第一目标文档的大小是否大于文档大小阈值之前，上述方法还包括：当第一目标文档和第二目标文档满足第一预设条件时，将第一目标文档和第二目标文档均确定为输出子文档；其中，第一预设条件为：第一目标文档的大小和第二目标文档的大小均不大于文档大小阈值，且，第一目标文档的页数与第二目标文档的页数相加起来等于用户端上传的目标pdf源文档的页数。进一步，考虑到实际应用时，可能存在目标pdf源文档的大小或者第一目标文档的大小大于文档大小阈值，而该目标pdf源文档或者第一目标文档仅有1页无法再进行分割的情况，不符合上述方法流程的执行逻辑。上述方法还包括：当目标pdf源文档满足第二预设条件或者第一目标文档满足第三预设条件时，将预设的错误提示信息发送至用户端；其中，第二预设条件为：目标pdf源文档的大小大于文档大小阈值，且，目标pdf源文档的页数为1；第三预设条件为：第一目标文档大小大于文档大小阈值，且，第一目标文档的页数为1。实际应用时，基于前述在线分割管理系统，可将预设的错误提示信息通过用户交互界面反馈给用户，错误提示信息可包括错误原因，具体内容可根据实际情况设置，在此不进行限制。对应上述方法，本发明实施例提供了一种pdf文档分割装置，参见图3，该装置包括：接收模块302，用于接收用户端上传的目标pdf源文档及输入的分割操作参数；文档分割模块304，用于根据分割操作参数，对目标pdf源文档进行分割，得到目标pdf源文档对应的输出子文档；发送模块306，用于将输出子文档发送至用户端。本发明实施例提供了一种pdf文档分割装置，能够接收用户端上传的目标pdf源文档及输入的分割操作参数，然后根据分割操作参数，对目标pdf源文档进行分割，得到目标pdf源文档对应的输出子文档，再将输出子文档发送至用户端。本发明实施例相较于现有技术中对pdf文档按固定页数进行分割的方式，能够按照用户自定义参数对pdf文档进行分割，更适于用户特定的分割需求，有效地提升了pdf文档分割的个性化程度。本实施例所提供的装置，其实现原理及产生的技术效果和前述实施例相同，为简要描述，装置实施例部分未提及之处，可参考前述方法实施例中相应内容。进一步，本实施例还提供了一种电子设备，包括存储器、处理器，存储器中存储有可在处理器上运行的计算机程序，处理器执行计算机程序时实现上述pdf文档分割方法的步骤。参见图4所示的一种电子设备的结构示意图，示出了电子设备400，包括：处理器40，存储器41，总线42和通信接口43，处理器40、通信接口43和存储器41通过总线42连接；处理器40用于执行存41中存储的可执行模块，例如计算机程序。其中，存储器41可能包含高速随机存取存储器(ram，randomaccessmemory)，也可能还包括非不稳定的存储器(non-volatilememory)，例如至少一个磁盘存储器。通过至少一个通信接口43(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接，可以使用互联网，广域网，本地网，城域网等。总线42可以是isa总线、pci总线或eisa总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示，图4中仅用一个双向箭头表示，但并不表示仅有一根总线或一种类型的总线。其中，存储器41用于存储程序401，处理器40在接收到执行指令后，执行程序401，前述本发明实施例任一实施例揭示的流过程定义的装置所执行的方法可以应用于处理器40中，或者由处理器40实现。处理器40可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器40中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器40可以是通用处理器，包括中央处理器(centralprocessingunit，简称cpu)、网络处理器(networkprocessor，简称np)等；还可以是数字信号处理器(digitalsignalprocessing，简称dsp)、专用集成电路(applicationspecificintegratedcircuit，简称asic)、现成可编程门阵列(field-programmablegatearray，简称fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器41，处理器40读取存储器41中的信息，结合其硬件完成上述方法的步骤。进一步，本发明实施例还提供了一种计算机可读存储介质，计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行上述任一项pdf文档分割方法的步骤。具体实现可参见方法实施例，在此不再赘述。所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：u盘、移动硬盘、只读存储器(rom，read-onlymemory)、随机存取存储器(ram，randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。最后应说明的是：以上所述实施例，仅为本发明的具体实施方式，用以说明本发明的技术方案，而非对其限制，本发明的保护范围并不局限于此，尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：任何熟悉本
技术领域：
：的技术人员在本发明揭露的技术范围内，其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化，或者对其中部分技术特征进行等同替换；而这些修改、变化或者替换，并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应所述以权利要求的保护范围为准。当前第1页12当前第1页12

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李譞
技术所有人：万兴科技股份有限公司
我是此专利的发明人

上一篇：一种法兰式风道及车厢新风系统的法兰式风道的制作方法
上一篇：确定时频资源的方法及装置与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。