一种文本信息处理方法及装置的制造方法

文档序号：10534801阅读：255来源：国知局

一种文本信息处理方法及装置的制造方法
【专利摘要】本发明公开了一种文本信息处理方法及装置。所述方法包括：获取待处理的文本信息，所述文本信息包括至少两行文本内容；若当前行存在行尾剩余空间，则根据所述当前行的文本内容识别当前行的可扩展空间；将所述行尾剩余空间分配至所述当前行的可扩展空间中。本发明提供的技术方案使得文字在排版过程行尾文字对齐，排版美观且便于阅读。
【专利说明】
一种文本信息处理方法及装置
技术领域
[0001]本发明涉及计算机技术，尤其涉及一种文本信息处理方法及装置。
【背景技术】
[0002]随着互联网技术的发展，人与人之间的信息传递更加方便、快捷，手段也多种多样。如电子邮件、微信、微博、手机短信等。
[0003]在信息的传递过程中，首先需要对用户输入的文本信息进行编辑，编辑完毕后再进行发送。在现有的文本信息编辑过程中，当一行宽度容纳不下剩余的文本内容时则剩余的内容另起一行进行显示，若此时出现在行首的是标点符号，由于根据语法规则这种情形是不被允许的，在排版上只能从该标点符号的前一个字符开始换行显示，从而在上一行的行尾产生了剩余空间。在存在英文的文本信息中，当行尾的空间无法容纳接下来的单词时，则只能将该单词另起一行显示，也在上一行的行尾产生剩余空间。
[0004]由此可见，现有技术在终端设备上进行文字信息的编辑排版时，经常会遇到在各行的行尾产生参差不齐的行尾剩余空间，导致文本信息的行尾排版无法对齐。

【发明内容】

[0005]本发明提供了一种文本信息处理方法及装置，以实现将文本信息的行尾排版对齐。
[0006]第一方面，本发明实施例提供了一种文本信息处理方法，包括:
[0007]获取待处理的文本信息，所述文本信息包括至少两行文本内容；
[0008]若当前行存在行尾剩余空间，则根据所述当前行的文本内容识别当前行的可扩展空间；
[0009]将所述行尾剩余空间分配至所述当前行的可扩展空间中。
[0010]第二方面，本发明实施例还提供了一种文本信息处理装置，包括:
[0011]文本获取模块，用于获取待处理的文本信息，所述文本信息包括至少两行文本内容；
[0012]可扩展空间识别模块，用于若当前行存在行尾剩余空间，则根据所述当前行中的文本内容识别当前行的可扩展空间；
[0013]文本编辑模块，用于将所述行尾剩余空间分配至所述当前行的可扩展空间中。
[0014]本发明实施例提供的技术方案，针对包括至少两行文本内容的文本信息，若当前行存在行尾剩余空间时，则会根据当前行的文本内容识别出当前行的可扩展空间，并将行尾剩余空间分配至当前行的可扩展空间中，解决在文字排版过程中存在行尾剩余空间导致的行尾版面无法对齐的问题，实现排版美观且便于阅读。
【附图说明】
[0015]图1是本发明实施例一提供的文本信息处理方法的流程示意图；
[0016]图2是本发明实施例二提供的文本信息处理方法的流程示意图；
[0017]图3是本发明实施例三提供的文本信息处理方法的流程示意图；
[0018]图4是本发明实施例四提供的文本信息处理方法的流程示意图；
[0019]图5为本发明实施例五提供的文本信息处理装置的结构示意图。
【具体实施方式】
[0020]下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释本发明，而非对本发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本发明相关的部分而非全部结构。
[0021 ] 实施例一
[0022]图1为本发明实施例一提供的文本信息处理方法的流程示意图，本实施例提供的技术方案适用于各种用户编辑并发送文本信息的情况，该方法可以由各种终端设备上安装的程序软件执行，例如在手机、平板电脑、笔记本电脑终端设备上安装的文本信息处理装置来执行，具体包括如下步骤:
[0023]步骤110、获取待处理的文本信息，该文本信息包括至少两行文本内容；
[0024]其中，用户发送各种文本信息之前，首先需要输入预发送的文本信息，并对文本信息进行编辑，该文本信息可以包括短消息、微信或QQ的聊天信息、微博评论信息等。用户在指定的文本信息编辑框中输入多行文字内容，当用户将上述文本信息输入完毕后，即可点击发送或者评论按钮进行发送。本发明实施例中，通过在终端设备上安装文本信息处理装置，其可以通过用户点击发送或评论按钮来触发，即在本步骤中获取用户输入的待处理的文本信息，且通常的当文本信息包括至少两行文本内容时，则可能会因为行首出现标点符号，或者是行尾无法容纳英文单词的问题，导致出现行尾剩余空间。
[0025]针对文本信息中的至少两行文本内容，可以进一步依次针对各行进行识别，识别其中的文本内容的文本类型及其可扩展空间。
[0026]步骤120、若当前行存在行尾剩余空间，则根据所述当前行的文本内容识别当前行的可扩展空间；
[0027]具体的，针对步骤110获取的文本信息，需要对任意一行的文本内容进行分析，若当前行存在行尾剩余空间，则需要对行尾剩余空间进行分配，对于不存在行尾剩余空间的情况，则可以忽略本步骤。
[0028]具体的，本步骤中根据当前行的文本内容识别当前行的可扩展空间主要是考虑当前行的文本内容的类型，例如当前行的文本内容仅包括中文字符、全角标点符号这类的占用2个字符位的文本时，则在行尾出现的行尾剩余空间一般不会大于一个中文字符的宽度，则可以将行尾剩余空间分配到各个中文字符和/或全角标点符号形成的间隙中，上述间隙均可以作为可扩展空间；而对于包括有占用I个字符位的英文字符等的情况，一是可能出现较长的英文单词，导致行尾剩余空间较宽，二是单个英文字符等只占用I个字符位，若调整两个英文字符的间隙，则很容易被肉眼识别，在该情况下，需要综合考虑上述两个方面识别可扩展空间，具体方案在后续实施例中进行描述。
[0029]步骤130、将上述行尾剩余空间分配至当前行的可扩展空间中。
[0030]在上述步骤120中获取到可扩展空间的基础上，本步骤可以将行尾剩余空间分配至当前行的可扩展空间中。
[0031]本发明实施例一提供的技术方案，其可以通过后台程序依次读取待处理文本信息的各行的文内容，当读取到换行符时计算行尾剩余空间，若存在行尾剩余空间，则将行尾剩余空间分配到可扩展空间中。
[0032]本发明实施例一的技术方案，针对包括至少两行文本内容的文本信息，若当前行存在行尾剩余空间时，则会根据当前行的文本内容识别出当前行的可扩展空间，并将行尾剩余空间分配至当前行的可扩展空间中，解决在文字排版过程中存在行尾剩余空间导致的行尾版面无法对齐的问题，实现排版美观且便于阅读。
[0033]进一步的，针对上述步骤120中识别出的可扩展空间，可以是在上述步骤130中将行尾剩余空间均匀分配至当前行的可扩展空间中。
[0034]进一步的，针对上述步骤130中将行尾剩余空间分配至所述当前行的可扩展空间中之后，还包括发送所述文本信息，或者将上述文本信息转换为图片，例如通过QQ或微信聊天将上述文本信息发送，或者在进行微博评论时，将上述文本信息发送给评论页面，或者是在当前社交应用中，由于针对用户提交的文字数目有限制，因此，当用户输入的文本信息过长时，可以先将上述文本信息转化为图片，然后再进行发送，利用本发明实施例一提供的技术方案，其生成的图片中的文字信息，行尾也会对齐，实现排版美观且便于阅读。
[0035]实施例二
[0036]图2为本发明实施例二提供的文本信息处理方法的流程示意图，本实施例可适用于用户编辑的文本内容均为第一类文本，即中文字符和/或全角标点符号的情况，具体包括如下步骤:
[0037]步骤210、获取待处理的文本信息，该文本信息包括至少两行文本内容；
[0038]其中，用户发送各种文本信息之前，首先需要输入预发送的文本信息，并对文本信息进行编辑，该文本信息可以包括短消息、微信或QQ的聊天信息、微博评论等。用户在指定的文本信息编辑框中输入多行文字内容，当用户将上述文本信息输入完毕后，即可点击发送或者评论按钮进行发送。本发明实施例中，通过在终端设备上安装文本信息处理装置，其可以通过用户点击发送或评论按钮来触发，即在本步骤中获取用户输入的，即待处理的文本信息，且通常的当文本信息包括至少两行文本内容时，则可能会因为行首出现标点符号，或者是行尾无法容纳英文单词的问题，导致出现行尾剩余空间。
[0039]针对文本信息中的至少两行文本内容，可以依次针对各行进行识别，识别其中的文本内容的文本类型及其可扩展空间。
[0040]步骤220、若当前行的文本内容均为第一类文字时，可扩展空间为任意两个上述第一类文本的间隙，上述第一类文本占用2个字符位，具体的，上述第一类文本包括中文字符和/或全角标点符号。
[0041]对于每个中文字符和全角标点符号，其文本信息的编码中均对应一个唯一的编码值，通过获取当前行中的每个字符的编码值即可确认该行中是否仅包含中文字符和全角标点符号，由于中文字符和全角标点符号在文本信息显示时占用相同的宽度，即通常为2个字符位，对于当前行中仅包括中文字符和全角标点符号的情况，其行尾剩余空间一般不会超过2个字符位的宽度，故可以直接将任意两个第一类文本的间隙都作为可扩展空间。
[0042]步骤230、将上行尾剩余空间分配至当前行的可扩展空间中。
[0043]在步骤220中将任意两个第一类文本的间隙都作为可扩展空间的基础上，本步骤中，优选地可以将行尾剩余空间均匀分配至各个第一类文本形成的间隙中。例如当前行的行尾剩余空间为5毫米，当前行中仅包括30个中文字符(即汉字)，各个中文字符的原间隙为I毫米，则调整各中文字符的间隙为1.17毫米即，可将当前行的行尾剩余空间均匀分配至各中文字符的间隙中，使得行尾能够排版对齐，且0.17毫米的宽度并不易被肉眼察觉，故保证了排版的美观。
[0044]本发明实施例二提供的技术方案，通过获取用户编辑的文本信息，并判断当当前行的文字内容均为第一类文本时，将行尾剩余空间均匀分配至任意两个第一类文本的间隙中，考虑到在当前行均为相同占位宽度的中文字符及全角标点符号时，行尾剩余空间不会大于一个中文字符的占位宽度，即可采取直接将行尾剩余空间在当前行形成的所有第一类文本的间隙中均分的方式，解决在文字信息排版过程中存在行尾剩余空间而导致的版面不美观的问题，实现排版美观且便于阅读的效果。
[0045]实施例三
[0046]图3为本发明实施例三提供的文本信息处理方法的流程示意图，本实施例可适用于用户编辑的文本信息中，其中至少一行的文本内容包含英文字符等占用I个字符位的第二类文本的情况，第二类文本包括英文字符、数字字符或半角标点符号中的至少一种，具体包括如下步骤:
[0047]步骤310、获取待处理的文本信息，该文本信息包括至少两行文本内容；
[0048]其中，用户发送各种文本信息之前，首先需要输入预发送的文本信息，并对文本信息进行编辑，该文本信息可以包括短消息、微信或QQ的聊天信息、微博评论等。用户在指定的文本信息编辑框中输入多行文字内容，当用户将上述文本信息输入完毕后，即可点击发送或者评论按钮进行发送。本发明实施例中，通过在终端设备上安装文本信息处理装置，其可以通过用户点击发送或评论按钮来触发，即在本步骤中获取用户输入的待处理的文本信息，且通常的当文本信息包括至少两行文本内容时，则可能会因为行首出现标点符号，或者是行尾无法容纳英文单词的问题，导致出现行尾剩余空间。
[0049]针对文本信息中的至少两行文本内容，可以依次针对各行进行识别，识别其中的文本内容的文本类型及其可扩展空间。
[0050]步骤320、若当前行的文本内容包括第二类文本时，判断当前行的行尾剩余空间是否小于预设阈值，若小于所述预设阈值，识别当前行中的可扩展空间，第二类文本占用I个字符位；
[0051]具体的，本步骤中也可以通过获取当前行中的每个字符的编码值确认是否属于第二类文本，第二类文本可以包括英文字符、数字字符或半角标点符号中的至少一种，具体的，上述第二类文本在显示时的占位宽度为中文字符的一半，然而一个英文单词可由多个英文字符(英文字母)组合而成，例如英文单词unenthusiastically，包括18个英文字符，如果位于行尾，而行尾又无法容纳该英文单词，这时只能做换行处理，则当前行将在行尾剩余空间较大。此时判断当前行的行尾剩余空间是否小于预设阈值，如预设阈值可以为2厘米，当行尾剩余空间小于2厘米时获取当前行的可扩展空间。
[0052]具体的，本实施例中当前行的文本内容可以是只包括第二类文本，或者是同时包括第一类文本和第二类文本，此时识别得到的可扩展空间可以包括:全角标点符号之前、全角标点符号之后、半角标点符号之前、半角标点符号之后、数字字符和中文字符之间、英文单词首字母之前、英文单词末尾字母之后和任意两个中文字符之间中的至少一种
[0053]步骤330、将行尾剩余空间分配至当前行的可扩展空间。
[0054]具体的，是在步骤320中获取到可扩展空间之后，将小于预设阈值的行尾剩余空间分配到可扩展空间中，优选的可以是均匀分配至各个可扩展空间中，以使得行尾对齐。另外，上述可扩展空间的选取，不会考虑一个英文单词中的两个英文字符，或者两个数字字符之间进行扩展，因为这些位置扩展后相对于相邻字符的占位宽度很容易被肉眼所辨别，而根据步骤320获取的可扩展空间进行扩展，能够有效避免上述问题。
[0055]本发明实施例三提供的技术方案，通过获取用于编辑的文本信息，并且当当前行文字内容均为第二类文字时，且行尾剩余空间小于预设阈值，识别当前行中的可扩展空间，其中的扩展空间包括全角标点符号之前、全角标点符号之后、半角标点符号之前、半角标点符号之后、数字字符和中文字符之间、英文单词首字母之前、英文单词末尾字母之后和任意两个中文字符之间中的至少一种，使得将行尾剩余空间进行分配后，既使得行尾对齐，又不会在一个英文单词中的两个英文字符，或者两个数字字符之间进行扩展，避免被用户肉眼辨别。本发明实施例三提供的技术方案能够解决因存在行尾剩余空间导致的版面不美观的问题，实现排版美观且便于阅读的效果。
[0056]实施例四
[0057]图4为本发明实施例四提供的文本信息处理方法的流程示意图，如图4所示，该方法包括如下步骤:
[0058]步骤410、获取待处理的文本信息，该文本信息包括至少两行文本内容;具体的，针对本步骤的详细描述可以参见上述的任一实施例。
[0059]步骤420、依次针对每行文本内容进行识别，识别各行文本内容的文本类型及其可扩展空间。具体的，当前行的文本内容均为第一类文本时，则可以执行步骤430;而当当前行的文本内容包括第二类文本时，则判断行尾剩余空间是否小于预设阈值，若大于或等于预设阈值则执行步骤440，若小于预设阈值则执行步骤450。
[0060]步骤430、将任意两个第一类文本的间隙作为可扩展空间，并可以将行尾剩余空间分配至上述第一类文本的间隙中，具体可以参见上述实施例二提供的技术方案。
[0061]步骤440、保持上述当前行的行尾剩余空间不变。
[0062]步骤450、获取当前行的可扩展空间，将行尾剩余空间分配至可扩展空间中。其中的可扩展空间包括全角标点符号之前、全角标点符号之后、半角标点符号之前、半角标点符号之后、数字字符和中文字符之间、英文单词首字母之前、英文单词末尾字母之后和任意两个中文字符之间中的至少一种。在获取上述可扩展空间后，将行尾剩余空间分配至可扩展空间中。本步骤的【具体实施方式】可以参照实施例三提供的技术方案。
[0063]实施例五
[0064]图5为本发明实施例五提供的文本信息处理装置的结构示意图，如图5所示，包括:
[0065]文本获取模块I，用于获取待处理的文本信息，所述文本信息包括至少两行文本内容；
[0066]可扩展空间识别模块2，用于若当前行存在行尾剩余空间，则根据所述当前行的文本内容识别当前行的可扩展空间；
[0067]文本编辑模块3，用于将所述行尾剩余空间分配至所述当前行的可扩展空间中。
[0068]本发明实施例五的技术方案，针对包括至少两行文本内容的文本信息，若当前行存在行尾剩余空间时，则会根据当前行的文本内容识别出当前行的可扩展空间，并将行尾剩余空间分配至当前行的可扩展空间中，解决在文字排版过程中存在行尾剩余空间导致的行尾版面无法对齐的问题，实现排版美观且便于阅读。
[0069]进一步的，文本编辑模块3具体用于将行尾剩余空间均匀分配至当前行的可扩展空间中。
[0070]进一步的，可扩展空间识别模块2具体用于若当前行的文本内容均为第一类文本时，所述可扩展空间为任意两个所述第一类文本的间隙，所述第一类文本占用2个字符位。所述第一类文本包括:中文字符和/或全角标点符号。
[0071]进一步的，可扩展空间识别模块2还用于若当前行的文本内容包括第二类文本时，判断所述当前行的行尾剩余空间是否小于预设阈值，若小于所述预设阈值，则识别当前行中的可扩展空间获，所述第二类文本占用I个字符位。所述第二类文本包括英文字符、数字字符和/或半角标点符号中的至少一种。所述可扩展空间包括:全角标点符号之前、全角标点符号之后、半角标点符号之前、半角标点符号之后、数字字符和中文字符之间、英文单词首字母之前、英文单词末尾字母之后和任意两个中文字符之间中的至少一种。
[0072]进一步的，文本编辑模块3具体还用于若当前行的行尾剩余空间大于或等于所述预设阈值，则保持所述当前行的行尾剩余空间不变。
[0073]进一步的，文本编辑模块3具体还用在所述将行尾剩余空间分配至所述当前行的可扩展空间中之后，发送所述文本信息，或将所述文本信息转换为图片。
[0074]上述装置可执行本发明任意实施例所提供的方法，具备执行方法相应的功能模块和有益效果。
[0075]注意，上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此，虽然通过以上实施例对本发明进行了较为详细的说明，但是本发明不仅仅限于以上实施例，在不脱离本发明构思的情况下，还可以包括更多其他等效实施例，而本发明的范围由所附的权利要求范围决定。
【主权项】
1.一种文本信息处理方法，其特征在于，包括: 获取待处理的文本信息，所述文本信息包括至少两行文本内容；若当前行存在行尾剩余空间，则根据所述当前行的文本内容识别当前行的可扩展空间；将所述行尾剩余空间分配至所述当前行的可扩展空间中。2.根据权利要求1所述的文体信息处理方法，其特征在于，所述将行尾剩余空间分配至当前行的可扩展空间中包括: 将行尾剩余空间均匀分配至当前行的可扩展空间中。3.根据权利要求1或2所述的文本信息处理方法，其特征在于，所述根据所述当前行的文本内容识别当前行的可扩展空间包括:若当前行的文本内容均为第一类文本时，所述可扩展空间为任意两个所述第一类文本的间隙，所述第一类文本占用2个字符位。4.根据权利要求3所述的文体信息处理方法，其特征在于，所述第一类文本包括:中文字符和/或全角标点符号。5.根据权利要求1或2所述的文体信息处理方法，其特征在于，所述根据所述当前行的文本内容识别当前行的可扩展空间包括: 若当前行的文本内容包括第二类文本时，判断所述当前行的行尾剩余空间是否小于预设阈值，若小于所述预设阈值，则识别当前行中的可扩展空间，所述第二类文本占用I个字符位。6.根据权利要求5所述的文体信息处理方法，其特征在于，所述第二类文本包括英文字符、数字字符或半角标点符号中的至少一种。7.根据权利要求6所述的文体信息处理方法，其特征在于，所述可扩展空间包括:全角标点符号之前、全角标点符号之后、半角标点符号之前、半角标点符号之后、数字字符和中文字符之间、英文单词首字母之前、英文单词末尾字母之后和任意两个中文字符之间中的至少一种。8.根据权利要求5所述的文体信息处理方法，其特征在于，还包括: 若当前行的行尾剩余空间大于或等于所述预设阈值，则保持所述当前行的行尾剩余空间不变。9.根据权利要求1所述的文体信息处理方法，其特征在于，所述将行尾剩余空间分配至所述当前行的可扩展空间中之后还包括: 发送所述文本信息，或将所述文本信息转换为图片。10.一种文本信息处理装置，其特征在于，包括: 文本获取模块，用于获取待处理的文本信息，所述文本信息包括至少两行文本内容；可扩展空间识别模块，用于若当前行存在行尾剩余空间，则根据所述当前行的文本内容识别当前行的可扩展空间；文本编辑模块，用于将所述行尾剩余空间分配至所述当前行的可扩展空间中。11.根据权利要求10所述的文体信息处理装置，其特征在于，所述文本编辑模块具体用于将行尾剩余空间均匀分配至当前行的可扩展空间中。12.根据权利要求10或11所述的文体信息处理装置，其特征在于，可扩展空间识别模块具体用于若当前行的文本内容均为第一类文本时，所述可扩展空间为任意两个所述第一类文本的间隙，所述第一类文本占用2个字符位。13.根据权利要求12所述的文体信息处理装置，其特征在于，所述第一类文本包括:中文字符和/或全角标点符号。14.根据权利要求10或11所述的文体信息处理装置，其特征在于，所述可扩展空间识别模块还用于若当前行的文本内容包括第二类文本时，判断所述当前行的行尾剩余空间是否小于预设阈值，若小于所述预设阈值，则识别当前行中的可扩展空间，所述第二类文本占用I个字符位。15.根据权利要求14所述的文体信息处理装置，其特征在于，所述第二类文本包括英文字符、数字字符和/或半角标点符号中的至少一种。16.根据权利要求15所述的文体信息处理装置，其特征在于，所述可扩展空间包括:全角标点符号之前、全角标点符号之后、半角标点符号之前、半角标点符号之后、数字字符和中文字符之间、英文单词首字母之前、英文单词末尾字母之后和任意两个中文字符之间中的至少一种。17.根据权利要求14所述的文体信息处理装置，其特征在于，所述文本编辑模块具体还用于若当前行的行尾剩余空间大于或等于所述预设阈值，则保持所述当前行的行尾剩余空间不变。18.根据权利要求14所述的文体信息处理装置，其特征在于，所述文本编辑模块具体还用在所述将行尾剩余空间分配至所述当前行的可扩展空间中之后，发送所述文本信息，或将所述文本信息转换为图片。
【文档编号】G06F17/25GK105893342SQ201511009899
【公开日】2016年8月24日
【申请日】2015年12月29日
【发明人】董尚勇
【申请人】乐视移动智能信息技术（北京）有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：董尚勇;
技术所有人：乐视移动智能信息技术（北京）有限公司;
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。