一种具有标点符号的候选项展示方法和装置与流程

文档序号:16245562发布日期:2018-12-11 23:32阅读:201来源:国知局
一种具有标点符号的候选项展示方法和装置与流程

本申请涉及输入法领域,特别是涉及一种具有标点符号的候选项展示方法和装置。

背景技术

标点符号是辅助文字记录语言的符号,不同语种下的标点符号可能有所区别,例如在汉语中常见的标点符号可以包括句号。、双引号“”、书名号《》等。

对标点符号的规范使用可以使书面文字的可读性更好,但是在使用输入法进行文字输入时,不少用户对标点符号的使用并不完全规范。原因在于,一些用户对标点符号的使用规范并不明确,导致输入文字时出现标点符号的不规范使用的情况;还有一些用户虽然了解如何规范使用标点符号,但是在使用输入法输入时,因为有些标点符号输入起来比较麻烦而不愿意规范使用。

可见,如何帮助用户在使用输入法输入文字时规范使用标点符号是亟需解决的问题。



技术实现要素:

为了解决上述技术问题,本申请实施例提供了一种具有标点符号的候选项展示方法和装置,免去了选择第一候选项再输入标点符号的繁杂操作,提高了用户的输入体验。

第一方面,本申请实施例提供了一种具有标点符号的候选项展示方法,该方法包括:

获取用户输入的字符串;

判断所述字符串所对应的候选项中是否包括具有符合标点符号使用规则的候选项;

若所述字符串所对应的候选项中的第一候选项为具有符合标点符号使用规则的候选项,生成第二候选项,所述第二候选项为所述标点符号使用规则中使用了标点符号的所述第一候选项;

将所述第二候选项展示在所述字符串对应的候选项展示位置中。

可选的,所述将所述第二候选项展示在所述字符串对应的候选项展示位置中,包括:

将所述第一候选项和第二候选项同时展示在所述字符串对应的一个候选项展示页面中,所述候选项展示页面包括多个候选项展示位置。

可选的,同时展示所述第一候选项和第二候选项的候选项展示页面为所述字符串对应候选项展示页面的第一页。

可选的,还包括:

根据历史输入数据判断所述字符串所对应的候选项中是否包括所述历史输入数据中输入的候选项,所述历史输入数据包括输入的标点符号与候选项组合;

若所述字符串所对应的候选项中的第三候选项为所述历史输入数据中的候选项,生成第四候选项,所述第四候选项为所述历史输入数据中标点符号与所述第三候选项的组合;

将所述第四候选项展示在所述字符串对应的候选项展示位置中。

可选的,所述历史输入数据包括所述用户和/或所述用户所处群组所输入的标点符号与候选项的组合。

可选的,在所述将所述第四候选项展示在所述字符串对应的候选项展示位置中的步骤之前,还包括:

判断所述第四候选项和第二候选项是否一致;

若一致,执行所述将所述第二候选项展示在所述字符串对应的候选项展示位置中的步骤。

可选的,还包括:

统计单位时间内历史输入数据中标点符号与候选项组合的出现次数;

将单位时间内出现次数满足预设条件的标点符号与候选项组合建立标点词库;

所述根据历史输入数据判断所述字符串所对应的候选项中是否包括所述历史输入数据中输入的候选项,包括:

根据所述标点词库判断所述字符串所对应的候选项中是否包括所述标点词库中的候选项;

所述若所述字符串所对应的候选项中的第三候选项为所述历史输入数据中的候选项,生成第四候选项,包括:

若所述字符串所对应的候选项中的第三候选项为所述标点词库中的候选项,生成第四候选项。

可选的,还包括:

根据所述单位时间周期性的更新所述标点词库,其中包括:若标点词库中的标点符号与候选项组合在更新周期中的出现次数未满足所述预设条件,将未满足预设条件的标点符号与候选项组合从所述标点词库中删除。

第二方面,本申请实施例提供了一种具有标点符号的候选项展示装置,该装置包括:第一获取单元、第一判断单元、第一生成单元和第一展示单元:

所述第一获取单元,用于获取用户输入的字符串;

所述第一判断单元,用于判断所述字符串所对应的候选项中是否包括具有符合标点符号使用规则的候选项;若所述字符串所对应的候选项中的第一候选项为具有符合标点符号使用规则的候选项,则触发第一生成单元;

所述第一生成单元,用于生成第二候选项,所述第二候选项为所述标点符号使用规则中使用了标点符号的所述第一候选项;

所述第一展示单元,用于将所述第二候选项展示在所述字符串对应的候选项展示位置中。

可选的,所述第一展示单元,包括:

第二展示子单元,用于将所述第一候选项和第二候选项同时展示在所述字符串对应的一个候选项展示页面中,所述候选项展示页面包括多个候选项展示位置。

可选的,所述第二展示子单元,还用于同时展示所述第一候选项和第二候选项的候选项展示页面为所述字符串对应候选项展示页面的第一页。

可选的,还包括第二判断单元、第二生成单元和第三展示单元:

所述第二判断单元,用于根据历史输入数据判断所述字符串所对应的候选项中是否包括所述历史输入数据中输入的候选项,所述历史输入数据包括输入的标点符号与候选项组合;若所述字符串所对应的候选项中的第三候选项为所述历史输入数据中的候选项,则触发第二生成单元;

所述第二生成单元,用于生成第四候选项,所述第四候选项为所述历史输入数据中标点符号与所述第三候选项的组合;

所述第三展示单元,用于将所述第四候选项展示在所述字符串对应的候选项展示位置中。

可选的,所述历史输入数据包括所述用户和/或所述用户所处群组所输入的标点符号与候选项的组合。

可选的,还包括第三判断单元:

所述第三判断单元,用于判断所述第四候选项和第二候选项是否一致;若一致,则触发所述第一展示单元。

可选的,还包括:

统计单元,用于统计单位时间内历史输入数据中标点符号与候选项组合的出现次数;

建立单元,用于将单位时间内出现次数满足预设条件的标点符号与候选项组合建立标点词库;

所述第二判断单元,包括:

第四判断子单元,用于根据所述标点词库判断所述字符串所对应的候选项中是否包括所述标点词库中的候选项;

所述第二生成单元,包括:

第三生成子单元,用于若所述字符串所对应的候选项中的第三候选项为所述标点词库中的候选项,生成第四候选项。

可选的,还包括更新单元和删除单元:

所述更新单元,用于根据所述单位时间周期性的更新所述标点词库,其中包括:若标点词库中的标点符号与候选项组合在更新周期中的出现次数未满足所述预设条件,则触发所述删除单元;

所述删除单元,用于将未满足预设条件的标点符号与候选项组合从所述标点词库中删除。

第三方面,本申请实施例提供了一种具有标点符号的候选项展示装置,该装置包括:存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:

获取用户输入的字符串;

判断所述字符串所对应的候选项中是否包括具有符合标点符号使用规则的候选项;

若所述字符串所对应的候选项中的第一候选项为具有符合标点符号使用规则的候选项,生成第二候选项,所述第二候选项为所述标点符号使用规则中使用了标点符号的所述第一候选项;

将所述第二候选项展示在所述字符串对应的候选项展示位置中。

第四方面,本申请实施例提供了一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行第一方面中所述的方法。

由上述技术方案可以看出,通过预先获得的、针对候选项的标点符号使用规则,可以在用户输入字符串时,判断该字符串所对应的候选项中是否有符合该标点符号使用规则的,若候选项中有第一候选项符合该标点符号使用规则,则可以根据该标点符号使用规则中与第一候选项组合使用的标点符号生成第二候选项,即包括了对应标点符号的第一候选项,并将第二候选项展示在该字符串对应的候选项展示位置中,向用户展示该第二候选项可以提示用户该候选项在标点符号使用规则中是需要与标点符号共同使用的,而且用户可以直接选择第二候选项进行上屏输入,免去了选择第一候选项再输入标点符号的繁杂操作,提高了用户的输入体验。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种具有标点符号的候选项展示方法的方法流程图;

图2为本申请实施例提供的一种具有标点符号的候选项展示方法的方法流程图;

图3为本申请实施例提供的一种具有标点符号的候选项展示装置的结构示意图;

图4为本申请实施例提供的一种具有标点符号的候选项展示的装置作为终端时的结构框图;

图5为本申请实施例提供的一些实施例中服务器的结构示意图。

具体实施方式

下面结合附图,对本申请的实施例进行描述。

用户可以使用输入法向终端进行文字的输入,而一般情况下撰写书面文字时需要使用标点符号,而且规范使用的标点符号可以有效提高书面文字的可读性。但是由于一些用户对标点符号使用方式的错误认知或因为标点符号输入麻烦而简略输入的情况,导致不少用户通过输入法输入的书面文字中标点符号的使用方式都是不规范的。

为了帮助用户在输入文字的过程中规范的输入标点符号,本申请实施例提供了一种具有标点符号的候选项展示方法和装置,通过预先获得的、针对候选项的标点符号使用规则,可以在用户输入字符串时,判断该字符串所对应的候选项中是否有符合该标点符号使用规则的,若候选项中有第一候选项符合该标点符号使用规则,则可以根据该标点符号使用规则中与第一候选项组合使用的标点符号生成第二候选项,即包括了对应标点符号的第一候选项,并将第二候选项展示在该字符串对应的候选项展示位置中,向用户展示该第二候选项可以提示用户该候选项在标点符号使用规则中是需要与标点符号共同使用的,而且用户可以直接选择第二候选项进行上屏输入,免去了选择第一候选项再输入标点符号的繁杂操作,提高了用户的输入体验。

本申请实施例可以应用于安装在终端中的输入法,该终端可以包括移动终端、计算机等可以安装输入法的智能设备,该输入法可以用于向终端中输入不同语种的文字,也可以是不同语种的特定输入法,例如中文输入法,日文输入法等。

输入法可以根据用户输入的字符串展示对应的候选项,用户所输入的字符串可以与输入法的输入规则相关,例如中文拼音输入法中,用户输入的字符串可以包括拼音串。被用户选择上屏的候选项可以理解为输入到终端中的文字,所输入文字的语种可以与输入法的输入语种相同或相关,例如通过中文输入法输入的文字可以是中文、英文等。

本申请实施例中所提出的书面文字包括了任何使用文字记载的语言表达形式,例如可以包括使用书面语表达的文字内容例如法律文件、论文等,也可以包括口语化表达的文字内容例如社交软件中的聊天内容等。

由于不同的语种对标点符号的使用规则可能不尽相同,标点符号的组成也不尽相同,故为了便于描述清楚,接下来的实施例中,将主要以中文输入法为例进行说明。

图1为本申请实施例提供的一种具有标点符号的候选项展示方法的方法流程图,所述方法包括:

s101:获取用户输入的字符串。

举例说明,在中文输入法中,该字符串可以是拼音串,也可以是其他组成形式的字符串。通过该字符串,输入法可以确定出至少一个对应的候选项。

用户可以通过多种方式输入该字符串,例如通过键盘等输入设备输入字符串,可以通过语音的方式输入字符串,在语音输入的情况下,输入法可以通过声音识别的方式从语音中确定用户输入的内容。

s102:判断所述字符串所对应的候选项中是否包括具有符合标点符号使用规则的候选项。

该标点符号使用规则可以是指该输入法可输入语种中针对标点符号的规范使用形式。其中,标点符号可以是可输入语种所使用的各类标点符号,例如汉语中可以包括书名号、双引号等,也可以包括对文字的特殊表现形式,例如斜体、加粗等。需要注意的是,不同语种中同一类标点符号的表现形式可以不同,例如汉语中书名号可以是《》,而英语中书名号可以是将整个书名斜体处理或配上下划线。

除了包括通过单个符号表示的标点符号以外,还包括通过多个符号表示的标点符号,例如各类括号【】{}()、书名号《》<>、引号‘’“”等,这类由多个符号表示的标点符号在输入时需要多次输入,而且大部分情况下还需要在这类标点符号之间输入相应的文字,例如书名:《哈利波特》、项目名称:【智能加图】等,故在输入书面文字时若需要与这类标点符号组合使用的文字时,用户要么先输入标点符号,然后将输入焦点移到标点符号之间,再输入文字,或者先输入标点符号,再输入文字,然后将文字整体移入(例如通过剪切复制)标点符号之间,再或者先输入一部分标点符号例如《,然后输入文字,再输入另一部分标点符号例如》,不论是哪一种情况都会增加输入复杂程度,导致有些用户懒得如此输入而直接输入文字不输入标点符号,导致了书面文字中出现了标点符号的不规范使用,可见,用户在输入书面文字的过程中,主要还是这类由多个符号表示的标点符号导致了的标点符号不规范使用的问题。

故在预先获取标点符号使用规则时,可以采集已经明确有标点符号固定用法的文字,例如已经出版图书的书名在书面文字中是需要与书名号组合使用的,那么已经出版的书名+书名号可以作为标点符号使用规则的一种,同理,歌曲名称、论文名称、绘画名称、电影名称等在书面文字中也需要和书名号组合使用,故也可以作为标点符号使用规则的一种。除了书名号以外,针对其他标点符号(包括由单个符号表示的标点符号和由多个符号表示的标点符号)与文字的固定组合使用也可以作为标点符号使用规则,这里不再一一赘述。获取标点符号使用规则的方式可以通过网络爬虫技术或采用机器学习的方式进行,本申请实施例中对此不进行限定。

也就是说,标点符号使用规则主要包括了一些专有文字与标点符号的特定用法,这些用法若能够在书面文字中体现,可以有效增加书面文字的可读性。

由于本申请实施例中,输入法根据用户所输入的字符串可以提供至少一个对应的候选项,在候选项被展示之前,可以通过预先获取的标点符号使用规则判断其中是否有候选项属于标点符号使用规则中需要与标点符号组合使用的文字,以便在确定出具有符合标点符号使用规则的候选项时可以对用户进行标点符号的协助输入。

s103:若所述字符串所对应的候选项中的第一候选项为具有符合标点符号使用规则的候选项,生成第二候选项,所述第二候选项为所述标点符号使用规则中使用了标点符号的所述第一候选项。

如果判断出该字符串对应的候选项中具有符合标点符号使用规则的候选项,例如第一候选项,那么可以确定该第一候选项一般是需要与标点符号组成使用的,或者说一般情况下,该第一候选项需要与特定的标点符号组合使用才能符合标点符号使用规则。

由于该标点符号使用规则中记录了第一候选项是与哪个或哪些标点符号组合使用,以及如何组合使用的,故可以根据该标点符号使用规则中记载的针对第一候选项与标点符号的组合使用方式生成第二候选项,该第二候选项中包括了第一候选项和与第一候选项组合使用的标点符号,例如在标点符号使用规则中记录了文字:哈利波特是与标点符号:书名号《》的组合使用的,组合使用方式是将哈利波特放在书名号之间,那么当用户输入的字符串所对应的候选项中包括了哈利波特这个候选项时,可以为该字符串生成一个新的候选项例如第二候选项:《哈利波特》。

s104:将所述第二候选项展示在所述字符串对应的候选项展示位置中。

由于生成的第二候选项中除了包括第一候选项以外,还包括了在标点符号使用规则中与第一候选项组合使用的标点符号,故若用户看到了所输入的字符串对应的候选项中包括了第二候选项,可以明白原来第一候选项是可以或需要与这个标点符号组合使用的,其次,若根据输入环境或上下文需要第一候选项与第二候选项中所示的标点符号组合使用,用户还可以直接选择第二候选项即可实现将第二候选项上屏,即将标点符号与第一候选项的正确组合直接输入到终端中,例如直接输入:《哈利波特》,避免了传统方式中选择了第一候选项后再输入标点符号的复杂操作,例如先输入哈利波特,再输入《》,然后再将哈利波特调整到《》中间。

本申请实施例中并不限定第二候选项展示在该字符串对应的哪个候选项展示位置,不过为了能够尽量让用户可以有机会看到第二候选项,即在选择候选项上屏之前可以看到第二候选项,一般不会将第二候选项展示在特别靠后的位置,例如需要用户多次向后翻候选项展示页面才能看到的位置,这里的候选项展示页面可以理解为展示的候选项的界面或窗口,在一页候选项展示页面中至少一个候选项展示位置,一页候选项展示页面中所包括的候选项展示位置多寡与候选项长度或页面设置相关。

不过有些输入情况或上下文语境下,用户通过该字符串实际想要输入的就是第一候选项,而非第二候选项,例如一本书的书名叫《这个蛋糕真好吃》,如果用户在社交软件中与其他用户聊天,希望表达今天吃了一个好吃的蛋糕,而输入了这个蛋糕真好吃对应的字符串,这个字符串对应的候选项中具有第一候选项:这个蛋糕真好吃,若根据标点符号使用规则生成第二候选项:《这个蛋糕真好吃》,并将第二候选项放在先于第一候选项的候选项展示位置且与第一候选项位于不同候选项展示页面中,这样用户将会先看到第二候选项,通过翻页后才能看到第一候选项,即实际想要输入的候选项,从而影响了用户的输入体验。

为此,可选的,本申请实施例提供了一种展示第一候选项和第二候选项的方式,在将所述第二候选项展示在所述字符串对应的候选项展示位置中时,可以将所述第一候选项和第二候选项同时展示在所述字符串对应的一个候选项展示页面中。

也就是说,将第一候选项和第二候选项展示在同一页候选项展示页面中,相应的,该候选项展示页面中需要至少具有两个候选项展示位置用于分别展示第一候选项和第二候选项。第一候选项可以展示在更靠前的位置,例如第二候选项的左侧,第二候选项也可以展示在更靠前的位置,例如第一候选项的左侧。第一候选项和第二候选项可以相邻的展示在候选项展示页面中,也可以不相邻的展示在候选项展示页面中。本申请实施例并不限定第一候选项和第二候选项的相对位置,不过,可选的,输入法可以结合输入的上下文语境进行判断,当前用户输入的字符串应该与什么有关,以前述“这个蛋糕真好吃”的例子为例,第一候选项:这个蛋糕真好吃,第二候选项:《这个蛋糕真好吃》,若根据上下文语境发现讨论的内容与美食相关,那么用户输入字符串所想要上屏的候选项更有可能与第一候选项有关,可以将第一候选项放在比第二候选项更靠前的位置,若根据上下文语境发现讨论的内容与读书相关,那么用户输入字符串所想要上屏的候选项更有可能与第二候选项有关,可以将第二候选项放在比第一候选项更靠前的位置。

在这种展示方式下,用户可以同时看到第一候选项和第二候选项,即起到了提示用户第一候选项的标点符号使用规则,也为用户提供了选择的权力,便于用户根据实际的输入语境选择所需候选项,提高了用户输入体验。

为了能够让用户第一时间看到第二候选项,可以将第一候选项和第二候选项展示在该字符串对应候选项展示页面的第一页中,即优先展示页面。使得用户在输入了该字符串后,在首先展示出的候选项中直接就能看到第一候选项和第二候选项,便于用户选择,一定程度上提高了输入效率。

除了可以通过预先获取的标点符号使用规则来协助用户输入过程中标点符号的规范输入,还可以根据实际使用输入法输入的历史输入数据来协助用户输入过程中标点符号的输入。使用历史输入数据协助用户输入过程中标点符号的输入可以作为独立的实施方式,也可以作为在通过预先获取的标点符号使用规则来协助用户输入过程中标点符号的规范输入的基础上的进一步改进。

历史输入数据可以是通过输入法输入文字所形成的数据,这里提到的输入法可以包括本申请实施例所应用的输入法,还可以包括其他输入法。根据不同的应用场景或使用需求,可以选择不同区间的输入数据作为该历史输入数据,例如历史输入数据可以是一小段时间内输入数据,如最近一周内采集的输入数据,也可以是较长时间内的输入数据。

通过输入法输入文字所形成的数据有很多,在本申请实施例中,主要关注的是其中与输入标点符号与候选项组合的相关数据,这类输入数据可以通过用户输入了文字和标点符号的输入行为得到,当系统能够判定所输入的文字与所输入的标点符号具有关联关系,或者说所输入的标点符号是为了标识所输入文字的,便可以将这一关联关系或者标识关系作为一个历史输入数据。

以通过单个符号表示的标点符号为例,当输入完一个文字后紧接着又输入了标点符号,可以认为这个文字和该标点符号具有关联关系,这一关联关系可以作为一个历史输入数据。以通过多个符号表示的标点符号为例,当用户先输入了文字,然后输入了标点符号,再将输入的文字调整到标点符号之间,可以认为该文字和该标点符号具有关联关系,这一关联关系可以作为一个历史输入数据,或者用户先输入了标点符号,然后输入文字,再将输入的文字调整到标点符号之间,也可以认为该文字和该标点符号具有关联关系,这一关联关系可以作为一个历史输入数据。

标点符号使用规则主要体现的是对标点符号的规范使用方式,例如针对书名需要加上书名号等情况,而由于历史输入数据主要是通过用户使用输入法的过程中生成的,故与标点符号使用规则相比,历史输入数据更能够体现用户的输入习惯或输入方式,例如一位做项目的工程师在输入项目名称时习惯加上括号【】,假设项目名称为智能加图,该工程师输入时总是以【智能加图】的方式,那么若将这一输入习惯作为历史输入数据,当有用户输入智能加图所对应的字符串时,针对其中为智能加图的第三候选项,可以通过历史输入数据生成第四候选项:【智能加图】。

根据不同应用场景或使用需求,历史输入数据所涵盖的用户范围也可以有所不同,例如历史输入数据可以包括单个用户如输入该字符串的用户和/或单个用户如输入该字符串的用户所处群组所输入的标点符号与候选项的组合。

也就是说,在用户数量较少或系统处理能力有余的情况下,可以针对每一个用户收集一组对应的历史输入数据,其中一个用户的历史输入数据均来自这个用户,那么该历史输入数据将能够很好的体现出这个用户的输入习惯,并可以将这个用户曾经输入的文字与标点符号组成使用方式应用于这个用户的当前输入中,当这个用户曾经输入了:《论语》,那么当这个用户再次输入论语对应的字符串时,可以向这个用户直接展示出《论语》这一候选项,从而简化用户的输入步骤,而且示出的第四候选项更符合该用户的输入习惯。

在用户数量较多的情况下,一个用户对应的历史输入数据可以包括该用户所在用户群组中各个用户的输入数据,这里提到的用户群组可以是具有共同特征的一些用户,例如具有共同的兴趣爱好的朋友、在同一个工作单位工作的同事、负责同一个项目的小组成员、住在同一片区的住户等。一个用户所处群组的数量可以为多个,故在确定历史输入数据时,可以将一个用户所处的部分或全部群组产生的输入数据作为历史输入数据。

具有共同特征的用户在标点符号上的输入习惯可能会有一定相似,或者所需输入的文字中可能会有一些特别的但是在群组中却常用的标点符号用法。例如一个项目群组中的用户在输入与项目相关的专用词汇时可能都会与特定标点符号组合使用,若将这一组合使用作为历史输入数据时,这个群组中用户在进行文字输入时,当输入了展示该专用词汇的字符串时,也可以在候选项展示位置示出包括了与该特定标点符号组合使用的该专用词汇,提高了该群组中用户的输入效率,并起到了适应于该群组特定标点符号输入习惯的效果,提高了用户的输入体验。

接下来通过附图介绍如何将历史输入数据应用于帮助用户在输入文字的过程中输入标点符号,图2为本申请实施例提供的一种具有标点符号的候选项展示方法的方法流程图,所述方法包括:

s201:根据历史输入数据判断所述字符串所对应的候选项中是否包括所述历史输入数据中输入的候选项。

举例说明,在执行本步骤之前,可以获取用户输入的字符串,本申请实施例不限定如何获取用户输入的字符串,在图2所对应实施例是在图1所对应实施例的基础上改进的前提下,该字符串可以是通过图1所对应实施例中s101步骤获取的,在图2所对应实施例是独立实施的前提下,该字符串也可以是单独获取的。

s202:若所述字符串所对应的候选项中的第三候选项为所述历史输入数据中的候选项,生成第四候选项,所述第四候选项为所述历史输入数据中标点符号与所述第三候选项的组合。

若能判断出字符串对应候选项中有候选项例如第三候选项为该历史输入数据中的候选项,则可以根据历史输入数据中第三候选项与标点符号的组合使用方式生成第四候选项。例如当历史输入数据中包括了《哈利波特》这一文字和标点符号组合使用方式,若用户输入的字符串所对应候选项中包括了哈利波特,那么可以根据该历史输入数据生成《哈利波特》。

s203:将所述第四候选项展示在所述字符串对应的候选项展示位置中。

针对第四候选项的展示方式与第二候选项的展示方式类似,具体描述可以参考图1所对应实施例中有关第二候选项如何展示的相关描述。第三候选项和第四候选项的展示方式与第一候选项和第二候选项的展示方式类似,具体描述可以参考图1所对应实施例中有关第一候选项和第二候选项如何展示的相关描述。

在有些情况下,有可能历史输入数据和标点符号使用规则中包括了相同的文字与标点符号的组合使用方式,故在当图2所对应实施例是在图1所对应实施例的基础上改进的前提下,可能出现通过标点符号使用规则生成的第二候选项与通过历史输入数据生成的第四候选项是相同的情况发生,这种情况下,若将第二候选项和第四候选项都进行展示,会导致重复展示,不仅会浪费展示位置,还会降低用户的使用体验,

为此,本申请实施例还提供了一种展示前去重的方式,在将第四候选项展示在字符串对应的候选项展示位置中之前,还可以判断第四候选项和第二候选项是否一致。若判断第二候选项和第四候选项是一致的,就没有必要展示相同的候选项,可以选择其中一个候选项展示即可,例如将第二候选项展示在所述字符串对应的候选项展示位置中。

需要注意的是,用户输入的文字可能与当时的时事热点相关,时事热点具有时效性,其特点在于在一个时间段内用户输入与该时事热点相关文字的频率会很高,但是过了这段时间,该时事热点相关文字的输入频率将会骤降。

为了能够让输入法的输入效果适应这种情况,所采集的历史输入数据中还可以包括针对时事热点中相关文字与标点符号的组合用法。本申请实施例提出了一种从历史输入数据中确定出时事热点中相关文字与标点符号的组合用法的方式。

可以根据所获取历史输入数据的时间,统计单位时间内历史输入数据中标点符号与候选项组合的出现次数,将单位时间内出现次数满足预设条件的标点符号与候选项组合建立标点词库。

该单位时间可以是预设的一个时间段,例如一天、一周、一个月等。若单位时间内的历史输入数据中出现了大量的标点符号和候选项的组合使用,可以确定与标点符号组合使用的该候选项可以属于时事热点的相关文字,例如在热带风暴“厄尔尼诺”肆虐的时期,会有大量用户在互联网上讨论与厄尔尼诺相关的数据、灾情等,由于厄尔尼诺属于对台风的专有命名,一般是需要加上双引号的,故该时期中会出现大量提及厄尔尼诺的输入数据,也就是说“厄尔尼诺”这种文字与标点符号组合的出现次数会很多。

为了尽量准确的确定出时事热点中相关文字与标点符号的组合,可以预先设置出预设条件,该预设条件可以是具体的出现次数,也可以是所统计数据中出现次数最高的前几个。一般来说,当预设条件越严格,满足该预设条件的候选项与标点符号的组合中,候选项属于时事热点的相关文字的可能性就越大。

为了便于使用,可以为将单位时间内出现次数满足预设条件的标点符号与候选项组合建立标点词库。由此当执行图2所对应实施例中的s201时,可以根据所述标点词库判断所述字符串所对应的候选项中是否包括所述标点词库中的候选项。执行s202时,可以若所述字符串所对应的候选项中的第三候选项为所述标点词库中的候选项,生成第四候选项。

通过建立标点词库,可以使得用户在使用输入法输入与时事热点相关文字时能够看到与标点符号组合使用的候选项,提高了讨论时的输入速度。

由于时事热点是具有时效性的,一个时事热点在一段时间后可能将没有用户再提及,故此,需要对建立的符号词库进行更新,除了要加入新出现的时事热点相关文字与标点符号的组合以外,还需要删除已经过时的时事热点相关文字与标点符号的组合,避免资源的浪费。

为此,还可以根据所述单位时间周期性的更新所述标点词库,其中包括:若标点词库中的标点符号与候选项组合在更新周期中的出现次数未满足预设条件,将未满足预设条件的标点符号与候选项组合从标点词库中删除。

参见图3,为本申请实施例提供的一种具有标点符号的候选项展示装置,该装置包括:第一获取单元301、第一判断单元302、第一生成单元303和第一展示单元304:

所述第一获取单元301,用于获取用户输入的字符串;

所述第一判断单元302,用于判断所述字符串所对应的候选项中是否包括具有符合标点符号使用规则的候选项;若所述字符串所对应的候选项中的第一候选项为具有符合标点符号使用规则的候选项,则触发第一生成单元303;

所述第一生成单元303,用于生成第二候选项,所述第二候选项为所述标点符号使用规则中使用了标点符号的所述第一候选项;

所述第一展示单元304,用于将所述第二候选项展示在所述字符串对应的候选项展示位置中。

在本申请一种实施方式中,所述第一展示单元304,包括:

第二展示子单元,用于将所述第一候选项和第二候选项同时展示在所述字符串对应的一个候选项展示页面中,所述候选项展示页面包括多个候选项展示位置。

在本申请一种实施方式中,所述第二展示子单元,还用于同时展示所述第一候选项和第二候选项的候选项展示页面为所述字符串对应候选项展示页面的第一页。

在本申请一种实施方式中,还包括第二判断单元、第二生成单元和第三展示单元:

所述第二判断单元,用于根据历史输入数据判断所述字符串所对应的候选项中是否包括所述历史输入数据中输入的候选项,所述历史输入数据包括输入的标点符号与候选项组合;若所述字符串所对应的候选项中的第三候选项为所述历史输入数据中的候选项,则触发第二生成单元;

所述第二生成单元,用于生成第四候选项,所述第四候选项为所述历史输入数据中标点符号与所述第三候选项的组合;

所述第三展示单元,用于将所述第四候选项展示在所述字符串对应的候选项展示位置中。

在本申请一种实施方式中,所述历史输入数据包括所述用户和/或所述用户所处群组所输入的标点符号与候选项的组合。

在本申请一种实施方式中,还包括第三判断单元:

所述第三判断单元,用于判断所述第四候选项和第二候选项是否一致;若一致,则触发所述第一展示单元304。

在本申请一种实施方式中,还包括:

统计单元,用于统计单位时间内历史输入数据中标点符号与候选项组合的出现次数;

建立单元,用于将单位时间内出现次数满足预设条件的标点符号与候选项组合建立标点词库;

所述第二判断单元,包括:

第四判断子单元,用于根据所述标点词库判断所述字符串所对应的候选项中是否包括所述标点词库中的候选项;

所述第二生成单元,包括:

第三生成子单元,用于若所述字符串所对应的候选项中的第三候选项为所述标点词库中的候选项,生成第四候选项。

在本申请一种实施方式中,还包括更新单元和删除单元:

所述更新单元,用于根据所述单位时间周期性的更新所述标点词库,其中包括:若标点词库中的标点符号与候选项组合在更新周期中的出现次数未满足所述预设条件,则触发所述删除单元;

所述删除单元,用于将未满足预设条件的标点符号与候选项组合从所述标点词库中删除。

本申请实施例还提供了一种具有标点符号的候选项展示的装置,该装置可以包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:

获取用户输入的字符串;

判断所述字符串所对应的候选项中是否包括具有符合标点符号使用规则的候选项;

若所述字符串所对应的候选项中的第一候选项为具有符合标点符号使用规则的候选项,生成第二候选项,所述第二候选项为所述标点符号使用规则中使用了标点符号的所述第一候选项;

将所述第二候选项展示在所述字符串对应的候选项展示位置中。

在本申请的一种实施方式中,所述处理器还用于调用所述存储器存储的程序指令执行如下操作:所述将所述第二候选项展示在所述字符串对应的候选项展示位置中,包括:

将所述第一候选项和第二候选项同时展示在所述字符串对应的一个候选项展示页面中,所述候选项展示页面包括多个候选项展示位置。

在本申请的一种实施方式中,所述处理器还用于调用所述存储器存储的程序指令执行如下操作:同时展示所述第一候选项和第二候选项的候选项展示页面为所述字符串对应候选项展示页面的第一页。

在本申请的一种实施方式中,所述处理器还用于调用所述存储器存储的程序指令执行如下操作:还包括:

根据历史输入数据判断所述字符串所对应的候选项中是否包括所述历史输入数据中输入的候选项,所述历史输入数据包括输入的标点符号与候选项组合;

若所述字符串所对应的候选项中的第三候选项为所述历史输入数据中的候选项,生成第四候选项,所述第四候选项为所述历史输入数据中标点符号与所述第三候选项的组合;

将所述第四候选项展示在所述字符串对应的候选项展示位置中。

在本申请的一种实施方式中,所述处理器还用于调用所述存储器存储的程序指令执行如下操作:所述历史输入数据包括所述用户和/或所述用户所处群组所输入的标点符号与候选项的组合。

在本申请的一种实施方式中,所述处理器还用于调用所述存储器存储的程序指令执行如下操作:在所述将所述第四候选项展示在所述字符串对应的候选项展示位置中的步骤之前,还包括:

判断所述第四候选项和第二候选项是否一致;

若一致,执行所述将所述第二候选项展示在所述字符串对应的候选项展示位置中的步骤。

在本申请的一种实施方式中,所述处理器还用于调用所述存储器存储的程序指令执行如下操作:还包括:

统计单位时间内历史输入数据中标点符号与候选项组合的出现次数;

将单位时间内出现次数满足预设条件的标点符号与候选项组合建立标点词库;

所述根据历史输入数据判断所述字符串所对应的候选项中是否包括所述历史输入数据中输入的候选项,包括:

根据所述标点词库判断所述字符串所对应的候选项中是否包括所述标点词库中的候选项;

所述若所述字符串所对应的候选项中的第三候选项为所述历史输入数据中的候选项,生成第四候选项,包括:

若所述字符串所对应的候选项中的第三候选项为所述标点词库中的候选项,生成第四候选项。

在本申请的一种实施方式中,所述处理器还用于调用所述存储器存储的程序指令执行如下操作:还包括:

根据所述单位时间周期性的更新所述标点词库,其中包括:若标点词库中的标点符号与候选项组合在更新周期中的出现次数未满足所述预设条件,将未满足预设条件的标点符号与候选项组合从所述标点词库中删除。

图4是根据一示例性实施例示出的一种文字发音的装置400作为终端时的框图。例如,装置400可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。

参照图4,装置400可以包括以下一个或多个组件:处理组件402,存储器404,电源组件406,多媒体组件408,音频组件410,输入/输出(i/o)的接口412,传感器组件414,以及通信组件416。

处理组件402通常控制装置400的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件402可以包括一个或多个处理器420来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件402可以包括一个或多个模块,便于处理组件402和其他组件之间的交互。例如,处理组件402可以包括多媒体模块,以方便多媒体组件408和处理组件402之间的交互。

存储器404被配置为存储各种类型的数据以支持在设备400的操作。这些数据的示例包括用于在装置400上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器404可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(sram),电可擦除可编程只读存储器(eeprom),可擦除可编程只读存储器(eprom),可编程只读存储器(prom),只读存储器(rom),磁存储器,快闪存储器,磁盘或光盘。

电源组件406为装置400的各种组件提供电力。电源组件406可以包括电源管理系统,一个或多个电源,及其他与为装置400生成、管理和分配电力相关联的组件。

多媒体组件408包括在所述装置400和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(lcd)和触摸面板(tp)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动运动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件408包括一个前置摄像头和/或后置摄像头。当设备400处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件410被配置为输出和/或输入音频信号。例如,音频组件410包括一个麦克风(mic),当装置400处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器404或经由通信组件416发送。在一些实施例中,音频组件410还包括一个扬声器,用于输出音频信号。

i/o接口412为处理组件402和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件414包括一个或多个传感器,用于为装置400提供各个方面的状态评估。例如,传感器组件414可以检测到设备400的打开/关闭状态,组件的相对定位,例如所述组件为装置400的显示器和小键盘,传感器组件414还可以检测装置400或装置400一个组件的位置改变,用户与装置400接触的存在或不存在,装置400方位或加速/减速和装置400的温度变化。传感器组件414可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物品的存在。传感器组件414还可以包括光传感器,如cmos或ccd图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件414还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。

通信组件416被配置为便于装置400和其他设备之间有线或无线方式的通信。装置400可以接入基于通信标准的无线网络,如wifi,2g或4g,或它们的组合。在一个示例性实施例中,通信部件416经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信部件416还包括近场通信(nfc)模块,以促进短程通信。例如,在nfc模块可基于射频识别(rfid)技术,红外数据协会(irda)技术,超宽带(uwb)技术,蓝牙(bt)技术和其他技术来实现。

在示例性实施例中,装置400可以被一个或多个应用专用集成电路(asic)、数字信号处理器(dsp)、数字信号处理设备(dspd)、可编程逻辑器件(pld)、现场可编程门阵列(fpga)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。

在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器404,上述指令可由装置400的处理器420执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是rom、随机存取存储器(ram)、cd-rom、磁带、软盘和光数据存储设备等。

图5是本申请的一些实施例中服务器的结构示意图。该服务器500可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(centralprocessingunits,cpu)522(例如,一个或一个以上处理器)和存储器532,一个或一个以上存储应用程序552或数据555的存储介质530(例如一个或一个以上海量存储设备)。其中,存储器532和存储介质530可以是短暂存储或持久存储。存储在存储介质530的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器522可以设置为与存储介质530通信,在服务器500上执行存储介质530中的一系列指令操作。

服务器500还可以包括一个或一个以上电源526,一个或一个以上有线或无线网络接口550,一个或一个以上输入输出接口558,一个或一个以上键盘556,和/或,一个或一个以上操作系统551,例如windowsservertm,macosxtm,unixtm,linuxtm,freebsdtm等等。

一种非临时性计算机可读存储介质,当所述存储介质中的指令由装置(终端或者服务器)的处理器执行时,使得装置能够执行一种视频的生成方法,所述方法包括:

获取用户输入的字符串;

判断所述字符串所对应的候选项中是否包括具有符合标点符号使用规则的候选项;

若所述字符串所对应的候选项中的第一候选项为具有符合标点符号使用规则的候选项,生成第二候选项,所述第二候选项为所述标点符号使用规则中使用了标点符号的所述第一候选项;

将所述第二候选项展示在所述字符串对应的候选项展示位置中。

本领域技术人员在考虑说明书及实践这里公开的申请后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由下面的权利要求指出。

应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制

以上所述仅为本申请的较佳实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

以上对本申请所提供的一种文字发音装置,进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1