专利名称:一种句子的页面生成方法和设备的制作方法
技术领域:
本发明涉及数字数据处理领域,尤其涉及一种句子的页面生成方法和设备。
背景技术:
随着互联网的普及,文本信息爆炸性增长,人们每天需要处理的文本信息也越来越多。现有的显示方式通常是将完整的文本显示出来,或者将文章的前半部分显示出来。通过现有技术中的显示方法处理文本信息,主要信息和次要信息的格式相同,效率较低。
发明内容
本发明实施例提供了一种句子的页面生成方法和设备,用于提高文本信息处理效率。本发明实施例提供了一种句子的页面生成方法,包括识别句子中的次要语言元素;按照设置的第一规则,将所述次要语言元素配置为弱化的显示效果;保持所述句子的顺序结构,按照配置的显示效果生成所述句子的页面。本发明实施例提供了一种句子的页面生成设备,包括第一识别模块,用于识别句子中的次要语言元素;第一配置模块,用于按照设置的第一规则,将所述第一识别模块识别的所述次要语言元素配置为弱化的显示效果;生成模块,用于保持所述句子的顺序结构,按照所述第一配置模块配置的显示效果生成所述句子的页面。本发明实施例提供的一种句子的页面生成方法和设备,通过弱化次要语言元素, 使得阅读者可以集中精力于重要的信息,从而提高文本信息处理效率;另外,在移动终端这类屏幕较小的设备上显示文本信息时,如果弱化次要语言元素时,缩小了次要语言元素所占的空间,还可以减少翻页次数。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1所示为本发明实施例一种句子的页面生成方法流程图;图2所示为本发明实施例另一种句子的页面生成方法流程图;图3所示为本发明实施例另一种句子的页面生成设备结构图。
具体实施例方式图1所示为本发明实施例一种句子的页面生成方法流程图,本实施例包括步骤101,识别句子中的次要语言元素;步骤102,按照设置的第一规则,将所述次要语言元素配置为弱化的显示效果;步骤103,保持所述句子的顺序结构,按照配置的显示效果生成所述句子的页面。本发明实施例的执行主体为处理器,该处理器可以位于服务器端也可以位于客户端。所述语言元素可以包括标点、符号、字、语素、词、词组、语块、组块、固定搭配、子句、和 /或句子成分等。所述次要语言元素可以包括以下一项或任意项组合修饰性的语言元素、 重复出现的语言元素、与所述句子的主题不相关的语言元素、信息量小于第一门限值的语言元素等。例如修饰性的语言元素可以为定语、状语、补语、形容词、副词、时间词、处所词、方位词、状态词、数词、量词、介词、连词、助词、叹词、语气词、拟声词。首先,识别句子中的次要语言元素,例如在法律文件中,为了描述准确,通常使用全称,这就属于信息量小于第一门限值的语言元素,包含的信息量较小;另外添加很多修饰性的语言元素,例如形容词,然而在阅读者看来,这些文字对于读懂句子并没有太大帮助。 例如,若假设次要语言元素为全称和修饰性描述,则本专利申请文件权利要求1 “识别句子中的次要语言元素;按照设置的第一规则,将所述次要语言元素配置为弱化的显示效果;保持所述句子的顺序结构,按照配置的显示效果生成所述句子的页面。”中的次要语言元素依次可以为“句子中的”、“次要语言”、“设置的”、“次要语言”、“弱化的”、“所述句子的”、“配置的”、“所述句子的”。其中为全称的次要语言元素为“次要语言”。为修饰性描述的次要语言元素依次为“句子中的”、“设置的”、“弱化的”、“所述句子的”、“配置的”、“所述句子的”。然后按照设置的第一规则,将所述次要语言元素配置为弱化的显示效果。所述第一规则可以为,将所述次要语言元素全部配置为相同的弱化的显示效果,仍继续前例,此方式为将全称和修饰性描述均配置为相同的弱化的显示效果。所述第一规则还可以为,将所述次要语言元素按照类别配置为不同的弱化的显示效果,仍继续前例,此方式为将全称和修饰性描述均配置为不同的弱化的显示效果。所述配置为弱化的显示效果可以包括配置为浅于其他语言元素的颜色、配置为不同于其他语言元素的字体、配置为小于其他语言元素的字号、配置为不同于其他语言元素的背景、删除所述次要语言元素、将所述次要语言元素替换为设置的标点符号、和/或将所述次要语言元素替换为设置的缩略语等。最后保持所述句子的顺序结构,按照配置的显示效果生成所述句子的页面。仍继续前例,此处以将不同类别的次要语言元素全部替换为省略号为例,本专利申请文件权利要求1可以变为“识别......元素;按照...第一规则,将所述...元素配置为...显示效果;保持...顺序结构,按照...显示效果生成...页面。”此处以将次要语言元素中的全称,S卩“次要语言”替换为设置的缩略语A,同时将其他次要语言元素替换为省略号为例,本专利申请文件权利要求1可以变为
5
“识别...A元素;按照...第一规则,将所述A元素配置为...显示效果;保持...顺序结构,按照...显示效果生成...页面。”再以本专利申请文件权利要求4和权利要求6为例,其中还包含很多重复的描述, 例如权4包含“配置为浅于其他语言元素的颜色、配置为小于其他语言元素的字号”权6包含“配置为深于其他语言元素的颜色、配置为大于其他语言元素的字号”如果将权利要求6中重复的描述缩小一号显示,将变为配置为深于其他语言元素的颜色,配置为大于其他语言元素的字号”再以网络论坛为例,在很多回复中往往存在灌水的现象,本实施例的方法也可以将回复中信息量较低的回复弱化处理。本发明实施例提供的一种句子的页面生成方法,通过弱化次要语言元素,使得阅读者可以集中精力于重要的信息,从而提高文本信息处理效率;另外,在移动终端这类屏幕较小的设备上显示文本信息时,如果弱化次要语言元素时,缩小了次要语言元素所占的空间,还可以减少翻页次数。图2所示为本发明实施例另一种句子的页面生成方法流程图,本实施例包括步骤101,识别句子中的次要语言元素;步骤102,按照设置的第一规则,将所述次要语言元素配置为弱化的显示效果;步骤204,识别句子中的主要语言元素;步骤205,按照设置的第二规则,将所述主要语言元素配置为强化的显示效果;步骤103,保持所述句子的顺序结构,按照配置的显示效果生成所述句子的页面。本发明实施例的执行主体为处理器。本实施例与上一实施例的区别在于,在识别次要语言元素的基础上还进一步识别主要语言元素。所述主要语言元素包括以下一项或任意项组合主语性质的语言元素、谓语性质的语言元素、宾语性质的语言元素、代词性的语言元素、名词性的语言元素、动词性的语言元素、否定意思的语言元素、与所述句子的主题相关的语言元素、信息量大于第二门限值的语言元素等。本实施例中识别次要语言元素并配置弱化的显示效果的步骤与上一实施例相同,在这里不再赘述。仍以本发明实施例权利要求1为例,虽然“弱化的”是修饰性描述,但是在文中为第一次出现,并且在同类专利中出现也不频繁,因此具有较高的信息量,可以将其配置成强化的显示效果。配置为强化的显示效果包括配置为深于其他语言元素的颜色、配置为不同于其他语言元素的字体、配置为大于其他语言元素的字号、配置为不同于其他语言元素的背景等。例如,权利要求1可以变为“识别......元素;按照...第一规则,将所述...元素配置为弱化的显示效果;保持...顺序结构,按照...显示效果生成...页面。”再以新闻为例,很多新闻报道的题目为了吸引读者,通常会隐去关键信息,另读者必须要阅读全文才能找到与主题最为相关的信息。例如
“国防部新任新闻发言人上任国防部新任新闻发言人近日低调上任。国防部网站M日的报道中,耿雁生首次以 “国防部新闻发言人”的身份,发布了关于中巴两军“友谊-2010”反恐联合训练的消息。此前,国防部外事办公室22日为驻华武官举行了“中国参与国际军控事务情况” 介绍会,据媒体报道,“介绍会由国防部新闻事务局局长耿雁生大校主持”。另据悉,国防部新闻事务局副局长由杨宇军担任。媒体分析称,按照惯例,国防部新闻事务局正副局长将同时兼任新闻发言人。这表示,国防部首任的两位新闻发言言人胡昌明和黄雪平在完成开创性局面之后,顺利交班,另有任用。”对于这样一则上任的新闻,读者最为关心的通常是一个人名,即谁上任了。因此文本中可以将人名作为主要语言元素进行强化“国防部新任新闻发言人上任国防部新任新闻发言人近日低调上任。国防部网站M日的报道中,耿雁生首次以 “国防部新闻发言人”的身份,发布了关于中巴两军“友谊-2010”反恐联合训练的消息。此前,国防部外事办公室22日为驻华武官举行了“中国参与国际军控事务情况” 介绍会,据媒体报道,“介绍会由国防部新闻事务局局长耿雁生大校主持”。另据悉,国防部新闻事务局副局长由杨宇军担任。媒体分析称,按照惯例,国防部新闻事务局正副局长将同时兼任新闻发言人。这表示,国防部首任的两位新闻发言人胡昌明和黄雪平在完成开创性局面之后,顺利交班,另有任用。”本发明实施例提供的一种句子的页面生成方法,通过弱化次要语言元素,使得阅读者可以集中精力于重要的信息,从而提高文本信息处理效率;另外,在移动终端这类屏幕较小的设备上显示文本信息时,如果弱化次要语言元素时,缩小了次要语言元素所占的空间,还可以减少翻页次数;而且还对主要语言元素进行了强化,可以进一步帮助读者快速抓住要点,提高处理效率。图3所示为本发明实施例另一种句子的页面生成设备结构图,本实施例包括第一识别模块301,用于识别句子中的次要语言元素;第一配置模块302,用于按照设置的第一规则,将所述第一识别模块识别的所述次要语言元素配置为弱化的显示效果;生成模块303,用于保持所述句子的顺序结构,按照所述第一配置模块配置的显示效果生成所述句子的页面。本发明实施例用于执行图1所示实施例和图2所示实施例的方法。所述语言元素可以包括以下一项或任意项组合标点、符号、字、语素、词、词组、语块、组块、固定搭配、子句、和/或句子成分等。所述次要语言元素可以包括以下一项或任意项组合修饰性的语言元素、重复出现的语言元素、与所述句子的主题不相关的语言元素、 信息量小于第一门限值的语言元素等。所述第一配置模块可以用于按照设置的第一规则,将所述第一识别模块识别的所述次要语言元素
7
配置为浅于其他语言元素的颜色、配置为不同于其他语言元素的字体、配置为小于其他语言元素的字号、配置为不同于其他语言元素的背景、删除所述次要语言元素、将所述次要语言元素替换为设置的标点符号、和/或将所述次要语言元素替换为设置的缩略
ta寸。本发明实施例还可以包括第二识别模块304,用于识别句子中的主要语言元素;第二配置模块305,用于按照设置的第二规则,将所述第二识别模块识别的所述主要语言元素配置为强化的显示效果。所述主要语言元素包括以下一项或任意项组合主语性质的语言元素、谓语性质的语言元素、宾语性质的语言元素、代词性的语言元素、名词性的语言元素、动词性的语言元素、否定意思的语言元素、与所述句子的主题相关的语言元素、信息量大于第二门限值的语言元素等;所述配置为强化的显示效果包括配置为深于其他语言元素的颜色、配置为不同于其他语言元素的字体、配置为大于其他语言元素的字号、配置为不同于其他语言元素的
曲旦绝冃足寺°本发明实施例提供的一种句子的页面生成设备,通过弱化次要语言元素,使得阅读者可以集中精力于重要的信息,从而提高文本信息处理效率;另外,在移动终端这类屏幕较小的设备上显示文本信息时,如果弱化次要语言元素时,缩小了次要语言元素所占的空间,还可以减少翻页次数。通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在可读取的存储介质中,如计算机的软盘,硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例上述的方法。以上上述,仅为本发明的具体实施方式
,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应上述以权利要求的保护范围为准。
权利要求
1.一种句子的页面生成方法,其特征在于,包括 识别句子中的次要语言元素;按照设置的第一规则,将所述次要语言元素配置为弱化的显示效果; 保持所述句子的顺序结构,按照配置的显示效果生成所述句子的页面。
2.如权利要求1所述的方法,其特征在于,所述语言元素包括以下一项或任意项组合 标点、符号、字、语素、词、词组、语块、组块、固定搭配、子句、和/或句子成分。
3.如权利要求1或2所述的方法,其特征在于,所述次要语言元素包括以下一项或任意项组合修饰性的语言元素、重复出现的语言元素、与所述句子的主题不相关的语言元素、信息量小于第一门限值的语言元素。
4.如权利要求1或2所述的方法,其特征在于,所述配置为弱化的显示效果包括 配置为浅于其他语言元素的颜色、配置为不同于其他语言元素的字体、配置为小于其他语言元素的字号、配置为不同于其他语言元素的背景、删除所述次要语言元素、将所述次要语言元素替换为设置的标点符号、和/或将所述次要语言元素替换为设置的缩略语。
5.如权利要求1或2所述的方法,其特征在于,还包括 识别句子中的主要语言元素;按照设置的第二规则,将所述主要语言元素配置为强化的显示效果; 所述主要语言元素包括以下一项或任意项组合主语性质的语言元素、谓语性质的语言元素、宾语性质的语言元素、代词性的语言元素、名词性的语言元素、动词性的语言元素、 否定意思的语言元素、与所述句子的主题相关的语言元素、信息量大于第二门限值的语言元素。
6.如权利要求1所述的方法,其特征在于,所述配置为强化的显示效果包括配置为深于其他语言元素的颜色、配置为不同于其他语言元素的字体、配置为大于其他语言元素的字号、配置为不同于其他语言元素的背景。
7.—种句子的页面生成设备,其特征在于,包括 第一识别模块,用于识别句子中的次要语言元素;第一配置模块,用于按照设置的第一规则,将所述第一识别模块识别的所述次要语言元素配置为弱化的显示效果;生成模块,用于保持所述句子的顺序结构,按照所述第一配置模块配置的显示效果生成所述句子的页面。
8.如权利要求7所述的设备,其特征在于, 所述语言元素包括以下一项或任意项组合标点、符号、字、语素、词、词组、语块、组块、固定搭配、子句、和/或句子成分;和/或所述次要语言元素包括以下一项或任意项组合修饰性的语言元素、重复出现的语言元素、与所述句子的主题不相关的语言元素、信息量小于第一门限值的语言元素。
9.如权利要求7或8所述的设备,其特征在于,所述第一配置模块用于按照设置的第一规则,将所述第一识别模块识别的所述次要语言元素配置为浅于其他语言元素的颜色、配置为不同于其他语言元素的字体、配置为小于其他语言元素的字号、配置为不同于其他语言元素的背景、删除所述次要语言元素、将所述次要语言元素替换为设置的标点符号、和/或将所述次要语言元素替换为设置的缩略语。
10.如权利要求7或8所述的设备,其特征在于,还包括 第二识别模块,用于识别句子中的主要语言元素;第二配置模块,用于按照设置的第二规则,将所述第二识别模块识别的所述主要语言元素配置为强化的显示效果;所述主要语言元素包括以下一项或任意项组合主语性质的语言元素、谓语性质的语言元素、宾语性质的语言元素、代词性的语言元素、名词性的语言元素、动词性的语言元素、 否定意思的语言元素、与所述句子的主题相关的语言元素、信息量大于第二门限值的语言元素;所述配置为强化的显示效果包括配置为深于其他语言元素的颜色、配置为不同于其他语言元素的字体、配置为大于其他语言元素的字号、配置为不同于其他语言元素的背景。
全文摘要
本发明实施例提供了一种句子的页面生成方法和设备,用于提高文本信息处理效率。本发明实施例提供的方法包括识别句子中的次要语言元素;按照设置的第一规则,将所述次要语言元素配置为弱化的显示效果;保持所述句子的顺序结构,按照配置的显示效果生成所述句子的页面。本发明实施例提供的一种句子的页面生成方法和设备,通过弱化次要语言元素,使得阅读者可以集中精力于重要的信息,从而提高文本信息处理效率;另外,在移动终端这类屏幕较小的设备上显示文本信息时,如果弱化次要语言元素时,缩小了次要语言元素所占的空间,还可以减少翻页次数。
文档编号G06F3/048GK102455856SQ201010528069
公开日2012年5月16日 申请日期2010年10月27日 优先权日2010年10月27日
发明者王博 申请人:王博