信息聚合归类的显示方法及系统的制作方法
【专利摘要】本发明公开了一种信息聚合归类的显示方法,从信息交互共享平台中获取信息,提取信息的内容关键词;根据所述内容关键词进行信息聚合归类,将信息分别按照其归属类进行显示。本发明还公开了一种信息聚合归类的显示系统,其中的关键词提取单元用于从信息交互共享平台中获取信息,提取信息的内容关键词;聚合归类单元用于根据所述内容关键词进行信息聚合归类;显示单元用于将信息分别按照其归属类进行显示。采用本发明,实现了信息聚合归类的显示,方便信息的共享和交互,降低用户操作复杂度。
【专利说明】信息聚合归类的显示方法及系统
【技术领域】
[0001]本发明涉及聚合技术,尤其涉及一种信息聚合归类的显示方法及系统。
【背景技术】
[0002]随着互联网的普及,用户日常生活和工作中越来越离不开信息共享和交互,尤其是在一些社交网络和媒体上的互动。目前,用户在互动时所用到的信息通常都是以单条信息的形式进行显示的,也就是说,信息的显示是以单个一条信息的属性进行最终显示的,用户发一条信息就显示一条信息,这样,就导致信息显示的无序性和零散性,有了互联网后信息量又是巨大的。从而,浩如烟海的巨大信息量无序,零散性地显示在社交网络和媒体上,这对于信息的共享和交互是非常不利的,因为用户很难从巨大的信息量中直接检索到自身关注的、有用的各类信息,而是先通过大量读取和不停刷新信息,从信息交互共享平台中获取到源数据,再通过用户自身对获取的源数据进行归类整合。
[0003]综上所述,现有技术存在的问题是:由于信息的显示是以单个一条信息的属性进行最终显示,因此,导致巨大信息量显示的无序性和零散性,不利于信息的共享和交互;需要用户来归类整合信息,用户操作复杂度高。
【发明内容】
[0004]有鉴于此,本发明的主要目的在于提供一种信息聚合归类的显示方法及系统,实现了信息聚合归类的显示,方便信息的共享和交互,降低用户操作复杂度。
[0005]为达到上述目的,本发明的技术方案是这样实现的:
[0006]一种信息聚合归类的显示方法,该方法包括:
[0007]从信息交互共享平台中获取信息,提取信息的内容关键词;根据所述内容关键词进行信息聚合归类,将信息分别按照其归属类进行显示。
[0008]其中,所述提取信息内容关键词具体包括:
[0009]在信息交互共享平台中检索多个信息,将多个信息中相同、相似或出现频度高、指定位置的内容作为内容关键词。
[0010]其中,所述根据所述信息内容关键词进行信息聚合归类具体包括:
[0011]将所述内容关键词作为对应信息的归属类,并将对应信息聚合在同一个归属类中,作为所述归属类的一个子集。
[0012]其中,所述将信息分别按照其归属类进行显示具体包括:
[0013]按照归属类的信息聚合标题、归属类的信息聚合热度、归属类的信息聚合反馈,分别进行显示。
[0014]其中,按照所述归属类的信息聚合标题进行显示具体包括:
[0015]根据设置的候选集对每个归属类中的全部信息进行检索;所述候选集包括:指定的通配符、标识符、文字、字母、字符、信息指定标点符号之内的词、信息的首或末段内容中的一种或至少一种的组合的匹配规则;[0016]当在信息中检索到与所述候选集中相匹配的内容时,将所检索到的内容与所述信息的归属类对应的内容关键词进行比对,选取所述所检索到的内容与所述内容关键词中重复出现概率高的内容作为归属类的标题并显示。
[0017]其中,按照所述归属类的信息聚合热度进行显示具体包括:
[0018]对每个归属类中的全部信息进行检索,获取每一条信息的出现频度并分别进行频度叠加、和/或获取全部信息的信息量总和,将频度叠加的结果、和/或信息量总和作为归属类的信息聚合热度并显示。
[0019]其中,按照所述归属类的信息聚合反馈进行显示具体包括:
[0020]对每个归属类中的全部信息的信息反馈进行检索,将检索到的信息反馈聚合归类到对应的信息并显示。
[0021]一种信息聚合归类的显示系统,该系统包括:关键词提取单元、聚合归类单元、显示单元;其中,
[0022]所述关键词提取单元,用于从信息交互共享平台中获取信息,提取信息的内容关键词;
[0023]所述聚合归类单元,用于根据所述内容关键词进行信息聚合归类;
[0024]所述显示单元,用于将信息分别按照其归属类进行显示。
[0025]其中,所述关键词提取单元,进一步用于在信息交互共享平台中检索多个信息,将多个信息中相同、相似或出现频度高的内容作为内容关键词并提取。
[0026]其中,所述聚合归类单元,进一步用于将所述内容关键词作为对应信息的归属类,并将对应信息聚合在同一个归属类中,作为所述归属类的一个子集。
[0027]其中,所述显示单元,进一步用于按照归属类的信息聚合标题、归属类的信息聚合热度、归属类的信息聚合反馈,分别进行显示。
[0028]本发明从信息交互共享平台中获取信息,提取信息的内容关键词;根据内容关键词进行信息聚合归类,将信息分别按照其归属类进行显示。
[0029]现有技术对信息没有进行归类,仅以单个一条信息的形式进行显示,而本发明根据内容关键词对信息进行聚合归类,并最终以聚合归类后的结果输出显示,该聚合归类显示是自动化的操作,无需用户获得一条条信息这样的源数据后,再手工自己进行归类整合,从而方便信息的共享和交互,降低了用户的操作复杂度。
【专利附图】
【附图说明】
[0030]图1为本发明方法的流程图;
[0031]图2为本发明系统的组成结构示意图。
【具体实施方式】
[0032]本发明的基本思想是:从信息交互共享平台中获取信息,提取信息的内容关键词;根据内容关键词进行信息聚合归类,将信息分别按照其归属类进行显示。
[0033]下面结合附图对技术方案的实施作进一步的详细描述。
[0034]一种信息聚合归类的显示方法,如图1所示,包括以下步骤:
[0035]步骤101、从信息交互共享平台中获取信息,提取信息的内容关键词。[0036]这里,步骤101具体包括:在信息交互共享平台中检索多个信息,将多个信息中相同、相似或出现频度高、指定位置(比如出现引号,括号,书名号等的位置)的内容作为内容关键词。
[0037]步骤102、根据内容关键词进行信息聚合归类。
[0038]这里,步骤102具体包括:将内容关键词作为对应信息所归属的归属类,并将对应信息聚合在同一个归属类中,作为所述归属类的一个子集。
[0039]步骤103、将信息分别按照其归属类进行显示。
[0040]这里,步骤103具体包括:按照归属类的信息聚合标题、归属类的信息聚合热度、归属类的信息聚合反馈,分别进行显示这三种具体实现方式,以下分别阐述。
[0041]一、按照归属类的信息聚合标题进行显示具体包括:
[0042]根据设置的候选集对每个归属类中的全部信息进行检索;所述候选集包括:指定的通配符、标识符、文字、字母、字符、信息指定标点符号之内的词(比如引号,括号,书名号等)、信息的首或末段内容中的一种或至少一种的组合的匹配规则;
[0043]当在信息中检索到与候选集中相匹配的内容时,将所检索到的内容与信息的归属类对应的内容关键词进行比对,选取所检索到的内容与内容关键词中重复出现概率高的内容作为归属类的标题并显示。
[0044]二、按照归属类的信息聚合热度进行显示具体包括以下任一种或两种方式的组合:
[0045]1、对每个归属类中的全部信息进行检索,获取每一条信息的出现频度并分别进行频度叠加,将频度叠加的结果作为归属类的信息聚合热度并显示。比如,出现频度是信息的转发次数时,如果在当前归属类中一条信息的总转发次数为10次,就在该条信息上标记上“转发10次”并显示。再如,如果某个归属类中有10条相关的信息,每条的信息被转发10次,这个类的总的转发热度就是100。会标记这个归属类的热度是100。
[0046]2、对每个归属类中的全部信息进行检索,获取全部信息的信息量总和,将全部信息的信息量总和作为归属类的信息聚合热度并显示。比如,如果在当前归属类中全部信息的信息量总和为100个,就在该类信息上标记上“信息总量共100个”并显示。
[0047]这样,加上标记后,可以直观地让用户知道哪个信息比较受关注,或哪个类比较受关注,方便用户进行操作。
[0048]三、按照归属类的信息聚合反馈进行显示具体包括:
[0049]对每个归属类中的全部信息的信息反馈进行检索,将检索到的信息反馈聚合归类到对应的信息并显示。
[0050]如上所述,每个归属类中会有许多条同类信息,这些信息可以作为归属类的一个子集存在,而针对每条信息也会有大量信息反馈,即对信息主题或内容进行评价,那么,为了达到最佳的信息资源整合的目的,可以针对每一条信息,对其信息反馈也进行聚合,并与这条信息相对应,也就是说,一条信息的信息反馈所聚合成的信息集合为该条信息的一个子集。这里,对该信息反馈所聚合成的信息集合也可以进一步进行归类细化和热度细化,在此不作赘述。需要指出的是,信息反馈除了针对一条信息,也可以针对一类信息,如针对每个归属类而言的信息反馈,在此不作赘述。
[0051]一种信息聚合归类的显示系统,如图2所示,该系统包括:关键词提取单元、聚合归类单元、显示单元;其中,关键词提取单元用于从信息交互共享平台中获取信息,提取信息的内容关键词;聚合归类单元用于根据所述内容关键词进行信息聚合归类;述显示单元用于将信息分别按照其归属类进行显示。
[0052]这里,关键词提取单元进一步用于在信息交互共享平台中检索多个信息,将多个信息中相同、相似或出现频度高的内容作为内容关键词并提取。
[0053]这里,聚合归类单元进一步用于将所述内容关键词作为对应信息所归属的类,并将对应信息聚合在同一个归属类中,作为所述归属类的一个子集。
[0054]这里,显示单元进一步用于按照类的信息聚合标题、类的信息聚合热度、类的信息聚合反馈,分别进行显示。
[0055]以下,以信息交互共享平台具体为一个微博平台来举例描述,但本发明并不局限于微博平台。
[0056]基于微博平台的方法流程,包括以下步骤: [0057]步骤201、从微博平台中获得新闻数据,并提取新闻数据中的内容关键词,对新闻数据按照内容关键词进行自动聚合归类。并且这个类别会随着新的新闻数据的不断产生和更新而不断地更新。
[0058]步骤202、在自动聚合归类之后,相似的新闻数据被自动聚合到一个新闻主题的归属类中。
[0059]执行完步骤202后,有以下几个可选步骤203a~步骤203c完成该方法流程。其中,
[0060]步骤203a、根据算法从每个归属类中的全部新闻数据中挑选一句话,作为整个新闻主题的标题,以用于显示。
[0061]这里,在一个新闻主题归属类的多条新闻数据中,针对提取上述标题的算法举例来说,可以为:提取每条微博中的第一句话,或者是特殊符号,如书名号“【】”中所包含的语句,作为候选的、可作为标题的集合。计算候选集中的每条语句中提取的关键词和归属类的中心节点的余弦夹角相似度。把其中相似度最高的作为这个归属类的标题。
[0062]步骤203b、计算归属类中每条新闻数据的热度,聚合每条新闻数据的热度,作为这个新闻主题的热度,以用于显示。
[0063]这里,针对计算所述热度的算法举例来说,可以为:经过聚合归类之后,一个归属类A中有30条微博属于这个归属类,每条微博的转播数是50。这个新闻主题的热度就是30X50 = 1500。如果另一个归属类B中有100条微博属于这个归属类,但是每条的转播数只有20。归属类B的热度就是100X20 = 2000。这样,在最终的排序展示的时候,归属类B就会排在归属类A之前,优先展示,用户也可以先看到归属类B。
[0064]步骤203c、聚合归属类中每条新闻数据的用户评论,作为这个新闻主题的用户评论,以用于显示。
[0065]这里,每一条新闻数据都有自己的用户评论,在把新闻数据聚合之后,可以同时把用户的评论也聚合起来,作为用户对这个新闻主题的评论显示出来,而不仅仅是针对一条新闻的评论。
[0066]步骤204、每个归属类按类别的热度排序,而不是一条新闻的热度,把这个排序结果输出,并输出每个新闻主题的标题,主题类别下的新闻数据,以及所有的这个主题的用户评论,而不是一条新闻的用户评论。
[0067]这里,采用新的显示排序方式,可以把同一个主题的从不同来源的相关新闻的热度汇总起来,作为一个新闻主题的热度,而不是单一新闻的热度显示排序。
[0068]可见,本发明这种方案应用于微博平台时,与现有技术相比,有显著优势。现有技术中,微博平台中有许多用户账号发布的新闻数据,这些新闻数据的显示都是以单条新闻数据的形式出现的,通用的一种显示排序方式是按单个一条新闻的属性,如按被转播的数量,或发布的时间顺序来对新闻逐条排序,而不是针对一类新闻数据而言,而事实上,同一个新闻主题的新闻数据可能被不同的用户账号发布。比如,以“工业明胶被曝光”的新闻事件来说,这个主题类别的相关消息被多家新闻媒体报道,《经济观察报》,《每日经济新闻》等,而且每条新闻数据所展现的可能是同一个新闻主题的不同的角度。如果采用现有技术,用户只能看到单条新闻数据的显示,例如《每日经济新闻》这家新闻媒体的关于“工业明胶”的一条新闻报道的热度或时间,而采用本发明,是按照主题的类别进行显示排序,即按新闻主题的标题、热度及评价等进行显示排序,这样,仍然以“工业明胶”为例,就可以采用“工业明胶”这个新闻主题去显示,把微博平台中关于“工业明胶”的所有相关新闻都聚合在一个类“工业明胶”中,用这个新闻主题的类作为参与显示排序的方式,更方便信息的交互和共享。
[0069]综上所述,采用本发明,除了有上述提到的明显优势之外,还有一个方面需要指出,现有技术是用户通过用户客户端登录用户帐号后,进入信息交互共享平台,发布信息、转发信息或回复信息,以实现信息的交互共享。这种用户在用户客户端(不限于手机客户端、PAD、个人掌上电脑和数码电子产品,台式机等)与信息交互共享平台(不限于微博平台)之间交互,需要不停的读取和刷新数据来获取数据,以及反馈数据,那么,这种来回访问获取数据及反馈数据的方式,如果仍然采用现有技术单个一条信息的显示,而不归类的话,势必增加用户获取有效数据的成本,因为信息量太大,无法直接得到想要的有效数据,用户操作复杂度高。另一方面,用户客户端与信息交互共享平台的交互多,访问所能得到的有效数据少,不仅访问效率低下,而且用户客户端与信息交互共享平台的交互越多,多次请求/响应,也会占用网络资源和带宽的。而采用本发明,由于信息是归类显示,而且会有热度、标题、反馈各种显示排序提示,会让用户用最短的时间得到更多的有效数据,因为,通过本发明,已经预先在信息交互共享平台归类好了信息才显示,用户可以直接得到有效数据,而不是未经处理的源数据,从而,用户操作复杂度降低,访问效率提高,交互次数减少,相应的,节约了网络资源和带宽的开销。
[0070]以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。
【权利要求】
1.一种信息聚合归类的显示方法,其特征在于,该方法包括: 从信息交互共享平台中获取信息,提取信息的内容关键词;根据所述内容关键词进行信息聚合归类,将信息分别按照其归属类进行显示。
2.根据权利要求1所述的方法,其特征在于,所述提取信息内容关键词具体包括: 在信息交互共享平台中检索多个信息,将多个信息中相同、相似或出现频度高、指定位置的内容作为内容关键词。
3.根据权利要求1或2所述的方法,其特征在于,所述根据所述信息内容关键词进行信息聚合归类具体包括: 将所述内容关键词作为对应信息的归属类,并将对应信息聚合在同一个归属类中,作为所述归属类的一个子集。
4.根据权利要求3所述的方法,其特征在于,所述将信息分别按照其归属类进行显示具体包括: 按照归属类的信息聚合标题、归属类的信息聚合热度、归属类的信息聚合反馈,分别进行显示。
5.根据权利要求4所述的方法, 其特征在于,按照所述归属类的信息聚合标题进行显示具体包括: 根据设置的候选集对每个归属类中的全部信息进行检索;所述候选集包括:指定的通配符、标识符、文字、字母、字符、信息指定标点符号之内的词、信息的首或末段内容中的一种或至少一种的组合的匹配规则; 当在信息中检索到与所述候选集中相匹配的内容时,将所检索到的内容与所述信息的归属类对应的内容关键词进行比对,选取所述所检索到的内容与所述内容关键词中重复出现概率高的内容作为归属类的标题并显示。
6.根据权利要求4所述的方法,其特征在于,按照所述归属类的信息聚合热度进行显示具体包括: 对每个归属类中的全部信息进行检索,获取每一条信息的出现频度并分别进行频度叠加、和/或获取全部信息的信息量总和,将频度叠加的结果、和/或信息量总和作为归属类的信息聚合热度并显示。
7.根据权利要求4所述的方法,其特征在于,按照所述归属类的信息聚合反馈进行显示具体包括: 对每个归属类中的全部信息的信息反馈进行检索,将检索到的信息反馈聚合归类到对应的信息并显示。
8.一种信息聚合归类的显示系统,其特征在于,该系统包括:关键词提取单元、聚合归类单元、显示单元;其中, 所述关键词提取单元,用于从信息交互共享平台中获取信息,提取信息的内容关键词; 所述聚合归类单元,用于根据所述内容关键词进行信息聚合归类; 所述显示单元,用于将信息分别按照其归属类进行显示。
9.根据权利要求8所述的系统,其特征在于,所述关键词提取单元,进一步用于在信息交互共享平台中检索多个信息,将多个信息中相同、相似或出现频度高的内容作为内容关键词并提取。
10.根据权利要求8或9所述的系统,其特征在于,所述聚合归类单元,进一步用于将所述内容关键词作为对应信息的归属类,并将对应信息聚合在同一个归属类中,作为所述归属类的一个子集。
11.根据权利要求10所述的系统,其特征在于,所述显示单元,进一步用于按照归属类的信息聚合标题、归属类的信息聚合热度、归属类的信息聚合反馈,分别进行显示。
【文档编号】G06F17/30GK103631791SQ201210300750
【公开日】2014年3月12日 申请日期:2012年8月22日 优先权日:2012年8月22日
【发明者】亢峰 申请人:腾讯科技(深圳)有限公司