专利名称:交互式评注设备,交互式评注系统及其方法
技术领域:
本发明涉及信息检索和信息呈现领域。具体而言,本发明涉及交互式评注设备及其方法以及交互式评注系统及其方法。
背景技术:
随着万维网的普及和万维网网页的可用性越来越强,许多用户开始依赖于万维网作为其工作和娱乐的信息来源。目前,网络浏览器成为了用户计算机上最常用的工具,许多用户将其视为信息世界的窗口。
当用户启动网络浏览器并向其中键入URL时,用户可能有两个基本需求。第一个需求也是根本需求,用户可能想要浏览与URL相关的期望目的地所涵盖的内容,并找到自己感兴趣的一些信息。第二个需求是补充需求,用户也想与其家人、朋友分享精辟观点或自己的感受,甚至只是想写下可能对别人或自己有用的东西。前一基本需求称作网络冲浪需求,而后一基本需求称作社交网络浏览或交互式网络浏览需求。
网络浏览器是满足网络冲浪需求的绝佳工具。但是,对于交互式网络浏览,现有网络浏览器不起作用。网络浏览器不是网页编辑器,无法提供工具以使得用户对当前下载的网络进行编辑和评注。有两种基本方法允许用户在网络冲浪期间进行评注、分享和交流。第一种方法是,网络应用提供商在发布其网站时传送相关特征(例如,许多新闻网站提供读者评注系统,鼓励读者在网站上留下反馈)。第二种方法是,在网络浏览器中开发和插入一些辅助工具(类似于当前文档编辑器的评注工具)。
当前,待评注的文档内容块(内容片段)的范围通常取决于用户(通过点击鼠标左键并移动鼠标)。只有少量传统系统提供文档内容块选择工具,例如名称为“A method for interactive commenting on mediafiles”的专利申请WO2007/135688 A2提供了一种图形工具,用于选择要评注的片段(片段包括视频或影片记录中的至少一个帧)。例如,如果所选多媒体内容中有n个帧,则用户可以使用该工具从n帧中选择m个帧(1≤m≤n)来创建片段、从所选片段中去除帧以及向所选片段添加帧。
现有的文档内容块选择工具一般不令人满意,因为在生成片段时,它无法自动创建片段来帮助用户节省时间。具体而言 假设多媒体源文件中有n个帧, 1.为了创建包括m个帧的片段,在最差情况下用户要进行m次选择; 2.即使用户始终选择一组帧来创建片段,下一次他也需要再次选择相关帧来创建片段; 3.用户无法将片段A当作组成部分来生成新片段B,因此在最差情况下用户要进行FC(B)次选择来创建B,FC(B)指示B包括的帧的数目。
既然具有优良网页内容块选择方法的评注系统能够帮助人们容易地进行评注和分享其所需,那么如何构造具有方便的网页内容块选择器的评注工具就成为普遍的问题,并且自动创建形成网页内容块的组成部分之间的关系是关键所在。
因此,需要交互式评注系统来帮助用户对其感兴趣的内容进行评注,从而节省用户的时间并提供交互式评注平台。
发明内容
为解决上述问题,本发明考虑到交互式网络浏览需求。本发明构造了一种具有方便的网页内容块选择器的评注工具,并自动创建形成网页内容块的组成部分之间的关系。因此,具有优良网页内容块辅助选择器的评注设备或评注系统有助于人们很容易地留下对网页内容块的评注和分享其希望表达的内容。
根据本发明第一方面,本发明提供了一种交互式评注设备,包括网页内容块辅助选择器,用于根据网页片段之间的关系,选择与用户所选的网页片段相对应的网页内容块;以及评注记录装置,用于记录与所选网页内容块关联的用户评注。
根据本发明第二方面,本发明提供了一种交互式评注方法,包括网页内容块辅助步骤,根据网页片段之间的关系,选择与用户所选的网页片段相对应的网页内容块;以及评注记录步骤,记录与所选网页内容块关联的用户评注。
根据本发明第三方面,本发明提供了一种交互式评注系统,包括网络服务器,用于提供多个网页;网络浏览器控制单元,用于获取用户查看的网页并提供给网页内容块辅助选择器;网页内容块辅助选择器,用于根据网页片段之间的关系,选择与用户所选的网页片段相对应的网页内容块;评注记录装置,用于记录与所选网页内容块关联的用户评注;以及评注显示单元,用于显示用户评注。
根据本发明第四方面,本发明提供了一种交互式评注方法,包括网页提供步骤,由网络服务器提供多个网页;网页获取步骤,获取用户查看的网页并提供给网页内容块辅助步骤;网页内容块辅助步骤,用于根据网页片段之间的关系,选择与用户所选的网页片段相对应的网页内容块;评注记录步骤,记录与所选网页内容块关联的用户评注;以及评注显示步骤,显示用户评注。
利用网页内容块辅助选择器,用户可以方便地创建要评注的网页内容块。这可以显著减少选择必要网页片段来创建网页内容块所花费的时间。具体而言 1.在创建网页内容块期间网页片段的视觉特征有所帮助。
假设网页中存在讲述故事的一组DIV块。在向该网页应用上述分段方法之后,每个DIV块对应于网页片段。因为DIV块描述同一个故事,所以它们的视觉特征应该相似,从而可以创建DIV块之间的关系。如果用户想要评注整个故事,他只需将其鼠标移到到任一DIV块上并点击鼠标,本发明就可以帮助用户创建所希望的网页内容块。显然,这可以节省用户的时间。
2.此外,本发明可以根据用户留下的评注,附加地创建不同网页片段或网页内容块之间的语义关系,从而帮助用户快速创建更加复杂的网页内容块。
假设有两个带标记的网页内容块,对第一个网页内容块的评注是“Hilary Clinton的戒指”,对第二个网页内容块的评注是“Hilary Clinton的耳环”。如果Hilary Clinton的戒指和耳环属于同一品牌“Charriol”,则用户可能想在两个网络块上留下“Hilary Clinton喜欢Charriol”之类的评注。因为戒指和耳环都是首饰,所以基于评注“Hilary Clinton的戒指”和“Hilary Clinton的耳环”创建两个相关网页内容块之间的关系,可以创建包括两个网页内容块的新网页候选块,以便用户进行评注处理。
图1a示出了根据本发明第一实施例的交互式评注系统的示意图; 图1b示出了根据本发明的交互式评注系统的网络内容辅助选择器的示意图; 图1c示出了网络内容辅助选择器的网页片段关系创建装置的示意图; 图1d示出了网络内容辅助选择器的网页内容候选块生成装置的示意图; 图1e是分段网页的一个示例; 图2a和2b示出了交互式评注方法的流程图; 图3是用于排序的分段网页的一个示例; 图4示出了根据本发明第二实施例的交互式评注系统; 图5a示出了根据本发明第二实施例的交互式评注系统的评注密度视觉化装置的示意图; 图5b示出了评注密度视觉化方法的流程图; 图5c到5f示出了形成评注密度视觉图形的过程的一个图形示例; 图6a示出了根据本发明第二实施例的交互式评注系统的即时评注装置的示意图; 图6b示出了即时评注方法的流程图; 图6c到6d是即时评注的一个屏幕截图示例; 图7a示出了根据本发明第二实施例的交互式评注系统的评注导航装置; 图7b示出了评注导航方法的流程图;以及 图7c到7d是评注导航的一个屏幕截图示例。
具体实施例方式 现在参照附图描述本发明的优选实施例,在附图中,相同的附图标记或数字指示相同的元件。此外,在以下描述中,省略了对公知功能和配置的详细说明,以避免使本发明的主题不清楚。
图1a是根据本发明第一实施例的交互式评注系统的示意图。
交互式评注系统包括网络浏览器控制装置1、网页数据库2、交互式评注设备10、评注显示装置5、数据存档装置9和位于远程服务器上的后台中心数据库11。网络浏览器控制装置1提供与主机(网络浏览器)进行通信的API集合,即获取查看网页的实例,并要求网络浏览器更新当前加载的HTML等等。交互式评注设备10包括网页内容块辅助选择器3和评注记录装置4。网页内容块辅助选择器3帮助用户选择该用户想要留下评注的网页内容块。在用户选择了网页内容块之后将调用评注记录装置4,之后,评注记录装置4记录用户编辑的评注并通过数据存档装置9将编辑的评注存储到后台中心数据库中。用户评注的格式包括多种格式,例如视频、音频、图像或文本。在用户浏览具有其他用户的评注的网页时,评注显示装置5从后台中心数据库11通过数据存档单元9获取相关评述并显示带有所获取的评注的网页。此外,所获取的评注将用于生成新版本HTML源,网络浏览器控制装置1然后使用该新版本HTML源来指示网络浏览器更新查看页以及相关评述。
图1b示出了根据本发明的交互式评注系统的网络内容辅助选择器3的示意图。网络内容辅助选择器3用于帮助用户选择要留下评述的网页内容块。
网络内容辅助选择器3包括网页分段装置31,其使用网页分段方法将查看网页分成多个网页片段,并在临时数据库36中存储分段的网页;网页片段ID生成装置32,其基于相关URL、相关HTML源等为每个网页片段生成唯一ID;视觉特征提取装置33,其提取每个网页片段的诸如字体颜色、字体大小、字体加粗风格、在网络浏览器布局上的位置等视觉特征,并将提取的信息存储到临时数据库36中;网页片段关系创建装置34,其基于每对网页片段的视觉特征和/或通过数据存档装置9从服务器的后台中心数据库11获取的相关评注,创建每对网页片段之间的链接,即关系;以及网页内容候选块生成装置35,其基于网页片段之间的关系生成多个网页内容候选块并将候选块存储到临时数据库36中。备选地,网络内容辅助选择器3可以不包括视觉特征提取装置33。因此,网页片段关系创建装置34根据两个网页片段之间基于共同特征的相似度或网页片段的两个相关评注之间的相似度,创建网页片段之间的关系。然后,网页内容候选块生成装置35基于从网页片段关系创建装置34获得的关系来生成网页内容候选块。
此外,可以理解的是,以上只描述了示例性的网络内容辅助选择器3。例如,在本发明中,网页分段装置31和网页片段ID生成装置32可以是可选装置。
图1c和图1d分别示出了网络内容辅助选择器的网页片段关系创建装置和网页内容候选块生成装置的示意图。
网页片段关系创建装置34包括网页片段关系实例提取单元301,其提取任意两个网页片段作为网页片段关系实例;以及网页片段关系实例得分计算单元302,其计算每个网页片段关系实例的得分,并通过得分滤除错误的网页片段关系。例如,如果计算的网页片段关系实例的得分小于阈值,则滤除该网页片段关系实例。
网页内容候选块生成装置35包括识别单元311、相关网页片段获取单元312、聚类单元313、合成强度计算单元314和排序单元315。识别单元311识别用户所选的当前网页片段,例如,用户在网页片段上点击鼠标右键以选择网页片段。相关网页片段获取单元312从临时数据库36获取与当前所选网页片段有关的所有网页片段。聚类单元313将获取的网页片段汇聚成各个聚类,每个聚类均视为网页内容候选块。合成强度计算单元314通过计算相关聚类的均值来计算每个网页内容候选块的合成强度。排序单元315通过复合成强度对网页内容候选块排序。
图2a和图2b是交互式评注方法的流程图。现在,结合图1b到1d描述该交互式评注方法。
参照图2a,在S201,网页分段装置31将网页分成多个网页片段。网页分段装置31采用一些传统的分段算法将网页分解成称作网页片段的较小部分。现有方法包括 >C.Bouras,V.Kapoulas和I.Misedakis,“A Web-page FragmentationTechnique for Personalized Browsing”(Poster Absract),ACM SAC 2004(IDM track),March 14-17,2004.Ramaswamy L,Iyengar A,Liu L,Douglis F.Automatic Fragment Detection in Dynamic Web Pages and ItsImpact on Caching.IEEE Trans Knowledge Data Eng2005;17(6)859-74。
图1e示出了分段网页的示例。对于网页中的所有图片,应用一些图像分段算法以将相关图像分成较小部分。
此外,对于图像、视频等,网页分段装置31可以提供选择工具,以便用户通过绘制圆圈、正方形等进行选择,从而用户可以手动地分段网页。
在S202,网页片段ID生成装置32为每个网页片段生成唯一ID。可以针对网页片段标识以下信息该网页片段所属的网页的URL、该网页片段的HTML源、该网页片段在网络浏览器布局上的视觉位置、可能的现有导航路径或可能发生的动作序列。基于上述信息,使用散列算法,网页片段ID生成装置32可以生成该网页片段的唯一ID。
网页片段可以具有如下格式 表1 在S203,视觉特征提取单元33经由网络浏览控制装置1提供有关每个网页片段的视觉特征的信息,例如字体风格(颜色、粗体、下划线、斜体、大小等)、在网络浏览器UI上的视觉位置、背景风格(背景颜色、背景图像等)。
提取的视觉特征可以具有如下格式 表2 其中,字段“视觉特征”中存储的数据可以是如下所示 <visualfeatures> <fontStyle><color value=”red”/><bold value=”bold”/><underline value=”true”/><italic value=”true”/>... </fontStyle> <position> <points><pont x=”10”y=”10”/> .... </points></position><background> <color value=”blue”/> <img value=http://www.abc.com/g.bmp/></background>...... </visualfeatures> 在S204,网页片段关系创建装置34创建网页片段之间的关系,网页内容候选块生成装置35在S205生成网页内容候选块。
具体而言,参照图2b,在S211,网页片段关系创建装置34的网页片段关系实例提取单元301将任意两个网页片段作为网页片段关系候选实例。在S212,网页片段关系创建装置34的网页片段关系实例得分计算单元302计算每个网页片段关系候选实例的得分,并通过得分滤除错误的网页片段关系,从而只有得分超过预定阈值的网页片段关系候选实例可以成为网页片段关系实例。
网页片段关系候选实例的得分计算如下。A和B是两个网页片段,RI(A,B)是网页片段关系候选实例,则RI(A,B)的得分(记为SI(RI(A,B))由如下等式计算 SI(RI(A,B))=w1·Sim(vs(A),vs(B)) +w2·Sim(cms(A),cms(B)) +w3·Sim(A,B) w1+w2+w3=1 其中, w1,w2和w3中至少一个可以取值为0, vs(A)是网页片段A的视觉特征, Sim(vs(A),vs(B))是网页片段A的视觉特征与网页片段B的视觉特征之间的相似度。为从视觉特征方面测量网页片段A和B之间的相似度,创建包括XML文档相似度测量(因为视觉特征以XML格式化)和几何关系确定(记录视觉位置信息,这是指示网页片段间关系的重要因素)的算法。
cms(A)指示与网页片段A有关的所有用户评注。
Sim(cms(A),cms(B))是两个相关评注集之间的相似度。首先,某个同义词词典可以用于处理两个评注集。然后,某个针对短文本的相似度测量可以用于生成得分。
Sim(A,B)是两个网页片段间基于共同特征的相似度,可以使用如下等式测量 当DomPath(A)表示与网页片段A相关的例如HTML元素ea的DOM路径时,DOM路径是从HTML文档根元素导航至ea所经历的HTML元素、HTML标记和HTML元素的直接文本的序列。InnerText(A)表示HTML元素ea的直接文本。Compact(DomPath(A),DomPath(B))表示DomPath(A)匹配DomPath(B)的一致性,两个DOM路径越相似,一致性越大。
如果SI(RI(A,B))大于预定义的阈值,则网页片段关系实例将存储在临时数据库36中作为网页片段关系实例得分计算单元302的网页片段关系实例。从而获得分段间的关系。网页片段关系实例具有如下格式 表3 然后,在S213,识别单元311识别用户所选的网页片段。用户可以使用鼠标进行网页片段的选择。
在S214,相关网页片段获取单元312根据网页片段间关系,从临时数据库36中获取与当前所选网页片段相关的网页片段。
在S215,聚类单元313使用k-Means、k-Medoids等现有聚类方法将所有相关网页片段进行聚类。每个网页片段聚类视为网页内容候选块。
在S216,合成强度计算单元314通过对聚类中的每个网页片段的值之和进行平均,来计算每个网页内容候选块的合成强度,其中聚类中的每个网页片段都分配有一个值。
网页内容候选块可以存储在网页内容候选块数据库中并具有如下格式 表4 接着,在S217,排序单元315通过合成强度对网页内容候选块(即,聚类中的)进行排序。如果合成强度相等,则根据网页片段关系实例、网页内容候选块的视觉形状和网页内容候选块的视觉位置进行排序。图3给出了该排序机制的详细说明。
图3是针对排序的分段网页的示例。大矩形指示显示所有网络内容所需的窗口,记为Wr,带较细边缘的矩形表示视觉窗口,记为Wv。
假设当前所选网页片段是网页片段A。其他网页片段B、C和D都与网页片段A相关。网页内容候选块包括网页内容候选块1(A+B)、网页内容候选块2(A+C)和网页内容候选块3(A+D)。
1)假如网页内容候选块1(A+B)和网页内容候选块2(A+C)的合成强度相等,则网页内容候选块1会比网页内容候选块2优先,因为网页内容候选块1的视觉形状比网页内容候选块2的视觉形状紧凑。
2)假如网页内容候选块2(A+C)和网页内容候选块3(A+D)的合成强度相等,则网页内容候选块2会比网页内容候选块3优先,因为网页片段D在视觉窗口(Wv)之外。
虽然图2a所示流程图包括S203,可选的,该流程图也可以不包含S203。那么在S204,网页片段关系创建装置34根据任意两个网页片段之间基于共同特征(即,常用特征,比如内部文字,对应的HTML源代码等)的相似度或网页片段相关评注的相似度,创建网页片段间的关系。在S205,网页内容候选块生成装置35生成网页内容候选块。
图4示出了根据本发明第二实施例的交互式评注系统。相比于第一实施例的交互式评注系统,不同之处在于图4所示交互式评注系统还包括评注密度视觉化装置6、即时评注装置7和评注导航装置8。评注密度视觉化装置6提供对查看的网页上的评注密度和位置进行视觉化的方法,以帮助用户高效地导航到网页的最热点区域。即时评注装置7提供允许多个用户对任何所选网页内容块进行即时评注的机制。评注导航装置8提供允许用户通过导航相关链接的评注来查看其感兴趣的网页内容块的方法。
将省略图4中与图1a中对相同的组成部分的描述,以避免使本发明不清楚。
要理解,图4所示框图只是示例性的交互式评注系统。备选地,在本发明中,评注密度视觉化装置6、即时评注装置7和评注导航装置8中的每一个都可以是可选装置。
在如下段落中,将分别描述评注密度视觉化装置6、即时评注装置7和评注导航装置8。
图5a示出了根据本发明第二实施例的交互式评注系统的评注密度视觉化装置的示意图。
许多用户在导航至特定网页之后,需要识别其感兴趣的部分。如果很多人对网页的某一部分很感兴趣,则一般就会认为该部分是令人感兴趣的。由于人们会对其感兴趣的那部分进行评注,所以评注密度视觉化装置6可以绘制网页的评注密度地图。用户可以使用该地图,通过简单点击地图上的有关区域,直接导航至最热点部分。
评注密度视觉化装置6包括视觉初始化单元61、数据获取单元62、基本图形生成单元63、评注密度计算单元64、图形呈现引擎65、以及可以存储网页片段的位置信息、相关评注、评注数目和图形元素的第一临时数据库66。评注密度视觉化装置6还可以包括总结单元,其对所示的网络的各个网页片段的评注进行总结,并将评注存储到第一临时数据库66中。
图5b示出了评注密度视觉化的过程。参照图5b,在S501,视觉初始化单元61执行基本图形初始化,例如分配存储器、生成画布等。在S502,数据获取单元62获取该网页中所有网页片段的位置信息和所有相关评注,然后将这些信息存储到第一临时数据库66中。在S503,基本图形生成单元63基于所有网页片段的位置信息,绘制如图5c所示的基本图形,该图形的图形元素存储在临时数据库66中。在S504,评注密度计算单元64计算针对每个网页片段的评注的数目,将计算结果作为评注密度存储在临时数据库66中。然后,在S505,图形呈现引擎65在视觉初始化单元61初始化的画布上绘制最终图形,并调用网络浏览器控制装置1向用户显示图形。图5d-5f示出了最终图形,在图5f中,如果相关评注的数目大于预定阈值,则在锥体顶部显示动画圆圈。因此,当用户点击图形的图形元素时,网络浏览器控制装置1为用户导航至网页的相关部分。
图6a示出了根据本发明第二实施例的交互式评注系统的即时评注装置的示意图。
当用户查看另一用户留下的评注时,用户可能不同意另一用户关于该网页内容块的意见,因此该用户可能想要与另一用户直接谈论该评注。即时评注装置7向用户提供方便的通道来进行有关评注或所选网页内容块的讨论。
即时评注装置7包括评注信息获取单元71、消息广播单元72、即时评注单元73、批数据保存单元74、以及可以存储网页内容块、相关评注、评注者的信息和交流评注的第二临时数据库75。即时评注单元73可以是基于对话的工具。
图6b示出了评注导航的过程。在S601,评注信息获取单元71获取与用户所选网页片段相对应的网页内容块、与该网页内容块有关的评注以及所获取网页内容块的评注者的信息,上述评注信息被存储到第二临时数据库75中。在S602,消息广播单元72向评注者通知用户想要对所获取的网页内容块进行即时评注。在S603,即时评注单元73提供用户可以直接与其他用户(评注者)讨论网页任何部分的平台,在交流期间生成的所有消息首先存储在临时数据库75中。在S604,批数据保存单元74将消息临时上载至后台中心数据库11。
例如,当用户将鼠标移动到与网页内容块有关的评注或任意网页片段上时,呈现图6c-6e所示的弹出工具条,并获取相关内容块。参照图6d,如果用户点击按钮“发起即时评注”,则即时评注装置7向曾经对所获取的网页内容块留下评注的所有评注者发出通知,只要这些评注者的网络浏览器是激活的。同时,参照图6e,即时评注装置7开启对话,通过该对话用户可以彼此交流。
此外,用户可以将任意网页片段从当前查看的网页拖拽至图6e的右视图,以开始新的聊天会话,并与曾经对该拖拽的网页片段的相关网页内容块进行评注的其他用户分享对该拖拽的网页片段的观点。
图7a示出了根据本发明第二实施例的交互式评注系统的评注导航装置。
用户在进行网络冲浪时,可能想要挖掘其感兴趣的当前部分的有关网页内容块。例如,当用户查看谈论Hillary Clinton的耳环的网页时,他可能想知道Hillary Clinton的其他首饰。评注导航装置8提供显示网页内容块聚类的高效视觉化方法。
评注导航装置8包括网页内容块搜索引擎81、图像预处理单元82、网页内容块聚类查看器83、以及可以存储网页内容块、排序信息、网页内容块的有关评注和图像的第三临时数据库84。
现在结合图7a和7b描述评注导航的过程。
在S701,网页内容块搜索引擎81从后台中心数据库11搜索和与用户所选网页片段对应的网页内容块相关的所有网页内容块,并将网页内容块和相关排序信息存储到第三临时数据库84中。在S702,图像预处理单元82为每个搜索到的网页内容块以及相关评注生成图像,并将数据保存到第三临时数据库84中。在S703,网页内容块聚类查看器83以可视化方式显示临时数据库84中存储的、排序后的网页内容块的图像。
例如,如果用户对Hillary Clinton的耳环感兴趣,并想知道与Hillary Clinton的首饰有关的更多信息,他可以选择有关Hillary Clinton的耳环的网页片段。评注导航装置8显示如图7c所示的交叉站点网页内容块导航的界面。如果用户点击“导航”,则评注导航装置8打开全屏视图(图7d)来显示相关网页内容块,通过该视图用户可以容易地查看交叉站点网页内容块。
虽然参照上述具体实施例描述了本发明,但是本发明不限于所述的实施例,而仅由所附权利要求限定。要理解,在本发明的范围和精神内,本发明技术人员可以对实施例进行任何修改和改变。
权利要求
1.一种交互式评注设备,包括
网页内容块辅助选择器,用于根据网页片段之间的关系,选择与用户所选的网页片段相对应的网页内容块;以及
评注记录装置,用于记录与所选网页内容块关联的用户评注。
2.根据权利要求1所述的设备,其中网页内容块辅助选择器包括
网页片段关系创建装置,用于创建网页片段之间的关系;以及
网页内容候选块生成装置,用于根据相关网页片段之间的关系,生成一个或多个网页内容块。
3.根据权利要求2所述的设备,其中网页片段关系创建装置根据网页片段之间基于共同特征的相似度或者基于网页片段的两个相关评注之间的相似度,创建网页片段之间的关系。
4.根据权利要求1所述的设备,其中网页内容块辅助选择器包括
视觉特征提取装置,用于提取多个网页片段中每个网页片段的视觉特征;
网页片段关系创建装置,用于根据网页片段的视觉特征,创建相关网页片段之间的关系;以及
网页内容候选块生成装置,用于根据相关网页片段之间的关系,生成一个或多个网页内容块。
5.根据权利要求4所述的设备,其中网页内容块辅助选择器还包括
网页分段装置,用于将网页分成多个网页片段;以及
网页片段ID生成装置,用于向多个网页片段的每一个网页片段分配唯一ID。
6.根据权利要求4所述的设备,其中网页片段关系创建装置包括
网页片段关系实例提取单元,用于提取任意两个网页片段作为网页片段关系实例;以及
网页片段关系实例得分计算单元,用于计算每个网页片段关系实例的得分。
7.根据权利要求6所述的设备,其中网页片段关系实例得分计算单元根据网页片段关系实例中两个网页片段的视觉特征之间的相似度、以及网页片段关系实例中两个网页片段之间基于共同特征的相似度和网页片段关系实例中与两个网页片段分别相关的两个评注之间的相似度中的至少一种相似度,来计算得分。
8.根据权利要求4所述的设备,其中网页内容候选块生成装置包括
识别单元,用于识别用户所选的网页片段;
相关网页片段获取单元,用于获取与所选网页片段相关的网页片段;
聚类单元,用于将获取的网页片段进行聚类,并将相关网页片段构成的每个聚类作为网页内容候选块;
合成强度计算单元,用于通过计算聚类中网页片段的均值来计算网页内容候选块的合成强度;以及
排序单元,用于根据合成强度对网页内容候选块进行排序。
9.根据权利要求8所述的设备,其中排序单元根据合成强度、视觉位置和视觉形状对网页内容候选块进行排序。
10.根据权利要求1所述的设备,其中交互式评述设备还包括
评述密度视觉化装置,用于根据用户对网页片段的评述,对评述密度进行视觉化。
11.根据权利要求10所述的设备,其中评述密度视觉化装置包括
数据获取单元,用于获取网页中网页片段的位置信息和网页片段的相关评述;
图形生成单元,用于根据网页片段的位置信息生成图形;
评述密度计算单元,用于计算每个网页片段的评述数目,作为评述密度;以及
图形呈现引擎,用于以图形形式呈现评述密度。
12.根据权利要求11所述的设备,其中评述密度视觉化装置还包括
总结单元,用于总结评述以相对于每个网页片段而显示。
13.根据权利要求1至10之一所述的设备,其中交互式评注设备还包括
即时评注装置,用于对用户所选的网页片段对应的网页内容块进行即时评注。
14.根据权利要求13所述的设备,其中即时评注装置包括
评注信息获取单元,用于获取与第一用户所选的网页片段对应的网页内容块、网页内容块的相关评述、以及曾经对获取的网页内容块进行评注的第二用户的信息;
消息广播单元,用于向第二用户通知第一用户想对获取的网页内容块进行相关评述;
即时评注单元,用于即时添加第一用户或第二用户对获取的网页内容块的相关评述。
15.根据权利要求1至13之一所述的设备,其中交互式评注设备还包括
评注导航装置,用于向用户提供评注导航。
16.根据权利要求15所述的设备,其中评注导航装置包括
网页内容块搜索引擎,用于搜索与用户所选的网页片段对应的网页内容块相关的网页内容块、相关评注和相关排序信息;
图像预处理单元,用于为每个搜索到的网页内容块和相关评述生成图像;以及
网页内容块聚类查看器,用于以排序方式显示搜索到的网页内容块的图像。
17.一种交互式评注方法,包括
网页内容块辅助步骤,根据网页片段之间的关系,选择与用户所选的网页片段相对应的网页内容块;以及
评注记录步骤,用于记录与所选网页内容块关联的用户评注。
18.根据权利要求17所述的方法,其中网页内容块辅助步骤包括
网页片段关系创建步骤,创建网页片段之间的关系;以及
网页内容候选块生成步骤,根据相关网页片段之间的关系,生成一个或多个网页内容块。
19.根据权利要求18所述的方法,其中网页片段关系创建步骤包括步骤根据网页片段之间基于共同特征的相似度或者基于网页片段的两个相关评注之间的相似度,创建网页片段之间的关系。
20.根据权利要求17所述的方法,其中网页内容块辅助步骤包括
视觉特征提取步骤,提取多个网页片段中每个网页片段的视觉特征;
网页片段关系创建步骤,根据网页片段的视觉特征,创建相关网页片段之间的关系;以及
网页内容候选块生成步骤,根据相关网页片段之间的关系,生成一个或多个网页内容块。
21.根据权利要求20所述的方法,其中网页内容块辅助步骤还包括
网页片段步骤,将网页分成多个网页片段;以及
网页片段ID生成步骤,向多个网页片段的每一个网页片段分配唯一ID。
22.根据权利要求20所述的方法,其中网页片段关系创建步骤包括
网页片段关系实例提取步骤,提取任意两个网页片段作为网页片段关系实例;以及
网页片段关系实例得分计算步骤,计算每个网页片段关系实例的得分。
23.根据权利要求22所述的方法,其中网页片段关系实例得分计算步骤包括步骤根据网页片段关系实例中两个网页片段的视觉特征之间的相似度、以及网页片段关系实例中两个网页片段之间基于共同特征的相似度和网页片段关系实例中两个网页片段分别相关的两个评注之间的相似度中至少一种相似度,来计算得分。
24.根据权利要求20所述的方法,其中网页内容候选块生成步骤包括
识别步骤,识别用户所选的网页片段;
相关网页片段获取步骤,获取与所选网页片段相关的网页片段;
聚类步骤,将获取的网页片段进行聚类,并将相关网页片段构成的每个聚类作为网页内容候选块;
合成强度计算步骤,通过计算聚类中网页片段的均值来计算网页内容候选块的合成强度;以及
排序单元,根据合成强度对网页内容候选块进行排序。
25.根据权利要求24所述的方法,其中排序步骤包括根据合成强度、视觉位置和视觉形状对网页内容候选块进行排序的步骤。
26.根据权利要求17所述的方法,还包括
评述密度视觉化步骤,根据用户对网页片段的评述,对评述密度进行视觉化。
27.根据权利要求26所述的方法,其中评述密度视觉化步骤包括
数据获取步骤,获取网页中网页片段的位置信息和网页片段的相关评述;
图形生成步骤,根据网页片段的位置信息生成图形;
评述密度计算步骤,计算每个网页片段的评述数目,作为评述密度;以及
图形呈现步骤,以图形形式呈现评述密度。
28.根据权利要求27所述的方法,其中评述密度视觉化步骤还包括
总结步骤,总结评述以相对于每个网页片段而显示。
29.根据权利要求17至26之一所述的方法,还包括
即时评注步骤,对用户所选的网页片段对应的网页内容块进行即时评注。
30.根据权利要求29所述的方法,其中即时评注步骤包括
评注信息获取步骤,获取与第一用户所选的网页片段对应的网页内容块、网页内容块的相关评述、以及曾经对获取的网页内容块进行评注的第二用户的信息;
消息广播步骤,向第二用户通知第一用户想对获取的网页内容块进行相关评述;
即时评注步骤,即时添加第一用户或第二用户对获取的网页内容块的相关评述。
31.根据权利要求17至29之一所述的方法,还包括
评注导航步骤,向用户提供评注导航。
32.根据权利要求31所述的方法,其中评注导航步骤包括
网页内容块搜索步骤,搜索与用户所选的网页片段对应的网页内容块相关的网页内容块、相关评注和相关排序信息;
图像预处理步骤,为每个搜索到的网页内容块和相关评述生成图像;以及
网页内容块聚类步骤,以排序方式显示搜索到的网页内容块的图像。
33.一种交互式评注系统,包括
网络服务器,用于提供多个网页;
网络浏览器控制单元,用于获取用户查看的网页,并提供给网页内容块辅助选择器;
网页内容块辅助选择器,用于根据网页片段之间的关系,选择与用户从网页中选择的网页片段相对应的网页内容块;
评注记录装置,用于记录与所选的网页内容块关联的用户评注;以及
评注显示单元,用于显示用户评注。
34.一种交互式评注方法,包括
网页提供步骤,由网络服务器提供多个网页;
网页获取步骤,获取用户查看的网页,并提供给网页内容块辅助选择步骤;
网页内容块辅助步骤,根据网页片段之间的关系,选择与用户从网页中选择的网页片段相对应的网页内容块;
评注记录步骤,记录与所选的网页内容块关联的用户评注;以及
评注显示单步骤,显示用户评注。
全文摘要
本发明提供了一种交互式评注设备及其方法。该设备包括网页内容块辅助选择器,用于根据网络分段之间的关系,选择与用户所选的网页片段相对应的网页内容块;以及评注记录装置,用于记录与所选网页内容块关联的用户评注。本发明还提供了一种交互式评注系统及其方法。本发明的交互式评注设备及其方法有助于用户方便地创建网页内容块,从而减少了选择网页片段来创建网页内容块所花费的时间。
文档编号G06F17/30GK101685453SQ20081016892
公开日2010年3月31日 申请日期2008年9月27日 优先权日2008年9月27日
发明者胡长建 申请人:日电(中国)有限公司