括两个部分:社交角色推理块111 (又名社交 谈话块)和社交身份推理块113 (又名声称的身份推理块)。
[0051] 社交角色推理块111可以被配置成通过主题建模技术和情感分析发现在讨论中 建立的社交角色。模块或子组件112被配置成检测用户的更喜欢的谈话的主题。模块或子 组件114被配置成检测用户的角色,例如,主题的专家、新手、仲裁人、特罗尔,等等。子组件 或模块116被配置成标识在谈话中缺少的社交角色。
[0052] 社交身份推理块113可以被配置成,至少基于用户的声称的兴趣,检测主题的专 家、新手和用户的兴趣,供简档增强建议模块使用,如下面更全面地讨论的。现在社交角色 也与主题相关联。用户可以是对于政治主题的特罗尔,但是,在与其他主题(例如,涉及育 儿或计算机)有关的主题中充当仲裁人。此块更多地聚焦于用户的主题的目标,而块114 聚焦于谈话,以标识一般缺少的角色。
[0053] 现在参考图3Α-Β,示出了用于执行社交角色推理111的示例方法的流程图。可以 使用潜在狄利克雷分配(LDA)(-种主题建模算法)来获取在框301中的讨论中涉及的主 题的估计。向LDA馈送一系列文档350,LDA从这些文档发现在文档集合中产生的"主题"。 "主题"是一起频繁地出现的词语的集合。在此情况下,被馈送到LDA的每一文档都对应于 来自社区的帖子。在LDA发现社区中的讨论的总体主题之后,获取每一帖子和评论的与每 一发现的主题的亲和性。在框303中,每一帖子和评论都被利用其最亲密的主题标记。在框 304中,可以标识由每一用户讨论的最新的主题。在框305中,测量每一用户针对每一特定 的主题生成的帖子和评论的量。为每一个主题,在框307a-c中,标识为一个主题生成最多 (和最少)内容的K个用户。为一个主题创建最多内容的用户,例如,被标记为该主题的"专 家"。就有关一个主题创建最少内容,或有关一个主题询问最多问题的用户,例如,可以被标 记为该主题的"新手",特别是当由社区以前详细地探索了该问题时。可以通过WordNet? 应用程序标识重复的问题,以测量向社区新提出的问题和以前在社区询问的问题之间的相 似度。WordNet?是英语的大型词汇数据库。名词、动词、形容词和副词被分组到认知同 义词组,每一个都表达不同的概念。参见,Miller,G.,A.WordNet?:英语的词汇数据库(a lexicaldatabaseforEnglish),CommunicationsACM38, 11(Nov. 1995),39-41。
[0054] 可以利用社交角色推理模块111检测的其他社交角色是"特罗尔"和"仲裁人"。 特罗尔是一组用户,其评论可以将谈话的初始主题切换到另一主题,例如,如在框321中标 识的,使用语言查询和字数计数(LIWC2007)。LIWC是文本分析软件程序,并计算人们跨各 种文本,包括电子邮件、演说、诗,或转写的日常的言语,使用不同类别的词语的程度。有关 LIWC的更多信息可以www*liwc*net找至I」,其中,在本文中,URL中的句号被替换为星号,以 避免非故意的超链接。可以通过对原始帖子中的文本使用LDA,并计算其主题矢量,来标识 谈话的第一初始主题。可以收集为帖子生成的评论,然后,可以使用LDA来获取它们自己的 主题矢量。然后,可以使用诸如L2范数之类的相似度量度,来测量评论与主帖子的相似度。 其与主帖子的相似度低于阈值T的评论,被标记为不相似。在框323中,可以收集前Μ个不 相似的评论,并将他们的作者尽可能地标记为特罗尔。特罗尔也可以被标识为张贴了攻击 性的评论的那些用户。在框325中,可以作出关于在用户被标识为可能的特罗尔之后用户 是否作出了Κ个评论的判断,那些评论是攻击性的或偏离主题的。如果用户继续是攻击性 的或偏离主题的,则在框327,用户被标记为特罗尔。
[0055] 仲裁人是这样的用户:在他们自己的评论之前的Κ个评论不相似,例如,不与谈话 的主要主题一致,但是,他们的评论以及他们的评论之后的Κ个评论与谈话的主要主题相 似。换言之,一旦偏离主要主题,仲裁人将谈话拉回到主要主题,如在框335, 337, 339中标 识的。框341帮助标识存在于活跃的谈话中的当前仲裁人。建模当前社交角色是当用户离 开或达到他们的所希望的目标时赞扬或警告用户所需的;也是标识可能需要插入某些社交 角色以达到平衡的谈话所需的。
[0056] 可以理解,可以基于社区以及他们的在线交互,可以构思额外的角色并添加到此 模块。例如,在某些文化中,可以有可以被突出的领导以及跟随者的明显的层次结构。
[0057] 此社交角色推理模块111也可以标识谈话仍被社区讨论的似然率,谈话被标记为 活跃。在框309,计算社区的谈话的平均寿命。然后,将特定谈话的当前寿命标识为低于或 高于平均值。如果平均值等于或低于平均寿命,如在框311中判断的,那么,在框313中,谈 话被标记为活跃。谈话的寿命可以被计算为从谈话在社区中首次启动时起以及它接收到其 最后一个评论时的时间流逝的时间。
[0058] 在框315中,从活跃的谈话的列表中,系统标识当前特罗尔、仲裁人、专家的列表、 由每一用户讨论的最新的主题的列表、这些谈话中的每一个中存在的社交角色的列表,以 及相关失效的谈话的列表。为标识相关的失效的谈话,可以使用LDA,来建模每一失效的以 及活跃的谈话作为主题矢量。使用相似度量度,诸如L2范数,测量每一失效的谈话与每一 活跃的谈话的相似度。当两者之间的相似度高于阈值t时,旧谈话被视为与新会谈相关。在 框317中,对于没有专家,或知识渊博的,频繁的切题的张贴者的谈话,可以将谈话标记为 缺乏专家。
[0059] 可以理解,图3A-B是示例方法的说明性流程图。可以按顺序,并行地,或按交替的 顺序等等,过程所示出的元素。
[0060] 图8是示出了声称的身份推理块113的示例方法的流程图。此块,或模块,通过应 用于用户用于在他们的个人简档页面声明他们的兴趣的标记的主题建模技术(LDA),发现 用户的声明的所感兴趣的主题,以及在这些主题的专业知识的水平。社交媒体中的标记可 能非常稀少,机器难以解释,特别是标记可能只是来自流行文化的名称,诸如"LadyGaga"。 在框801中,可以使用众包的知识库来获取关于标记的简述,并综合此信息,以便机器更好 地解释。在框803中,将这些文档(标记+综合的数据)馈送到LDA,并用于发现定义用户 的兴趣的主题。在框805中,在发现主题之后,利用其最亲密的主题标记每一用户的每一标 记兴趣。在框807中,测量每一用户具有的对于每一个主题的兴趣标记的数量。对于每一 个用户,标识与用户的兴趣标记最相关的K个主题,然后,将它们标记为用户的所感兴趣的 主题。
[0061]通过利用用户的兴趣标记与所感兴趣的特定的主题如何相关以及共享那些相同 兴趣标记的其他用户量,获取特定主题的专业知识的水平。例如,对于"流行音乐"主题,两 个用户可以具有下列相关的兴趣标记:用户A以及10, 000个其他用户使用兴趣标记"Lady Gaga",用户B以及1,000个其他用户使用兴趣标记"Bornthisway"。对于此示例,对于主 题"流行音乐",模块将用户B标记为比用户A更内行。
[0062]此概念的意图是,专家具有非常专业化的标记。如此,较少的非专家用户在他们的 简档中声称专家作为兴趣具有的标记的兴趣。例如,标记"LadyGaga"可以具有1000个用 户感兴趣,而标记"BadRomance"具有500个用户感兴趣。对于"BadRomance"具有兴趣的 用户更有可能是比仅仅使用标记"LadyGaga"的用户在LadyGaga的音乐方面的更内行, 因为标记"LadyGaga"是比更专业化的标记"BadRomance"更通用。更专业化的标记表示 更多的专业知识。
[0063]然后,对于特定主题,基于用户的专业知识水平,对用户进行排序。在框809中,对 于每个主题,获取带有最高专业知识水平的K个用户,并将他们标记为该主题的专家。在框 811中,对于每个主题,带有最少专业知识的水平(但是带有大于零的水平)的K个用户被 标记为主题新手。在框813中,对于每个用户,标识他或她为其生成了最多数据的K个主题, 将这些主题标记为用户的首选的所感兴趣的主题。
[0064]现在参考图4_6,所不是不例社交建议模块130 (图1B)的流程图。此模块130从 社交推理模块110接收分类和推理,诸如专家的列表、有关X主题的新手,仲裁人,特罗尔的 列表,每一用户的谈话的所感兴趣的主题以及首选的主题,存在于每一讨论510中的社交 角色。然后,社交建议模块130可以使用此数据来提供不同类型的社交建议。实施例可以 使用三个不同的工作块来实现此结果:简档增强建议块131、在线谈话建议块133和社交目 标警告块135。
[0065] 在图4中,作为流程图示出了简档增强建议块131的示例模块:此块通过 WordNet?或能够测量不同组的词语之间的相似度的其他相似的本体,将用户的所感兴趣 的主题映射到社区的谈话的主题。此过程标识用户的声称的兴趣不同于谈话的用户的首选 的主题。然后,使用此信息来作出建议,或自动地增强用户的在线简档,例如,添加他们在社 区连续地讨论的主题X。对于被推断是X主题方面的行家或专家的用户,此块也可以建议用 户将此信息添加到中他们的简档中。
[0066]在声称的兴趣如何被映射到谈话的主题的一个示例方法中,在框401中,模块获 取谈话的每一主题的顶级词以及所感兴趣的每一主题的顶级词。可以从一个或多个知识 库,或数据存储位置中检索谈话410a的主题和所感兴趣的主题410b。使用知识库来测量谈 话的每一主题中的顶级词与所感兴趣的每一主题的顶级词的相似度。
[0067]在框403中,如果相似度大于阈值T,则会谈的主题被映射到所感兴趣的主题。可 以向用户呈现谈话的主题与所感兴趣的主题的映射。在框405中,用户可以被允许校正或 增强主题映射。
[0068] 模块也可以被配置成向用户作出添加所感兴趣的主题的建议,如用户的活动所 示。在框407中,对于每一个用户,模块可以标识他们的谈话的首选的主题中的哪一个没有 到所感兴趣的主题的映射。可以从数据存储器中检索带有谈话的首选主题或兴趣420a_b 的用户的列表,如在社交角色推理模块110中标识的。此过程检查谈话的主题是否具有到 用户的简档中的兴趣的映射,但是,它相对于所有用户进行检查。当存在映射时,这是因为 一个或多个用户在他们的简档中具有关于主题的标记。如果谈话的主题没有到简档中的主 题的映射,则显然,没有用户将这样的兴趣添加到他们的简档中。作出的第一类型的建议 是,向用户建议,利用这样的没有映射的但是存在于用户的帖子和/或评论中的主题增强 他们的简档;还通知用户,没有其他人向他们的简档中添加这样的信息,如此,提供社交感 知度。用户可以基于建议和上下文信息,增强他们的简档。在框409中,对于谈话的剩余的 首选的主题,模块可以检查其被映射的所感兴趣的主题是否在用户的所感兴趣的首选的主 题中。在框411中,模块可以向用户建议,将当前不在他们的首选的所感兴趣的主题里的被 映射的所感兴趣的主题添加到他们的简档中。在此情况下,建议的主题确实具有映射,但 是,用户没有向她的简档添加该主题。
[0069] 可以理解,此模块可以在社区或谈话服务器上以特定的周期性执行,以主动地给 用户发送关于他们的简档的建议,或可以由社区的管理员或仲裁人启动或发起。在另一个 实施例中,用户可以启动此模块的本地版本,或请求社区服务器自组织地提供简档增强建 议。可以理解,如此处所描述的,各种模块,可以作为本地版本运行,或从社区服务器运行。 例如,用户可以首选运行人物可视化的本地副本,以评估用户的向外面向的社交人物。用户 还可以首选启动社交角色推理模块的变体,以提供有关用户的社交角色的个人反馈,以及 他们是否与用户的目标一致。
[0070] 在框413中,可以使用所感兴趣的主题420c的主题专家列表,在那里,对于每一 个主题,模块可以向主题专家建议:向他们的简档添加他们是该主题方面的专家。在框415 中,可以使用谈话的主题的主题专家的列表420d,在那里,对于每一个主题,模块可以向主 题专家建议,向他们的简档添加,他们是该主题的专家。
[0071] 图5示出了在线谈话建议块133的示例方法的流程图:此块标识在活跃的讨论 (表示被贡献和讨论的)511 (缺乏专家),521 (缺乏仲裁人)中缺少的社交角色,并查找能 够满足那些所需的社交角色的用户。可以检索数据510,如在社交角色推理模块中标识的。 此块也可以使相关的并可能使参与讨论的用户感兴趣的K个旧谈话改头换面。
[0072] 为标识谈话何时缺乏某些社交角色,该块分析在讨论中是否有大于K个特罗尔或 K新手,而没有仲裁人或专家正在参与讨论。取决于情况,系统可以搜索仲裁人的列表或专 家的列表,并向这些列表的前K个用户发送警告515, 525。如果经过一段时间以后这K个用 户没有作出响应,则系统可以警告接下来的前K个用户。可以理解,此模块可以在社区或谈 话服务器上以特定的周期性执行,以检查谈话中的缺少的角色,或可以或社区的管理员或 仲裁人启动。
[0073] 此块也可以分析谈话在谈话中缺少的社交角色是否匹配用户在他们的社交目标 531中作为目标的角色。在这样的情况下系统可以向这些用户发送警告,以将空缺535 (仲 裁人警告)和536 (专家警告)通知它们。此块也可以向用户呈现建议的谈话的可视化,提 供讨论的主题的总览,攻击性的水平、带有有关主题的专业知识水平的参与者的姓名,提供 这样的可视化,是因为当某些类型的用户存在,或讨论涉及某一水平的攻击性时,某些用户 可能参与讨论会感觉到私密。
[0074] 另外,此块标识K个最相关的旧谈话,并可以在原始讨论的侧面显示它们。
[0075] 图6是示出了社交目标警告块135的示例方法的流程图。此块接收用户612的讨 论的最新的主题,以及他们的担任的最新的社交角色610。然后,该块分析用户所承担的社 交角色是否与他/她的社交目标614冲突,在这样的情况下,系统警告用户潜在的危险。在 框601中,对于带有声明的目标的每一个用户,示例方法首先判断目标是否是仲裁人。如果 是,那么,在框603中,判断用户是否在谈话的特罗尔的列表中。,如果是,则在框605中,可 以向用户发送警告消息/警告,作为目标是成仲裁人的提醒。
[0076] 如果用户不是作为特罗尔列出的,那么,在框607中,判断用户是否在谈话的当前 仲裁人的列表中。如果是,那么,在框609中,可以向用户发送祝贺消息/警告。在框611 中,就用户是否具有要成为专家的目标的判断。如果不是,则对于下一用户,过程继续。可以 理解,如果为社区或谈话定义了其他目标,那么,将对额外的角色[未示出]作出额外的检 查。如果用户目标是成为专家,如在框611中判断的,那么,在框613中,判断用户是否在谈 话的当前专家的列表中。如果是,那么,在框615中,可以向用户发送祝贺消息/警告。如 果用户不在当前专家列表中,那么,在框617中,可以向用户发送警告消息/警告,作为目标 是成为专家的提醒。
[0077] 在一个实施例中,用户的目标可能是更像特定的其他用户,或不同于特定的其他 用户。在此情况下,一旦用户选择了像或不像的用户,则对该用户的简档,如果可用的话,以