用于从社交媒体中识别、监控和排名事件的系统的制作方法
【技术领域】
[0001] 本发明一般涉及社交媒体分析的领域。
【背景技术】
[0002] 社交媒体提供了关于城市正在发生的事件的信息的良好和不断更新的来源,这些 事件例如是骚乱、演唱会、交通等。这些事件或事故可包括涉及固定地理区域内成群的参与 者的活动。另外,社交媒体提供了独特的视角以根据诸如未固定位置的移动传感器的元件、 社交网络特征和人类感知来实现情境感知,例如社会影响的直接评估。
[0003] 通常,情境感知是根据物理传感器计算的,而不是获取人们的感知。在事件的过程 中,人们对于不同因素的感知,例如安全事故的危急程度(criticality)、演唱会的用户参 与等,可产生变化。然而,缺乏对城市中的事件针对用户所选择的兴趣度量在现在的时间和 不久的将来的实时监控和排名是成问题的。能够提供这种事件的监控和排名的系统,包括 预计未来的事件的排名,可极大地帮助执行资源分配和例如城市管理者和/或警察的迅速 行动。
【发明内容】
[0004] 提供了一种用于从社交媒体中识别、监控和对事件排名的新的计算机实现的系统 和方法。该方法可包括从社交媒体流中检测事件并持续地监控事件,计算每个事件的当前 分数,确定表示每个事件的预期演变的预计分数,根据事件的当前分数而对事件进行排名, 根据事件的预计分数而预测事件的排名,响应于从社交媒体流中检测到的关于事件的新输 入,更新所预测的排名。
[0005] 该系统可包括存储器设备、显示器设备和连接到存储器设备的硬件处理器,该处 理器被配置为:从社交媒体流中检测事件并持续地监控事件,计算每个事件的当前分数,确 定表示每个事件的预期演变的预计分数,根据事件的当前分数而对事件进行排名,根据事 件的预计分数而预测事件的排名,响应于从社交媒体流中检测到的关于事件的新输入,更 新所预测的排名。
[0006] 在一个方面,当前分数根据事件的特性计算,该特性包括社会影响评估、用户的动 态位置、人类感知和社交网络特征中的一个或多个。在一个方面,当前分数根据事件的类型 和/或其演变是已知的类似事件并使用一个或多个扩散模型来计算。在一个方面,更新所 预测的排名至少包括用户提供关于事件的实时反馈,其影响事件的当前状态的预测并通过 所考虑的扩散模型影响事件的预期演变。在一个方面,更新所预测的排名基于一个或多个 扩散模型并基于事件的预期演变自动地执行。在一个方面,所预测的排名被显示在显示器 设备上。
【附图说明】
[0007] 图1是一个实施例中的本公开的示例性系统结构;
[0008] 图2是表示一个实施例中的创造性方法的流程的流程图;
[0009] 图3是示例性的显示屏;
[0010]图4是一个实施例中的示例性扩散模型;
[0011] 图5是一个实施例中的示例性示意性系统结构。
【具体实施方式】
[0012] 提供了用于从社交媒体中检测、监控和排名事件的系统和方法的实施例。排名包 括当前排名和预计排名,以使得创造性的系统和方法能够输出(例如显示)事件的排名列 表以及事件的未来排名的预计。在一个实施例中,该系统和方法可以确定事件的当前排名 重要性和/或危急程度,并可使用该信息以预测事件的未来危急程度,包括预测事件的危 急程度何时会发生变化。
[0013]图1示出了在其中运行本方法的计算或移动设备计算系统体系100的示例性硬件 配置。该硬件配置优选地具有至少一个处理器或中央处理单元(CPU) 111。CPU111通过系 统总线112连接到随机存取存储器(RAM) 114、只读存储器(ROM) 116、输入/输出(I/O)适配 器118 (用于将诸如磁盘单元121和磁带驱动器140的外部设备连接到总线112)、用户接口 适配器122 (用于将键盘124、鼠标126、扬声器128、磁盘驱动设备132和/或其它用户接口 设备连接到总线112)、用于将系统100连接到数据处理网络、因特网、内部网、局域网(LAN) 等的通信适配器134、以及用于将总线112连接到显示器设备138和/或打印机139 (例如 数码打印机等)的显示适配器136。
[0014] 在一个实施例中,计算系统100被编程以执行图2所示的方法处理步骤。例如,数 据可被存储在RAM114和/或磁盘单元121或磁带驱动器140中。CPU111可执行诸如事 件评分、事件排名等的方法处理步骤。
[0015] 系统和方法的实施例可使用例如来自推特、博客、文本消息、网页等的社交媒体文 本和数据及其独特的传感器来运行。一种类型的传感器包括物理传感器,诸如摄像机、天气 传感器、交通传感器等。此外,可以从社交媒体中感知信息。该信息可例如使用文本内容的 自然编程语言(NPL)分析、复杂网络分析、图像分析和情感分析来进行分析。复杂网络分析 例如可包括时空网络分析。图像分析例如可包括附带有文本或与文本相关联的照片和其它 图像的分析。社交媒体添加了新维度的信息;各种传感器可提供社会影响的直接评估,充当 没有固定位置的移动传感器,和/或基于人类感知而提供社交网络特征。
[0016] 此外,事件或事故的检测可使用推特内容的文本分析和推特的时空网络分析(诸 如区域中报道事件的推特数量)实现。此外,可使用可能的图片附件的图像分析和/或推 特文本的情感分析。可选地,事件可通过其它源来检测,诸如紧急服务的呼叫(E-911)或现 场摄像机,在这种情况下,事件被人工地记录在系统中,事件的对应区域随后被系统主动地 监控以从与该事件有关的社交媒体中获得进入的信息。
[0017] 事件的危急程度的评估可以使用社交媒体用下面详细讨论的危急程度的扩散模 型来执行。上述的社交媒体传感器的特殊特性可用于调节紧急情况的危急程度/扩散的参 数,诸如森林火灾模型的扩散概率。NLP分析可用于确定环境。通过图像分析和/或情感分 析获得的数据也可在评估中使用。事件的危急程度可以被计算为与被监控事件有关的各种 输入的函数,诸如事件类型(某些事件可以被认为比其它事件更危险)、相关推特的数量及 其内容、在系统中记录的类似历史事件(例如历史有关事件)的危急程度(这些事件如何 发展、在事件的演变过程中有多严重等)、推特的情感分析、在时间窗口内报告事件的人数 等。
[0018] 图2示出了本发明的示例性方法。首先在步骤S1,例如通过对涉及同一事件的推 特进行聚类来进行事件检测。这可以通过所接收的推特的文本分析来实现,也可以利用概 念本体来实现。此外,连同事件检测一起,发生事件监控,以使得在步骤S1最初检测到的事 件可在检测到后立即被监控,直到它们变得不重要。所检测和/或监控的事件可被成为"事 件"。
[0019] 在步骤S2,系统例如通过计算"当前分数"来执行对每个事件的评分,系统(可选 地)计算每个事件的时间轮廓(profile)。在步骤S2计算的分数注重所监控的事件A的当 前状态,因为关于事件A的信息只实时到来,并且该实时信息用于维持该事件如何发展。事 件的分数可以考虑来自社交媒体传感器的数据来计算,该数据可包括诸如社会影响评估、 用户的动态位置、人类感知、社交网络特征等的特性。例如,事件的社会影响可基于事件对 公民的预期效果来测量。因此,武装抢劫将被认为比无伤亡的交通事故更重要。警察根据 各种事件的重要性而对这些事件确定优先级,该优先级可被提供作为系统评估社会影响的 输入。作为对事件的分数的另一个贡献因子,人们关于事件的感知可例如通过对所接收的 推特执行情感分析、通过计算用户与所报道的事件的接近程度等来计算。对所接收的推特 的情感分析可以例如基于用户所使用的文字、诸如出现在文本中的惊叹号的任何标点符号 等。
[0020] 上述的每一个因子可被分配一个权重,事件的总分数可以被计算为不同贡献因子 的加权和。分数还可根据事件的类型计算,诸如骚乱、音乐会,火灾等。事件的时间轮廓可 根据关于事件的通过社交媒体变得可用的信息实时地计算(作为可选的步骤)。当新的关 于事件的信息可用时,事件的分数被重新计算,事件的分数的演变被记录,从而创建捕获事 件的演变的时间轮廓。
[0021] 在步骤S3,系统或者通过将事件的时间轮廓(在S2中计算的)与扩散模型或者 与在知识库中存储的历史有关事件相匹配或者通过将事件的当前分数及时定位到扩散模 型(或历史事件)来执行时间轮廓匹配。例如,事件的时间轮廓可用于确定在知识库中是 否存在具