使用本地语义评分的位置感知的制作方法
【专利说明】
【背景技术】
[0001]搜索引擎继续获得用于基于相对位置来识别对相关的搜索查询的响应的改善能力。基于位置的特征可以允许搜索引擎滤出与由用户指定的位置(诸如用户的当前位置)无关的实体和/或其它结果。基于此类特征,一旦指定了位置,用户可以确定附近服务是否是感兴趣的,诸如是否存在附近饭店、零售店或感兴趣的其它实体。虽然此类基于位置的搜索是有益的,但仍要求用户指定初始位置以便开始搜索。因此,不熟悉特定地理区域的用户具有使用搜索引擎来找到感兴趣特征(诸如餐饮或娱乐)的有限能力。例如,用户不能基于高级偏好或语义兴趣来浏览区域或发现感兴趣实体。
【发明内容】
[0002]在各种方面,提供了用于确定描述关于地理区域的一个或多个特征的连续评分模型的系统和方法。该评分模型可以适合于结合来自点源以及区域(area)信息两者的信息。基于该评分模型,用户可以获得用于任何期望位置处的一个或多个特征或期望地理区域的特征值。由于用连续函数来表示特征,所以还可以执行用于任意地理区域的特征值的比较和/或将形成辅助值的特征的组合。
[0003]提供本
【发明内容】
是为了以简化形式介绍下面在详细描述中进一步描述的概念的选择。本
【发明内容】
并不意图识别要求保护的主题的关键特征或本质特征,其也不意图孤立地用作确定要求保护的主题的范围的辅助。
【附图说明】
[0004]下面参考附图来描述本发明,在所述附图中:
图1一3示意性地示出了搜索环境中的特征分数的显示的示例。
[0005]图4示意性地示出了用于显示特征分数信息的另一方法的示例。
[0006]图5示意性地示出了用于显示特征分数信息的另一方法的示例。
[0007]图6示意性地示出了适合于执行本发明的某些实施例的网络环境。
[0008]图7是适合于在实现本发明的某些实施例时使用的示例性计算环境的框图。
[0009]图8 —10示出了根据本发明的某些实施例的方法的示例。
【具体实施方式】
[0010]概沭
在各种方面,提供了用于确定描述关于地理区域的一个或多个语义特征的平滑、连续函数的系统和方法。该平滑、连续函数可以适合于结合来自单个位置处的个别实体的信息以及一般地与某个类型的地理区域有关的信息。基于该底层函数,用户可以获得用于任何期望位置处的一个或多个特征或期望地理区域的特征值。由于用连续函数来表示语义特征,所以还可以执行用于任意地理区域的特征值的比较。这允许识别例如具有最高餐饮或饭店分数的城市内的区域或具有餐饮、娱乐以及可及性分数的期望组合的区域。用户还可以选择在期望的抽象水平调查地理区域的特征。
[0011]构造用于特征的评分模型
作为提供特征信息时的第一步骤,可以识别与感兴趣特征有关的各种类型的数据。然后可以使用所识别数据来拟合用于开发数据模型的基础函数,该数据模型在至少感兴趣地区内是连续的。
[0012]“特征”被定义为可以数值地表示为语义分数或特征分数的任何方便类型的信息。用于特征的特征分数是基于被识别为与特征有关的底层数据而确定的。例如,一个类型的特征可以是“餐饮”特征,其中,餐饮分数表示关于与特征分数位置有关的饭店的数目、品质和/或其它信息。可以将被识别为与特征分数位置有关的单独饭店中的每一个表示为有助于用于确定餐饮分数的函数的数据点。基于对应于单独数据点值的数据的其它特征可以包括实况音乐特征、酒吧或客栈特征、购物特征、绿地特征或者其中可以基于被识别为与特征有关的单独实体或其它数据点来发展分数的任何其它类型的特征。可选地,可以将单独数据点称为“无维度”数据,因为单独数据点当在合理比例的地图上显示时不具有任何有意义的空间范围。替代地,数据点通常与单个位置、诸如单个街道地址相关联。
[0013]其它类型的特征可以基于用于一个定义的地理区域的数据。某些类型的特征可以对应于基于到河流的距离或到主干道(诸如主要道路或公路)的距离的特征。此类特征一般地可以被描述为具有用于对应于河流或道路/公路的地理区域的基于线的数据。可选地,此类特征可以称为具有I维数据,具有对应于特征的地理空间路径的“长度”维度。其它特征可以对应于基于区域的值,诸如犯罪统计(针对“安全”特征)、人口密度、一个或多个附近街道上的汽车数目和/或平均速度(针对“交通”特征)或者基于与位置相关联的一个或多个公立学校的“学校品质”特征。此类特征可以可选地被称为具有二维数据。
[0014]可以基于评分模型将可以表示为数值值的任何类型的特征表示为特征。某些潜在特征可以包括但不限于娱乐特征,诸如用于餐饮、酒、客栈、(现场)音乐、剧场、电影、竞技、步行、雪上运动、海景、旅游胜地或期望的任何其它类型的娱乐特征。如上述列表所指示的,许多娱乐特征表示对应于点位置的特征,但某些特征(诸如海景)可表示基于线的数据。特征的其它示例可以是生活方式特征,诸如用于人口密度、交通、可及性(诸如与主干道的距离)、行人友好或步行适合性、自行车友好、学校品质、犯罪、家庭友好或购物的特征。特征的其它示例可以包括社交媒体特征,诸如位置处的由社交媒体用户的签到的相对数目或针对位置的“喜欢”的数目。
[0015]“基本网格区域”指代供在确定连续函数以表示与特征相关联的数据时所使用的单个网格区域。在确定用以表示与特征相关联的数据的函数之前,至少对应于相关感兴趣区域的地区被划分成包含多个基本网格区域的网格。优选地,使用规则棋盘形布置来形成基本网格区域,诸如将区划分成正方形、矩形或其它平行六边形。单独基本网格的尺寸可以是任何方便尺寸。一个选项是选择大致上具有市中心区中的城市街区的尺寸的正方形基本网格。作为替换,基本网格的尺寸可以变化,诸如通过在市中心区使用较小基本网格区域和在农村地区使用较大基本网格区域。优选但不要求将相同的基本网格区域用于多个特征,诸如对所有特征使用相同的基本网格区域。这可以促进将来自不同特征的特征分数组合。
[0016]“基本函数”被定义为用来表示与基本网格区域中的特征相关联的数据的至少一部分的函数。高斯函数表示用于表示基本网格区域内的特征数据的方便选择,但其它函数形式可以是适当的。针对给定特征,可以使用一个或多个基本函数来表示基本网格区域内的数据。例如,针对基于点或位置的数据,可以使用单个(高斯)基本函数来拟合数据或在网格区域内相等地间隔开的多个高斯曲线,或者高斯曲线可以与每个数据点相关联。还可以使用其它替换方案,只要所述一个或多个基本函数可以用来表示基本网格区域内的数据即可。可以类似地使用一个或多个高斯函数来表示基本网格区域内的基于线或基于区域的数据。然后可以使用分配给基于点、线和/或区域的特征数据的数据值来拟合一个或多个基本函数。
[0017]然后可以使用来自多个网格区域的基本函数来确定用于特征的评分模型。(替换地,如果特征数据具有适当形式,则可以将评分模型直接地拟合到特征数据的至少一部分。)可以用各种方式来选择被用于确定用于特征的评分模型的所述多个网格区域。在某些方面,具有基本函数的基本网格区域可以可用于诸如美国之类的大的地区。在此类方面,可以使用所有的可用网格区域来计算评分模型。作为替换,可以选择在截止距离内和/或满足某个其它相关准则的网格区域以便计算评分模型。优选地,所选的多个网格区域允许计算感兴趣地区(诸如由用户识别的地区)内的连续评分模型。在替换实施例中,可以将大型地区(诸如美国)预先划分成不同的多个网格区域,针对所述不同的多个网格区域中的每一个预先和/或周期性地计算评分模型。
[0018]可以将多种函数形式用于评分函数。用于计算评分模型的一个方法是初始尝试针对每个不同的特征拟合不同函数形式的函数。适当函数形式的示例包括高斯函数、指数函数以及三次函数。针对每个类型的函数形式,可以向每个基本网格区域分配函数。然后可以诸如用加权最小二乘回归法将函数拟合到网格区域内的基本函数。然后将在此初始尝试期间提供最佳(或者期望的)拟合的函数形式选作用于针对该特征的评分模型的函数形式。
[0019]应注意的是虽然向每个基本网格区域分配单独函数以便构建评分模型,但分配给基本网格区域的函数的值在用于基本网格区域的边界处通常将不是零。替代地,来自(至少)相邻网格区域的函数可以在网格区域内具有有意义的非零值。因此,在网格区域之间的边界处,评分模型可以仍是连续的,因为所有位置处的评分模型表示多个连续函数范围内的和。
[0020]在用以选择用于评分模型的函数形式的初始拟合之后,可以将网格区域内的底层数据和/或基本集函数正则化以去除遗漏或虚假数据的影响和/或使其最小化