用于标识数据值之间的隐私相关相关性的方法和装置的制造方法
【专利说明】用于标识数据值之间的隐私相关相关性的方法和装置
[0001 ] 公开领域
[0002]本公开总体上设及公开信息并且更具体地设及用于标识数据值之间的隐私相关 相关性的方法和装置。
[000引背景
[0004]最近几年,参与在线社区(例如,web用户、社交媒体用户、在线购物者等等)的人数 已经增加。运种参与者经常在互联网上向第=方提供某些信息W便交换一个或多个服务。 在某些示例中,提供给第=方的信息帮助促成该一个或多个服务和/或允许第=方改善其 提供该一个或多个服务的能力。例如,如果第=方向参与者发送有关未来服务机会(例如, 减价出售、产品促销、折扣等等)的信息,则参与者提供给第=方的信息可W用关注参与者 的兴趣的方式导致运样的未来服务机会。
[000引附图简要描述
[0006] 图1是根据本公开的教导被构建W便标识数据值之间的隐私相关相关性的示例隐 私排名系统的示意性说明。
[0007] 图2是示出隐私值排名的示例简档数据库的示意性说明。
[0008] 图3是图1的示例隐私排名管理器的示例实现方式的示意性说明。
[0009] 图4至图6是标识可被执行W标识数据值之间的隐私相关相关性的示例机器可读 指令的流程图。
[0010] 图7是可执行图4、图5和/或图6的指令W便实现图巧日/或图3的示例隐私排名管理 器的示例处理器平台的示意性说明。
[001U 详细描述
[001引随着在线社区的消费者和其他参与者下在此称为"用户")与第S方交互,对于 运种用户而言唯一的数据量变得可公开使用。第=方可包括但不限于社交媒体服务(例如, 经由一个或多个网页/网站、经由移动电话应用(app)等等进行参与)、在线商户(例如,商户 网站)、调查请求和/或成员卡(例如,优选购物卡)。除了用户主动地提供给一个或多个第= 方的信息之外,每个接收实体可生成和/或W其他方式培养有关每个用户的信息。例如,第 =方可通过跟踪用户访问商店的次数、用户访问网站的次数、所购买的产品列表、每次访问 所花费的平均钱数等等来特征化用户行为。通常,运种所收集的/所培养的信息掲示出一定 粒度的用户习惯、用户偏好和/或用户行为。
[0013] 从用户收集的信息可由第S方用于一个或多个上下文计算目的。总体而言,上下 文计算是指W掲示更稳健的合成信息的方式应用离散信息。例如,如果用户掲示他或她的 性别,运个信息将不会导致隐私安全问题,因为"男性"类别或"女性"类别内的成员身份是 非常大的。总体而言,类别越大(例如,可属于某个类别的用户的种群),在种群中唯一地标 识和/或W其他方式过滤出的风险就越低。另一方面,其中相对少量的人们共享的标识信息 可导致第S方将单个用户与给定的种群区别开的能力更强。
[0014] 另外,如果用户掲示出生日期,则隐私安全风险仍相对较低,因为种群内的每个个 体落入一年可能365天中的任意一天。仍另外,如果用户掲示他或她的邮政编码,相应的隐 私安全风险相对较低,因为邮政编码通常包括上千个人。然而,运=个离散信息的上下文聚 合(组合)导致标识个人的信息上下文,其程度为被认为隐私的粒度。
[0015] 随着用户继续向第=方实体提供离散的信息块,运种实体可W能够应用上下文计 算方法来导出有关每个用户的附加信息。运种附加信息可允许一个或多个第=方实体将具 有更相关和/或更有可能导致购买决定的广告材料的用户作为目标。然而,运种附加信息还 可侵占一个或多个用户认为不舒服和/或过量的隐私程度。
[0016] 在某些示例中,用户是脸书?的成员。为了获得脸书?账户,用户提供姓名、电子邮 件地址和住所地址。仅仅通过姓名、电子邮件地址和住所地址,与脸书广告相关联的一个或 多个商户可将基于运个有限信息定制的广告的用户作为目标,运可包括与住所地址相关联 的总体人口统计和/或与所提供的姓名相关联的文化假设/试探。然而,在用户点击和/或W 其他方式选择与维度相关联的"喜欢"图标的情况下,则运个附加信息被添加到与该用户相 关的其他信息的集合中。如在此所使用的,维度是可W与用户(诸如用户的一个或多个属 性)相关联的一种类型的信息。维度类型包括但不限于姓名、年龄、性别、偏好(例如,对汽车 型号、食物产品等等的偏好)、医疗状况、头发颜色和/或所有权状况(例如,该用户是否拥有 卡车、汽车、蜂窝电话、特定计算设备等等)。另外,维度可包括上下文数据,诸如与同该用户 相关联的环境溫度有关的信息、该用户的当前速度、该用户的当前位置、与该用户相关联的 位置的历史趋势等等。术语维度有时在此被称为"隐私值(vr、"值"或"属性"。
[0017] 在某些示例中,维度可被表达为包含将特定用户与一个或多个相应的属性相关联 的信息的元组。在其他示例中,元组可反映属性W及共享该特定属性的种群的相应尺寸。如 上所述,维度的成员身份尺寸指示潜在的隐私风险,因为相对大的群组产生唯一地标识单 个用户的较低能力,而相对小的群组提供唯一地标识单个用户的更好能力。
[0018] 在此公开的方法、系统、装置和/或制品通过部分地确定有多少其他用户共享给定 的维度计算该维度的隐私相关性。另外,两个或更多个维度之间的关联由在此公开的示例 方法、系统、装置和/或制品计算W便基于将与用户相关联的不同类型的维度的唯一性概率 归一化来掲示隐私相关性分数。在某些示例中,具有相对强/高相关性的未命名维度可由在 此公开的示例方法、系统、装置和/或制品标识。在两个或更多个维度展现特别高的共同出 现概率的情况下,在此公开的示例方法、系统、装置和/或制品生成集群。
[0019] 例如,某些维度展现相对强的相关性并且符合众所周知的消费者行为的期望,诸 如在星期天早上从便利店购买鸡蛋还有面包和奶酪。运样,即将购买鸡蛋和面包的用户还 可呈现相对高的购买奶酪的可能性,由此导致维度集群。换言之,具有消费者已经在星期天 早上购买鸡蛋和奶酪的知识(例如,经由优选购物卡交易获得的信息)的营销实体可W利用 此信息来生成该消费者的针对一个或多个奶酪产品的有针对性广告。然而,某些维度呈现 可不落入众所周知的消费者行为期望的较强相关性,诸如购买女性除毛刀的男性杂货店购 物者与骑自行车人的较强相关性。给定运个示例相关性,一个或多个第=方营销实体可将 具有来自本地自行车商店的广告的运种杂货店购物者作为目标。其中运种未预期的相关性 出现的情况在此被称为"隐藏相关性"。如W下进一步详细描述的,可通过特征向量分析标 识运种隐藏相关性W便在多个维度中找到主导特征向量。
[0020] 尽管维度之间的一个或多个相关性可导致相对无害的结论(例如,用户可能购买 奶酪或用户可能是骑自行车人),某些维度集群可导致公开被认为隐私的信息(例如,用户 具有特定的医疗状况、用户处于特定的收入范围等等)。在此公开的示例方法、系统、装置 和/或制品建立与一个或多个维度和/或用户相关联的隐私排名从而使得该用户可确定隐 私相关性指示。另外,在此公开的示例方法、系统、装置和/或制品标识可能不能在预期消费 者行为内容易地标识和/或认识到的维度(例如,隐私值)之间的隐藏相关性(例如,主导特 征向量)。相应的,运种隐私相关性信息可允许用户确定是否应当向第=方掲示或向其隐藏 一个或多个维度。隐私排名管理器(有时在此被称为维度权威)可在客户端设备(例如,用户 个人计算机、用户移动设备等等)上操作和/或W其他方式执行并且拦截维度公开的一个或 多个实例。例如,维度权威可对用户点击与脸书?相关联的网页上的"喜欢"图标做出响应。 "喜欢"图标可W与维度(诸如蜂窝电话的类型)相关联。如果将运个维度公开给第=方将用 户身份被发现的可能性增加阔值量,则示例维度权威可阻止"喜欢"图标和/或通知用户公 开该维度可导致负面的隐私后果。例如,在参与内容增加能够标识用户的可能性的情况下, 一个或多个通知消息可被提供给用户(例如,经由弹窗),建议用户不要继续,如在共同待审 的美国专利申请序列号13/997,918中所公开的,该申请通过引用W其整体结合在此。
[0021] 图1是示例隐私排名系统100的示意性说明。在图1的所示示例中,系统100包括任 何数量的主组102、隐私排名管理器104W及简档数据库106W便掲示排名维度列表。如在此 所使用的,主组被定义为具有维度的一个或多个实体。主组可包括一个或多个用户(例如, 群组)。简档数据库106中的示例维度可被排名从而使得最大排名与同最大主组(例如,具有 是该维度的成员的最大数量的用户的主组)相关联的维度相对应。如上所述,维度的种群 (例如,成员身份尺寸(即,主组的数量))确定维度有多隐私敏感。另外,两个或更多个维度 可呈现相对高的相关性并且被归类到一个或多个集群中。换言之,集群的维度可导致出现 和/或观察到具有第二维度出现和/或W其他方式观察到的相对高可能性的第一维度。
[0022]