用于量化客户参与度的系统和方法与流程

文档序号:23554384发布日期:2021-01-05 21:16阅读:181来源:国知局
用于量化客户参与度的系统和方法与流程

交叉引用

本申请要求于2018年3月21日提交的美国临时专利申请号62/646,070的权益,该美国临时专利申请通过引用整体并入本文。



背景技术:

为了更有效地向医疗保健提供商(hcp)提供产品和服务,医药销售代表(医药代表)必须以更有针对性的方式与hcp进行沟通和互动。有效的沟通可以包括面对面会议、电话呼叫和联网机会。符合医药代表最大利益的是尽可能多地收集关于与hcp交互的数据,以便改善他们与hcp的交互,从而产生更多的销售。

销售和营销数据的检索和分析可能存在某些挑战。例如,销售数据可能仅在合计水平可用。来自各个hcp的数据可能不容易获得。一些客户资源管理(crm)软件可以收集hcp数据,但可能不会收集个性化数据或出于隐私原因可能会掩盖特定的数据条目。此外,hcp数据(例如,处方数据)可能在设施水平提供,或者以“区块(brick)”的形式提供,这可能使得很难将成功的销售归于特定的hcp。此外,由hcp处方或推荐产生的医药销售可能会受到特定医药代表交互之外的变量的影响。这些混淆变量可能使得难以确定在医药代表或医药公司控制范围内(以及控制范围外)的特定动作的影响。收集和分析数据的困难以及各种混淆变量可能导致公司的工作被潜在地误导,且销售人员的效率降低。



技术实现要素:

为了更好地了解从医药销售代表(医药代表)到医疗保健提供商(hcp)的针对性动作的功效,需要能够减轻区块数据收集的影响并减轻混淆变量的影响的方法和系统。本文公开的系统和方法可通过使用从医药代表和hcp收集的信息调节区块水平销售数据,来补偿混淆变量的影响。所公开的系统和方法可对经调整的销售数据执行操作,以去除混淆变量的影响。

在一方面,公开了一种计算机实现的方法。所述方法可以包括从多个数据源获得数据。所述数据可以包括(1)药品的合计销售值以及(2)多个属性,所述多个属性包括(i)与多个医疗保健设施相关的信息以及(ii)与多个医疗保健提供商(hcp)相关的信息。可以在多个区块下提供所述多个hcp,每个区块包括所述医疗保健设施中的一个或多个,并且每个设施包含一个或多个hcp。所述方法可以包括通过在所述多个区块的每个区块内的hcp之间分配所述合计销售值来生成所述经调整的销售数据。

在一些实施方式中,所述多个数据源可以包括用于客户资源管理(crm)、市场细分、销售的多个数据库和/或医药公司的专有数据库。

在一些实施方式中,可基于包括地理区域、设施的位置、设施的规模、设施内hcp的数量、区域的社会经济学状况、区域的人口统计资料或其他非地理因素的一个或多个因素定义所述多个区块。

在一些实施方式中,所述多个区块可以包括第一组区块和第二组区块。所述第一组区块中的每个区块可以包括医疗保健设施的独特集合。所述第二区块中的每个区块可以包括单个独特的医疗保健设施。

在一些实施方式中,所述经调整的销售数据可以包括在单个hcp水平而不是在区块水平分解的销售值。

在一些实施方式中,所述方法还可以包括在预测模型中使用所述经调整的销售数据作为指标,以估计不同营销策略对所述药品的销售的影响。

在一些实施方式中,所述方法还可以包括基于所述不同影响策略的估计影响,标识一个或多个营销策略以优化所述药品的销售。

在一些实施方式中,所述方法还可以包括向用户提供一个或多个经标识的营销策略的推荐。所述用户可以包括所述药品的一个或多个销售代表。

在一些实施方式中,可以以被配置为在与所述用户相关的电子设备上显示的一个或多个图形可视化对象的形式提供所述推荐。

在一些实施方式中,可以部分地基于相应区块中hcp的对外活动数据(outboundactivitydata)在hcp之间分配所述合计销售值。

在一些实施方式中,所述对外活动数据可与hcp采取的一个或多个动作相关,所述动作不是销售所述药品的实体采取的特定动作的直接结果。

在一些实施方式中,所述对外活动数据可以包括多个对外特征,包括(1)hcp对提供所述药品用于销售的公司的网页的访问次数,(2)hcp与所述药品的一个或多个销售代表的通信次数,(3)hcp参加的相关研讨会次数,或(4)hcp对所述药品的批单(endorsement)次数或其他类似的hcp动作次数。

在一些实施方式中,可通过将所述合计销售值投影(project)到由所述对外活动定义的空间上以在每个区块内的hcp之间分配所述合计销售值。

在一些实施方式中,可使用线性变换或非线性变换将所述合计销售值投影到所述空间上。

在一些实施方式中,所述多个对外特征的子集可以是彼此的函数或彼此相关。

在一些实施方式中,所述多个对外特征的子集可以是所述属性中的一个或多个的函数或与所述属性中的一个或多个相关。

在一些实施方式中,可以对与所述对外活动相关的多个对外特征应用多个权重。可对具有较高价值或重要性的第一对外特征应用较高的权重,并且可对具有较低价值或重要性的第二对外特征应用较低的权重。

在一些实施方式中,可以以对外矩阵的形式提供所述对外活动,所述对外矩阵包括(1)多个对外特征作为所述矩阵中的列以及(2)所述区块中的所述单个hcp作为所述矩阵中的行。

在一些实施方式中,可基于(1)所述对外矩阵的伪逆以及(2)所述区块中每个hcp的平均区块水平销售生成所述经调整的销售数据。

本公开内容的另一方面公开了一种系统。所述系统可以包括与多个数据源通信的服务器;以及存储指令的存储器,所述指令当被所述服务器执行时,使所述服务器执行一组操作。所述操作可以包括从多个数据源获得数据。所述数据可以包括(1)药品的合计销售值以及(2)多个属性,所述多个属性包括(i)与多个医疗保健设施相关的信息以及(ii)与多个医疗保健提供商(hcp)相关的信息。可以在多个区块下提供所述多个hcp,每个区块包括所述设施中的一个或多个,并且每个设施包含一个或多个hcp。所述操作还可以包括通过在所述多个区块的每个区块内的hcp之间分配所述合计销售值来生成经调整的销售数据。

在又一方面,公开了一种非暂时性计算机可读存储介质。所述存储介质可以包括指令,所述指令当被服务器执行时,使所述服务器执行一组操作。所述操作可以包括从多个数据源获得数据。所述数据可以包括(1)药品的合计销售值以及(2)多个属性,所述多个属性包括(i)与多个医疗保健设施相关的信息以及(ii)与多个医疗保健提供商(hcp)相关的信息。可以在多个区块下提供所述多个hcp,每个区块包括所述医疗保健设施中的一个或多个,并且每个设施包含一个或多个hcp。所述操作还可以包括通过在所述多个区块的每个区块内的hcp之间分配所述合计销售值来生成经调整的销售数据。

在另一方面,提供了一种用于估计对内活动(inboundactivity)对药品的销售的影响的计算机实现的方法。所述方法可以包括从多个数据源获得数据。所述数据可以包括(1)与多个医疗保健提供商(hcp)相关的信息以及(2)与(a)一个或多个销售代表或(b)与所述药品的销售相关的自动化营销系统采取的事件或动作相关的对内活动数据。所述方法还可以包括通过在预测模型中使用经调整的销售数据作为第一指标,估计所述对内活动数据对所述药品向所述多个hcp的销售的影响。可以通过在与所述多个hcp相关的多个区块的每个区块内的hcp之间分配合计销售值来获得所述经调整的销售数据。

在一些实施方式中,所述方法还可以包括基于所述对内活动数据的估计影响对多个对内特征进行排名。所述排名可指示所述多个对内特征中的每个的重要性或优势度(dominance)。

在一些实施方式中,可对所述对内活动数据中的多个对内特征应用多个权重。可对具有较高价值或重要性的第一对内特征应用较高的权重,并且对具有较低价值或重要性的第二对内特征应用较低的权重。

在一些实施方式中,所述对内活动数据中的多个对内特征可以包括(1)所述一个或多个销售代表对hcp的访问次数,(2)所述一个或多个销售代表向hcp发送的电子通信次数,(3)所述一个或多个销售代表致电hcp的次数,(4)所述一个或多个销售代表向hcp发起的会议邀请次数,或(5)公司发送给hcp的提供所述药品的信息的营销通信次数。

在一些实施方式中,可从包括以下中的一项或多项的多个通信渠道收集所述对内活动数据:(1)电子邮件通信;(2)移动电话短信;(3)社交媒体网站;(4)移动应用;(5)电话呼叫;(6)面对面会议;(7)视频会议;(8)会议或研讨会;或(9)在hcp的设施中进行的事件。

在一些实施方式中,所述方法还可以包括从所述经调整的销售数据中去除所述对内活动数据的影响;以及在去除所述对内活动数据的影响后,从所述预测模型中捕获残差数据。

在一些实施方式中,从所述多个数据源获得的所述数据还可以包括(3)包含多个对外特征的对外活动数据,所述对外特征与所述多个hcp采取的动作相关。

在一些实施方式中,所述多个对外特征可以包括(1)hcp对与提供所述药品用于销售的公司相关的网页的访问次数,(2)hcp与所述药品的销售代表之间的通信次数,(3)hcp参加的相关研讨会次数,或(4)hcp对所述药品的批单次数。

在一些实施方式中,所述多个对外特征可以包括所述hcp(a)打开所述一个或多个销售代表发送的一个或多个信息,(b)点击所述一个或多个消息中的内容或超链接,(c)回复所述一个或多个信息,(d)将所述一个或多个消息转发给一个或多个其他方,(e)删除所述一个或多个信息,(f)归档所述一个或多个信息,(g)在社交媒体或网站上发布或分享所述一个或多个信息,或(h)不对所述一个或多个信息采取动作。

在一些实施方式中,所述方法还可以包括生成作为经调整的销售数据的函数的残差数据的图;以及在所述图中确定图案,其中所述图案指示所述残差数据与所述对外特征中的一个或多个之间的关联。

在一些实施方式中,所述方法还可以包括通过在所述预测模型中使用所述残差数据作为第二指标,估计所述对外活动数据对所述药品向所述多个hcp的经调整的销售的影响。

在一些实施方式中,所述方法还可以包括基于所述对外活动数据的估计影响对多个对外特征进行排名,其中所述排名指示所述多个对外特征中的每个的重要性或优势度。

在一些实施方式中,所述方法还可以包括生成参与度模型(engagementmodel),在所述参与度模型中已将所述对外活动数据的估计影响用于估计所述经调整的销售数据;以及使用所述参与度模型确定所述多个hcp中的每个与所述一个或多个销售代表的参与度水平。

在一些实施方式中,可以以参与度得分的形式提供所述参与度水平。

在一些实施方式中,所述方法还可以包括标识所述一个或多个销售代表的一个或多个最佳对内活动,以使所述参与度得分在任何给定时间最大化。

在一些实施方式中,所述方法还可以包括生成所述一个或多个最佳对内活动的时间顺序,以使所述参与度得分在一段时间内最大化。

在一些实施方式中,所述方法还可以包括生成作为所述残差数据的函数的所述参与度得分的图;以及在所述图中确定图案。所述图案可指示hcp的参与度水平与所述残差数据之间的关联。

在一些实施方式中,所述方法还可以包括生成作为所述经调整的销售数据的函数的所述参与度得分的图;以及从所述图中确定相关系数。所述相关系数可指示在去除所述对内活动数据的影响的情况下,所述hcp的参与度水平对所述药品的销售的贡献。

在一些实施方式中,可从所述参与度模型中去除所述对内活动数据的影响,使得所述参与度模型独立于对内活动。

在一些实施方式中,所述预测模型可利用机器学习算法。所述机器学习算法可选自随机森林、提升决策树、分类树、回归树、装袋树(baggingtree)、神经网络和旋转森林。

根据另一方面,提供了一种用于估计对内活动对药品的销售的影响的系统。所述系统可以包括:与多个数据源通信的服务器;以及存储指令的存储器,所述指令当被所述服务器执行时,使所述服务器执行一组操作。所述操作可以包括从多个数据源获得数据。所述数据可以包括(1)与多个医疗保健提供商(hcp)相关的信息以及(2)与一个或多个销售代表采取的事件或动作相关的对内活动数据,所述事件或动作与所述药品的销售相关。所述操作还可以包括通过在与所述多个hcp相关的多个区块的每个区块内的hcp之间分配合计销售值来获得经调整的销售数据;以及通过在预测模型中使用所述经调整的销售数据作为第一指标,估计所述对内活动数据对所述药品向所述多个hcp的销售的影响。

在又一方面,提供了一种包括指令的非暂时性计算机可读存储介质,当所述指令被服务器执行时,使所述服务器执行操作。所述操作可以包括从多个数据源获得数据。所述数据可以包括(1)与多个医疗保健提供商(hcp)相关的信息以及(2)与一个或多个销售代表采取的事件或动作相关的对内活动数据,所述事件或动作与所述药品的销售相关。所述操作还可以包括通过在与所述多个hcp相关的多个区块的每个区块内的hcp之间分配合计销售值来获得经调整的销售数据;以及通过在预测模型中使用所述经调整的销售数据作为第一指标,估计所述对内活动数据对所述药品向所述多个hcp的销售的影响。

在另一方面,公开了一种用于估计对外活动对药品的销售的影响的计算机实现的方法。所述方法可以包括从多个数据源获得数据。所述数据可以包括对外活动数据,所述对外活动数据包括与多个医疗保健提供商(hcp)采取的动作相关的多个对外特征。所述方法还可以包括通过使用预测模型中的残差数据,估计所述对外活动数据对所述药品向所述多个hcp的销售的影响。可通过在预测模型中从经调整的销售数据中去除对内活动数据的估计影响来获得所述残差数据。可通过在与所述多个hcp相关的多个区块的每个区块内的hcp之间分配合计销售值来获得所述经调整的销售数据。

在一些实施方式中,所述多个对外特征可以包括(1)hcp对与提供所述药品用于销售的公司相关的网页的访问次数,(2)hcp与所述药品的销售代表之间的通信次数,(3)hcp参加的相关研讨会次数,或(4)hcp对所述药品的批单次数。

在一些实施方式中,所述多个对外特征可以包括所述hcp(a)打开所述一个或多个销售代表发送的一个或多个信息,(b)点击所述一个或多个消息中的内容或超链接,(c)回复所述一个或多个信息,(d)将所述一个或多个消息转发给一个或多个其他方,(e)删除所述一个或多个信息,(f)归档所述一个或多个信息,(g)在社交媒体或网站上发布或分享所述一个或多个信息,或(h)不对所述一个或多个信息采取动作。

在一些实施方式中,所述方法还可以包括基于所述对外活动数据的估计影响对多个对外特征进行排名。所述排名可指示所述多个对外特征中的每个的重要性或优势度。

在一些实施方式中,所述方法还可以包括生成参与度模型,在所述参与度模型中已从所述经调整的销售数据中去除所述对内活动数据的估计影响;以及使用所述参与度模型确定所述多个hcp中的每个与所述一个或多个销售代表的参与度水平。

在一些实施方式中,所述方法还可以包括部分地基于从所述参与度模型获得的所述参与度水平,为所述多个hcp中的每个确定最佳的销售和营销策略。

根据另一方面,提供了一种用于估计对外活动对药品的销售的影响的系统。所述系统可以包括:与多个数据源通信的服务器;以及存储指令的存储器,所述指令当被所述服务器执行时,使所述服务器执行一组操作。所述操作可以包括从多个数据源获得数据。所述数据可以包括对外活动数据,所述对外活动数据包括与多个医疗保健提供商(hcp)采取的动作相关的多个对外特征。所述操作还可以包括通过使用预测模型中的残差数据,估计所述对外活动数据对所述药品向所述多个hcp的销售的影响。可通过在预测模型中从经调整的销售数据中去除对内活动数据的估计影响来获得所述残差数据。可通过在与所述多个hcp相关的多个区块的每个区块内的hcp之间分配合计销售值来获得所述经调整的销售数据。

在又一方面,提供了一种包括指令的非暂时性计算机可读存储介质,所述指令当被服务器执行时,使所述服务器执行操作。所述操作可以包括从多个数据源获得数据。所述数据可以包括对外活动数据,所述对外活动数据包括与多个医疗保健提供商(hcp)采取的动作相关的多个对外特征。所述操作还可以包括通过使用预测模型中的残差数据,估计所述对外活动数据对所述药品向所述多个hcp的销售的影响。可通过在预测模型中从经调整的销售数据中去除对内活动数据的估计影响来获得所述残差数据。可通过在与所述多个hcp相关的多个区块的每个区块内的hcp之间分配合计销售值来获得所述经调整的销售数据。

应当理解,可以单独地、共同地或彼此结合地理解本公开内容的不同方面。本文所述的实施方式可以被修改、组合并且以不同的配置使用。本文所述的各个方面可以应用于以下阐述的任何特定应用。通过审阅说明书、权利要求书和附图,本公开内容的其他目的和特征将变得显而易见。

援引并入

本说明书中提及的所有出版物、专利和专利申请均通过引用并入本文,其程度如同特别地且单独地指出每个单独的出版物、专利或专利申请通过引用而并入。

附图说明

本公开内容的新颖特征在所附权利要求书中具体阐述。通过参考以下对说明性实施方式加以阐述的详细描述和附图,将会获得对本公开内容的特征和优点的更好的理解,在这些附图中:

图1示出了根据一些实施方式的、包含医疗保健提供商(hcp)参与度引擎的系统;

图2示出了根据一些实施方式的、可由系统分析以便考虑对内和对外活动的数据类型的示例;

图3是根据一些实施方式的、图示了系统的不同功能的框图;

图4示出了根据一些实施方式的随机森林算法;

图5示出了根据一些实施方式的、由hcp将对外特征的影响投影到销售上的图示;

图6是根据一些实施方式的流程;

图7图示了根据一些实施方式的去混淆对内活动影响的过程的视觉表示;

图8a图示了已考虑对外活动影响后的hcp数据的视觉表示;

图8b示出了用于减少来自销售数据的对外和对内活动的影响的方法的实际应用;以及

图9示出了根据本文公开的实施方式的、被编程或以其他方式配置为执行数据共享和分析任务的计算机系统。

具体实施方式

所公开的方法和系统可以通过至少解决以下挑战来使实体能够改进和面向其在销售和营销方面的工作。例如,联系医疗保健提供商(hcp)的医药销售代表(医药代表)通常需要有关向hcp营销治疗和医疗服务的最佳实践的信息。不幸的是,鉴于有限的可用数据以及在数据收集过程中可能产生的混淆影响,通常难以评估哪种方法最有效。

首先,医药代表与hcp之间的交互数据经常被隐藏。出于隐私原因,医疗销售信息可能不可用,或者可能仅在设施水平或“区块”水平可用。在单个区块中,来自一个或多个hcp的数据可能是合计的。因此,收集区块水平的数据意味着可能无法获得各个hcp的销售数据,尤其是在区块包含来自许多不同hcp的数据的情况下。此外,对于一些区块,一些hcp的数据可能丢失、不准确或损坏。出于隐私原因,数据也可能被隐藏。例如,如果hcp不想透露其身份,则销售水平的数据中可能缺少层级信息。hcp地理信息也可能被隐藏。

其次,销售数据通常可能无法反映医药代表与hcp之间的关键交互。hcp可能对要开具给患者的药品/疗法产生重大影响,这可能会影响药品/疗法的销售。例如,hcp可能与一个或多个医药代表具有良好的工作关系,并且如果hcp相信那些代表所营销的产品和服务的功效,那么hcp可能会倾向于推荐来自与hcp具有良好工作关系的代表的处方产品和服务。hcp对为患者开具哪些产品和服务的推荐可以显著地影响这些产品和服务的销售。hcp也可能希望试用新产品,或者可能个别地易受良好推销术的影响。反之亦然——hcp可能对尝试新产品和服务持怀疑态度。hcp可能倾向于从他们认为对他们的医疗实践有效的医药公司的供给品中开具产品和服务,而可能不太倾向于开具他们认为效果不佳的那些产品或服务。一些销售代表可能是更有经验的销售人员,或者具有使其能够更有效地销售产品或服务的个人素质。一些医药公司可能被hcp和医疗保健设施所广泛认可,这可能导致hcp更加频繁地从这些公司开具商品和服务。此外,一些公司可能与一些hcp或医疗保健设施具有独家业务关系。例如,如果有特定的疾病或流感流行,则可以根据提供商的特定需求开具处方并因此购买产品和服务。

为了减轻上述影响或因素,首先必须确定它们。所公开的方法和系统可以确定影响销售且与医药代表对于hcp所作的销售工作没有直接关系的各种因素。这些因素可以分为对内影响和对外影响,它们可以分别来自对内活动和对外活动。此外,hcp的属性(本文也称为协变量)也可能影响销售分析。

对内活动的一些示例可以包括:医药代表访问医生、医药代表向hcp发送消息(诸如电子邮件)、hcp或hcp员工致电医药代表以及网络详情(诸如网络研讨会或基于web的会议)。对内活动不限于外部实体针对各个hcp进行的活动。在一些实施方式中,对内活动可以包括一个或多个医药代表在外部实体的指导下对各个hcp进行的任何相关活动。对内活动可以组织成矩阵形式。

对外活动的一些示例可以包括hcp从收到来自医药代表的电子邮件到打开来自医药代表的电子邮件之间经过的时间、hcp访问医药代表的网页或其他相关网页或hcp参加与医药代表领域相关的会议。对外活动可以包括hcp或一个或多个人员在hcp的指导下针对一个或多个医药代表或向医药代表提供指导的实体进行的任何相关活动。与上述对内活动类似,这些对外活动也可以组织成矩阵形式。

协变量可以包括但不限于hcp工作或分配的设施(例如,医院、医务室等)、部门或专业(例如,心脏病科、放射科等)或相关的区块(例如,相关的设施、组、设施集合等)。

在一些实施方式中,本文公开的方法可以通过首先分解每区块的销售数据以形成调节后的销售数据,然后消除来自对内和对外活动的混淆影响来进行。在本上下文中,分解数据可以包括在区块内的所有hcp之间分配每个区块的总销售。分解可以包括如下假设,即参与度较高、通常产生较多对外活动的hcp在销售中所占的比例相对较大。因此,调节销售可以包括相对于hcp的对外活动在该区块内的hcp之间分配每个区块的销售。

接下来,该方法可以包括校正来自对内活动的影响。可以通过拟合函数来校正来自对内活动的影响,该函数将对内活动和协变量的值作为自变量,并返回根据上一步计算得出的经调整的销售。在该步骤之后,接下来该方法可以计算一组残差,以便确定可能存在于数据中的其他混淆影响。接下来,该方法可以通过拟合函数来校正对外活动,该函数以对外影响作为自变量并返回来自对内校正步骤的所述一组残差。执行此步骤以校正对外影响引起的任何影响。

可以通过线性或非线性方法来执行模型拟合。线性方法可以包括线性回归。非线性方法可以包括决策树算法,诸如梯度提升树、装袋或随机森林算法。

图1示出了包含医疗保健提供商(hcp)参与度引擎的系统100。该系统可以包括网络、一个或多个客户端设备和一个或多个服务器。

网络可以是计算机网络,诸如局域网(lan)、广域网(wan)、无线局域网(wlan)、城域网(man)、存储区域网(san)、校园网(can)或个人局域网(pan)。网络可以是有线网或无线网,诸如wi-fi网络。网络可以包括服务器、路由器、交换器以及其他网络设备和服务,以促进数据(,包括会话数据、控制数据、命令)的传输以及系统各部分之间的其他通信。

客户端设备可以是计算设备。例如,计算设备可以包括移动计算设备,诸如手机、智能手机、个人助理和平板计算机。计算设备还可以包括膝上型计算机、终端或台式计算机。客户端设备可以允许不同方(即医药代表和hcp)之间交换信息。客户端设备中的一个或多个可以与一个或多个医药代表关联(“医药代表客户端设备”)。一个或多个客户端设备可以与一个或多个医疗保健提供商(hcp)关联(“hcp客户端设备”)。医疗保健提供商可以包括医师、护士、护理医师、药剂师、科学家、研究人员或技术人员。药业代表和hcp可以使用其客户端设备进行通信,例如使用基于文本的线上或网络通信方法,诸如电子邮件、即时消息、互联网聊天协议、留言板或布告板系统(bbs)。消息还可以包括移动文本消息以及来自社交媒体网站、移动应用、电话呼叫、面对面会议、视频会议、会议或研讨会或者与在hcp的工作设施进行的活动相关的消息。

医药代表客户端设备可以将信息(包括医药代表采取的动作)传输到服务器以用于分析。医药代表客户端设备可以从服务器接收推荐(诸如推荐的消息或建议的联系hcp的方法),并将其呈现给医药代表。医药代表客户端设备可以安装提供用于呈现此类推荐的用户界面(ui)的软件。软件可以集成有:与支持网络通信的应用,诸如包括veevacrm和iqviacrm在内的客户关系管理(crm)系统,以及包括outlook、hangouts、ichat和messenger在内的其他软件应用。例如,软件可以扩展聊天应用以提供将信息呈现给医药代表的弹出通知或其他窗口。医药代表客户端设备可以定期从服务器检索推荐消息,或者可以在医药代表提交要从服务器提供推荐消息的请求时检索消息。hcp客户端设备还可以在其上安装网络通信程序,并且可以将医药代表发送的消息呈现给hcp。医药代表客户端设备和hcp客户端设备都可以在其上安装可以记录医药代表和hcp分别采取的动作并将这些动作的记录发送到服务器的软件。记录的动作可以包括鼠标点击、击键或与屏上元素的交互。可以将动作与时间戳一起发送到服务器,以便服务器将它们记录为时间绑定(time-binned)数据以用于机器学习分析。

服务器可以是物理服务器或虚拟服务器。物理服务器可以部署在服务器农场环境中。虚拟服务器可以存在于云计算环境或分布式计算环境中。服务器可以存储数据并执行数据分析。服务器可以包括一个或多个数据存储系统。数据存储可以包含消息数据、医药代表数据和hcp数据。医药代表数据可以包括医药代表出售的药物和治疗。hcp数据可以包括hcp的专业或执业领域、它们所属的医院或机构以及hcp的资历水平。医药代表和hcp数据还可以包括人口统计信息,诸如年龄、教育程度、位置和种族。数据存储还可以存储医药市场策略的电子表示,例如医药代表访问hcp或向hcp发送消息的优选或最佳时机、针对hcp的部门的具体说明、针对和改善与hcp互动的指南、对内活动的顺序和类型等。

服务器可以从包括医药代表客户端设备和hcp客户端设备在内的客户端设备中接收数据。服务器可以通过网络与安装在客户端设备上的计算机程序进行通信,以便从客户端设备请求数据从而执行机器学习分析。例如,服务器可以定期请求动作数据。服务器可以基于每月、每周或每天或者以预定的时间间隔请求数据。在一些实施方式中,客户端设备可以能够选择是否与服务器共享特定的数据项或数据类别。服务器可以安装一个或多个计算机程序以集成和组织数据。计算机程序之一可以被配置为确定从客户端设备中的一个或多个中采样的数据是否不足,并且可以在必要时从客户端设备请求附加数据。

hcp参与度引擎可以被配置为评价药物代表针对hcp的动作对销售的有效性。hcp参与度引擎可以分析来自服务器内数据存储的数据,以便产生参与度得分。hcp参与度得分可以仅取决于hcp参与度,并且可以与hcp属性和对内活动无关。为了产生参与度得分,hcp参与度引擎可以首先去除由一些数据引起的混淆影响。可能引起混淆影响的数据可以包括对内活动数据、对外活动数据以及hcp和医药代表的属性。当去除了这些混淆影响时,hcp参与度引擎可以根据药物代表的动作来评估hcp参与度。hcp参与度引擎可以使用一个或多个机器学习算法或统计方法来执行此分析。hcp参与度引擎可以使用随机森林模型来预测一个或多个医药代表动作之后hcp的动作。例如,hcp参与度引擎可用于预测假设医药代表在特定时间在一系列其他消息中发送了消息,并且该消息包含特定内容,则hcp是否将打开由医药代表发送的消息。

在一些实施方式中,hcp引擎可以根据一组动作或一组动作序列产生得分。然后,hcp引擎可以选择得分最高的动作或动作序列。这可以用方程(1)表示:

i*=argmaxi(hes)

在上式中,i*表示选定的动作,即产生最大hcp参与度得分(hes)的动作。该表达式可以是时间依赖性的,动作的得分会基于时间变化。可以使用相似的表达式来确定一组动作序列中具有最大hes的动作序列。

基于所计算的hes,系统可以提供关于优选哪个动作或动作序列的见解或推荐。例如,使用具有图形用户界面的移动应用,可以将这些见解或推荐在医药代表客户端设备上提供给医药代表。也可以使用网络通信(诸如电子邮件通信)方法将它们提供给医药代表。

图2是可由系统分析以便考虑对内活动和对外活动的数据类型的图示。数据类型可以包括账户信息210、协变量220、对内数据240、对外数据230、对外权重250和对内权重260。以上数据类型内的数据可以包括定量数据和/或定性数据。数据可以呈矩阵或向量形式,并且可以包括二元数据、连续数据或分类型数据。

数据可以从许多不同的数据源导入到系统中。数据源可以包括客户关系管理(crm)系统、医药专有数据库、市场细分和销售数据。系统可以处理来自这些不同来源的数据,以便产生具有特定字段的标准化数据,该标准化数据可由本文公开的算法使用以用于分析。特定账户的数据可以由一个或多个数据源提供,并且来自这些数据源的不同数据字段可以合并到特定账户的一个数据条目中。

账户信息210可以包括由医药代表管理的个人账户。一个账户可以对应单个hcp,或者由一个或多个hcp组成的单个设施。单个数据区块可以包括来自一个或多个账户的数据。可以为账户分配编号标签(例如,1001、1002、10003等)或名称标签。账户可以与一个或多个区块相关,这取决于账户是与个人相关还是与设施相关。在一些情况下,hcp可以隶属于多个设施,因此一个账户可以同时与多个区块相关。当新的hcp向设施注册时,或者当hcp移至不同设施或不再活动时,账户信息可以更新。

协变量220包括hcp的各种属性。协变量220可以包括人口统计信息,诸如专业、设施、经验年限、职业、购买习惯、年龄、职称以及关于hcp和医药代表之间的关系的信息。协变量220可以彼此相关、与对内变量中的一个或多个相关、与对外变量中的一个或多个相关、或者彼此独立并且独立于变量中的任何一个。例如,年长的hcp可能具有更高的资历和多年的经验。年长的hcp可能与特定的医药代表有更好的人际关系,因为他们可能与医药代表有更多的联系。协变量220可以是连续变量、分类变量或二元变量。二元变量可以包括hcp是否对药物/疗法表现出兴趣,是否向设施或同事提出推荐,以及/或者是否在特定的时间表内(诸如在特定的一天、一周、一个月或一年内)为患者开具药物/疗法的处方。二元变量还可以包括hcp是否已对来自医药代表的通信执行动作。连续变量可以包括时间绑定的患者量、跟踪的发送和接收的通信量、执行各种与患者护理相关的活动所花费的时间以及累积的药物和疗法处方。分类变量可以包括专业、资历、经验年限、参加设施、教育程度、婚姻状况、参加的会议、种族和工作时间。

对外活动230或变量可以是hcp响应于医药代表所执行的动作而采取的动作,其直接或间接地与医药代表所执行的动作有关。对外活动230可以包括(1)hcp对提供所述药品销售的公司的网页的访问次数,(2)hcp与所述药品的一个或多个销售代表的通信次数,(3)hcp参加的相关研讨会次数,或(4)hcp对所述药品的批单次数。对外活动230可以产生对外特征,其可以作为数据输入系统并用于分析。可以分析对外特征以便确定该特征对hcp参与度水平有什么影响。对外特征可以彼此相关、独立、与对内特征相关或与协变量相关。在一些情况下,多个对外特征可以包括hcp(a)打开一个或多个销售代表发送的一个或多个信息,(b)点击所述一个或多个消息内的内容或超链接,(c)回复所述一个或多个信息,(d)将所述一个或多个消息转发给一个或多个其他方,(e)删除所述一个或多个信息,(f)归档所述一个或多个信息,(g)在社交媒体或网站上发布或分享所述一个或多个信息,或(h)不对所述一个或多个信息采取动作。

对内活动240或变量可以是医药代表和/或医药公司针对hcp执行的动作,目的是向hcp营销和销售产品或服务。除医药代表的工作外,医药公司可以直接向hcp发送通信,该通信的形式可以是营销材料(电子版或纸质)、各种媒体或渠道上的广告、参加研讨会的邀请等。对内活动(或变量)可以是独立的,或者可以是彼此或协变量的函数。在一些情况下,它们可以与对外变量有一些相关。可以对对内活动进行编目以创建对内特征,其可由系统分析以便确定hcp参与度。在一些情况下,对内活动数据中的多个对内特征可以包括(1)所述一个或多个销售代表对hcp的访问次数,(2)所述一个或多个销售代表向hcp发送的电子通信次数,(3)所述一个或多个销售代表致电hcp的次数,(4)所述一个或多个销售代表向hcp发起的会议邀请次数,或(5)公司发送给hcp的提供关于药品的信息的营销通信次数。可以从包括以下中的一项或多项的一个或多个通信渠道收集所述对内活动240:(1)电子邮件通信;(2)移动电话短信;(3)社交媒体网站;(4)移动应用;(5)电话呼叫;(6)面对面会议;(7)视频会议;(8)会议或研讨会;或(9)在hcp的设施中进行的事件。

为了使系统对对外特征和对内特征执行分析,可以以矩阵形式表示对外特征和对内特征。例如,对内特征矩阵中的行可以是个人账户编号或标签,其可以表示hcp或区块。列可以是对内特征,其中每个列代表一个特定类别。因此,特定的行-列2d索引可以表示来自特定账户的特定特征值。如果特定索引的特征数据不可用,则可以根据其他特征值进行插值。

在一些实施方式中,对内特征和对外特征可以具有应用于其的对内权重260和对外权重250。这些权重可以是向量中的标量,可以将其应用于对外特征以便提高分析的准确性。可以使用一个或多个向量乘法运算来应用权重。这些权重可以由最终用户描述和输入,或者可以使用机器学习算法或统计方法生成。可以对在混淆中具有较高价值或重要性的特征应用较大的权重,而对在混淆中具有较低价值或重要性的特征应用较小的权重。权重可以被配置为响应于条件而变化。例如,取决于特定的动作发生的日期、星期或月份,该特定的动作可以具有较大或较小的重要性。此外,随着系统检索到更多数据,系统可以学习有关对内动作和对外动作的信息,该信息可能导致客户重新评估这些动作中的一项或多项的重要性。权重可以被配置为捕获医药营销部门对各种对外因素和对内因素的重要性的“意见”。作为示例,在对外交互的价值方面而言,hcp参加网络研讨会的重要性可以被加权为hcp访问网站的重要性的两倍。尽管图2以矩阵中的列的形式示意性地图示了权重,但是应当理解,权重实际上是使矩阵的行相乘的向量-即,每一列都被加权。

合计销售270可以由区块组织。区块可以包括从设施收集的数据。区块可以包括一个或多个设施,而这些设施又可以具有一个或多个hcp。单个区块可以包含共同具有一个或多个因素的设施,这些因素包括地理区域、位置、规模大小、hcp的数量、区域的社会经济状况或区域的人口统计资料。分析中使用的区块的规模大小可以相同,也可以不同。分析中使用的区块中的一些可以来自包含一个hcp的设施,其他区块可以来自具有多个hcp的设施。

经调整的销售数据可以包括在个人水平而不是区块水平分解的销售值。在一些实施方式中,可以通过确定区块内每个hcp的平均销售(通过将区块中的总销售除以区块中包含的hcp数量)来执行分解。接下来,系统可以确定每个hcp的经调整的销售。该系统可以假设高度参与的hcp更可能已经开具或推荐了某些药品或服务来开处方给患者。因此,参与度较高的hcp被分配较高比例的经调整的销售,而参与度较低的hcp被分配较低比例的经调整的销售。

图3是根据一些实施方式的图示了系统的不同功能的框图。图3的框图示出了销售数据产生/调节310、去混淆对内活动影响320以及去混淆对外活动影响330。术语“去混淆”可以指“不混淆”,并且这些术语在本文中可以互换使用。去混淆对内活动影响和去混淆对外活动影响的步骤可以互换执行。如本文所公开的,可以针对对外活动执行销售数据调节。在各种实施方式中,可以使用其他类型的收集数据来执行销售数据调节。

销售数据产生310可以包括在区块内的hcp之间分配区块水平的销售数据。可以从多个来源获得数据,并且可以在区块内的所有hcp之间执行销售数据的分配。与个别销售数据不同,可以通过在服务器中记录来自hcp的活动数据来直接测量hcp参与度。可以假设具有高对外活动的hcp表现出高的参与度,因此,与具有较低对外活动的hcp相比,它们可能占更大的销售百分比,这为销售分配方法提供了前提。调节销售数据可以包括根据砖块内hcp的hcp对外活动,对每个区块的平均销售或未调节的销售应用权重。这可以通过使用矩阵乘法方法将未调节的销售数据投影到对外活动数据形成的空间上来执行。可以在预测模型(诸如本文所述的hes模型)中使用经调整的销售数据作为指标,以估计不同营销策略对药品销售的影响。还可以开发其他预测模型以估计也利用经调整的销售数据的营销策略的影响,并使用如本文所述的不同方法考虑混淆。

在一些情况下,医药公司可以对对外特征进行分类,使得一些特征的权重高于其他特征。该加权也可以通过将对外特征与对外权重的矩阵或向量进行矩阵相乘来执行。在对内处理阶段之后,系统可以通过将拟合函数应用于可用的对内特征集并测量经调整的销售与该函数所预测的销售之间的偏差,来计算残差。然后,系统可以根据这些残差对对外活动数据执行处理。

可以使用简单的线性模型或通过非线性模型在区块销售内分配给hcp。在一些实施方式中,在区块销售内分配给hcp可以涉及使用如其他地方所述的伪逆,这对于简化线性模型可能更优选。线性模型可以包括线性回归。非线性模型可以包括基于决策树的模型,诸如梯度提升树、分类树、回归树、装袋树和随机森林。它们还可以包括基于神经网络的模型。

销售调节过程的实现如下所述。在一个示例中,可以通过首先求解x的方程(2)在区块b中的提供商之间分配未调节的总体销售数据。

方程(2):

obx=sb

在方程(2)中,子矩阵ob标识与区块b和子向量(例如,列向量)相关的提供商的对外活动,并且sb标识与区块b相关的提供商的销售(或开处方)活动。

为了确定根据(或基于)每个提供商的对外活动进行调节的每个提供商的分配销售数据,可以求解方程(3)和(4)。

方程(3):

方程(4):

在方程(3)中,是ob的伪逆,并且方程(4)的投影提供了根据提供商的对外活动进行调节的销售(也称为“对外活动分配的销售值”)。

方程(4)的解obx*提供了每个提供商的经分配销售数据(也称为“经调整的销售值”)。

在向对外活动赋予不同权重的实施方式中,可以通过求解方程(5)来提供加权的对外活动矩阵

方程(5):

在方程(5)中,i是标识子矩阵并且wo是对外活动权重子矩阵。方程(5)求解后,可以使用加权的对外活动子矩阵代替方程(2)-(4)中的ob,以提供加权的对外活动分配的销售值。

在另一示例中,多个(例如,三个)提供商可以被分配到特定的区块b(例如,在其中实践)。在该示例中,第一提供商在相关时间段期间参加了两次研讨会,第二提供商在相关时间段期间访问了一次相关网站,第三提供商在相关时间段期间参加了一次研讨会。因此,第一提供商的参与度高于第二提供商或第三提供商。提供商的对外活动提供以下对外子矩阵ob,其中行指示三个提供商,列指示不同的对外活动,其中左列为访问网站,右列为参加座谈会。

在该示例中,隐藏的总区块销售(例如,在特定区块中所有销售的总和)可以是3,因此在相关时间段期间,每个提供商的平均区块水平销售等于1,这提供了以下子向量sb

ob的伪逆如下。

根据提供商的对外活动进行调节的销售(也称为“对外活动分配的销售”)提供如下:

其中

如以上矩阵所示,由于第一提供商具有两次对外活动(即,两次研讨会访问),而第二提供商和第三提供商各自仅具有一次对外活动(即,分别为一次网站访问和一次研讨会访问),因此认为第一提供商在特定区块b中的三个提供商之中具有最大的相对销售份额。

以上是使用伪逆的线性模型的示例。如前所述,该模型的优点是使用简单。尽管如此,应该注意的是,在一些其他实施方式中可以使用更复杂的非线性模型。

对内去混淆阶段320可以考虑对内活动对hcp参与度的影响。为了实现这一点,系统可以拟合对内特征和协变量对于经调整的销售的函数。这可以使用非线性方法,例如使用随机森林算法来实现。当执行随机森林算法时,系统可以确定协变量和对内活动的相对重要性,以便确定哪个对经调整的销售贡献最大。

在一个实施方式中,通过拟合函数f(c,i)减少对内活动的影响。例如,拟合模型f(c,i)=s*,其中s*是每个区块经调整的销售的向量:

模型f(c,i)包括属性(例如,属性或协变量的矩阵),因为对内活动可能与特定的提供商属性高度关联或相关。例如,较年轻的提供商可能更容易接受电子邮件而不是电话呼叫,并且可以发现,例如,年龄属性低于“35”的提供商可能暴露于更多的电话呼叫对内活动。

在一些实施方式中,可以对对内特征应用权重。在该实施方式中,使用加权对内活动子矩阵iw≡iiwi,而不是拟合f(c,i)=s*

最后,系统可以在对外影响处理阶段期间考虑对外影响。系统可以再次拟合模型,这次将模型与从对对内影响进行去混淆步骤计算出的残差进行拟合。该模型可以将对外影响拟合到残差,以便考虑对外活动影响。

在对外去混淆阶段330期间,通过建模h(o)=s*将与销售数据相关的其余影响归因于每个提供商的对外活动。所得模型h*(o)提供了隐藏的总销售数据、在对内活动处理阶段期间收集的对外活动和对内活动以及基于每个供应商的对外活动而与对内活动相对无关的在特定区块中每个提供商的估计销售之间的相关性。所得相关性提供了特定提供商如何与对内活动无关地和公司(例如,医药公司)进行“参与”的指示,对内活动是该公司对提供商执行的动作。通过使用该信息,公司可以确定特定区块中的哪个提供商与公司的营销工作无关地开具了相关产品(例如,药品),因此,通过针对被建模为在某种程度上参与并可能随着时间而变得更加参与的提供商,可以使得该公司可以更好地利用其有限的营销资源。

可以对对外特征进行排名,以便确定哪些特征与hcp参与度最密切相关。生成显示对外特征相对重要性的排名列表可以使医药公司确定要监视hcp的哪些对外活动,以便确定哪些hcp参与度最迫切,从而可能从医药代表购买产品和服务。该数据可允许医药公司部分地基于从参与度模型获得的参与度水平,为多个hcp中的每个确定最佳的销售和营销策略。

图4示出了可以用于本公开内容的实施方式的随机森林算法。随机森林是一种用于分类、回归和其他任务的集成学习方法,其通过在训练时构造大量决策树并输出作为各个树的类别(分类)或均值预测(回归)模式的类别来进行操作。随机决策林可以校正决策树对其训练集进行过拟合的习惯。

使用单个树对大型数据集进行分类通常是不可取的。决策树通过关于数据集元素的各个特性对数据集进行迭代分区来对数据集内的元素进行分类。这些特性称为特征。为了恰当地对数据元素进行分类,分区可能各自只需要包含很少的元素。在决策树中,通过使用特征的阈值比较元素来进行分区。例如,可以将人群拆分为两组,其中一组具有棕色眼睛,另一组没有棕色眼睛。可将该拆分可视化为分支,其中将每个分支底部的元素可视化为叶子或节点。对于大型数据集,需要创建许多分区。当训练决策树时,创建过多的分区可能导致偏差低但方差高的数据集。因此,使用单个深度决策树创建过多分区可能会导致过拟合。

为了避免在使用决策树对数据进行分类时的过拟合,已经开发了多个机器学习算法。这些方法之一是随机森林方法。随机森林方法创建许多树并将其平均,从而减少方差并提高性能。对于每个创建的树,随机森林算法选择特征的随机子集。此过程称为自举汇聚(bootstrapaggregating)或装袋。要创建的树的数量可以由开发人员设置,并且可以是数百个。单个决策树可以生长到特定长度或分支决策的数量。例如,可以由开发人员设置所用特征的数量。或者,可以基于收敛条件(诸如损失函数的最小化)来确定树的长度。一旦所有的树均已实现,就可以汇聚来自树的分类结果。例如,可以为每棵树底部的每个分类组(节点或叶子)赋予一个得分,并且可以将这些得分加在一起以产生每个分类组的总分类得分。每个组中的所有元素都具有相同的得分。这些得分可以映射到定性值。在先前的示例中,随机森林方法可以赋予所有具有棕色眼睛的受试者大于0.5的得分,并赋予所有没有棕色眼睛的受试者小于0.5的得分。

图4示出了具有两棵决策树的随机森林的简单示例。基于两个特征的不同“随机”集,每棵决策树有两个拆分。左树在特征1和2上拆分,而右树在特征3和4上拆分。每棵树分析一组元素,其包括感兴趣的特征,由黑色实心圆圈表示。尽管每棵树分析的元素数量相同,但其余元素(由未填充的白色圆圈表示)不一定相同。这是因为在该实现方式中,每棵树都随机选择元素的固定大小的子集进行分析。树的每一层级对应于一个二元决策。在图4中,该决策为是或否决策。在树的每一层级,根据关于每一层级特征的二元决策对元素进行分类。终端节点或叶子代表元素的最终分类。基于这些分类,对元素赋予得分。在左树上,黑色实心圆圈被赋予得分(1)。在右树上,黑色实心圆圈被赋予得分(2)。将这些得分相加以产生黑色实心圆圈元素的总得分。尽管图中未示出,但白色的未填充圆圈也获得得分。

尽管此处描述了随机森林算法,但也可以使用其他方法汇总决策树中的得分以对数据元素进行分类。这些方法包括梯度提升树、其他类型的装袋树、旋转森林和决策表。

图5示出了根据一些实施方式的由hcp将对外特征的影响投影到销售上的影响的图示。该图示出了对根据模拟创建的“合成”数据的数据调节,该模拟旨在捕获在实践中可能看到的均值和协方差行为。该图示出了根据该数据的经调整的销售与销售的对比,该数据具有10,000个hcp观察值、四个对外变量和十个区块。对于平均区块销售,图示了分析中所有hcp的经调整的销售410。对于特定的平均销售值,存在hcp的估计销售范围。较宽的带在平均销售上可能具有更多的差异,或者也可能由于基础区块中包含更多的hcp而更宽。

该图示出了17个区块的经调整的销售。区块可以代表一个或多个账户。在图5中,所有区块包含多个账户的销售数据。该图示出了第一区块420,第一区块420示出了一个区块中的经调整的销售的范围,其中总销售约为400,000。该图还示出了第二区块430,其中总销售约为650,000,该区块内具有一定范围的hcp的经调解销售。

图6是根据一些实施方式的流程600。第一步,系统收集来自hcp和医药代表的数据以及可由crm、药房数据库、市场细分和其他来源提供的其他数据。所收集的数据可以包括hcp信息、交易、事件、web访问、销售数据和设施信息。所收集的数据可以存储在服务器中,在服务器中可以对其进行预处理以便呈现适于分析的格式。

接下来,系统读取并产生收集并存储在服务器中的未调节销售数据,以形成经调整的销售数据。该步骤分析的数据可以包括未调节数据、设施信息和hcp信息。设施信息和hcp信息可用于产生未调节的销售数据。例如,对于特定的区块,如果已知该区块内销售数据的原始设施,则可以将区块信息与设施和hcp信息进行交叉索引,以便确定哪些hcp属于具有属于该区块的数据的设施。可以例如使用图3的方法来调节销售数据(在区块内的hcp之间分配销售)。

接下来,系统读取和产生对内hcp数据。所收集的数据可以包括关于事件和交易的数据。事件数据可以包括医药代表针对hcp采取以便向hcp营销商品和服务的对内活动,hcp为其患者开具处方而其患者进而可以进行购买以履行处方。交易数据可以包括以下纪录。在美国,可以在药房和其他药物分销商处收集有关填写哪些处方和订购这些处方的hcp的数据(例如,iqvia可以收集此类数据)。在其他地区(诸如欧洲),有关hcp脚本编写的数据通常可能不可用,除非在区块水平。在一些情况下,交易数据可以包括有关销售代表留给hcp哪些免费样品的数据。医药代表通常也可能需要在一个或多个crm系统中记录其交易活动。系统可以访问crm系统,并下载数据以用于处理。通过提取存储在数据内的相关字段并将数据包装为矩阵格式,系统可以将数据转换为对内特征信息。然后使用非线性方法(例如,如图3所示)分析产生的对内特征,以去除对内活动数据的影响。系统基于其估计的影响对对内特征进行排名。对内特征的排名基于各个对内特征的重要性或优势度。当针对经调整的销售数据拟合函数时,系统计算残差,可以对残差进行分析以确定是否由于对内活动的影响而存在任何混淆。可以图形化地分析残差。可以创建残差图,并且可以分析该图内的残差图案以确定附加混淆。在一些实施方式中,可以建立新的模型借而将残差作为新模型预测的目标。

接下来,系统读取和产生对外hcp数据。用于该步骤的数据可以包括事件数据和web访问数据。事件数据可以包括hcp与医药代表沟通后采取的对外动作。这些动作可能与医药代表讨论的产品或服务有关。web访问数据可以包括有关hcp参加的线上事件的信息。这些线上事件可以包括网络研讨会、会议、会谈、培训课程、线上博览会以及访问医药公司的网页。然后可以对所读取和产生的对外数据进行处理并转换为矩阵格式,以供系统分析。接下来,该方法可以使用对内处理阶段计算出的模型残差来估计对外效应的影响。该方法拟合对外特征与残差的函数以便考虑对外活动对hcp参与度的影响。在对这些影响进行去混淆后,系统可以创建考虑了对内和对外影响的hcp参与度模型,以便产生hcp参与度得分。

图7图示了去混淆对内活动影响的过程的视觉表示;图7示出了残差图710、直方图730和相对重要性图720。

相对重要性图720示出了协变量和对内特征对hcp参与度的相对贡献。例如,该图表中列出了30个协变量和对内特性。每个特征的相对重要性描述了每个特征对hcp参与度得分的影响大小。该数据是在使用随机森林模型对对内特征进行数据分析期间收集的。可以使用各种数据分析工具来构建相对重要性图。相对重要性的条形图可以通过例如随机森林代码来计算。相对重要性图720显示,具有最大相对重要性的对内特征i2导致了经调整的销售的大部分变化。其他协变量和对内特征的影响较微小。该图表显示,i2是导致残差结构的最重要的预测因子。残差图710示出了残差作为经调整的销售的函数。基于从对内处理阶段确定的残差创建该图。残差图显示残差呈椭圆形图案。如果用于将对内特征拟合到经调整的销售的函数已捕获所有的对内变量和协变量与经调整的销售之间的关系结构,则残差将不会显示出明显的图案。由于这些图显示的是椭圆形图案,所以表明残差中的信息可能与对外特征相关联。

直方图730示出了在补偿对内活动影响之后的残差。该图表示出了残差的分布。由于直方图显示的是结构(图案),因此表明残差中存在剩余信息,可以对其进行建模以捕获额外的对外影响。

图8a图示了已考虑对外活动影响后的hcp数据的视觉表示。图8a示出了残差图810和图表820,其示出了在去除对外活动影响的情况下经调整的销售与hes之间的关系。图8a的视觉表示显示,在去除混淆影响之后,hes和经调整的销售高度相关。这表明医药代表的针对性行为与药品和服务的销售之间存在密切的关系。

图820示出了在去除对内活动和对外活动产生的混淆的情况下,经调整的销售和医疗保健参与度得分之间的相关性图。可以看出,去除混淆因素后,医疗保健参与度与经调整的销售之间存在密切的相关性。图820示出了两个变量之间的密切线性关联。这种关联意味着去除混淆因素后,医药代表采取的动作与hcp参与度直接相关。

残差图810示出了系统已去除对内混淆影响和对外混淆影响两者后的残差。残差图810显示的图案比已去除对内影响但未去除对外影响之后的残差图710的图案弱。这表明混淆效果已被去除。残差中仍然存在双峰图案,表明数据中可能仍然存在一些混淆。造成混淆的原因可能是未知因素,如果系统访问导致这些因素的附加数据,则可以去除混淆。

图8b示出了用于减少对外活动和对内活动的方法的实际应用830。在图8b的示例中,在36个月的时间内从16,722个hcp收集数据。协变量是hcp水平的人口统计信息。对内变量是当月发送和访问的数量。对外变量是当月登录的数量。在区块水平汇总销售。结果显示,去除混淆影响后,hes与销售之间的相关性等于0.79。

计算机系统

本公开内容提供了被编程为实现本公开内容的方法的计算机系统。图9示出了被编程或以其他方式配置为执行数据共享和分析任务的计算机系统901。计算机系统901可以调节本公开的各个方面,例如存储hcp和医药代表的动作并执行机器学习分析。计算机系统901可以是用户的电子设备或相对于电子设备远程定位的计算机系统。电子设备可以是移动电子设备。

计算机系统901包括中央处理单元(cpu,本文也称为“处理器”和“计算机处理器”)905,其可以是单核或多核处理器或者用于并行处理的多个处理器。计算机系统901还包括存储器或存储位置910(例如,随机存取存储器、只读存储器、闪存)、电子存储单元915(例如,硬盘)、用于与一个或多个其他系统通信的通信接口920(例如,网络适配器)以及外围设备925(诸如缓存、其他存储器、数据存储或电子显示器适配器)。存储器910、存储单元915、接口920和外围设备925通过通信总线(实线)(诸如主板)与cpu905通信。存储单元915可以是用于存储数据的数据存储单元(或数据储库)。计算机系统901可以借助于通信接口920可操作地耦合至计算机网络(“网络”)930。网络930可以是因特网、互联网或外联网,或者与因特网通信的内联网或外联网。在一些情况下,网络930是电信或数据网络。网络930可以包括一个或多个计算机服务器,其可以实现分布式计算,诸如云计算。在一些情况下,借助于计算机系统901,网络930可以实现对等网络,其可以使耦合至计算机系统601的设备充当客户端或服务器。

cpu905可以执行一系列机器可读指令,其可以体现在程序或软件中。指令可以存储在存储位置(诸如存储器910)中。指令可以被导送到cpu905,其随后可以编程或以其他方式将cpu905配置为实现本公开内容的方法。由cpu905执行的操作的示例可以包括获取、解码、执行和写回。

cpu905可以是电路(诸如集成电路)的一部分。系统901的一个或多个其他组件可以包括在电路中。在一些情况下,电路是专用集成电路(asic)。

存储单元915可以存储文件,诸如驱动程序、库和已保存的程序。存储单元915可以存储用户数据,例如用户偏好和用户程序。在一些情况下,计算机系统901可以包括位于计算机系统901外部,诸如位于通过内联网或因特网与计算机系统901通信的远程服务器上的一个或多个附加的数据存储单元。

计算机系统901可以通过网络930与一个或多个远程计算机系统通信。例如,计算机系统901可以与用户的远程计算机系统通信。远程计算机系统的示例包括个人计算机(例如,便携式pc)、平板pc或平板计算机(例如,ipad、galaxytab)、电话、智能电话(例如,iphone、android使能性设备、)或个人数字助理。用户可以通过网络930访问计算机系统901。

本文所述的方法可以通过存储在计算机系统901的电子存储位置(例如,存储在存储器910或电子存储单元915上)的机器(例如,计算机处理器)可执行代码的方式来实现。机器可执行或机器可读代码可以以软件的形式提供。在使用期间,代码可以由处理器905执行。在一些情况下,可以从存储单元915检索代码并将其存储在存储器910中,以备供处理器605访问。在一些情况下,可以排除电子存储单元915,并且将机器可执行指令存储在存储器910中。

可以对代码进行预编译并将其配置为用于具有适用于执行该代码的处理器的机器,或者可以在运行时期间对代码进行编译。可以以可选择的编程语言提供代码,以使代码能够以预编译或实时编译的方式执行。

本文提供的系统和方法的方面(诸如计算机系统901)可以体现在编程中。可以将技术的各个方面视为“产品”或“制品”,其通常以被承载或体现在机器可读介质中的机器(或处理器)可执行代码或相关数据的形式。机器可执行代码可以存储在电子存储单元,诸如存储器(例如,只读存储器、随机存取存储器、闪存)或硬盘上。“存储”型介质可以包括计算机、处理器等的任何或所有有形存储器或其相关模块,诸如各种半导体存储器、磁带驱动器、磁盘驱动器等,其可以随时为软件编程提供非暂时性存储。软件的全部或部分有时可以通过因特网或其他各种电信网络进行通信。例如,这样的通信可以使得能够将软件从一个计算机或处理器加载到另一计算机或处理器中,例如,从管理服务器或主机计算机加载到应用服务器的计算机平台中。因此,可以承载软件元素的另一种介质包括例如通过有线和光纤陆线网络以及经各种空中链路在本地设备之间的物理接口上使用的光波、电波和电磁波。诸如有线或无线链路、光链路等载送这种波的物理元件也可以被视为承载软件的介质。如本文所用,除非限于非暂时性的有形“存储”介质,否则诸如计算机或机器“可读介质”的术语是指参与向处理器提供指令以供执行的任何介质。

因此,诸如计算机可执行代码的机器可读介质可以采取许多形式,包括但不限于有形存储介质、载波介质或物理传输介质。非易失性存储介质包括例如光盘或磁盘,诸如任何计算机中的任何存储设备等,诸如可用于实现附图中所示的数据库等。易失性存储介质包括动态存储器,诸如这种计算机平台的主存储器。有形传输介质包括同轴电缆;铜线和光纤,包括在计算机系统中包括总线的电线。载波传输介质可以采取诸如在射频(rf)和红外(ir)数据通信期间产生的电信号或电磁信号或声波或光波的形式。因此,计算机可读介质的常见形式包括例如:软盘、软磁盘、硬盘、磁带、任何其他磁性介质、cd-rom、dvd或dvd-rom、任何其他光学介质、穿孔卡纸带、任何其他具有孔图案的物理存储介质、ram、rom、prom和eprom、flash-eprom、任何其他存储芯片或盒式磁带、传输数据或指令的载波、传输此类载波的电缆或链路或者计算机可以从中读取编程代码或数据的任何其他介质。这些形式的计算机可读介质中的许多可能涉及将一个或多个指令的一个或多个序列载送给处理器以用于执行。

计算机系统901可以包括电子显示器935或与电子显示器935通信,该电子显示器935包括用于向医药代表提供例如推荐动作的用户界面(ui)940。ui的示例包括但不限于图形用户界面(gui)和基于web的用户界面。

本公开内容的方法和系统可以通过一个或多个算法来实现。算法可以通过由中央处理单元905执行的软件来实现。例如,算法可以是用于生成消息推荐的机器学习算法。

尽管已经在本文中示出和描述了本发明的优选实施方式,但是对于本领域技术人员而言显而易见的是,这些实施方式仅以示例的方式提供。在不脱离本发明的情况下,本领域技术人员现在将想到许多变化、改变和替换。应该理解,本文所述的本发明的实施方式的各种可替选方案可以用于实施本发明。旨在通过所附权利要求限定本发明的范围,并且由此涵盖这些权利要求范围内的方法和结构及其等同方案。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1