一种用于直播带货的模拟培训方法和系统与流程

文档序号：28299193发布日期：2021-12-31 23:32阅读：84来源：国知局

1.本技术涉及ai模拟技术领域，具体涉及一种用于直播带货的模拟培训方法和系统。

背景技术：

2.随着直播行业监管趋严，对主播、投手、运营人员的专业素养要求不断提高，主播的话术、动作、价值观导向等，都会受到平台及相关部门的监管，如果触发红线，直播间可能随时面临关停、下架商品等处罚，对品牌和mcn机构来说，都是不可挽回的损失，而智能培训系统，可以更有针对性地培养具有专业素养的直播团队。

技术实现要素：

3.为了解决上述技术问题，本发明提供了一种用于直播带货的模拟培训方法和系统。本发明所采用的技术方案如下：
4.一种用于直播带货的模拟培训系统，该系统包括直播数据采集模块、直播成效预测模块和直播成效归因模块；
5.所述直播数据采集模块用于采集和存储学员的历史直播数据、历史直播成效数据和实时直播数据；所述历史直播数据和历史直播成效数据用于生成直播样本数据，所述实时直播数据用于对学员的直播行为进行成效预测和分析；
6.所述直播成效预测模块采用rf随机森林回归算法，根据学员的所述直播样本数据进行训练，以生成直播成效预测模型；
7.所述直播成效归因模块采用lr逻辑回归算法，根据学员的所述直播样本数据进行训练，得到直播成效权重因子，并建立直播成效归因模型；
8.其中，所述直播成效预测模块基于训练好的直播成效预测模型，根据所述实时直播数据预测得到各个学员的直播成效预测数据；所述直播成效归因模块根据所述实时直播数据和所述直播成效预测数据，基于所述直播成效归因模型对各个学员的直播成效进行分析，确定各个学员需要提升的技能。
9.进一步的，所述学员包括以下多个类型：主播学员、投手学员和运营学员。
10.进一步的，所述直播成效预测模块根据不同的学员类型分别建立对应类型的直播成效预测模型，包括主播成效预测模型、投手成效预测模型和运营成效预测模型，并基于学员的类型调用对应类型的直播成效预测模型对学员的直播成效进行预测，得到学员的直播成效预测数据。
11.进一步的，所述直播成效归因模块根据不同的学员类型分别建立对应类型的直播成效归因模型，包括主播成效归因模型、投手成效归因模型和运营成效归因模型，并基于学员的类型调用对应类型的直播成效归因模型对学员的直播成效预测数据进行分析。。
12.进一步的，所述直播数据采集模块还用于将所述历史直播数据按照学员类型进行分类以用于训练所述直播成效预测模型和所述直播成效归因模型，以及将所述实时直播数
据按照学员id进行匹配得到各个学员的实时直播数据。
13.进一步的，所述历史直播成效数据和直播成效预测数据包括直播间成交金额和直播投流回报率。
14.进一步的，所述直播成效权重因子包括多个权重因子，分别对应于不同的学员技能。
15.进一步的，所述历史直播数据和实时直播数据包括投流数据、用户画像、品类标签、主播话术和直播互动中的一个或多个。
16.进一步的，还包括数据库模块，用于存储各个学员的基本信息、直播行为数据和评分数据，并与所述直播数据采集模块、直播成效预测模块和直播成效归因模块相关联，当生成新的直播数据、直播成效预测数据和/或直播成效归因数据时更新所述数据库模块中的学员数据。
17.一种用于直播带货的模拟培训方法，该方法包括：
18.采集和存储学员的历史直播数据、历史直播成效数据和实时直播数据；所述历史直播数据和历史直播成效数据用于生成直播样本数据，所述实时直播数据用于对学员的直播行为进行成效预测和分析；
19.采用rf随机森林回归算法，根据学员的所述直播样本数据进行训练，以生成直播成效预测模型；
20.采用lr逻辑回归算法，根据学员的所述直播样本数据进行训练，得到直播成效权重因子，并建立直播成效归因模型；
21.基于训练好的直播成效预测模型，根据所述实时直播数据预测得到各个学员的直播成效预测数据；
22.根据所述实时直播数据和所述直播成效预测数据，基于所述直播成效归因模型对各个学员的直播成效进行分析，确定各个学员需要提升的技能。
23.通过本技术实施例，可以获得如下技术效果：与现有技术相比，本技术能够有针对性提升专业技能，同时也关注不同学员、不同岗位之间的团队协作能力。
附图说明
24.为了更清楚地说明本技术实施例中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本技术的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。
25.图1a为模拟培训系统的总体框架示意图；
26.图1b为模拟培训系统功能划分示意图；
27.图2为rf随机森林回归训练的框架图；
28.图3为主播id库中的处理流程框图；
29.图4为投手id库中的处理流程框图；
30.图5为运营id库中的处理流程框图；
31.图6为模拟培训方法的流程示意图。
具体实施方式
32.为使本技术实施例的目的、技术方案和优点更加清楚，下面将结合本技术实施例中的附图，对本技术实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本技术一部分实施例，而不是全部的实施例。基于本技术中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的全部其他实施例，都属于本技术保护的范围。
33.图1a和图1b为模拟培训系统的总体框架以及功能划分示意图。该系统包括直播数据采集模块、直播成效预测模块、直播成效归因模块以及数据库模块。
34.所述直播数据采集模块用于采集和存储学员的历史直播数据、历史直播成效数据和实时直播数据；所述历史直播数据和历史直播成效数据用于生成直播样本数据，所述实时直播数据用于对学员的直播行为进行成效预测和分析；
35.所述直播成效预测模块采用rf随机森林回归算法，根据学员的所述直播样本数据进行训练，以生成直播成效预测模型；
36.所述直播成效归因模块采用lr逻辑回归算法，根据学员的所述直播样本数据进行训练，得到直播成效权重因子，并建立直播成效归因模型；
37.数据库模块，用于存储各个学员的基本信息、直播行为数据和评分数据，并与所述直播数据采集模块、直播成效预测模块和直播成效归因模块相关联，当生成新的直播数据、直播成效预测数据和/或直播成效归因数据时更新所述数据库模块中的学员数据；
38.其中，所述直播成效预测模块基于训练好的直播成效预测模型，根据所述实时直播数据预测得到各个学员的直播成效预测数据；所述直播成效归因模块根据所述实时直播数据和所述直播成效预测数据，基于所述直播成效归因模型对各个学员的直播成效进行分析，确定各个学员需要提升的技能。所述学员包括以下多个类型：主播学员、投手学员和运营学员。
39.所述直播成效预测模块根据不同的学员类型分别建立对应类型的直播成效预测模型，包括主播成效预测模型、投手成效预测模型和运营成效预测模型，并基于学员的类型调用对应类型的直播成效预测模型对学员的直播成效进行预测，得到学员的直播成效预测数据。
40.所述直播成效归因模块根据不同的学员类型分别建立对应类型的直播成效归因模型，包括主播成效归因模型、投手成效归因模型和运营成效归因模型，并基于学员的类型调用对应类型的直播成效归因模型对学员的直播成效预测数据进行分析。
41.所述直播数据采集模块还用于将所述历史直播数据按照学员类型进行分类以用于训练所述直播成效预测模型和所述直播成效归因模型，以及将所述实时直播数据按照学员id进行匹配得到各个学员的实时直播数据。
42.所述历史直播成效数据和直播成效预测数据包括直播间成交金额和直播投流回报率。所述直播成效权重因子包括多个权重因子，分别对应于不同的学员技能。所述历史直播数据和实时直播数据包括投流数据、用户画像、品类标签、主播话术和直播互动中的一个或多个。
43.从实现的功能上划分，该系统包括直播id库、主播id库、投手id库和运营id库共四个数据库；直播id库、主播id库、投手id库和运营id库之间依次连接；其中，所述直播id库包括历史数据、模拟数据、职责数据这3个表结构，在每个表结构中均以单场直播id作为索引；
各个数据库中的数据存储逻辑结构如下表所示。
[0044][0045]
所述投手id库、运营id库、主播id库中均包括基本信息、行为数据、评分数据这3个表结构。投手id库、运营id库、主播id库的数据存储逻辑结构如下表所示。
[0046][0047][0048][0049]
所述职责数据表结构中的投手id、运营id、主播id分别与相对应的投手id库、运营id库、主播id库相关联；当直播id库的数据发生变化，表明有新的直播培训数据进入，这3个库的数据也会相应发生联动变化，对每个学员的评分也随之改变，通过算法将其能力变化的趋势体现在他们个人的电子简历中，简历形成自动更新。
[0050]
下面将分别介绍各个数据库的功能：
[0051]
1)直播id库
[0052]
在直播id库中，根据所获取的学员直播行为的实时数据进行学员id匹配，将匹配结果保存至职责数据的表结构中，并同时输出至所述主播id库中；
[0053]
获取历史数据，并使用smote(synthetic minority oversampling technique合成少数过采样技术)将获取的所述历史数据生成直播样本数据，根据所述直播样本数据进行rf随机森林回归训练，以生成rf随机森林模型；
[0054]
获取的学员直播行为的实时数据，根据所获取的学员直播行为的实时数据，使用所述rf随机森林模型，获得预测直播成效gmv&roi(总成交金额&投流回报率)；
[0055]
将所述预测直播成效gmv&roi输出至所述主播id库；
[0056]
图2为rf随机森林回归训练的框架图。所述历史数据包括历史直播数据和历史成效数据，所述历史直播数据包括投流数据、用户画像、品类标签、主播话术以及直播互动；根
据历史直播数据和历史成效数据来训练rf随机森林模型。
[0057]
gmv为直播间广义成交金额，gmv＝销售额+取消订单金额+拒收订单金额+退货订单金额，roi为直播投流回报率，roi＝gmv/投流成本。
[0058]
在本技术中选择rf随机森林回归模型，是因为影响直播成效的因素众多，往往是多个因素的不同组合，影响了最终的直播成效，而rf随机森林可以自动生成多种因素的组合变量，并在此基础上预测直播成效，可以提高预测准确率。随机森林是决策树的集成，通常用bagging方法训练，即自举汇聚法(boost strap aggregating)或者样本有放回的训练。随机森林可以做分类，也可以做数值的回归预测，在本发明的技术方案中，我们做数值的回归预测。
[0059]
2)主播id库
[0060]
从所述主播id库的行为数据的表结构中获取数据并输入至经过训练的lr逻辑回归模型中，进行主播行为提升分析；将所述预测直播成效gmv&roi输出至所述投手id库；图3为主播id库中的处理流程框图。
[0061]
所述获取数据并输入至经过训练的lr逻辑回归模型中，具体包括：
[0062]
获取主播的模拟直播数据，所述主播的模拟直播数据包括已直播时长、直播品类、互动数据、表情截图以及语音数据，使用权重因子对所述主播的模拟直播数据进行加权，并将加权后的所述主播的模拟直播数据与所述预测直播成效gmv&roi一并输入至经过训练的lr逻辑回归模型中；
[0063]
所述使用权重因子对所述模拟直播数据进行加权，具体包括：
[0064]
将已直播时长转化为数值型数据并使用权重因子x1进行加权，将直播品类数据转化为类别标签数据并使用权重因子x2进行加权，将互动数据转化为数值型数据并使用权重因子x3进行加权，将表情截图通过实时表情识别算法处理以得到表情标签识别数据并使用权重因子x4进行加权，将语音数据通过n
‑
gram模型处理以得到发音吐字及流畅度分数并使用权重因子x5进行加权；
[0065]
其中，实时表情识别算法(emotion
‑
recognition)是一套已开源的表情识别算法，在本技术中可以识别主播的表情类别，从而形成实时的表情标签，标签数据可以用于直播成效算法建模，同时也用于对主播进行个人专业素养打分。
[0066]
n
‑
gram模型计算语义通顺度。先将主播的语音转成文字，再利用n
‑
gram模型计算语义通顺度，进而给主播的吐字发音及流畅度进行打分。
[0067]
所述进行主播行为提升分析，具体包括：进行业绩归因分析，找到主播需要提升的技能模块；
[0068]
所采用的lr逻辑回归模型(权重归因分析)如下：
[0069][0070]
其中，为预估的成效数据(如gmv或roi)，x为特征数据(如发音准确率)，h
w
()是对所有特征数据进行权重计算的函数，σ(
·
)为逻辑函数，将x特征矩阵转置后与w权重数据做乘积，并进行sigmod函数转换：
[0071]
[0072]
通过lr逻辑回归模型，我们可以将影响主播kpi的因素进行权重解析，如已直播时长(经验值)、直播品类(擅长领域)、互动数据(互动表现)、表情标签(表现力)、语音数据(发音及流利度)等，从而找到主播需要改进的方向，有针对性地进行提升。
[0073][0074][0075]
所述权重因子通过如下方式获得：
[0076]
获取主播的历史直播数据以及主播的历史直播成效gmv&roi，并输入至lr逻辑回归模型，以对所述lr逻辑回归模型进行训练，并得到权重因子x1、x2、x3、x4、x5；
[0077]
3)投手id库
[0078]
从所述投手id库的行为数据的表结构中获取数据并输入至经过训练的lr逻辑回归模型中，进行投手行为提升分析；将所述预测直播成效gmv&roi输出至所述运营id库；图4为投手id库中的处理流程框图。
[0079]
所述获取数据并输入至经过训练的lr逻辑回归模型中，具体包括：
[0080]
获取投手的模拟直播数据，所述投手的模拟直播数据包括投流人均成本、人群包数据、投流成效、投流次数，使用权重因子对所述投手的模拟直播数据进行加权，并将加权后的所述投手的模拟直播数据与所述预测直播成效gmv&roi一并输入至经过训练的lr逻辑回归模型中；
[0081]
所述使用权重因子对所述投手的模拟直播数据进行加权，具体包括：
[0082]
将投流人均成本转化为数值型数据并使用权重因子x1’进行加权，将人群包数据转化为类别标签数据并使用权重因子x2’进行加权，将投流成效转化为数值型数据并使用权重因子x3’进行加权，将投流次数转化为数值型数据并使用权重因子x4’进行加权；
[0083]
所述权重因子通过如下方式获得：
[0084]
获取投手的历史直播数据以及投手的历史直播成效gmv&roi，并输入至lr逻辑回归模型，以对所述lr逻辑回归模型进行训练，并得到权重因子x1’、x2’、x3’、x4’；
[0085]
所述进行投手行为提升分析，具体包括：进行业绩归因分析，找到投手需要提升的技能模块；
[0086]
通过lr逻辑回归模型，我们可以将影响投手kpi的因素进行权重解析，如投流人均成本(成本控制分)、人群包(洞察分)、投流成效(能力分)、投流次数(经验分)等，从而找到投手需要改进的方向，有针对性地进行提升。具体方法与主播id库的方式类似，在此不再给出具体示例，可参见主播id库的示例。
[0087]
4)运营id库
[0088]
从所述运营id库的行为数据的表结构中获取数据并输入至经过训练的lr逻辑回归模型中，进行运营行为提升分析；图5为运营id库中的处理流程框图。
[0089]
所述获取数据并输入至经过训练的lr逻辑回归模型中，具体包括：
[0090]
获取运营的模拟直播数据，所述运营的模拟直播数据包括选品品类、选品数量、爆款数量、商品差评率，使用权重因子对所述运营的模拟直播数据进行加权，并将加权后的所述运营的模拟直播数据与所述预测直播成效gmv&roi一并输入至经过训练的lr逻辑回归模型中；
[0091]
所述使用权重因子对所述运营的模拟直播数据进行加权，具体包括：
[0092]
将选品品类转化为类别标签数据并使用权重因子x1”进行加权，将选品数量转化为数值型数据并使用权重因子x2”进行加权，将爆款数量转化为数值型数据并使用权重因子x3”进行加权，将商品差评率进行dssm语义分类以获得“好评”或者“差评”数据并使用权重因子x4”进行加权；
[0093]
所述权重因子通过如下方式获得：
[0094]
获取运营的历史直播数据以及运营的历史直播成效gmv&roi，并输入至lr逻辑回归模型，以对所述lr逻辑回归模型进行训练，并得到权重因子x1”、x2”、x3”、x4”；
[0095]
所述进行运营行为提升分析，具体包括：进行业绩归因分析，找到运营需要提升的技能模块；
[0096]
通过lr逻辑回归模型，我们可以将影响运营同学kpi的因素进行权重解析，如选品品类(擅长领域)、选品数量(经验分)、爆款数量(洞察分)、商品差评率(能力分)等，从而找到运营同学需要改进的方向，有针对性地进行提升。具体方法与主播id库的方式类似，在此不再给出具体示例，可参见主播id库的示例。
[0097]
图6为模拟培训方法的流程示意图。该方法包括如下步骤：
[0098]
步骤1、采集和存储学员的历史直播数据、历史直播成效数据和实时直播数据；所述历史直播数据和历史直播成效数据用于生成直播样本数据，所述实时直播数据用于对学员的直播行为进行成效预测和分析；
[0099]
步骤2、采用rf随机森林回归算法，根据学员的所述直播样本数据进行训练，以生成直播成效预测模型；
[0100]
步骤3、采用lr逻辑回归算法，根据学员的所述直播样本数据进行训练，得到直播成效权重因子，并建立直播成效归因模型；
[0101]
步骤4、基于训练好的直播成效预测模型，根据所述实时直播数据预测得到各个学员的直播成效预测数据；
[0102]
步骤5、根据所述实时直播数据和所述直播成效预测数据，基于所述直播成效归因模型对各个学员的直播成效进行分析，确定各个学员需要提升的技能。
[0103]
通过上述方法能够有针对性提升专业技能，同时也关注不同学员、不同岗位之间的团队协作能力。
[0104]
在一些实施例中，计算机程序的部分或者全部可以经由rom而被载入和/或安装到设备上。当计算机程序加载并被执行时，可以执行上文描述的方法的一个或多个步骤。
[0105]
本技术中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如，非限制性地，可以使用的示范类型的硬件逻辑部件包括：场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、负载可编程逻辑设备(cpld)等等。
[0106]
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
[0107]
在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd
‑
rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
[0108]
此外，虽然采用特定次序描绘了各操作，但是这应当理解为要求这样操作以所示出的特定次序或以顺序次序执行，或者要求所有图示的操作应被执行以取得期望的结果。在一定环境下，多任务和并行处理可能是有利的。同样地，虽然在上面论述中包含了若干具体实现细节，但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实现中。相反地，在单个实现的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实现中。
[0109]
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题，但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反，上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：汤伟杰
技术所有人：上海乐项信息技术有限公司
我是此专利的发明人

上一篇：一种热交换自清洁式空压机热交换系统的制作方法
上一篇：一种电动搬运车的制作方法