一种基于人工智能的名单分配方法及相关设备与流程

文档序号：25484565发布日期：2021-06-15 21:45阅读：74来源：国知局

本申请涉及计算机
技术领域：
，具体涉及人工智能
技术领域：
，涉及一种基于人工智能的名单分配方法及相关设备，尤其涉及一种基于人工智能的名单分配方法，一种名单分配装置、一种名单分配设备以及一种计算机可读存储介质。
背景技术：
：企业拓展业务的两种途径分为线下代理人和线上电话坐席，线上电话坐席即由坐席根据用户画像模型筛选后的名单拨打用户电话，从而进行业务的沟通和介绍，来提高用户的购买意愿，最终促成交易。在实际电话拨打过程中，名单在不同坐席之间的分配会对业务营销的效果有所影响，因此找到名单与坐席之间的最优分配，可以使坐席进行更高效、更高质量的电话沟通，帮助企业了解用户偏好的接听体验，提高电话的拨打效率。传统对不同表现的坐席进行名单的分配，主要是由决策对象直接分配，效率低下，不够智能化。技术实现要素：本申请实施例提供了一种基于人工智能的名单分配方法及相关设备，有利于简单高效的实现对坐席的名单分配，提高名单分配的智能性。一方面，本申请实施例提供了一种基于人工智能的名单分配方法，该方法包括：获取训练数据集，所述训练数据集包括历史坐席的历史特征矩阵，以及所述历史坐席的对象分配决策，所述历史特征矩阵用于表征所述历史坐席的特征信息，所述对象分配决策用于表征决策对象依照所述特征信息对所述历史坐席所作出的分配行为；确定待进行模型训练对应的轮次，并获取所述轮次对应的模型决策函数；根据所述模型决策函数和所述训练数据集对分配模型进行训练，以更新分配模型的网络参数；确定下一次模型训练对应的新轮次，并依照所述新轮次更新所述模型决策函数；获取指定数量的新特征矩阵，以及各新特征矩阵对应的新对象分配决策，任一新对象分配决策用于表征决策对象依照对应的新特征矩阵所做出的分配行为；通过所述指定数量的新特征矩阵、所述各新特征矩阵对应的新对象分配决策以及所述训练数据集，构成新数据集；依照所述新数据集和更新后的模型决策函数，对网络参数更新后的分配模型进行新轮次的训练，以得到目标分配模型；接收名单分配请求，所述名单分配请求中携带有目标坐席的目标特征矩阵；调用所述目标分配模型对所述目标特征矩阵进行数据分析，确定针对所述目标坐席的目标预测分配决策，所述目标预测分配决策指示了向所述目标坐席分配目标名单。在一个实施例中，第j轮次的模型训练对应的模型决策函数为：其中，所述为第j轮次的模型训练对应的决策比例，所述表征第j轮次的模型训练，由分配模型学习得到的初始预测分配决策，所述表征第j轮次的模型训练，由决策对象决策得到的对象分配决策；第j轮次的模型训练过程中分配模型输出的最终预测分配决策与所述第j轮次的模型训练对应的模型决策函数关联。在一个实施例中，所述待进行模型训练对应的轮次为i，述待进行模型训练对应的轮次为i，所述新轮次为i+1，所述i为大于等于1的整数，当所述i为1时，为1，所述依照所述新轮次更新所述模型决策函数的具体实施方式为：按照降低所述i轮次对应的模型决策函数中决策比例的方向，更新所述i轮次对应的模型决策函数。在一个实施例中，所述历史坐席包括多个，所述根据所述模型决策函数和所述训练数据集对分配模型进行训练，以更新分配模型的网络参数的具体实施方式为：根据所述模型决策函数调用分配模型对所述训练数据集进行数据分析，确定针对多个历史坐席的预测分配决策；依照所述针对多个历史坐席的预测分配决策和所述对象分配决策，计算所述分配模型对应损失函数的值；按照所述损失函数的值下降的方向，更新所述分配模型的网络参数。在一个实施例中，所述预测分配决策指示了针对每一个历史坐席的分配行为，每一个历史坐席的分配行为包括存在名单分配的有效分配行为，或者不存在名单分配的无效分配行为，所述获取指定数量的新特征矩阵的具体实施方式为：解析所述多个历史坐席的预测分配决策，并依照解析结果从所述多个历史坐席中筛选存在有效分配行为的目标历史坐席；为所述目标历史坐席分配与对应有效分配行为匹配的目标名单，以便于所述目标历史坐席依照目标名单执行对应的目标业务；在检测到所述目标历史坐席执行完成所述目标业务后，获取指定数量的目标历史坐席的新特征信息；依照各新特征信息更新对应目标历史坐席的历史特征矩阵，得到指定数量的新特征矩阵。在一个实施例中，所述预测分配决策指示了针对每一个历史坐席的分配行为，每一个历史坐席的分配行为包括存在名单分配的有效分配行为，或者不存在名单分配的无效分配行为，所述获取指定数量的新特征矩阵的具体实施方式为：解析所述多个历史坐席的预测分配决策，并依照解析结果从所述多个历史坐席中筛选存在有效分配行为的目标历史坐席；为所述目标历史坐席分配与对应有效分配行为匹配的目标名单，以便于所述目标历史坐席依照目标名单执行对应的目标业务；在检测到所述目标历史坐席执行完成所述目标业务后，获取第一数量的目标历史坐席的新特征信息；依照各新特征信息更新对应目标历史坐席的历史特征矩阵，得到第一数量的新特征矩阵；获取第二数量的新坐席的特征矩阵，并根据所述第二数量的新坐席的特征矩阵和所述第一数量的新特征矩阵，确定指定数量的新特征矩阵。在一个实施例中，所述第j轮次的模型训练对应的模型决策函数为：其中，，表征第j轮次的模型训练对应新坐席的数量，表征第j轮次的模型训练对应在职坐席的数量，表征第j-1轮次模型训练对应在职坐席的数量，表征第j轮次的模型训练对应离职坐席的数量；为第j轮次的模型训练对应的决策比例，表征第j轮次的模型训练，由分配模型学习得到的初始预测分配决策，表征第j轮次的模型训练，由决策对象决策得到的对象分配决策；第j轮次的模型训练过程中分配模型输出的最终预测分配决策与所述第j轮次的模型训练对应的模型决策函数关联。另一方面，本申请实施例提供了一种名单分配装置，包括：训练模块，用于获取训练数据集，所述训练数据集包括历史坐席的历史特征矩阵，以及所述历史坐席的对象分配决策，所述历史特征矩阵用于表征所述历史坐席的特征信息，所述对象分配决策用于表征决策对象依照所述特征信息对所述历史坐席所作出的分配行为；所述训练模块，还用于确定待进行模型训练对应的轮次，并获取所述轮次对应的模型决策函数；所述训练模块，还用于根据所述模型决策函数和所述训练数据集对分配模型进行训练，以更新分配模型的网络参数；所述训练模块，还用于确定下一次模型训练对应的新轮次，并依照所述新轮次更新所述模型决策函数；所述训练模块，还用于获取指定数量的新特征矩阵，以及各新特征矩阵对应的新对象分配决策，任一新对象分配决策用于表征决策对象依照对应的新特征矩阵所做出的分配行为；所述训练模块，还用于通过所述指定数量的新特征矩阵、所述各新特征矩阵对应的新对象分配决策以及所述训练数据集，构成新数据集；所述训练模块，还用于依照所述新数据集和更新后的模型决策函数，对网络参数更新后的分配模型进行新轮次的训练，以得到目标分配模型；通信模块，用于接收名单分配请求，所述名单分配请求中携带有目标坐席的目标特征矩阵；处理模块，用于调用所述目标分配模型对所述目标特征矩阵进行数据分析，确定针对所述目标坐席的目标预测分配决策，所述目标预测分配决策指示了向所述目标坐席分配目标名单。再一方面，本申请实施例提供了一种名单分配设备，名单分配设备包括处理器、存储装置和通信接口，所述处理器、存储装置和通信接口相互连接，其中，所述存储装置用于存储支持名单分配设备执行上述方法的计算机程序，所述计算机程序包括程序指令，所述处理器被配置用于调用所述程序指令，执行如下步骤：获取训练数据集，所述训练数据集包括历史坐席的历史特征矩阵，以及所述历史坐席的对象分配决策，所述历史特征矩阵用于表征所述历史坐席的特征信息，所述对象分配决策用于表征决策对象依照所述特征信息对所述历史坐席所作出的分配行为；确定待进行模型训练对应的轮次，并获取所述轮次对应的模型决策函数；根据所述模型决策函数和所述训练数据集对分配模型进行训练，以更新分配模型的网络参数；确定下一次模型训练对应的新轮次，并依照所述新轮次更新所述模型决策函数；获取指定数量的新特征矩阵，以及各新特征矩阵对应的新对象分配决策，任一新对象分配决策用于表征决策对象依照对应的新特征矩阵所做出的分配行为；通过所述指定数量的新特征矩阵、所述各新特征矩阵对应的新对象分配决策以及所述训练数据集，构成新数据集；依照所述新数据集和更新后的模型决策函数，对网络参数更新后的分配模型进行新轮次的训练，以得到目标分配模型；接收名单分配请求，所述名单分配请求中携带有目标坐席的目标特征矩阵；调用所述目标分配模型对所述目标特征矩阵进行数据分析，确定针对所述目标坐席的目标预测分配决策，所述目标预测分配决策指示了向所述目标坐席分配目标名单。又一方面，本申请实施例提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序包括程序指令，所述程序指令当被处理器执行时使所述处理器执行上述基于人工智能的名单分配方法。本申请实施例中，可获取训练数据集，确定待进行模型训练对应的轮次，获取该轮次的模型训练对应的模型决策函数，根据模型决策函数和训练数据集对分配模型进行训练，以更新分配模型的网络参数。进一步地，确定下一次模型训练对应的新轮次，并依照新轮次更新模型决策函数，获取指定数量的新特征矩阵，以及各新特征矩阵对应的新对象分配决策，通过指定数量的新特征矩阵、各新特征矩阵对应的新对象分配决策以及训练数据集，构成新数据集。进一步地，依照新数据集和更新后的模型决策函数，对网络参数更新后的分配模型进行新轮次的训练，以得到目标分配模型，接收携带有目标坐席的目标特征矩阵的名单分配请求，调用目标分配模型对目标特征矩阵进行数据分析，确定针对目标坐席的目标预测分配决策。有利于提高对坐席进行名单分配的效率和智能性。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。图1是本申请实施例的一种基于人工智能的名单分配方法的流程示意图；图2是本申请实施例的另一种基于人工智能的名单分配方法的流程示意图；图3是本申请实施例的一种名单分配装置的结构示意图；图4是本申请实施例的一种名单分配设备的结构示意图。具体实施方式本申请实施例提出了一种基于人工智能的名单分配方法，该方法应用于名单分配设备，该名单分配设备可以指终端设备，例如智能手机、智能平板、台式计算机或笔记本计算机等，也可以指服务器，该服务器可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、cdn（contentdeliverynetwork，内容分发网络）、以及大数据和人工智能平台等基础云计算服务的云服务器。请参见图1，本申请实施例的所述方法包括如下步骤：s101：获取训练数据集。其中，该训练数据集包括历史坐席的历史特征矩阵，以及历史坐席的对象分配决策，历史特征矩阵用于表征历史坐席的特征信息，对象分配决策用于表征决策对象依照特征信息对历史坐席所作出的分配行为。示例性地，在对坐席进行分配名单的应用场景中，此处的决策对象可以为各坐席的管理人员，例如坐席队长或者其它人员。以历史坐席为第k位坐席为例，第k位坐席的历史特征矩阵可记为，表示第k位坐席的特征信息随时间（t-m时刻到t时刻内）变化的一个的矩阵：其中，矩阵中每一行表示第k位坐席在t时刻的n个特征信息，该特征信息分为两大类，一类是关于第k位坐席的个人信息，如坐席的年龄、性别、家庭收入等；另一类是关于该坐席的业务特征信息，如月均拨打电话通数，月均拨打电话时长，月均拨打电话成功率，月均收入保费等。矩阵中每一列表示每一种特征信息在时间t-m时刻至t时刻内的变化过程。第k位坐席的对象分配决策可记为，表示由决策对象在时间t-m到t内,在每个时刻对第k位坐席的分配行为，可以为：其中，可以指在t-m时刻向第k位坐席分配财富值为高的目标名单；可以指在t-m+1时刻向第k位坐席分配财富值为中的目标名单；指在t时刻向第k位坐席分配财富值为低的目标名单。其中，财富值高低判定，可以根据数据库中预先存储的用户的存款金额和理财行为等进行综合评判用户的财富值。s102：确定待进行模型训练对应的轮次，并获取该轮次的模型训练对应的模型决策函数。在一个实施例中，第j轮次的模型训练对应的模型决策函数为：式1.1其中，为第j轮次的模型训练对应的决策比例，表征第j轮次的模型训练，由分配模型学习得到的初始预测分配决策，表征第j轮次的模型训练，由决策对象决策得到的对象分配决策；第j轮次的模型训练过程中分配模型输出的最终预测分配决策与第j轮次的模型训练对应的模型决策函数关联。在本申请实施例中，第j轮次的模型训练过程中分配模型输出的最终预测分配决策与第j轮次的模型训练对应的模型决策函数关联。通过在分配模型的训练过程中，引入模型决策函数，可以更好的平衡决策对象的决策在模拟策略学习中的决定作用。具体实现中，分配模型在每轮次的迭代训练过程中均可以不断的更新决策比例。例如，在最初的几轮模型训练中，训练数据集中的数据相对较少，分配模型可能会出现较多的错误决策，这时可以增大决策对象的决策比率，例如，在第一轮次的训练模型时，可以选取=1，即模型初始的分配策略完全依据决策对象的决策，随着分配模型训练迭代的次数增多，分配模型开始拥有比较好的决策性能，此时可以按照权重逐渐降低的方式，更新每轮次的模型决策函数，降低训练过程中决策对象的决策（即上述对象分配决策）比率，加大分配模型自己学习的分配策略（即上述初始预测分配决策）的比率。在模型训练过程中，引入这样的模型决策函数可以使分配模型在训练后期更稳定，分配的效果和准确率更好。s103：根据模型决策函数和训练数据集对分配模型进行训练，以更新分配模型的网络参数。其中，上述名单分配模型可以为深度神经网络(deepneuralnetworks，dnn)，在第一次迭代训练过程中，可以直接使用由决策对象历史完成的策略相关数据（例如上述训练数据集）对dnn进行训练，更新dnn的网络参数。s104：确定下一次模型训练对应的新轮次，并依照新轮次更新模型决策函数。其中，假设待进行模型训练对应的轮次为i，那么新轮次为i+1，i为大于等于1的整数，当i为1时，为1，上述依照新轮次更新模型决策函数的具体方式为：按照降低i轮次对应的模型决策函数中决策比例的方向，更新i轮次对应的模型决策函数，从而得到i+1轮次对应的模型决策函数，该i+1轮次对应的模型决策函数为：式1.2s105：获取指定数量的新特征矩阵，以及各新特征矩阵对应的新对象分配决策，任一新对象分配决策用于表征决策对象依照对应的新特征矩阵所做出的分配行为。s106：通过指定数量的新特征矩阵、各新特征矩阵对应的新对象分配决策以及训练数据集，构成新数据集。在对分配模型的训练过程中，每一轮次的训练结束后，可以筛选出指定数量的新特征矩阵，由决策对象给出对的新对象分配决策，通过新特征矩阵、新对象分配决策和当前轮次训练时输入的训练数据集构成下一轮次模型训练所需的新数据集。示例性地，以i为1为例，第一轮次迭代训练输入的训练数据集记为d1，第一次迭代训练后，可以筛选出指定数量的新特征矩阵，由决策对象给出对的新对象分配决策，构建出第一轮次迭代训练对应的决策数据集合。进一步地，可以将与第一迭代训练输入的训练数据集d1聚合，得到第二轮次迭代训练所需的新数据集d2，d2=d1。s107：依照新数据集和更新后的模型决策函数，对网络参数更新后的分配模型进行新轮次的训练，以得到目标分配模型。在一个实施例中，可以依照新数据集和更新后的模型决策函数，对网络参数更新后的分配模型进行新轮次的训练，再次更新分配模型的网络参数，并依照上述步骤s104~步骤s107相似地方式进行对再次更新的分配模型进行又一轮次的迭代训练，直至名单分配模型达到收敛状态，则停止训练，得到目标名单分配模型。其中，名单分配模型达到收敛状态是指名单分配模型所输出的预测分配策略（可以理解为模型输出的分配决策结果）达到收敛。由上述内容可知，本方案在分配模型的每次迭代训练中，均会更新上一次训练所采用的训练数据集，在下次迭代训练过程中，重新在整个更新后的训练数据集上训练名单分配模型，且每一次训练所使用的新数据集均包括上一轮次训练输入的训练集，使得模型训练过程中保存了所有数据的历史决策信息，因此可以对每轮次新加入坐席的特征矩阵有较好的分配效果，有利于提高分配模型输出结果的准确度。s108：接收名单分配请求，名单分配请求中携带有目标坐席的目标特征矩阵。s109：调用目标分配模型对目标特征矩阵进行数据分析，确定针对目标坐席的目标预测分配决策，该目标预测分配决策指示了向目标坐席分配目标名单。在一个实施例中，本申请实施例中的名单分配设备可以指名单分配平台对应的后台服务器，这种情况，当用户存在名单分配需求时，可以通过登录名单分配平台，在名单分配平台中输入目标坐席的特征信息，在用户输入完成后，可以触发名单分配平台根据该目标坐席的特征信息生成目标坐席的目标特征矩阵，将该目标特征矩阵加入名单分配请求，并向后台服务器发送携带有目标坐席的目标特征矩阵的名单分配请求。进一步地，后台服务器接收到该名单分配请求后，可以调用目标分配模型对目标特征矩阵进行数据分析，确定针对目标坐席的目标预测分配决策。该目标预测分配决策指示了向目标坐席分配目标名单，例如目标预测分配决策指示了向目标坐席分配财富值最高的名单。进一步地，后台服务器确定针对目标坐席的目标预测分配决策之后，还可以直接执行与目标预测分配决策匹配的分配行为，例如，目标预测分配决策指示了向目标坐席分配财富值最高的名单，那么，后台服务器执行的分配行为可以为：将财富值最高的名单分配给目标坐席。或者，在另一个实施例中，本申请实施例中的名单分配设备可以指上述名单分配平台本身，或者运行有该名单分配平台的终端设备。终端设备如何执行步骤s108~步骤s109可以参见上述后台服务器的执行步骤，此处不再赘述。通过上述内容可知，本申请实施例一方面，在模型训练过程中，每一次新轮次模型训练所使用的新数据集均包括上一轮次训练所使用的训练数据集，可以使得模型在训练过程中，保存所有的历史对象决策信息，可以对每轮次新加入的坐席的特征矩阵有很好的分配效果，提高模型训练的效率，即便是在训练数据量较少的情况下，也可以根据少量的迭代训练，使得模型具有良好的分配效果。这样的训练方式，尤其适用于针对坐席的名单分配场景，在名单分配的实际过程中，决策对象分配名单的频率约为一月一次，频率不高，收集的有效数据有限，如果采用普通的模型训练方式，一般在训练模型时需要大量的训练数据，训练数据有限的情况下，根本无法保证模型最终的分配效果。另一方面，在每一个新轮次模型训练时，均会加入新对象决策信息，以及每一个新轮次的训练，均会考虑决策对象当前引入的分配决策，那么，依照此种方式训练得到的目标分配模型，后续在实际应用过程中，遇到外界因素的影响，例如受到节日、人力约束、公司发展策略等的影响，分配策略相比之前需要进行重大调整，那么就可以由决策对象依照该影响重新进行分配决策，并依照重新作出的分配决策对模型进行训练，可以使得该模型可以快速的适应外界因素的影响，灵活性更强。本申请实施例中，可获取训练数据集，确定待进行模型训练对应的轮次，获取所述轮次的模型训练对应的模型决策函数，根据模型决策函数和训练数据集对分配模型进行训练，以更新分配模型的网络参数。进一步地，确定下一次模型训练对应的新轮次，并依照新轮次更新模型决策函数，获取指定数量的新特征矩阵，以及各新特征矩阵对应的新对象分配决策，通过指定数量的新特征矩阵、各新特征矩阵对应的新对象分配决策以及训练数据集，构成新数据集。进一步地，依照新数据集和更新后的模型决策函数，对网络参数更新后的分配模型进行新轮次的训练，以得到目标分配模型，接收携带有目标坐席的目标特征矩阵的名单分配请求，调用目标分配模型对目标特征矩阵进行数据分析，确定针对目标坐席的目标预测分配决策。有利于提高对坐席进行名单分配的效率和智能性。再请参见图2，是本申请实施例的另一种基于人工智能的名单分配方法，该基于人工智能的名单分配方法由上述名单分配设备执行，请参见图2，本申请实施例的所述方法包括如下步骤。s201：获取训练数据集，确定待进行模型训练对应的轮次，并获取该轮次的模型训练对应的模型决策函数。s202：根据模型决策函数调用分配模型对训练数据集进行数据分析，确定针对多个历史坐席的预测分配决策。s203：依照针对多个历史坐席的预测分配决策和对象分配决策，计算分配模型对应损失函数的值。s204：按照损失函数的值下降的方向，更新分配模型的网络参数。s205：确定下一次模型训练对应的新轮次，并依照新轮次更新模型决策函数，获取指定数量的新特征矩阵，以及各新特征矩阵对应的新对象分配决策。其中，上述指定数量的新特征矩阵的获取方式包括：第一种，人为获取，具体地，可由用户手动录入指定数量的坐席的新特征矩阵；第二种、自动化获取。在一个实施例中，步骤s202中的预测分配决策指示了针对每一个历史坐席的分配行为，每一个历史坐席的分配行为包括存在名单分配的有效分配行为，或者不存在名单分配的无效分配行为，这种情况下，获取指定数量的新特征矩阵的具体方式（即上述提及的自动化获取方式）包括：解析多个历史坐席的预测分配决策，并依照解析结果从多个历史坐席中筛选存在有效分配行为的目标历史坐席。进一步地，为目标历史坐席分配与对应有效分配行为匹配的目标名单，以便于目标历史坐席依照目标名单执行对应的目标业务。进一步地，在检测到目标历史坐席执行完成目标业务后，获取指定数量的目标历史坐席的新特征信息，依照各新特征信息更新对应目标历史坐席的历史特征矩阵，得到指定数量的新特征矩阵。采用这样的方式，可以充分利用现有的有限名单分配的数据，在数据量较少时，通过少量的迭代也会有良好的效果，为不同特征的坐席提供最优的名单分配策略。示例性地，假设上述指定数量为2，上述多个历史坐席包括第一坐席、第二坐席、第三坐席和第四坐席，预测分配决策所指示的对每一个历史坐席的分配行为如表1所示。这种情况下，第一坐席、第二坐席和第三坐席则均为存在有效分配行为的目标历史坐席，第四坐席为存在无效分配行为的目标历史坐席。进一步地，可向第一坐席分配财富值为高的名单（即第一坐席对应的目标名单），向第二坐席分配财富值为中的名单（即第二坐席对应的目标名单），向第三坐席分配财富值为低的名单（即第三坐席对应的目标名单），当每一位目标历史坐席依照该分配行为执行对应的目标业务（例如给分配到自身的名单中的用户打电话）后，那么每一位目标历史坐席的特征信息均会产生变化（例如月均拨打电话通数，月均拨打电话时长，月均拨打电话成功率，月均收入保费等等）。相应地，名单分配设备在检测到第一坐席、第二坐席和第三坐席均执行完成各自对应的目标业务后，可以从第一坐席、第二坐席和第三坐席中随机获取2个目标历史坐席（例如第一坐席和第二坐席；第一坐席和第三坐席；或者第二坐席和第三坐席）的新特征信息，从而得到3个新特征矩阵。表1历史坐席分配行为第一坐席向其分配财富值为高的名单第二坐席向其分配财富值为中的名单第三坐席向其分配财富值为低的名单第四坐席不存在名单分配通过上述内容可知，在获取指定数量的新特征矩阵时，并未考虑每个坐席的在职状态，为了使得所训练得到的目标分配模型输出结果更加准确，可以对上述性特征矩阵的获取方式进行进一步地优化。具体地，可以结合每个坐席的在职状态，对于历史坐席而言包括当前在职的坐席，以及当前已经离职的坐席，除此以外，还可以考虑当前新入职的坐席，本申请实施例中称为新坐席。这种情况下，上述获取指定数量的新特征矩阵的具体实施方式包括：解析多个历史坐席的预测分配决策，并依照解析结果从多个历史坐席中筛选存在有效分配行为的目标历史坐席。进一步地，为目标历史坐席分配与对应有效分配行为匹配的目标名单，以便于目标历史坐席依照目标名单执行对应的目标业务。在检测到目标历史坐席执行完成目标业务后，获取第一数量的目标历史坐席的新特征信息，依照各新特征信息更新对应目标历史坐席的历史特征矩阵，得到第一数量的新特征矩阵。进一步地，获取第二数量的新坐席的特征矩阵，并根据第二数量的新坐席的特征矩阵和第一数量的新特征矩阵，确定指定数量的新特征矩阵。其中，上述指定数量、第一数量和第二数量均是根据实验测算数据预先设置的，后续可根据实际需求进行调整。示例性地，假设指定数量为3，第一数量为2，第二数量为1，那么可以获取2个目标历史坐席的特征矩阵以及1个新坐席的特征矩阵，由2个目标历史坐席的特征矩阵和1个新坐席的特征矩阵，作为3个新特征矩阵。由于上述新一轮迭代训练时输入的新特征矩阵考虑了坐席离职和入职的情况，那么，为了结合坐席的流动情况，提高分配模型的准确度。可以对上述模型决策函数进行优化，将模型决策函数与坐席流动策略关联，以第j轮次对应的模型策略函数为例，优化后的第j轮次的模型训练对应的模型决策函数为：式1.3其中，，表征第j轮次的模型训练对应新坐席的数量，表征第j轮次的模型训练对应在职坐席的数量，表征第j-1轮次模型训练对应在职坐席的数量，表征第j轮次的模型训练对应离职坐席的数量；为第j轮次的模型训练对应的决策比例，表征第j轮次的模型训练，由分配模型学习得到的初始预测分配决策，表征第j轮次的模型训练，由决策对象决策得到的对象分配决策；第j轮次的模型训练过程中分配模型输出的最终预测分配决策与所述第j轮次的模型训练对应的模型决策函数关联。s206：通过指定数量的新特征矩阵、各新特征矩阵对应的新对象分配决策以及训练数据集，构成新数据集，依照新数据集和更新后的模型决策函数，对网络参数更新后的分配模型进行新轮次的训练，以得到目标分配模型。s207：接收携带有目标坐席的目标特征矩阵的名单分配请求，并调用目标分配模型对目标特征矩阵进行数据分析，确定针对目标坐席的目标预测分配决策。其中，步骤s206~步骤s207的具体实施方式可参见上述实施例中针对步骤s106~步骤s109的相关描述，此处不再赘述。本申请实施例还提供了一种计算机存储介质，该计算机存储介质中存储有程序指令，该程序指令被执行时，用于实现上述实施例中描述的相应方法。再请参见图3，是本申请实施例的一种名单分配装置的结构示意图，该名单分配装置设置于名单分配设备，所述名单分配装置包括训练模块30、通信模块31和处理模块32。本申请实施例的所述装置的一个实现方式中，所述装置包括如下结构。训练模块30，用于获取训练数据集，所述训练数据集包括历史坐席的历史特征矩阵，以及所述历史坐席的对象分配决策，所述历史特征矩阵用于表征所述历史坐席的特征信息，所述对象分配决策用于表征决策对象依照所述特征信息对所述历史坐席所作出的分配行为；所述训练模块30，还用于确定待进行模型训练对应的轮次，并获取所述轮次对应的模型决策函数；所述训练模块30，还用于根据所述模型决策函数和所述训练数据集对分配模型进行训练，以更新分配模型的网络参数；所述训练模块30，还用于确定下一次模型训练对应的新轮次，并依照所述新轮次更新所述模型决策函数；所述训练模块30，还用于获取指定数量的新特征矩阵，以及各新特征矩阵对应的新对象分配决策，任一新对象分配决策用于表征决策对象依照对应的新特征矩阵所做出的分配行为；所述训练模块30，还用于通过所述指定数量的新特征矩阵、所述各新特征矩阵对应的新对象分配决策以及所述训练数据集，构成新数据集；所述训练模块30，还用于依照所述新数据集和更新后的模型决策函数，对网络参数更新后的分配模型进行新轮次的训练，以得到目标分配模型；通信模块31，用于接收名单分配请求，所述名单分配请求中携带有目标坐席的目标特征矩阵；处理模块32，用于调用所述目标分配模型对所述目标特征矩阵进行数据分析，确定针对所述目标坐席的目标预测分配决策，所述目标预测分配决策指示了向所述目标坐席分配目标名单。在一个实施例中，第j轮次的模型训练对应的模型决策函数为：其中，所述为第j轮次的模型训练对应的决策比例，所述表征第j轮次的模型训练，由分配模型学习得到的初始预测分配决策，所述表征第j轮次的模型训练，由决策对象决策得到的对象分配决策；第j轮次的模型训练过程中分配模型输出的最终预测分配决策与所述第j轮次的模型训练对应的模型决策函数关联。在一个实施例中，所述待进行模型训练对应的轮次为i，所述新轮次为i+1，所述i为大于等于1的整数，当所述i为1时，为1，所述训练模块30，具体用于：按照降低所述i轮次对应的模型决策函数中决策比例的方向，更新所述i轮次对应的模型决策函数。在一个实施例中，所述历史坐席包括多个，所述训练模块30，还具体用于：根据所述模型决策函数调用分配模型对所述训练数据集进行数据分析，确定针对多个历史坐席的预测分配决策；依照所述针对多个历史坐席的预测分配决策和所述对象分配决策，计算所述分配模型对应损失函数的值；按照所述损失函数的值下降的方向，更新所述分配模型的网络参数。在一个实施例中，所述预测分配决策指示了针对每一个历史坐席的分配行为，每一个历史坐席的分配行为包括存在名单分配的有效分配行为，或者不存在名单分配的无效分配行为，所述训练模块30，还具体用于：解析所述多个历史坐席的预测分配决策，并依照解析结果从所述多个历史坐席中筛选存在有效分配行为的目标历史坐席；为所述目标历史坐席分配与对应有效分配行为匹配的目标名单，以便于所述目标历史坐席依照目标名单执行对应的目标业务；在检测到所述目标历史坐席执行完成所述目标业务后，获取指定数量的目标历史坐席的新特征信息；依照各新特征信息更新对应目标历史坐席的历史特征矩阵，得到指定数量的新特征矩阵。在一个实施例中，所述预测分配决策指示了针对每一个历史坐席的分配行为，每一个历史坐席的分配行为包括存在名单分配的有效分配行为，或者不存在名单分配的无效分配行为，所述训练模块30，还具体用于：解析所述多个历史坐席的预测分配决策，并依照解析结果从所述多个历史坐席中筛选存在有效分配行为的目标历史坐席；为所述目标历史坐席分配与对应有效分配行为匹配的目标名单，以便于所述目标历史坐席依照目标名单执行对应的目标业务；在检测到所述目标历史坐席执行完成所述目标业务后，获取第一数量的目标历史坐席的新特征信息；依照各新特征信息更新对应目标历史坐席的历史特征矩阵，得到第一数量的新特征矩阵；获取第二数量的新坐席的特征矩阵，并根据所述第二数量的新坐席的特征矩阵和所述第一数量的新特征矩阵，确定指定数量的新特征矩阵。在一个实施例中，所述第j轮次的模型训练对应的模型决策函数为：其中，，表征第j轮次的模型训练对应新坐席的数量，表征第j轮次的模型训练对应在职坐席的数量，表征第j-1轮次模型训练对应在职坐席的数量，表征第j轮次的模型训练对应离职坐席的数量；为第j轮次的模型训练对应的决策比例，表征第j轮次的模型训练，由分配模型学习得到的初始预测分配决策，表征第j轮次的模型训练，由决策对象决策得到的对象分配决策；第j轮次的模型训练过程中分配模型输出的最终预测分配决策与所述第j轮次的模型训练对应的模型决策函数关联。在本申请实施例中，上述各个模块的具体实现可参考前述各个附图所对应的实施例中相关内容的描述。本申请实施例中，名单分配装置可获取训练数据集，确定待进行模型训练对应的轮次，获取该轮次的模型训练对应的模型决策函数，根据模型决策函数和训练数据集对分配模型进行训练，以更新分配模型的网络参数。进一步地，确定下一次模型训练对应的新轮次，并依照新轮次更新模型决策函数，获取指定数量的新特征矩阵，以及各新特征矩阵对应的新对象分配决策，通过指定数量的新特征矩阵、各新特征矩阵对应的新对象分配决策以及训练数据集，构成新数据集。进一步地，依照新数据集和更新后的模型决策函数，对网络参数更新后的分配模型进行新轮次的训练，以得到目标分配模型，接收携带有目标坐席的目标特征矩阵的名单分配请求，调用目标分配模型对目标特征矩阵进行数据分析，确定针对目标坐席的目标预测分配决策。有利于提高对坐席进行名单分配的效率和智能性。再请参见图4，是本申请实施例的一种名单分配设备的结构示意图，本申请实施例的所述名单分配设备包括供电模块等结构，并包括处理器601、存储装置602以及通信接口603。所述处理器601、存储装置602以及通信接口603之间可以交互数据，由处理器601实现相应的名单分配功能。所述存储装置602可以包括易失性存储器（volatilememory），例如随机存取存储器（random-accessmemory，ram）；存储装置602也可以包括非易失性存储器（non-volatilememory），例如快闪存储器（flashmemory），固态硬盘（solid-statedrive，ssd）等；所述存储装置602还可以包括上述种类的存储器的组合。所述处理器601可以是中央处理器601（centralprocessingunit，cpu）。在一个实施例中，所述处理器601还可以是图形处理器601（graphicsprocessingunit，gpu）。所述处理器601也可以是由cpu和gpu的组合。在所述名单分配设备中，可以根据需要包括多个cpu和gpu进行相应的名单分配。在一个实施例中，所述存储装置602用于存储程序指令。所述处理器601可以调用所述程序指令，实现如本申请实施例中上述涉及的各种方法。在第一个可能的实施方式中，所述名单分配设备的所述处理器601，调用所述存储装置602中存储的程序指令，用于获取训练数据集，所述训练数据集包括历史坐席的历史特征矩阵，以及所述历史坐席的对象分配决策，所述历史特征矩阵用于表征所述历史坐席的特征信息，所述对象分配决策用于表征决策对象依照所述特征信息对所述历史坐席所作出的分配行为；确定待进行模型训练对应的轮次，并获取所述轮次的模型训练对应的模型决策函数；根据所述模型决策函数和所述训练数据集对分配模型进行训练，以更新分配模型的网络参数；确定下一次模型训练对应的新轮次，并依照所述新轮次更新所述模型决策函数；获取指定数量的新特征矩阵，以及各新特征矩阵对应的新对象分配决策，任一新对象分配决策用于表征决策对象依照对应的新特征矩阵所做出的分配行为；通过所述指定数量的新特征矩阵、所述各新特征矩阵对应的新对象分配决策以及所述训练数据集，构成新数据集；依照所述新数据集和更新后的模型决策函数，对网络参数更新后的分配模型进行新轮次的训练，以得到目标分配模型；通过通信接口603接收名单分配请求，所述名单分配请求中携带有目标坐席的目标特征矩阵；调用所述目标分配模型对所述目标特征矩阵进行数据分析，确定针对所述目标坐席的目标预测分配决策，所述目标预测分配决策指示了向所述目标坐席分配目标名单。在一个实施例中，第j轮次的模型训练对应的模型决策函数为：其中，所述为第j轮次的模型训练对应的决策比例，所述表征第j轮次的模型训练，由分配模型学习得到的初始预测分配决策，所述表征第j轮次的模型训练，由决策对象决策得到的对象分配决策；第j轮次的模型训练过程中分配模型输出的最终预测分配决策与所述第j轮次的模型训练对应的模型决策函数关联。在一个实施例中，所述待进行模型训练对应的轮次为i，所述新轮次为i+1，所述i为大于等于1的整数，当所述i为1时，为1，所述处理器601，具体用于：按照降低所述i轮次对应的模型决策函数中决策比例的方向，更新所述i轮次对应的模型决策函数。在一个实施例中，所述历史坐席包括多个，所述处理器601，还具体用于：根据所述模型决策函数调用分配模型对所述训练数据集进行数据分析，确定针对多个历史坐席的预测分配决策；依照所述针对多个历史坐席的预测分配决策和所述对象分配决策，计算所述分配模型对应损失函数的值；按照所述损失函数的值下降的方向，更新所述分配模型的网络参数。在一个实施例中，所述预测分配决策指示了针对每一个历史坐席的分配行为，每一个历史坐席的分配行为包括存在名单分配的有效分配行为，或者不存在名单分配的无效分配行为，所述处理器601，还具体用于：解析所述多个历史坐席的预测分配决策，并依照解析结果从所述多个历史坐席中筛选存在有效分配行为的目标历史坐席；为所述目标历史坐席分配与对应有效分配行为匹配的目标名单，以便于所述目标历史坐席依照目标名单执行对应的目标业务；在检测到所述目标历史坐席执行完成所述目标业务后，获取指定数量的目标历史坐席的新特征信息；依照各新特征信息更新对应目标历史坐席的历史特征矩阵，得到指定数量的新特征矩阵。在一个实施例中，所述预测分配决策指示了针对每一个历史坐席的分配行为，每一个历史坐席的分配行为包括存在名单分配的有效分配行为，或者不存在名单分配的无效分配行为，所述处理器601，还具体用于：解析所述多个历史坐席的预测分配决策，并依照解析结果从所述多个历史坐席中筛选存在有效分配行为的目标历史坐席；为所述目标历史坐席分配与对应有效分配行为匹配的目标名单，以便于所述目标历史坐席依照目标名单执行对应的目标业务；在检测到所述目标历史坐席执行完成所述目标业务后，获取第一数量的目标历史坐席的新特征信息；依照各新特征信息更新对应目标历史坐席的历史特征矩阵，得到第一数量的新特征矩阵；获取第二数量的新坐席的特征矩阵，并根据所述第二数量的新坐席的特征矩阵和所述第一数量的新特征矩阵，确定指定数量的新特征矩阵。在一个实施例中，所述第j轮次的模型训练对应的模型决策函数为：其中，，表征第j轮次的模型训练对应新坐席的数量，表征第j轮次的模型训练对应在职坐席的数量，表征第j-1轮次模型训练对应在职坐席的数量，表征第j轮次的模型训练对应离职坐席的数量；为第j轮次的模型训练对应的决策比例，表征第j轮次的模型训练，由分配模型学习得到的初始预测分配决策，表征第j轮次的模型训练，由决策对象决策得到的对象分配决策；第j轮次的模型训练过程中分配模型输出的最终预测分配决策与所述第j轮次的模型训练对应的模型决策函数关联。本申请实施例中，名单分配设备可获取训练数据集，确定待进行模型训练对应的轮次，获取该轮次的模型训练对应的模型决策函数，根据模型决策函数和训练数据集对分配模型进行训练，以更新分配模型的网络参数。进一步地，确定下一次模型训练对应的新轮次，并依照新轮次更新模型决策函数，获取指定数量的新特征矩阵，以及各新特征矩阵对应的新对象分配决策，通过指定数量的新特征矩阵、各新特征矩阵对应的新对象分配决策以及训练数据集，构成新数据集。进一步地，依照新数据集和更新后的模型决策函数，对网络参数更新后的分配模型进行新轮次的训练，以得到目标分配模型，接收携带有目标坐席的目标特征矩阵的名单分配请求，调用目标分配模型对目标特征矩阵进行数据分析，确定针对目标坐席的目标预测分配决策。有利于提高对坐席进行名单分配的效率和智能性。其中，本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(blockchain)，本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了一批次网络交易的信息，用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体（read-onlymemory，rom）或随机存储记忆体（randomaccessmemory，ram）等。以上所揭露的仅为本申请的部分实施例而已，当然不能以此来限定本申请之权利范围，本领域普通技术人员可以理解实现上述实施例的全部或部分流程，并依本申请权利要求所作的等同变化，仍属于本申请所涵盖的范围。当前第1页12

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：夏婧;吴振宇;王建明
技术所有人：平安科技(深圳)有限公司
我是此专利的发明人

上一篇：一种用于易燃易爆物品运输降温防火装置的制作方法
上一篇：一种轨道结构的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。