本技术涉及数据处理,特别是涉及一种用户识别方法、装置、设备、存储介质和程序产品。
背景技术:
1、挖掘出潜在用户并将其转化为平台用户这个过程被称之为拉新,其是提高平台用户数量的有效手段。在拉新过程中,往往会采用一些干预策略,如发送短信、app(application,应用程序)的推送消息、打电话、发优惠券等。通常一部分潜在用户本身就对平台有较大需求且对平台品牌有认知,即使在平台不采用干预策略的情况下,也会大概率自己转化成平台用户,这种称之为自然转化用户;而与之相反,另一部分潜在用户是只有当平台采用干预策略时,才能将其转化成平台用户,这种称之为干预转化用户。对于平台而言,干预策略往往需要消耗一定的成本,如发短信的通信费等,因此,准确的识别出潜在用户且是干预转化用户是有必要的。
2、传统技术中,用大量平台用户数据训练神经网络模型,然后用训练好的神经网络模型识别干预转化用户,其中平台用户数据包括干预转化用户数据。
3、但是,干预转化用户数据中的用户往往是不能完全确定其是干预转化用户,因为用户收到短信转化为平台用户,不代表用户未收到短信就不会转化为平台用户,所以,传统技术中训练得到神经网络模型识别干预转化用户的准确性较低。
技术实现思路
1、基于此,有必要针对上述技术问题,提供一种能够提高干预转化用户识别准确性的用户识别方法、装置、设备、存储介质和程序产品。
2、第一方面,本技术提供了一种用户识别方法。该方法包括:获取目标用户的用户数据;将用户数据输入至预先训练的用户识别模型中,得到用户识别模型输出的识别结果;根据识别结果确定目标用户是否为干预转化用户;其中,用户识别模型是根据用户拉新业务的因果推断数据训练得到的。
3、在其中一个实施例中,因果推断数据包括观测数据和随机数据,用户识别模型的训练方法包括:根据观测数据对初始神经网络模型进行预训练,得到预训练神经网络模型,并根据随机数据对预训练神经网络模型进行精调训练,得到精调神经网络模型;根据精调神经网络模型得到用户识别模型。
4、在其中一个实施例中,根据观测数据对初始神经网络模型进行预训练,得到预训练神经网络模型,并根据随机数据对预训练神经网络模型进行精调训练,得到精调神经网络模型,包括:将观测数据分别输入至训练好的第一树模型和第二树模型中,通过第一树模型和第二树模型进行特征提取得到观测特征;将随机数据分别输入至第一树模型和第二树模型中,通过第一树模型和第二树模型进行特征提取得到随机特征;根据观测特征对初始神经网络模型进行预训练,得到预训练神经网络模型,并根据随机特征对预训练神经网络模型进行精调训练,得到精调神经网络模型。
5、在其中一个实施例中,用户识别方法还包括:根据观测数据对第一初始树模型进行训练,得到第一树模型;根据随机数据对第二初始树模型进行训练,得到第二树模型。
6、在其中一个实施例中,根据精调神经网络模型得到用户识别模型,包括:将第一树模型、第二树模型以及精调神经网络模型作为用户识别模型。
7、在其中一个实施例中,将用户数据输入至预先训练的用户识别模型中,得到用户识别模型输出的识别结果,包括:将用户数据输入至用户识别模型中,得到用户识别模型输出的第一识别结果和第二识别结果;第一识别结果是用户识别模型针对向目标用户施加干预的情况所输出的结果,第二识别结果是用户识别模型针对不向目标用户施加干预的情况所输出的结果。
8、在其中一个实施例中,将用户数据输入至用户识别模型中,得到用户识别模型输出的第一识别结果和第二识别结果,包括:根据用户数据生成干预数据和不干预数据,干预数据用于表征向目标用户施加干预的情况的特征,不干预数据用于表征不向目标用户施加干预的情况的特征;将干预数据输入至用户识别模型中,得到第一识别结果,并将不干预数据输入至用户识别模型中,得到第二识别结果。
9、在其中一个实施例中,将干预数据输入至用户识别模型中,得到第一识别结果,包括:将干预数据分别输入至用户识别模型包括的第一树模型和第二树模型中,通过第一树模型和第二树模型对干预数据进行特征提取得到第一特征;将第一特征输入至用户识别模型包括的精调神经网络模型中,得到精调神经网络模型输出的第一识别结果。
10、在其中一个实施例中,将不干预数据输入至用户识别模型中,得到第二识别结果,包括:将不干预数据分别输入至用户识别模型包括的第一树模型和第二树模型中,通过第一树模型和第二树模型对不干预数据进行特征提取得到第二特征;将第二特征输入至用户识别模型包括的精调神经网络模型中,得到精调神经网络模型输出的第二识别结果。
11、在其中一个实施例中,根据用户数据生成干预数据和不干预数据,包括:获取干预特征值,将干预特征值与用户数据进行拼接,得到干预数据;获取不干预特征值,将不干预特征值与用户数据进行拼接,得到不干预数据。
12、在其中一个实施例中,根据识别结果确定目标用户是否为干预转化用户,包括:根据第一识别结果和第二识别结果确定向目标用户施加干预和不向目标用户施加干预的两种情况下目标用户的转化差异;根据转化差异确定目标用户是否为干预转化用户。
13、在其中一个实施例中,根据转化差异确定目标用户是否为干预转化用户,包括:若转化差异大于预设差异阈值,则确定目标用户为干预转化用户。
14、第二方面,本技术还提供了一种用户识别装置。该装置包括:获取模块,用于获取目标用户的用户数据;识别模块,用于将用户数据输入至预先训练的用户识别模型中,得到用户识别模型输出的识别结果;确定模块,用于根据识别结果确定目标用户是否为干预转化用户;其中,用户识别模型是根据用户拉新业务的因果推断数据训练得到的。
15、在其中一个实施例中,因果推断数据包括观测数据和随机数据,用户识别装置还包括训练模块,用于根据观测数据对初始神经网络模型进行预训练,得到预训练神经网络模型,并根据随机数据对预训练神经网络模型进行精调训练,得到精调神经网络模型;根据精调神经网络模型得到用户识别模型。
16、在其中一个实施例中,训练模块,用于将观测数据分别输入至训练好的第一树模型和第二树模型中,通过第一树模型和第二树模型进行特征提取得到观测特征;将随机数据分别输入至第一树模型和第二树模型中,通过第一树模型和第二树模型进行特征提取得到随机特征;根据观测特征对初始神经网络模型进行预训练,得到预训练神经网络模型,并根据随机特征对预训练神经网络模型进行精调训练,得到精调神经网络模型。
17、在其中一个实施例中,训练模块,还用于根据观测数据对第一初始树模型进行训练,得到第一树模型;根据随机数据对第二初始树模型进行训练,得到第二树模型。
18、在其中一个实施例中,训练模块,还用于将第一树模型、第二树模型以及精调神经网络模型作为用户识别模型。
19、在其中一个实施例中,识别模块,用于将用户数据输入至用户识别模型中,得到用户识别模型输出的第一识别结果和第二识别结果;第一识别结果是用户识别模型针对向目标用户施加干预的情况所输出的结果,第二识别结果是用户识别模型针对不向目标用户施加干预的情况所输出的结果。
20、在其中一个实施例中,识别模块,还用于根据用户数据生成干预数据和不干预数据,干预数据用于表征向目标用户施加干预的情况的特征,不干预数据用于表征不向目标用户施加干预的情况的特征;将干预数据输入至用户识别模型中,得到第一识别结果,并将不干预数据输入至用户识别模型中,得到第二识别结果。
21、在其中一个实施例中,识别模块,还用于将干预数据分别输入至用户识别模型包括的第一树模型和第二树模型中,通过第一树模型和第二树模型对干预数据进行特征提取得到第一特征;将第一特征输入至用户识别模型包括的精调神经网络模型中,得到精调神经网络模型输出的第一识别结果。
22、在其中一个实施例中,识别模块,还用于将不干预数据分别输入至用户识别模型包括的第一树模型和第二树模型中,通过第一树模型和第二树模型对不干预数据进行特征提取得到第二特征;将第二特征输入至用户识别模型包括的精调神经网络模型中,得到精调神经网络模型输出的第二识别结果。
23、在其中一个实施例中,识别模块,还用于获取干预特征值,将干预特征值与用户数据进行拼接,得到干预数据;获取不干预特征值,将不干预特征值与用户数据进行拼接,得到不干预数据。
24、在其中一个实施例中,确定模块,还用于根据第一识别结果和第二识别结果确定向目标用户施加干预和不向目标用户施加干预的两种情况下目标用户的转化差异;根据转化差异确定目标用户是否为干预转化用户。
25、在其中一个实施例中,确定模块,还用于若转化差异大于预设差异阈值,则确定目标用户为干预转化用户。
26、第三方面,本技术还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述第一方面任一项所述的方法的步骤。
27、第四方面,本技术还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面任一项所述的方法的步骤。
28、第五方面,本技术还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述第一方面任一项所述的方法的步骤。
29、上述用户识别方法、装置、设备、存储介质和程序产品,通过获取目标用户的用户数据,将用户数据输入至预先训练的用户识别模型中,得到用户识别模型输出的识别结果,再根据识别结果确定目标用户是否为干预转化用户,其中,用户识别模型是根据用户拉新业务的因果推断数据训练得到的。由于因果推断数据中具有确定的采用干预后用户才转化为平台用户的因果特性,这样,采用因果推断数据训练得到的用户识别模型将能够更加准确的识别出干预转化用户,达到提高干预转化用户识别准确性的目的。