本公开涉及计算机,尤其涉及一种姿态图像的样本生成方法和电子设备。
背景技术:
1、随着计算机技术的迅猛发展,人工智能模型在诸多领域都呈现出巨大潜力。一般,人工智能模型的性能与样本训练数据密切相关。
2、然而,在特定场景下(例如,与人体姿态动作相关的场景),数据收集成本较高,样本数量也较为稀少;若要获取足够数量的样本训练数据极为困难。而样本数据的缺失会直接影响人工智能模型的训练效果和泛化能力。因此,在特定场景下,如何获取大量的样本数据是目前亟需解决的问题。
技术实现思路
1、为了解决上述技术问题,本公开提供了一种姿态图像的样本生成方法和电子设备,能够解决样本数据不足的问题。
2、本公开的技术方案如下:
3、第一方面,本公开提供一种姿态图像的样本生成方法,应用于电子设备,该方法包括:创建姿态动作数据库;姿态动作数据库包括多个姿态动作文本数据;利用深度学习模型,对多个姿态动作文本数据进行处理,生成多个姿态动作图像,其中,一个姿态动作文本数据对应的一个姿态动作图像;对多个姿态动作图像进行特征提取,得到多个姿态动作图像对应的多个姿态动作特征;利用多个姿态动作特征和姿态动作样本数据集,生成多个重构图像;姿态动作样本数据集包括多个姿态动作样本图像;对多个重构图像进行处理,得到多个姿态动作样本图像。
4、结合第一方面,另一种可能的实现方式中,创建姿态动作数据库包括:获取多个文本数据;文本数据用于生成人体姿态动作;多个文本数据中的每个文本数据对应的人体姿态动作不同;基于多个文本数据,得到姿态动作数据库。
5、结合第一方面,另一种可能的实现方式中,利用深度学习模型,对多个姿态动作文本数据进行处理,生成多个姿态动作图像,包括:基于多个姿态动作文本数据,得到多个姿态动作文本数据中各姿态动作文本数据对应的文本特征向量;将各姿态动作文本数据对应的文本特征向量输入深度学习模型,得到多个姿态动作图像;深度学习模型具备生成与各文本特征向量匹配的姿态动作图像的能力。
6、结合第一方面,另一种可能的实现方式中,利用多个姿态动作特征和姿态动作样本数据集,生成多个重构图像,包括:对姿态动作样本数据集中的多个姿态动作样本图像进行特征提取,得到多个姿态动作样本特征;利用多个姿态动作特征替换多个姿态动作样本特征,并生成多个重构图像。
7、结合第一方面,另一种可能的实现方式中,对多个重构图像进行处理,得到多个姿态动作样本图像,包括:对多个重构图像进行标准化处理,得到多个第一重构图像;对多个第一重构图像进行质量提升处理,得到多个姿态动作样本图像,质量提升处理包括调整清晰度、添加噪声、和颜色空间变换中的至少一项。
8、结合第一方面,另一种可能的实现方式中,基于多个姿态动作文本数据,得到多个姿态动作文本数据中各姿态动作文本数据对应的文本特征向量,包括:对各姿态动作文本数据进行关键信息提取,得到各目标姿态动作文本数据;对各目标姿态动作文本数据进行编码,得到各姿态动作文本数据对应的文本特征向量。
9、结合第一方面,另一种可能的实现方式中,各目标姿态动作文本数据包括动作类型、动作主体和动作幅度中的至少一项。
10、第二方面,本公开提供一种姿态图像的样本生成装置,该姿态图像的样本生成装置可以应用于电子设备,用于实现上述第一方面中的方法。该姿态图像的样本生成装置的功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。硬件或软件包括一个或多个与上述功能相对应的模块,例如,创建模块、生成模块和处理模块等。
11、其中,创建模块,被配置为创建姿态动作数据库;姿态动作数据库包括多个姿态动作文本数据。
12、生成模块,被配置为利用深度学习模型,对多个姿态动作文本数据进行处理,生成多个姿态动作图像,其中,一个姿态动作文本数据对应的一个姿态动作图像;以及利用多个姿态动作特征和姿态动作样本数据集,生成多个重构图像,姿态动作样本数据集包括多个姿态动作样本图像。
13、处理模块,被配置为对多个姿态动作图像进行特征提取,得到多个姿态动作图像对应的多个姿态动作特征;以及对多个重构图像进行处理,得到多个姿态动作样本图像。
14、结合第二方面,在一种可能的实现方式中,创建模块,还被配置为,获取多个文本数据;文本数据用于生成人体姿态动作;多个文本数据中的每个文本数据对应的人体姿态动作不同;以及基于多个文本数据,得到姿态动作数据库。
15、结合第二方面,在一种可能的实现方式中,生成模块,还被配置为基于多个姿态动作文本数据,得到多个姿态动作文本数据中各姿态动作文本数据对应的文本特征向量;以及将各姿态动作文本数据对应的文本特征向量输入深度学习模型,得到多个姿态动作图像;深度学习模型具备生成与各文本特征向量匹配的姿态动作图像的能力。
16、结合第二方面,在一种可能的实现方式中,生成模块,还被配置为对姿态动作样本数据集中的多个姿态动作样本图像进行特征提取,得到多个姿态动作样本特征;以及利用多个姿态动作特征替换多个姿态动作样本特征,并生成多个重构图像。
17、结合第二方面,在一种可能的实现方式中,处理模块,还被配置为对多个重构图像进行标准化处理,得到多个第一重构图像;以及对多个第一重构图像进行质量提升处理,得到多个姿态动作样本图像,质量提升处理包括调整清晰度、添加噪声、和颜色空间变换中的至少一项。
18、结合第二方面,在一种可能的实现方式中,生成模块,还被配置为对各姿态动作文本数据进行关键信息提取,得到各目标姿态动作文本数据;以及对各目标姿态动作文本数据进行编码,得到各姿态动作文本数据对应的文本特征向量。
19、结合第二方面,在一种可能的实现方式中,各目标姿态动作文本数据包括动作类型、动作主体和动作幅度中的至少一项。
20、第三方面,本公开提供一种电子设备,包括:存储器、显示屏和一个或多个处理器;存储器、显示屏与处理器耦合。其中,存储器用于存储计算机程序代码,计算机程序代码包括计算机指令;当电子设备运行时,该处理器用于执行该存储器存储的一个或多个计算机指令,以使电子设备执行如上述第一方面中任一项的姿态图像的样本生成方法。
21、第四方面,本公开提供一种计算机存储介质,包括计算机指令,当计算机指令在电子设备上运行时,使得电子设备执行如第一方面中任一项的姿态图像的样本生成方法。
22、第五方面,本公开提供一种计算机程序产品,当计算机程序产品在电子设备上运行时,使得电子设备执行如第一方面中任一项的姿态图像的样本生成方法。
23、第六方面,提供了一种装置(例如,该装置可以是芯片系统),该装置包括处理器,用于支持第一设备实现上述第一方面中所涉及的功能。在一种可能的设计中,该装置还包括存储器,该存储器,用于保存第一设备必要的程序指令和数据。该装置是芯片系统时,可以由芯片构成,也可以包含芯片和其他分立器件。
24、应当理解的是,上述第二方面至第六方面的有益效果可以参见上述第一方面中的相关描述,在此不再赘述。
25、在本公开中,上述名称对设备或功能模块本身不构成限定,在实际实现中,这些设备或功能模块可以以其他名称出现。只要各个设备或功能模块的功能和本公开类似,属于本公开权利要求及其等同技术的范围之内。
26、本公开的这些方面或其他方面在以下的描述中会更加简明易懂。
27、本公开提供的技术方案与现有技术相比具有如下优点:通过创建姿态动作数据库,可以收集大量的姿态动作文本数据。然后通过对多个姿态动作文本数据进行处理,可以得到多个姿态动作图像,之后可以利用该多个姿态动作图像可以得到多个姿态动作样本图像。也就是说,本公开通过大量姿态动作文本数据便可以得到大量的姿态动作样本图像。这样,不仅可以显著提高样本的数量,还可以有效解决样本数据不足和样本质量差的问题,为人工智能在特定领域的应用提供强有力的数据支持。之后还可以利用多个姿态动作样本图像进行模型训练,以提升模型的训练效果和泛化能力。并且相较于相关技术,通过专业摄影师实地蹲守抓拍姿态动作图像而言,本公开能够大幅度降低人力物力成本。