一种数字人快速开发方法、系统、电子设备及存储介质与流程

文档序号：41014841发布日期：2025-02-21 19:17阅读：3来源：国知局

本技术涉及数字人开发的，具体涉及一种数字人快速开发方法、系统、电子设备及存储介质。

背景技术：

1、随着计算机技术的发展，数字人作为连接虚拟与现实世界的桥梁，被广泛应用于多个领域，例如虚拟客服、虚拟主播以及个性化娱乐等。数字化技术不仅提高了娱乐行业的内容创作效率，还推动了人工智能和虚拟现实技术的应用。

2、在现有技术中，为了快速构建符合特定需求的数字人，通常采取的方式包括但不限于：采用现成的3d模型库进行快速配置，结合动画制作工具自定义数字人的外观特征和动作表现；根据开发需求编写特定场景下的交互脚本，以模拟真实环境中的交互与反馈，实现数字人的基本功能。上述方法虽然能够在一定程度上满足对数字人开发效率的需求，但在处理涉及复杂人物性格及情感互动的情形时仍显不足。具体表现为：传统的数字人创建过程中，对外观特征、性格特征以及预设功能之间的整合还需进一步加强，特别是个性化的预设功能往往难以充分适应特定应用场景下的需求。

3、因此，需要一种能够开发应对复杂场景及情感互动的数字人的方法。

技术实现思路

1、本技术提供一种数字人快速开发方法、系统、电子设备及存储介质，能够根据需求快速构建并优化数字人。

2、在本技术的第一方面提供了一种数字人快速开发方法，应用于数字人开发平台，所述数字人快速开发方法包括：

3、当接收到第一人物需求和第一场景需求时，根据所述第一人物需求确定第一外观特征和性格特征，根据所述第一场景需求确定第二外观特征和预设功能，所述第一外观特征包括性别、年龄、脸型和肤色，所述第二外观特征包括面部特征、发型和服装，所述性格特征包括幽默、严谨和温柔，所述预设功能包括语音交互、动作表现和情感交流；

4、根据所述第一外观特征、所述第二外观特征、所述性格特征和所述预设功能构建第一数字人；

5、根据所述第一场景需求构建活动场景和测试情形，所述测试情形包括触发条件、交互对象、预期结果；

6、根据所述测试情形对所述第一数字人进行训练以得到第二数字人。

7、通过采用上述技术方案，接收并解析第一人物需求和第一场景需求，能够迅速确定数字人的外观、性格特征及所需功能，从而实现高效定制化开发。分别确定第一外观特征（性别、年龄、脸型和肤色）和第二外观特征（面部特征、发型和服装），以及性格特征（幽默、严谨、温柔）和预设功能（语音交互、动作表现、情感交流），确保了数字人的全面性和个性化。结合第一和第二外观特征，构建的数字人在外观上能够高度还原真实人物，增强用户的视觉真实感。根据性格特征的设置，数字人能够展现出特定的行为模式和情感反应，使其更加贴近真实人物或满足特定场景需求。预设功能包括语音交互、动作表现和情感交流，这些功能的集成使得数字人能够与用户进行更加自然和全面的互动。通过根据场景需求构建活动场景和测试情形，并对数字人进行针对性训练，提高了数字人在不同场景下的适应性和表现力。通过构建测试情形对数字人进行训练，可以及时发现并解决潜在问题，从而不断优化数字人的性能和表现。

8、可选的，所述根据所述测试情形对所述第一数字人进行训练以得到第二数字人包括：

9、获取所述测试情形中真实人类的第一肢体动作数据，对所述第一肢体动作数据进行第一处理以得到第二肢体动作数据，所述第一处理包括去除噪声、平滑动作曲线和调整动作速度；

10、将所述第二肢体动作数据中每一个关节角度和位置信息映射到所述第一数字人对应的位置以得到第二数字人。

11、通过采用上述技术方案，获取真实人类的第一肢体动作数据，可以确保数字人的动作基于真实的人体运动数据，从而增加动作的真实性和可信度。对第一肢体动作数据进行去除噪声、平滑动作曲线和调整动作速度的第一处理，可以有效减少数据中的误差和抖动，使数字人的动作更加平滑自然，符合人类运动的规律。将处理后的第二肢体动作数据中的每一个关节角度和位置信息精确映射到第一数字人对应的位置，可以确保数字人的动作与真实人类动作在细节上保持高度一致。这种精准的映射不仅提高了数字人动作的准确性，还增强了其表现力和沉浸感。由于该方法是基于测试情形中的真实人类动作数据进行训练的，因此可以灵活应对不同场景和需求下的动作要求。无论是简单的日常动作还是复杂的专业动作，都可以通过这种方法进行训练和映射。随着测试情形的变化或需求的更新，可以重新获取和处理新的肢体动作数据，并对第一数字人进行再次训练，以得到适应新场景或新需求的第二数字人。这种灵活性和可调整性使得本技术实施例具有广泛的应用前景和持续优化的可能性。由于第二数字人的动作更加自然和真实，因此能够显著提升用户与数字人交互时的沉浸感和体验质量。这种提升不仅有助于增强用户对数字人的认同感和信任感，还能够促进更加自然和流畅的交互过程。

12、可选的，所述根据所述测试情形对所述第一数字人进行训练以得到第二数字人包括：

13、获取所述测试情形中各种情绪下真实人类的第一面部表情数据，对所述第一面部表情数据进行第二处理以得到第二面部表情数据，所述第二处理包括去除噪声、根据情绪类别对表情进行分类、定义统一的表情描述语言、表情编码标准以及表情评价标准；

14、识别所述第一数字人的当前情感状态，根据所述当前情感状态选择相匹配的面部表情，并将所述相匹配的面部表情映射到所述第一数字人以得到第二数字人。

15、通过采用上述技术方案，获取测试情形中各种情绪下真实人类的第一面部表情数据，为数字人提供了丰富的情感表达基础。这些数据确保了数字人在表达情感时的真实性和可信度。对第一面部表情数据进行去除噪声、根据情绪类别对表情进行分类等第二处理，提高了数据的纯净度和可用性。同时，定义统一的表情描述语言、表情编码标准以及表情评价标准，为表情数据的处理和应用提供了标准化框架，进一步提升了表情的准确性和一致性。通过识别第一数字人的当前情感状态，系统能够准确判断其需要表达的情感类型。这一功能使得数字人能够更加智能地根据当前情境调整自己的表情，增强了交互的真实性和自然性。根据当前情感状态选择相匹配的面部表情，并将这些表情映射到第一数字人上，从而得到第二数字人。这一过程实现了情感与表情的精准匹配，使得数字人在表达情感时更加细腻和生动。由于第二数字人能够更准确地表达各种情绪，用户在与其交互时会感受到更强的沉浸感和真实感。这种沉浸感有助于提升用户的参与度和满意度。通过精准的表情映射，第二数字人能够更好地理解用户的情感需求，并作出相应的表情回应。这种情感交流不仅增强了用户与数字人之间的互动性，还促进了双方之间的情感联系和信任建立。上述过程涉及到了情感识别、表情分类、表情映射等多个技术领域，推动了这些技术的不断创新和发展。这些技术的进步为数字人技术的进一步应用提供了有力支持。

16、可选的，所述根据所述测试情形对所述第一数字人进行训练以得到第二数字人包括：

17、根据所述性格特征设置所述第一数字人的语速，根据所述年龄和性别设置所述第一数字人的音色，并根据所述第一数字人的当前情感状态和对话内容设置所述第一数字人的语调；

18、根据预设对话脚本对设置后的第一数字人进行对话训练以得到第二数字人。

19、通过采用上述技术方案，根据性格特征设置语速，根据年龄和性别设置音色，以及根据当前情感状态和对话内容设置语调，这些个性化设置使得数字人在表达时更加符合人类的行为习惯和情感表达方式，从而提升了表达的自然度和逼真度。通过根据当前情感状态调整语调，数字人能够更准确地传达自己的情感，增强与用户的情感交流能力。这种情感适应性使得数字人在交互过程中更加生动和有趣，提高了用户的参与度和满意度。通过预设对话脚本对设置后的第一数字人进行对话训练，可以使其熟悉并掌握各种对话场景和语境下的表达方式，从而提高对话的流畅性和连贯性。这种训练还有助于数字人更好地理解和响应用户的输入，实现更加高效的交互。具有丰富表达能力的数字人可以应用于多个领域，如虚拟客服、在线教育、娱乐互动等。在这些领域中，数字人能够提供更加自然、流畅和个性化的交互体验，满足用户多样化的需求。通过提升数字人的表达能力，用户可以感受到更加真实、生动的交互体验，从而提升对数字人的认同感和满意度。这种积极的用户体验有助于增强用户对数字人技术的信任和接受度。对数字人语速、音色、语调的设置以及对话训练等技术的不断探索和应用，推动了数字人技术的不断创新和发展。这些技术成果不仅提高了数字人的表达能力，还为未来数字人技术的进一步研究和应用提供了宝贵的经验和参考。

20、可选的，所述根据所述第一外观特征、所述第二外观特征、所述性格特征和所述预设功能构建第一数字人包括：

21、构建初始3d模型，并创建骨骼系统，所述骨骼系统包括多个关节和骨骼；

22、将所述骨骼系统与所述初始3d模型进行绑定以使得骨骼运动时能够带动所述初始3d模型产生相应的变化；

23、根据所述第一外观特征、所述第二外观特征、所述性格特征对所述初始3d模型进行调整以得到初始数字人；

24、在所述初始数字人中加入所述预设功能以构建第一数字人。

25、通过采用上述技术方案，构建初始3d模型并创建骨骼系统，为数字人提供了坚实的基础。骨骼系统的引入使得数字人的动作更加自然流畅，同时也为后续的外观调整提供了便利。根据第一外观特征（如脸型、发型等）、第二外观特征（如服装、配饰等）以及性格特征对初始3d模型进行调整，使得最终得到的初始数字人具有高度的个性化。这种个性化不仅体现在外观上，还能通过微调模型细节来传达出数字人的性格特质。将骨骼系统与初始3d模型进行绑定，使得骨骼的运动能够直接带动模型产生相应的变化。这种设计极大地增强了数字人的动作表现能力，使其能够做出各种复杂的动作和表情，提高了交互的真实感和沉浸感。在初始数字人中加入预设功能，如语音识别、自然语言处理、情感计算等，使得第一数字人不仅具有逼真的外观和动作，还能与用户进行深入的交互。这些功能的集成大大扩展了数字人的应用场景和使用价值。整个构建过程采用了模块化设计思路，包括3d建模、骨骼绑定、外观调整和功能集成等模块。这种设计使得开发团队可以根据实际需求灵活调整开发流程，提高开发效率。同时，模块化的设计也有助于降低开发成本，因为开发者可以复用已有的模块来构建新的数字人。

26、可选的，所述根据所述第一场景需求构建活动场景和测试情形包括：

27、当所述活动场景为面试时，将面试者构建为测试情形中的交互对象，将所述面试者的自我介绍构建为触发条件，根据所述自我介绍确定预设问题和预设答案；

28、根据所述面试者的回答内容与所述预设答案的相似度确定第一情绪状态，并根据所述面试者的回答情绪确定第二情绪状态，根据所述第一情绪状态和所述第二情绪状态确定所述第一数字人的回复状态。

29、通过采用上述技术方案，通过预设问题和答案，以及根据面试者回答内容自动判断其情绪状态和回答质量，第一数字人能够智能地生成回复。这种智能化的问答方式不仅提高了面试的效率，还使得面试过程更加客观和准确。根据面试者的情绪状态和回答内容，第一数字人能够调整其回复状态，从而提供更加个性化的反馈。这种个性化的反馈有助于建立更加良好的面试氛围，增强面试者的参与感和信任感。通过构建面试活动场景和测试情形，模拟真实的面试环境，使得面试者能够在接近真实的情境中展示自己的能力和素质。这种真实场景模拟有助于提高面试结果的可信度。面试者的回答内容和情绪状态会影响第一数字人的回复状态，形成动态的交互过程。这种动态交互不仅使得面试过程更加生动有趣，还有助于挖掘面试者更深层次的能力和素质。通过预设问题和答案以及自动化的情绪判断机制，第一数字人能够快速地处理面试者的回答，并生成相应的回复。这种自动化处理方式大大提高了面试的效率。根据面试者的回答内容和情绪状态进行综合分析，第一数字人能够更准确地评估面试者的能力和素质。这种准确评估有助于企业更加科学地选拔人才。第一数字人可以作为远程面试的面试官，实现跨越地域限制的面试。这种远程面试方式不仅节省了企业和面试者的时间和成本，还提高了面试的灵活性和便捷性。通过分析面试者的表现和反馈，第一数字人还可以为面试者提供个性化的培训建议和指导。这种个性化培训有助于提升面试者的能力和素质，为企业培养更多优秀的人才。

30、可选的，所述根据所述面试者的回答内容与所述预设答案的相似度确定第一情绪状态，并根据所述面试者的回答情绪确定第二情绪状态，根据所述第一情绪状态和所述第二情绪状态确定所述第一数字人的回复状态包括：

31、使用自然语言处理技术计算所述回答内容与所述预设答案的相似度，根据所述相似度匹配第一情绪状态，使用情感分析技术对所述回答内容中的情感词汇进行分析以确定所述面试者的回答情绪，并根据所述回答情绪匹配第二情绪状态；

32、根据所述第一情绪状态和所述第二情绪状态从预设情绪表中匹配对应的目标状态，并将所述目标状态作为所述第一数字人的回复状态。

33、通过采用上述技术方案，通过计算回答内容与预设答案的相似度，可以客观地评估面试者的回答与标准答案的接近程度。这种基于文本的相似度计算减少了人为判断的主观性，提高了评估的准确性。情感分析技术能够识别回答内容中的情感词汇，并据此判断面试者的回答情绪。这种技术使得对面试者情绪状态的评估更加细致和准确，有助于更全面地了解面试者的心理状态。根据第一情绪状态（基于回答内容与预设答案的相似度）和第二情绪状态（基于回答情绪）从预设情绪表中匹配对应的目标状态，这一过程确保了第一数字人的回复能够针对面试者的具体表现和情感状态进行个性化调整。这种针对性的回复有助于建立更加积极和有效的沟通氛围。由于第一数字人的回复状态是根据面试者的实时表现和情感状态动态调整的，因此能够更好地适应面试过程中的变化，提高回复的灵活性和适应性。整个评估和回复过程都是自动化的，减少了人工干预的需要，提高了面试的效率。同时，自动化的处理也减少了人为错误的可能性，提高了面试的可靠性。通过个性化的回复和针对性的评估，第一数字人能够为面试者提供更加贴心和专业的面试体验。这种体验有助于增强面试者的参与感和满意度，提高整体面试效果。该过程结合了自然语言处理技术和情感分析技术，展示了不同技术领域的融合应用。这种技术融合不仅丰富了面试评估的手段和方法，也为其他领域的技术创新提供了有益的借鉴和启示。将自然语言处理技术和情感分析技术应用于面试场景，是一种创新的应用尝试。这种创新应用不仅推动了相关技术的发展和进步，也为面试领域带来了新的机遇和挑战。

34、在本技术的第二方面提供了一种数字人快速开发系统，包括特征模块、构建模块、场景模块以及训练模块，其中：

35、特征模块，配置用于当接收到第一人物需求和第一场景需求时，根据所述第一人物需求确定第一外观特征和性格特征，根据所述第一场景需求确定第二外观特征和预设功能，所述第一外观特征包括性别、年龄、脸型和肤色，所述第二外观特征包括面部特征、发型和服装，所述性格特征包括幽默、严谨和温柔，所述预设功能包括语音交互、动作表现和情感交流；

36、构建模块，配置用于根据所述第一外观特征、所述第二外观特征、所述性格特征和所述预设功能构建第一数字人；

37、场景模块，配置用于根据所述第一场景需求构建活动场景和测试情形，所述测试情形包括触发条件、交互对象、预期结果；

38、训练模块，配置用于根据所述测试情形对所述第一数字人进行训练以得到第二数字人。

39、在本技术的第三方面提供了一种电子设备，包括处理器、存储器、用户接口以及网络接口，所述存储器用于存储指令，所述用户接口和所述网络接口均用于与其他设备通信，所述处理器用于执行所述存储器中存储的指令，以使所述电子设备执行如上述任意一项所述的方法。

40、在本技术的第四方面提供了一种计算机可读存储介质，所述计算机可读存储介质存储有指令，当所述指令被执行时，执行如上述任意一项所述的方法。

41、综上所述，本技术实施例中提供的一个或多个技术方案，至少具有如下技术效果或优点：

42、1、能够迅速根据用户提出的人物需求和场景需求，生成符合要求的数字人。通过明确的第一外观特征、第二外观特征、性格特征和预设功能的定义，使得数字人的开发过程更加高效；允许用户根据需要定制数字人的性别、年龄、脸型、肤色、面部特征、发型、服装以及性格特征，确保数字人能够精准匹配特定场景和角色的要求；

43、2、数字人不仅具备基本的外观特征，还集成了语音交互、动作表现和情感交流等预设功能。这些功能使得数字人在实际应用中能够与用户进行更加自然和丰富的互动；通过构建活动场景和测试情形，对数字人进行训练，使其能够在不同场景下表现出相应的行为和反应，增强了数字人的适应性和灵活性；

44、3、通过精细化的外观特征和性格特征的设定，以及丰富的预设功能，使得数字人在外观和行为上都更加接近真实人物，从而提升了用户的沉浸感和真实感；语音交互、动作表现和情感交流等功能的集成，使得数字人能够与用户进行更加深入和有意义的互动，增强了用户体验的丰富性和趣味性；

45、4、通过构建和训练数字人的自动化流程，降低了人工干预的程度，从而提高了开发效率并降低了开发成本；当数字人开发完成并经过训练，其模型和参数可以被复用于其他类似的项目或场景中，进一步提高了开发效率和资源利用率。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘晓毅,吴莎,崔哲,邸泽朝
技术所有人：联动云通信科技（北京）有限公司
我是此专利的发明人

上一篇：一种柔性摆动装置的制作方法
上一篇：一种AR眼镜协同手势操作终端的响应映射方法和装置与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。