一种语音绘图方法、装置及计算机设备与流程

文档序号:31399439发布日期:2022-09-03 04:13阅读:58来源:国知局
一种语音绘图方法、装置及计算机设备与流程

1.本技术主要涉及计算机应用技术领域,更具体地说是涉及一种语音绘图方法、装置及计算机设备。


背景技术:

2.计算机绘图是相对于手工绘图而言的一种高效率、高质量的绘图技术。使用者可以通过如鼠标、触控笔等输入设备,结合绘图工具所具有的如填色、线条选择等绘图功能,完成绘图创作。
3.目前这种绘图方法需要使用者不断手动调整,过程繁琐,效率低、美观性差,也需要使用者非常熟悉绘图工具,且对于具有艺术性的待绘制图像,还需要使用者具有艺术审美等绘画技能,极大提高了对绘图使用者的要求,增大了绘图局限性。


技术实现要素:

4.有鉴于此,本技术提供了一种语音绘图方法,所述方法包括:
5.获得用于描述待绘制图像的绘图语音;
6.按照预设处理规则,对所述绘图语音进行意象分析,获得绘图特征以及所述绘图特征的绘图权重;其中,所述绘图权重越高的所述绘图特征对所述待绘制图像的影响力越大;
7.至少基于所述绘图特征和所述绘图权重进行图像绘制,得到目标图像。
8.可选的,所述按照预设处理规则,对所述绘图语音进行意象分析,获得绘图特征以及所述绘图特征的绘图权重;包括:
9.提取所述绘图语音所包含的针对所述待绘制图像的多个绘图元素;
10.基于所述绘图元素在所述绘图语音中的状态信息,确定多个绘图特征以及所述多个绘图特征各自的绘图权重;
11.其中,所述状态信息包括重复次数、音调、描述顺序、语法类型、逻辑合理性之中的一个或多个组合信息;所述绘图权重越高的所述绘图特征,在图像绘制过程中的绘图顺序越靠前。
12.可选的,所述基于所述绘图元素在所述绘图语音中的状态信息,确定多个绘图特征以及所述多个绘图特征各自的绘图权重,包括:
13.确定针对所述待绘制图像重复描述的绘图元素为第一绘图特征,增大所述第一绘图特征的第一绘图权重;和/或,
14.对所述多个绘图元素进行音调比较,确定重音所对应的绘图元素为第二绘图特征,增大所述第二绘图特征的第二绘图权重;和/或,
15.基于所述多个绘图元素在所述绘图语音中的描述顺序,确定对应的第三绘图特征以及所述第三绘图特征的第三绘图权重;和/或,
16.确定所述多个绘图元素各自的语法类型;
17.基于不同语法类型的权重和所述多个绘图元素,确定相应语法类型的第四绘图特征以及所述第四绘图特征的第四绘图权重;和/或,
18.检测到逻辑关系不合理的任意两个绘图元素,确定该两个绘图元素中具有较低绘图权重的绘图元素;
19.对所述具有较低绘图权重的绘图元素进行语意联想分析,得到针对该两个绘图元素的第五绘图特征。
20.可选的,所述检测到逻辑关系不合理的任意两个绘图元素,确定该两个绘图元素中具有较低绘图权重的绘图元素,包括:
21.基于所述多个绘图元素各自的语法类型和描述顺序,确定具有关联关系的任意两个绘图元素;
22.从字词知识图谱中未查询到该两个绘图元素之间的关系,确定该两个绘图元素之间的逻辑关系不合理;
23.基于所述逻辑关系不合理的两个绘图元素各自的语法类型,确定具有较低绘图权重的绘图元素。
24.可选的,所述对所述具有较低绘图权重的绘图元素进行语意联想分析,得到针对该两个绘图元素的第五绘图特征,包括:
25.从字词知识图谱中,查询与所述具有较低绘图权重的绘图元素关联的候选联想元素;
26.将所述候选联想元素与对应的两个逻辑关系不合理的绘图元素进行场景匹配分析,确定属于同一场景下的目标联想元素;
27.利用该两个逻辑关系不合理的绘图元素以及所述目标联想元素,确定对应的多个第五绘图特征。
28.可选的,所述至少基于所述绘图特征和所述绘图权重进行图像绘制,得到目标图像,包括:
29.至少将多个所述绘图特征和所述绘图权重输入图像生成模型进行图像绘制,得到候选图像;
30.将所述候选图像与所述绘图语音内容进行匹配分析,得到绘制匹配度;
31.如果所述绘制匹配度大于匹配阈值,将所述候选图像确定为目标图像输出;
32.如果所述绘制匹配度小于或等于所述匹配阈值,调整所述图像生成模型的模型参,继续对调整后的图像生成模型输出的新的候选图像进行匹配分析,得到目标图像。
33.可选的,所述方法还包括:
34.基于所述绘图语音包含的针对待绘制图像的描述内容,对图像库进行图像搜索,确定所述待绘制图像的相似图像;
35.基于所述描述内容,对所述相似图像包含的图像元素进行解构与重组,得到针对所述待绘制图像的参考图像;
36.所述至少基于所述绘图特征和所述绘图权重进行图像绘制,得到目标图像,包括:
37.基于参考图像、所述绘图特征和所述绘图权重进行图像绘制,得到目标图像。
38.可选的,所述基于参考图像、所述绘图特征和所述绘图权重进行图像绘制,得到目标图像,包括:
39.将所述参考图像中的图像元素与所述绘图特征进行匹配分析,得到对应的匹配结果;
40.基于所述匹配结果和所述绘图权重,确定对应所述图像元素的元素权重;
41.至少将所述参考图像以及所述元素权重输入图像生成模型进行图像绘制,得到目标图像。
42.本技术还提出了一种语音绘图装置,所述装置包括:
43.绘图语音获得模块,用于获得用于描述待绘制图像的绘图语音;
44.分析模块,用于按照预设处理规则,对所述绘图语音进行意象分析,获得绘图特征以及所述绘图特征的绘图权重;其中,所述绘图权重越高的所述绘图特征对所述待绘制图像的影响力越大;
45.图像绘制模块,用于至少基于所述绘图特征和所述绘图权重进行图像绘制,得到目标图像。
46.本技术还提出了一种计算机设备,所述计算机设备包括:
47.通信接口;
48.存储器,用于存储实现如上述的语音绘图方法的程序;
49.处理器,用于加载并执行所述存储器存储的程序,实现如上述的语音绘图方法。
50.由此可见,本技术提供了一种语音绘图方法、装置及计算机设备,本技术提出基于人工智能进行语意视觉化处理,这样,用户可以直接语音描述待绘制图像的内容,使得计算机设备获得对应的绘图语音后,可以按照预设处理规则,对该绘图语音进行意象分析,得到该待绘制图像的绘图特征及其绘图权重,从而至少基于该绘图特征及其绘图权重进行图像绘制,得到符合用户对待绘制图像的描述内容的目标图像,相对于人工绘制图像的实现方式,本技术提出的语音绘图方法大大提高了绘图效率,且无需用户具有较高的绘图技能,扩大了绘图场景,也能够满足普通用户的绘图需求。
附图说明
51.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
52.图1为图像绘制过程示意图;
53.图2为适用于本技术提出的语音绘图方法的计算机设备的一可选示例的硬件结构示意图;
54.图3为适用于本技术提出的语音绘图方法的计算机设备的又一可选示例的硬件结构示意图;
55.图4为本技术提出的语音绘图方法的一可选示例的流程示意图;
56.图5为本技术提出的语音绘图方法的又一可选示例的流程示意图;
57.图6为本技术提出的语音绘图方法的又一可选示例的流程示意图;
58.图7为本技术提出的语音绘图方法的又一可选示例的流程示意图;
59.图8为本技术提出的语音绘图方法的又一可选示例的流程示意图;
60.图9a为适用于本技术提出的语音绘图方法中,搜索待绘制图像的相似图像的示意图;
61.图9b为适用于本技术提出的语音绘图方法所得到的目标图像示意图;
62.图10为本技术提出的语音绘图方法的又一可选示例的流程示意图;
63.图11为本技术提出的语音绘图装置的一可选示例的结构示意图。
具体实施方式
64.针对背景技术部分描述的技术问题,本技术提出基于人工智能技术包含的各种算法进行语意视觉化处理,将图像描述文本转化为图像,这样,用户可以对待绘制图像的内容进行描述,得到绘图语音后,利用人工智能对绘图语音进行分析,依据分析结果绘制符合该绘图语音内容的图像,如图1所示的图像绘制过程示意图,随着迭代更新次数增加,能够不断提高所得图像质量,但所花费的时间较长。
65.为了改善上述问题,本技术希望能够在较少的迭代次数下,更快且准确获得用户自己描述内容的关键意象,即通过对绘图语音进行意象分析,确定描述的各绘图特征及其绘图权重,由该绘图权重表征该绘图特征对待绘制图像的影响力,从而结合各绘图特征及其绘图权重,基于人工智能包含的图像绘制算法进行图像绘制,直接得到所需的目标图像。相对于人工绘制方式,这种语音绘制方法大大提高了图像绘制效率,降低了对用户的绘画技能要求,满足大部分用户图像绘制需求。
66.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
67.参照图2,为适用于本技术提出的语音绘图方法的计算机设备的一可选示例的硬件结构示意图,在一些实施例中,该计算机设备也可以是具有一定数据处理能够的电子设备,如智能手机、平板电脑、增强现实技术(augmented reality,ar)设备、虚拟现实(virtual reality,vr)设备、车载设备、台式计算机、机器人等,电子设备使用者可以使用电子设备的语音绘图功能,通过语音描述待绘制图像的内容,由电子设备执行语音绘图方法,同步绘制所描述内容的图像后输出,随着描述内容增多,不断更新绘制图像等。
68.在又一些实施例中,上述计算机设备也可以为服务器,如独立的物理服务器、多台物理服务器构成的服务器集群,或者是能够实现云计算的云服务器等,可以通过有线网络或无线网络与电子设备通信连接,接收电子设备所采集到的绘图语音,执行本技术提出的语音绘制方法进行图像绘制,将得到的目标图像反馈至该电子设备或指定终端设备等,满足语音绘图处理需求。本技术对执行语音绘图的计算机设备类型不做限制。在又一些实施例中,在语音绘图执行过程中,也可以由电子设备与服务器交互实现,本技术对此不做限制,可视情而定。
69.基于上述分析,如图2所示,本技术提出的计算机设备可以包括但并不局限于:通信接口21、存储器22和处理器23,其中:
70.通信接口21、存储器22和处理器23各自的数量均可以为至少一个,且通信接口21、存储器22和处理器23均可以直接或通过i/o接口连接电子设备的通信总线,实现电子设备
中各组件之间的数据通信,满足语音绘图过程中的数据传输需求。
71.通信接口21可以包括能够利用无线通信网络实现数据交互的通信模块的数据接口,该通信模块可以包括但并不局限于:wifi模块、5g/6g(第五代移动通信网络/第六代移动通信网络)模块、gprs模块、短距离通信模块等;根据应用需求,该通信接口21还可以包括实现计算机设备内部组成部件之间的数据交互的数据接口,如usb接口、串/并口、多媒体数据传输接口、显示端口等,本技术对该通信接口21包含的接口类型、数量及其工作原理不做详述。
72.存储器22可以用于存储实现上述各方法实施例描述的语音绘图方法的程序;处理器23可以加载并执行存储器存储的该程序,以实现上述相应方法实施例描述的语音绘图方法的各个步骤,具体实现过程可以参照下文实施例相应部分的描述,本技术在此不做详述。
73.本技术实施例中,存储器22可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件或其他易失性固态存储器件。处理器23,可以为中央处理器(central processing unit,cpu)、特定应用集成电路(application-specific integrated circuit,asic)、数字信号处理器(dsp)、专用集成电路(asic)、现成可编程门阵列(fpga)或者其他可编程逻辑器件等。本技术对上述存储器22和处理器23的结构及其型号不做限定,可以根据实际需求灵活调整。
74.应该理解的是,图2所示的计算机设备的结构并不构成对本技术实施例中计算机设备的限定,在实际应用中,计算机设备可以包括比图2所示的更多或更少的部件,或者组合某些部件。尤其是在计算机设备为上文列举的电子设备的场景下,如图3所示,该计算机设备还可以包括如感应触摸显示面板上的触摸事件的触摸感应单元、键盘、鼠标、摄像头、拾音器等至少一个输入组件;如显示器、扬声器、振动机构、灯等至少一个输出组件;天线;传感器模组;电源模组等,图3并未示出所列举的各输入组件和各输出组件,可以依据电子设备类型及其功能需求确定硬件结构,本技术在此不做一一列举。
75.参照图4,为本技术提出的语音绘图方法的一可选示例的流程示意图,该方法可以由服务器或电子设备执行,也可以由服务器与电子设备配合执行,如图4所示,该语音绘图方法可以包括:
76.步骤s41,获得用于描述待绘制图像的绘图语音;
77.在需要绘制某一图像(记为待绘制图像)的情况下,用户可以对待绘制图像的内容(如组成该图像的各绘图元素、绘图特征等)进行语音描述,由语音采集器同步采集对应的绘图语音,若本技术实施例的执行主体是电子设备,语音采集器可以集成在电子设备中,也可以是独立的采集器,其可以将采集到的绘图语音发送至电子设备的处理器,执行本技术提出的语音绘图方法。
78.当然,若本技术实施例的执行主体是服务器,语音采集器可以利用自身的通信功能,将采集到的绘图语音上传至服务器,或先发送至电子设备,再利用电子设备的远程通信能力,将该绘图语音发送至服务器,由服务器获得用于描述待绘制图像的绘图语音后,执行后续处理步骤,完成图像的自行绘制。
79.可见,对于不同类型的计算机设备,执行步骤s41的实现方法可能会所差异,但获得绘图语音后的后续处理过程类似,本技术不再对不同场景举例详述。其中,由于用户描述待绘制图像的绘图语音是连续的多帧语音信号,随着时间推进,会不断获得新的绘图语音,
往往在获得连续多帧绘图语音,才能够表达一个完整的绘图元素、绘图特征,之后,才能够执行后续步骤,推进图像绘制进度。本技术对获得的绘图语音包含的语音帧个数不做限制,可视情况而定。
80.步骤s42,按照预设处理规则,对绘图语音进行意象分析,获得绘图特征以及该绘图特征的绘图权重;
81.本技术实施例中,预设处理规则可以包括一种或多种,用于提取绘图语音包含的不同类型的绘图特征及其绘图权重,该绘图权重越高的绘图特征对待绘制图像的影响力越大,因此,通过预设规则对提取到的绘图特征,在待绘制图像内容的占比进行分析,配置对应的绘图权重。本技术对预设处理规则内容不做限制,可视情况而定。
82.本技术从不同方面的多种预设处理规则对绘图语音进行意象分析,能够更加全面获得待绘制图像的绘图特征,提高所绘制图像的精准度和效率。可选的,对于多种预设处理规则,可以依据待绘制图像的类型、图像绘制要求等因素,来确定多种预设处理规则的执行优先级,也可以从绘图语音内容中提取各意向的优先级,选择相匹配的预设处理规则,快速且准确地完成目标图像的绘制,也可以依据实际需求,适应性调整预设处理规则内容,以更好地完成语音绘图。
83.步骤s43,至少基于绘图特征和绘图权重进行图像绘制,得到目标图像。
84.本技术实施例中,可以由预训练的图像生成器(即图像生成模型,其可以基于图像绘制算法进行模型训练得到,本技术对该图像生成器的训练实现方法不做限制),利用所得到的多个绘图特征及其绘图权重,实现图像绘制,得到符合绘图语音包含的待绘制图像描述内容的目标图像。
85.在目标图像的获得过程中,可以利用预训练的判别器,对每次绘制得到的图像与绘图语音包含的图像描述内容进行匹配分析,确定本次绘制的图像是否符合该图像描述内容,如果符合,将本次绘制的图像确定为目标图像;如果不符合,可以适应性调整图像生成模型的模型参数,由调整后的图像生成模型重新进行图像绘制,将新绘制的图像输入判别器进行匹配分析,如此迭代更新,直至获得符合绘图语音包含的图像描述内容的目标图像。
86.在一些实施例中,为了提高图像绘制效率和准确性,在上述图像绘制过程中,还可以基于绘图语音进行图像搜索,得到与绘图语音包含的图像描述内容相似度最高的相似图像,依据该待绘制图像的描述内容,对该相似图像包含的图像元素进行解构与重组,得到用于绘制图像的参考图像,之后,可以基于该参考图像、上述得到的各绘图特征及其绘图权重进行图像绘制,得到所需的目标图像,本技术对上述步骤s43的实现方法不做限制,可以依据实际绘图需求进行灵活调整,并不局限于本技术上下文描述的实现方法。
87.综上,本技术提出基于人工智能进行语意视觉化处理,这样,用户可以直接语音描述待绘制图像的内容,使得计算机设备获得对应的绘图语音后,可以按照预设处理规则,对该绘图语音进行意象分析,得到该待绘制图像的绘图特征及其绘图权重,从而至少基于该绘图特征及其绘图权重进行图像绘制,得到符合用户对待绘制图像的描述内容的目标图像,相对于人工绘制图像的实现方式,本技术提出的语音绘图方法大大提高了绘图效率,且无需用户具有较高的绘图技能,扩大了绘图场景,也能够满足普通用户的绘图需求。
88.参照图5,为本技术提出的语音绘图方法的又一可选示例的流程示意图,该方法可以对上文提出的语音绘图方法的一可选细化实现过程进行描述,但并不局限于本实施例描
述的细化实现方法,如图5所示,本实施例提出的语音绘图方法可以包括:
89.步骤s51,获得用于描述待绘制图像的绘图语音;
90.步骤s52,提取该绘图语音所包含的针对待绘制图像的多个绘图元素;
91.步骤s53,基于绘图元素在绘图语音中的状态信息,确定多个绘图特征以及多个绘图特征各自的绘图权重;
92.为了实现对包含对待绘制图像的描述内容的绘图语音进行意象分析,确定该待绘制图像具有的绘图特征,及其在待绘制图像内容中的占比,本技术提出依据绘图语音中描述的待绘制图像的各绘图元素的状态信息,如对应绘制元素的重复次数、音调、描述顺序、语法类型、逻辑合理性等之中的一个或多个组合信息,来确定后续需要绘制的待绘制图像具有的多个绘图特征,以及该绘图特征对整个待绘制图像的影响力,记为绘图权重。
93.需要说明,在实际应用中,上述绘图权重越高的绘图特征对待绘制图像的影响力越大,且在图像在图像绘制过程中的绘图顺序越靠前。上述绘图元素可以包括但并不应局限于绘图语音中,描述待绘制图像内容的组成对象、各组成对象的颜色和布局关系、整个图像意境、背景等等,可以依据待绘制图像的类型、绘制要求等确定,本技术对绘图元素内容及其提取方式不做限制。
94.可选的,本技术可以利用人工智能包含的语音识别算法、机器学习算法等,对绘图语音进行分析,得到针对待绘制图像的绘图元素,之后,可以按照预设处理规则,确定各绘图元素在绘图语音中的至少一种状态信息,再基于所确定的状态信息,确定绘图特征及其绘图权重,实现该过程的详细步骤本技术不做详述。
95.在一些实施例中,本技术可以基于多个预设处理规则,构建一个或对应多个意象分析模型,模型构建过程可以依据各预设处理规则内容确定,本技术实施例在此不做详述。这样,在获得绘图语音后,可以直接将该绘图语音输入该意象分析模型,输出针对待绘制图像的各绘图特征及其绘图权重。但并不局限于本技术描述的绘图特征获取方法。
96.步骤s54,至少将多个绘图特征及其绘图权重输入图像生成模型进行图像绘制,得到候选图像;
97.图像生成模型可以是基于人工智能包含的图像绘制算法、机器学习算法等进行训练学习得到,用以将输入的文本信息转换为图像,即实现图像绘制处理,本技术对该图像生成模型的训练实现过程不做详述。
98.步骤s55,将该候选图像与绘图语音内容进行匹配分析,得到绘制匹配度;
99.步骤s56,检测该绘制匹配度是否大于匹配阈值,如果否,进入步骤s57;如果是,进入步骤s58;
100.结合上文实施例对应部分的描述,本技术可以利用预训练的判别器实现步骤s55,即判断候选图像与绘图语音包含的待绘制图像的描述内容是否一致,这可以通过两者之间的绘制匹配度是否大于匹配阈值,来表示是否一致,若所得绘图匹配度大于匹配阈值,可以认为候选图像与绘图语音中待绘制图像的描述内容一致;反之,可以认为不一致,本技术对匹配阈值的数值大小不做限制,可视情而定。
101.可选的,将候选图像与绘图语音包含的待绘制图像的描述内容输入判别器后,判别器可以按照上文描述的匹配分析,输出该候选图像与该描述内容是否一致的判别结果,若一致,说明本次绘制的候选图像符合用户对待绘制图像的描述内容;若不一致,说明本次
绘制的候选图像不符合用户对待绘制图像的描述内容,可以继续对图像生成模型进行迭代更新,重新绘制图像。
102.步骤s57,调整图像生成模型的模型参数,以继续对调整后的图像生成模型输出的新候选图像进行匹配分析;
103.步骤s58,将该候选图像确定为目标图像输出。
104.继上文描述,在绘制匹配度小于或等于匹配阈值的情况下,因本次绘制的图像不符合绘图语音的描述内容,需要重新绘图,所以,为了提高图像绘制准确性,可以据此调整图像生成模型的模型参数,再按照上文描述的方法,将所得到的绘图特征及其绘图权重输入调整后的图像生成模型,得到新的候选图像后,对新的候选图像与绘图语音内容进行匹配分析,确定新的候选图像是否符合针对待绘制图像的描述内容,如果仍不符合,可以继续调整模型参数,如此经过模型多次迭代更新,直至得到符合该描述内容的目标图像。
105.在上述一致性判别过程中,若确定本次绘制的候选图像与绘图语音内容的绘制匹配度大于匹配阈值,可以直接将该候选图像确定为目标图像,即符合该绘图语音对待绘制图像的描述内容的图像。
106.参照图6,为本技术提出的语音绘图方法的又一可选示例的流程示意图,本实施例可以是上文语音绘图方法的又一可选细化实现方法,该方法仍可以由计算机设备执行。如图6所示,该语音绘图方法可以包括:
107.步骤s61,获得用于描述待绘制图像的绘图语音;
108.步骤s62,提取该绘图语音所包含的针对待绘制图像的多个绘图元素;
109.关于步骤s61和步骤s62的实现过程,可以参照上文实施例相应部分的描述,本实施例在此不做赘述。
110.步骤s63,确定针对待绘制图像重复描述的绘图元素为第一绘图特征,增大第一绘图特征的第一绘图权重;
111.本技术实施例中,对于某一预设处理规则,可以通过对绘图语音分析重点,将其包含的重复描述的内容确定为重点内容,为了方便描述,将重复描述的内容(通常为待绘制图像的某一或多个绘图元素)确定为第一绘图特征,相对于其他未重复描述的绘图特征,可以增加第一绘图特征的第一绘图权重,以通过绘图权重的大小,表征对应绘图特征的重要程度。
112.可选的,在对绘图权重进行调整配置过程中,可以依据第一绘图特征的重复次数实现,重复次数越高的第一绘图特征,说明其对待绘制图像的重要程度越高,对应第一绘图权重越大。本技术对重复次数与第一绘图权重之间的调整关系不做限制,可视情而定。
113.步骤s64,对多个绘图元素进行音调比较,确定重音所对应的绘图元素为第二绘图特征,增大第二绘图特征的第二绘图权重;
114.在又一预设处理规则中,在对绘图语音进行重点分析过程中,也可以将重音所在的绘图元素确定为重要内容,因此,可以对绘图语音描述的多个绘图元素各自的音调进行比较,确定重音所在的第二绘图特征,并增大该第二绘图特征对应的第二绘图权重,由该绘图权重大小表征描述对应绘图元素的音调高低。
115.需要说明,在对绘图语音进行意象分析的过程中,可以有选择性地确定所使用的预设处理规则,因此,可以选择调用上文描述的任一个或多个预设处理规则,执行所选择的
预设处理规则对应的步骤,也就是说,上述步骤s63和步骤s64并不一定执行,可视情况而定。
116.步骤s65,基于多个绘图元素在绘图语音中的描述顺序,确定对应的第三绘图特征以及其第三绘图权重;
117.在又一些实施例中,本技术根据需要还可以调用针对绘图语音内容的预设处理规则,根据绘图语音内容的描述顺序,确定待绘制图像内容所占比重,因此,本技术可以在提取绘图语音中各绘图元素时,确定各绘图元素在绘图语音中的描述顺序,再基于各绘图元素的描述顺序,确定对应的第三绘图特征及其第三绘图权重,由于越先描述的绘图元素,对待绘制图像内容的占比往往越高,可以在绘制图像时先绘制,因此,描述顺序越靠前的第三绘图特征,配置的对应第三绘图权重越大,但本技术对描述顺序与绘图权重大小之间的调整配置关系不做限制,可视情况而定。
118.同理,对于步骤s65对应的预设处理规则,也可以根据实际需求进行有选择性地调用,在需要调用该预设处理规则时,执行步骤s65;若不需要调用该预设处理规则,不再执行步骤s65,执行调用其他预设处理规则对应的处理步骤。
119.步骤s66,确定多个绘图元素各自的语法类型;
120.步骤s67,基于不同语法类型的权重和多个绘图元素,确定相应语法类型的第四绘图特征及其第四绘图权重;
121.在本技术提出的又一预设处理规则中,本技术也可以对绘图语音内容的语意进行重点分析,通过语法拆分,确定各语句的语法元素构成,考虑用户语音描述内容的现实情况,最复杂的情况考虑同时包含主语、谓语、宾语、定语、状语、补语的语句,如“你(主语)拿着(谓语)红红的(定语)苹果(宾语)摇摇晃晃地(状语)走着(谓语),苹果红得像天边的夕阳(补语)”,以通过赋予语法元素不同权重,来组成待绘制图像的内容。
122.其中,本技术可以依据上文列举的多种语法类型,即主语、谓语、宾语、定语、状语、补语等语法类型在绘图描述中的重要性,确定各语法类型的权重,如不同语法类型的权重大小关系可以表示为:宾语=定语》补语》状语》主语=谓语。
123.基于此,可以按照语句的语法特点,确定从绘图语音中提取出的多个绘图元素各自的语法类型,之后,按照不同语法类型对应的权重,对相应绘图元素进行分析,确定绘图描述重点的第四绘图特征及其第四绘图权重,如直接将各绘图元素所属语法类型对应的权重,直接确定为第四绘图权重,也可以基于该语法类型对应的权重,确定第四绘图权重,保证语法类型对应的权重与第四绘图权重之间正相关,本技术对两者之间的调整对应关系不做限制。
124.在实际应用中,确定需要调用该预设处理规则的情况下,执行步骤s66和步骤s67。且在调用多个预设处理规则的情况下,在执行每一预设处理规则的过程中,确定绘图特征的绘图权重时,可以综合这多个预设处理规则的内容实现,实现过程本技术不做详述。
125.步骤s68,检测到逻辑关系不合理的任意两个绘图元素,确定该两个绘图元素中具有较低绘图权重的绘图元素;
126.步骤s69,对具有较低绘图权重的绘图元素进行语意联想分析,得到针对该两个绘图元素的第五绘图特征;
127.对于绘图语音的描述内容,相邻绘图元素之间的关系可能不符合自然语言的逻辑
关系,如“红色的大海”这与常规的蓝色大海并不一致,需要对其进行校准更新。基于此,本技术可以按照预设逻辑关系,对从绘图语音提取到的多个绘图元素关系进行逻辑分析,确定逻辑关系不合理的任意两个绘图元素,之后,可以结合上文描述的绘图权重配置方法,分析确定出这两个绘图元素中具有较低绘图权重的绘图元素。
128.仍以“红色的大海”为例,通常情况下大海不会是红色,提取两个绘图元素“大海”和“红色”后,两者之间的逻辑关系不合理,按照上文描述的预设处理规则,可以确定“大海”的绘图权重大于“红色”的绘图权重,可以确定具有较低绘图权重的绘图元素“红色”。可以对该绘图元素进行语意联想分析,即对“红色”进行等价联想,如“红色的珊瑚”,那么可以认为用户描述的“红色的大海”,其是因为大海中有红色的珊瑚,导致海面看起来是红色,基于这一语意联想分析结果,确定针对这两个绘图元素的第五绘图特征。
129.基于上述分析,在一些实施例中,如图7所示,本实施例描述的预设处理规则的实现方法,即步骤s68和步骤s69包含的一可选实现方式可以包括:
130.步骤s71,基于多个绘图元素各自的语法类型和描述顺序,确定具有关联关系的任意两个绘图元素;
131.步骤s72,从字词知识图谱中未查询到该两个绘图元素之间的关系,确定该两个绘图元素之间的逻辑关系不合理;
132.其中,字词知识图谱可以对字词库中不同词语或语句进行关联性分析,依据关联性分析结果生成,本技术对字词知识图谱的生成方法不做限制,当然也可以采用其他数据结构表示方式,表征不同词语之间的逻辑关系,并不局限于知识图谱表示方式。
133.这样,在确定具有关联关系的任意两个绘图元素,如某一短语或语句包含的两个绘图元素,可以在预先构建的字词知识图谱中,查询是否存在这两个绘图元素之间的逻辑关系,若存在,可以认为这两个绘图元素之间的逻辑关系合理;若不存在,可以认为这两个绘图元素之间的逻辑关系不合理。
134.步骤s73,基于逻辑关系不合理的两个绘图元素各自的语法类型,确定具有较低绘图权重的绘图元素;
135.关于任一绘图元素的绘图权重的获取方法,可以参照但并不局限于上文描述的预设处理规则确定,本技术实施例在此不做详述。
136.步骤s74,从字词知识图谱中,查询与具有较低绘图权重的绘图元素关联的候选联想元素;
137.步骤s75,将候选联想元素与对应的两个逻辑关系不合理的绘图元素进行场景匹配分析,确定属于同一场景下的目标联想元素;
138.步骤s76,利用该两个逻辑关系不合理的绘图元素以及目标联想元素,确定对应的多个第五绘图特征。
139.如上文对“红色的大海”这一举例,对“红色”这一具有较低绘图权重的绘图元素进行联想,所得到的候选联想元素可以包括“珊瑚”“夕阳”等,之后,对候选联想元素和逻辑关系不合理的绘图元素进行场景分析,从候选联想元素中,筛选与这两个绘图元素所属同一场景的目标联想元素,如属于大海场景下的“珊瑚”等,之后,可以对筛选得到的目标联想元素以及逻辑关系不合理的逻辑关系,确定绘图的第五绘图特征,如“红色的珊瑚,使得大海表面呈现红色”等,以便后续据此实现“红色的大海”这一描述内容的图像绘制。
140.需要说明,本技术对本技术对步骤s68和步骤s69对应的预设处理规则的内容及其实现方法不做限制,包括但并不局限于上文描述的实现方式,可以根据实际应用需求进行灵活调整,本申实施例在此不做一一举例详述。
141.步骤s610,至少基于上述各绘图特征及其绘图权重进行图像绘制,得到目标图像。
142.在本技术实施例中,可以按照上文描述的任一个或多个预设处理规则,确定任一绘图特征及其绘图权重过程中,基于人工智能进行图像绘制,随着所确定的绘图特征增多,不做更新绘制的图像,直至得到目标图像。关于步骤s610的实现过程,可以参照但并不局限于上文实施例对应部分的描述,本实施例在此不做赘述。
143.需要说明,对于上文步骤描述的各预设处理规则,可以按照预设的优先级执行,包括但并不局限于上文描述的步骤执行顺序,且并不局限于上文描述的多种预设处理规则,可以从中选择一种或多种组合执行,或者结合其他预设处理规则,对绘图语音进行意象分析,获得多个绘图特征及其绘图权重,实现过程本技术不做一一举例详述。
144.参照图8,为本技术提出的语音绘图方法的又一可选示例的流程示意图,该方法可以由计算机设备执行,如图8所示,该方法可以包括:
145.步骤s81,获得用于描述待绘制图像的绘图语音;
146.步骤s82,基于该绘图语音包含的针对待绘制图像的描述内容,对图像库进行图像搜索,确定待绘制图像的相似图像;
147.步骤s83,基于针对待绘制图像的描述内容,对相似图像包含的图像元素进行解构与重组,得到针对待绘制图像的参考图像;
148.结合上文对本技术技术方案的相关描述,在判断绘制语音包含的对待绘制图像的描述内容存在客观逻辑,还可能包含个性化的内容,为了提高图像绘制效率和准确性,可以由搜索引擎对该描述内容进行检索,若检测到与描述内容的相似度达到相似阈值的待定参考图像,可以确定有客观逻辑的存在,可以从检索到的待定参考图像中,选择相似度最高的相似图像,对其包含的图像元素进行解构,按照用户描述内容对这些图像元素进行重组,生成新的图像作为针对待绘制图像的参考图像。
149.需要说明,本技术对搜索引擎对图像库进行搜索,得到相似图像的搜索算法及其运算原理不做限制,以及用于相似图像的解构与重组所使用的算法原理不做详述。
150.示例性的,在图像搜索页面的搜索框输入搜索信息(其可以依据待绘制图像的名称、类型等确定,本技术对该搜索信息的内容及其获取方法不做限制),如输入“梵高的卧室”(即待绘制图像),搜索引擎知识图谱可以匹配到如图9a所示的“在亚尔的卧室”这一相似图像,两者相似度较高,可以认为这两幅图像强相关,但搜索到的图像与待绘制图像仍存在一定差别,本技术可以对搜索到的相似图像进行图像元素提取和重构,结合待绘制图像的风格,生成参考图像。
151.在又一些实施例中,本技术可以由人工智能,依据绘图语音包含的待绘制图像的描述内容,对相似图像包含的多个图像元素进行重组,直接得到如图9b的目标图像,当然,若重组得到的图像不符合描述内容,可以依据描述内容对所生成的图像进行调整,直至符合描述内容。也可以按照下文步骤描述的方法,获得符合描述内容的目标图像,本技术对如何基于相似图像,获得目标图像的实现方法不做限制。
152.其中,按照上文描述的搜索方式,若未搜索到待绘制图像的相似图像,可以按照本
申请上文实施例描述的方法,直接对绘图语音图像进行意象分析,基于得到的绘图特征及其绘图权重,实现图像自动绘制,得到目标图像,实现过程本实施例在此不做赘述。
153.步骤s84,按照预设处理规则,对绘图语音进行意象分析,获得绘图特征及其绘图权重;
154.关于步骤s84的实现过程,可以参照上文实施例对应部分的描述,本实施例在此不做赘述。
155.步骤s85,将参考图像中的图像元素与绘图特征进行匹配分析,得到对应的匹配结果;
156.步骤s86,基于匹配结果和绘图权重,确定对应图像元素的元素权重;
157.步骤s87,至少将参考图像以及元素权重输入图像生成模型进行图像绘制,得到目标图像。
158.本技术实施例中,可以基于参考图像、绘图特征和绘图权重进行图像绘制,得到目标图像。在该实现过程中,可以利用所获得的绘图特征,对参考图像包含的图像元素进行匹配,确定哪些图像元素与待绘制图像的内容相同,之后,可以结合绘图特征的绘图权重,来确定该图像元素的元素权重,由此表征该图像元素对待绘制图像内容的重要性,以便在后续绘图时,可以重点对该图像元素进行绘制,突出所得目标图像中的该图像元素。本技术对元素权重的获取方法不做限制。
159.关于如何利用图像生成模型对输入信息进行图像绘制,得到目标图像的实现过程,可以参照上文实施例相应部分的描述,本实施例在此不做赘述。
160.在又一些实施例中,如图10所示的语音绘图方法的流程示意图,获得绘图语音后,搜索引擎搜索与绘图语音对待绘制图像的描述内容相似度大于相似阈值的相似图像,如果未搜索到,可以按照预设处理规则对绘图语音进行意图分析,得到绘图特征及其绘图权重;若搜索到相似图像,可以对其图像元素进行解构和重组,得到参考图像,之后,可以将得到参考图像和绘图语音包含的描述内容输入图像生成模型,或者将绘图特征及其绘图权重输入图像生成模型,以使得图像生成模型基于输入信息进行图像绘制,得到候选图像,再输入判别器,确定该候选图像是否符合待绘制图像的描述内容,如果符合,将该候选图像确定为目标图像;如果不符合,可以调整模型参数,利用调整后的模型参数重新进行图像绘制,如此迭代更新,得到目标图像。
161.综上,本技术通过绘图语音、语义、语调分析,能够更快且准确呈现视觉化关键意象,绘制得到所需目标图像。在计算机设备为具有显示器的电子设备的情况下,可以在用户描述待绘制图像的过程中,按照上文描述的任一方法,同步绘制图像,在描述完时即可得到目标图像;当然,也可以在获得对待绘制图像的完整绘图语音后,再按照上文描述的语音绘图方法,得到目标图像,本技术对该实现方式不做限制。
162.在上述计算机设备为服务器的情况下,可以将采集到的绘图语音同步发送至服务器,或将完整的绘图语音发送至服务器,由该服务器按照上文描述的语音绘图方法,绘制得到目标图像,将其反馈至电子设备输出。本技术对图像绘制的应用环境及其系统架构不做限制。可以理解,对于上述语音绘图方法的执行过程,对于用户来说可以是无感知的,用户启动计算机设备的图像绘制功能后,只需要描述待绘制图像内容,即可得到目标图像,相对于人工绘制目标图像的实现方法,大大提高了图像绘制效率,无需用户具有较高绘图技能,
提高了用户体验。
163.参照图11,为本技术提出的语音绘图装置的一可选示例的结构示意图,该装置可以包括:
164.绘图语音获得模块111,用于获得用于描述待绘制图像的绘图语音;
165.分析模块112,用于按照预设处理规则,对所述绘图语音进行意象分析,获得绘图特征以及所述绘图特征的绘图权重;其中,所述绘图权重越高的所述绘图特征对所述待绘制图像的影响力越大;
166.图像绘制模块113,用于至少基于所述绘图特征和所述绘图权重进行图像绘制,得到目标图像。
167.在一些实施例中,分析模块112可以包括:
168.绘图元素提取单元,用于提取所述绘图语音所包含的针对所述待绘制图像的多个绘图元素;
169.绘图特征确定单元,用于基于所述绘图元素在所述绘图语音中的状态信息,确定多个绘图特征以及所述多个绘图特征各自的绘图权重;
170.其中,所述状态信息包括重复次数、音调、描述顺序、语法类型、逻辑合理性之中的一个或多个组合信息;所述绘图权重越高的所述绘图特征,在图像绘制过程中的绘图顺序越靠前。
171.可选的,绘图特征确定单元可以包括:
172.第一确定单元,用于确定针对所述待绘制图像重复描述的绘图元素为第一绘图特征,增大所述第一绘图特征的第一绘图权重;和/或,
173.第二确定单元,用于对所述多个绘图元素进行音调比较,确定重音所对应的绘图元素为第二绘图特征,增大所述第二绘图特征的第二绘图权重;和/或,
174.第三确定单元,用于基于所述多个绘图元素在所述绘图语音中的描述顺序,确定对应的第三绘图特征以及所述第三绘图特征的第三绘图权重;和/或,语法类型确定单元,用于确定所述多个绘图元素各自的语法类型;
175.第四确定单元,用于基于不同语法类型的权重和所述多个绘图元素,确定相应语法类型的第四绘图特征以及所述第四绘图特征的第四绘图权重;和/或,
176.绘图元素确定单元,用于检测到逻辑关系不合理的任意两个绘图元素,确定该两个绘图元素中具有较低绘图权重的绘图元素;
177.第五确定单元,用于对所述具有较低绘图权重的绘图元素进行语意联想分析,得到针对该两个绘图元素的第五绘图特征。
178.在一些实施例中,上述绘图元素确定单元可以包括:
179.元素关系确定单元,用于基于所述多个绘图元素各自的语法类型和描述顺序,确定具有关联关系的任意两个绘图元素;
180.逻辑关系检测单元,用于从字词知识图谱中未查询到该两个绘图元素之间的关系,确定该两个绘图元素之间的逻辑关系不合理;
181.绘图元素子确定单元,用于基于所述逻辑关系不合理的两个绘图元素各自的语法类型,确定具有较低绘图权重的绘图元素。
182.可选的,上述第五确定单元可以包括:
183.候选联想元素查询单元,用于从字词知识图谱中,查询与所述具有较低绘图权重的绘图元素关联的候选联想元素;
184.目标联想元素确定单元,用于将所述候选联想元素与对应的两个逻辑关系不合理的绘图元素进行场景匹配分析,确定属于同一场景下的目标联想元素;
185.第五绘图特征确定单元,用于利用该两个逻辑关系不合理的绘图元素以及所述目标联想元素,确定对应的多个第五绘图特征。
186.在本技术提出的又一些实施例中,上述图像绘制模块113可以包括:
187.图像绘制单元,用于至少将多个所述绘图特征和所述绘图权重输入图像生成模型进行图像绘制,得到候选图像;
188.第一匹配分析单元,用于将所述候选图像与所述绘图语音内容进行匹配分析,得到绘制匹配度;
189.目标图像确定单元,用于如果所述绘制匹配度大于匹配阈值,将所述候选图像确定为目标图像输出;
190.模型参数调整单元,用于如果所述绘制匹配度小于或等于所述匹配阈值,调整所述图像生成模型的模型参,继续对调整后的图像生成模型输出的新的候选图像进行匹配分析,得到目标图像。
191.在又一些实施例中,基于上文各实施例的描述,该装置还可以包括:
192.图像搜索模块,用于基于所述绘图语音包含的针对待绘制图像的描述内容,对图像库进行图像搜索,确定所述待绘制图像的相似图像;
193.解构重组模块,用于基于所述描述内容,对所述相似图像包含的图像元素进行解构与重组,得到针对所述待绘制图像的参考图像;
194.基于此,上述图像绘制模块113具体可以用于基于参考图像、所述绘图特征和所述绘图权重进行图像绘制,得到目标图像。
195.可选的,该图像绘制模块113可以包括:
196.第二匹配分析单元,用于将所述参考图像中的图像元素与所述绘图特征进行匹配分析,得到对应的匹配结果;
197.元素权重确定单元,用于基于所述匹配结果和所述绘图权重,确定对应所述图像元素的元素权重;
198.目标图像绘制单元,用于至少将所述参考图像以及所述元素权重输入图像生成模型进行图像绘制,得到目标图像。
199.需要说明的是,关于上述各装置实施例中的各种模块、单元等,均可以作为程序模块存储在存储器中,由处理器执行存储在存储器中的上述程序模块,以实现相应的功能,关于各程序模块及其组合所实现的功能,以及达到的技术效果,可以参照上述方法实施例相应部分的描述,本实施例不再赘述。
200.本技术还提供了一种计算机可读存储介质,其上可以存储计算机程序,该计算机程序可以被处理器调用并加载,以实现上述实施例描述的语音绘图方法的各个步骤。
201.最后,需要说明的是,关于上述各实施例中,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方
法或者设备也可能包含其它的步骤或元素。由语句“包括一个
……”
限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
202.其中,在本技术实施例的描述中,除非另有说明,“/”表示或的意思,例如,a/b可以表示a或b;本文中的“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。另外,在本技术实施例的描述中,“多个”是指两个或多于两个。
203.本技术涉及到的术语诸如“第一”、“第二”等仅用于描述目的,用来将一个操作、单元或模块与另一个操作、单元或模块区分开来,而不一定要求或者暗示这些单元、操作或模块之间存在任何这种实际的关系或者顺序。且不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量,由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。
204.另外,本说明书中各个实施例采用递进或并列的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置、计算机设备而言,由于其与实施例公开的方法对应,所以描述的比较简单,相关之处参见方法部分说明即可。
205.对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本技术。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本技术的精神或范围的情况下,在其它实施例中实现。因此,本技术将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1