大模型控制电子设备的方法和装置

文档序号:38479547发布日期:2024-06-27 11:38阅读:36来源:国知局
大模型控制电子设备的方法和装置

本申请涉及计算机,并且更具体地,涉及计算机中的一种大模型控制电子设备的方法、装置、电子设备和可读存储介质。


背景技术:

1、目前,电子设备一般会集成显示屏,以便于用户通过显示屏显示的图形用户界面(graphical user interface,gui)控制电子设备处理。

2、在通过电子设备处理一些较为复杂的事项的过程中,用户通常需要多次通过gui向电子设备输入相关的指令控制电子设备动作,该过程的难度和工作量通常比较大。


技术实现思路

1、本申请提供了一种大模型控制电子设备的方法、装置、电子设备和可读存储介质,本申请能够降低用户在通过电子设备处理事项过程中的难度和工作量。

2、第一方面,提供了一种大模型控制电子设备的方法,应用于具有显示屏的电子设备,包括:

3、确定所述电子设备当前需要完成的第一任务;

4、获取所述电子设备当前的第一状态信息,以及所述显示屏当前的第一屏幕截图;

5、将所述第一任务、所述第一状态信息和所述第一屏幕截图输入预先训练得到的多模态大模型,以得到所述多模态大模型输出的第一结果,所述第一结果包括所述第一任务对应的至少一个第一指令;

6、控制所述电子设备执行所述至少一个第一指令,以使所述电子设备完成所述第一任务。

7、本申请实施例中,在控制电子设备处理某个事项的过程中,首先确定电子设备当前需要完成的第一任务,以及获取电子设备当前的第一状态信息和显示屏当前的第一屏幕截图,然后将第一任务、第一状态信息和第一屏幕截图输入预先训练得到的多模态大模型得到多模态大模型输出的第一结果,之后控制电子设备执行第一结果中包括的至少一个第一指令。通过多模态大模型将任务分解为至少一个指令,然后控制电子设备执行每个指令,不需要用户手动向电子设备输入指令控制电子设备动作,可以降低用户的工作难度和工作量。

8、可选地,所述第一任务为所述电子设备需要完成的多个任务中的一个,所述确定所述电子设备当前需要完成的第一任务,包括:

9、确定所述第一任务是否为所述多个任务中第一个被执行的任务;

10、若否,则将前一次执行完成的所述多个任务中的第二任务、所述第一状态信息和所述第一屏幕截图输入所述多模态大模型,以得到所述多模态大模型输出的第二结果,所述第二结果中包括所述第二任务的执行结果;

11、在所述执行结果指示所述第二任务成功执行的情况下,从所述多个任务中确定在所述第二任务之后执行的所述第一任务。

12、可选地,述方法还包括:在所述执行结果指示所述第二任务需要重新执行的情况下,将所述第二任务、所述第一状态信息和所述第一屏幕截图输入所述多模态大模型,以得到所述多模态大模型输出的第三结果,所述第三结果中包括至少一个第二指令;控制所述电子设备执行所述至少一个第二指令,以使所述电子设备完成所述第二任务。

13、可选地,所述多个任务为完成待处理事项需要执行的多个任务,所述方法还包括:在所述执行结果表征所述待处理事项需要重新处理的情况下,将所述待处理事项、所述第一状态信息和所述第一屏幕截图输入所述多模态大模型,以得到所述多模态大模型输出的第四结果,所述第四结果中包括更新后的多个任务;控制所述电子设备执行所述更新后的多个任务,以使得所述电子设备重新处理所述待处理事项。

14、可选地,所述方法还包括:在所述执行结果指示跳转到所述多个任务中的第三任务的情况下,将所述第三任务、所述第一状态信息和所述第一屏幕截图输入所述多模态大模型,以得到所述多模态大模型输出的第五结果,所述第五结果中包括至少一个第三指令;控制所述电子设备执行所述至少一个第三指令,以使所述电子设备完成所述第三任务。

15、可选地,所述第一任务为待处理事项对应的多个任务中的一个,在所述确定所述电子设备当前需要完成的第一任务之前,所述方法还包括:在执行所述多个任务中的第一个被执行的任务之前,获取所述电子设备的第二状态信息,以及所述显示屏的第二屏幕截图;将所述待处理事项、所述第二状态信息和所述第二屏幕截图输入所述多模态大模型,以得到所述多模态大模型输出的第六结果,所述第六结果中包括所述多个任务。

16、可选地,所述控制所述电子设备执行所述至少一个第一指令,包括:

17、在所述第一指令为多个的情况下,根据所述第一结果中包括的多个所述第一指令的执行顺序依次执行多个所述第一指令。

18、第二方面,提供了一种大模型控制电子设备的装置,该装置设置于具有显示屏的电子设备,包括:

19、确定模块,用于确定所述电子设备当前需要完成的第一任务;

20、获取模块,用于获取所述电子设备当前的第一状态信息,以及所述显示屏当前的第一屏幕截图;

21、输入模块,用于将所述第一任务、所述第一状态信息和所述第一屏幕截图输入预先训练得到的多模态大模型,以得到所述多模态大模型输出的第一结果,所述第一结果包括所述第一任务对应的至少一个第一指令;

22、控制模块,用于控制所述电子设备执行所述至少一个第一指令,以使所述电子设备完成所述第一任务。

23、第三方面,提供一种电子设备,包括存储器,用于存储可执行程序代码;处理器,用于从所述存储器中调用并运行所述可执行程序代码,使得所述电子设备执行上述第一方面或第一方面任意一种可能的实现方式中的方法。

24、第四方面,提供了一种可执行程序代码产品,该可执行程序代码产品包括:可执行程序代码,当该可执行程序代码在计算机上运行时,使得该计算机执行上述第一方面或第一方面任意一种可能的实现方式中的方法。

25、第五方面,提供了一种可读存储介质,该可读存储介质存储有可执行程序代码,当该可执行程序代码在计算机上运行时,使得该计算机执行上述第一方面或第一方面任意一种可能的实现方式中的方法。



技术特征:

1.一种大模型控制电子设备的方法,其特征在于,所述电子设备具有显示屏,所述方法包括:

2.如权利要求1所述的方法,其特征在于,所述第一任务为所述电子设备需要完成的多个任务中的一个,所述确定所述电子设备当前需要完成的第一任务,包括:

3.如权利要求2所述的方法,其特征在于,所述方法还包括:

4.如权利要求2所述的方法,其特征在于,所述多个任务为完成待处理事项需要执行的多个任务,所述方法还包括:

5.如权利要求2所述的方法,其特征在于,所述方法还包括:

6.如权利要求1所述的方法,其特征在于,所述第一任务为待处理事项对应的多个任务中的一个,在所述确定所述电子设备当前需要完成的第一任务之前,所述方法还包括:

7.如权利要求1-6中任一项所述的方法,其特征在于,所述控制所述电子设备执行所述至少一个第一指令,包括:

8.一种大模型控制电子设备的装置,其特征在于,设置于具有显示屏的电子设备,包括:

9.一种电子设备,其特征在于,所述电子设备包括:

10.一种可读存储介质,其特征在于,所述可读存储介质存储有可执行程序代码,当所述可执行程序代码被执行时,实现如权利要求1至7中任意一项所述的方法。


技术总结
本申请提供了一种大模型控制电子设备的方法和装置,涉及计算机技术领域。该方法包括:确定电子设备当前需要完成的第一任务,以及获取电子设备当前的第一状态信息和显示屏当前的第一屏幕截图,将第一任务、第一状态信息和第一屏幕截图输入预先训练得到的多模态大模型得到多模态大模型输出的第一结果,之后控制电子设备执行第一结果中包括的至少一个第一指令。本申请实施例中,通过多模态大模型将任务分解为至少一个指令,然后控制电子设备执行每个指令,不需要用户手动向电子设备输入指令控制电子设备动作,可以降低用户的工作难度和工作量。

技术研发人员:牛润良,常毅,王琪,李金栋,王仕琪
受保护的技术使用者:吉林大学
技术研发日:
技术公布日:2024/6/26
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1