本公开涉及人工智能,尤其涉及图像处理、深度学习和智能设备领域。
背景技术:
1、近年来,随着深度学习技术的发展,语音识别、图像识别等技术的准确率得到有效提升,基于语音或图像识别的应用也出现在多种不同的场景中。特别是智能设备中,用户可以无需手动输入,通过语音及图像就可以与设备进行交互。
2、例如,智能眼镜中设置有摄像头,基于摄像头的输入实现用户与设备之间的交互。其中,摄像头的输入是区域性的,输入的内容中存在多个人/物/景等情况。相关技术中,采用自动对焦或者识别眼球的变化的方式,在摄像头输入的图像中确定处理目标。
技术实现思路
1、本公开提供了一种基于智能眼镜的目标选择方法、装置和电子设备。
2、根据本公开的一方面,提供了一种基于智能眼镜的目标选择方法,包括:
3、响应于智能眼镜采集的n个图像中出现目标手势,在所述n个图像之前采集的m个图像中,选取不包含手势信息的第一图像;其中,n和m均为不小于1的整数;
4、基于所述目标手势,在所述第一图像中确定处理目标。
5、根据本公开的另一方面,提供了一种基于智能眼镜的目标选择装置,包括:
6、第一图像确定模块,用于响应于智能眼镜采集的n个图像中出现目标手势,在所述n个图像之前采集的m个图像中,选取不包含手势信息的第一图像;其中,n和m均为不小于1的整数;
7、第一目标确定模块,用于基于所述目标手势,在所述第一图像中确定处理目标。
8、根据本公开的另一方面,提供了一种电子设备,包括:
9、至少一个处理器;以及
10、与该至少一个处理器通信连接的存储器;其中,
11、该存储器存储有可被该至少一个处理器执行的指令,该指令被该至少一个处理器执行,以使该至少一个处理器能够执行本公开实施例中任一的方法。
12、根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,该计算机指令用于使该计算机执行根据本公开实施例中任一的方法。
13、根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,该计算机程序在被处理器执行时实现根据本公开实施例中任一的方法。
14、根据本公开实施例的技术方案,用户可以采用目标手势指示处理目标,电子设备可以基于目标手势,在出现目标手势之前采集的不包含手势信息的第一图像中确定出处理目标。一方面便于交互,另一方面通过在不包含手势信息的第一图像中确定处理目标,可以提升选择处理目标的准确性。
15、应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
1.一种基于智能眼镜的目标选择方法,包括:
2.根据权利要求1所述的方法,还包括:
3.根据权利要求2所述的方法,还包括:
4.根据权利要求1-3中任一项所述的方法,其中,所述基于所述目标手势,在所述第一图像中确定处理目标,包括:
5.根据权利要求4所述的方法,其中,所述基于所述第二框选位置信息,在所述第一图像中确定处理目标,包括:
6.根据权利要求5所述的方法,还包括:
7.根据权利要求1-5中任一项所述的方法,还包括:
8.一种基于智能眼镜的目标选择装置,包括:
9.根据权利要求8所述的装置,还包括:
10.根据权利要求9所述的装置,还包括:
11.根据权利要求8-10中任一项所述的装置,其中,所述第一目标确定模块,包括:
12.根据权利要求11所述的装置,其中,所述第二框选单元用于:
13.根据权利要求12所述的装置,还包括:
14.根据权利要求8-13中任一项所述的装置,还包括:
15.一种电子设备,包括:
16.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-7中任一项所述的方法。
17.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-7中任一项所述的方法。
18.一种智能眼镜,包括如权利要求15所述的电子设备。