一种显示设备及图像识别方法与流程

文档序号:33379997发布日期:2023-03-08 05:23阅读:32来源:国知局
1.本技术涉及显示设备
技术领域
:,尤其涉及一种显示设备及图像识别方法。
背景技术
::2.显示设备是指能够输出具体显示画面的电子设备,可以是智能电视、通信终端、智能广告屏、投影仪等电子设备。以智能电视为例,智能电视是基于internet应用技术,具备开放式操作系统与芯片,拥有开放式应用平台,可实现双向人机交互功能,集影音、娱乐、数据等多种功能于一体的电视产品,用于满足用户多样化和个性化需求。3.显示设备还可以对其显示的画面进行智能图像识别,比如用户在观看过程中,可以对显示画面中包括的动物、植物、景点、汽车或品牌等特征目标截图进行识别,进而获取特征目标的详细信息。然而,部分特征目标需要通过对其全景进行识别,才能得出特征目标的信息。因此,如果在用户向显示设备发送识别指令时,显示画面中仅包括特征目标的局部特征,则无法识别出特征目标的信息,进而导致特征目标识别召回率低下,降低用户体验。技术实现要素:4.本技术提供了一种显示设备及图像识别方法,以解决显示设备特征目标识别召回率低的问题。5.第一方面,本技术提供一种显示设备,包括:显示器与控制器。所述控制器被配置为执行以下程序步骤:6.响应于特征目标识别指令,获取所述用户界面的显示内容,所述显示内容包括视频内容和/或图像内容;7.读取所述显示内容的分类标签;8.如果所述显示内容的分类标签中包括特征目标标识,则在预设时间内连续对所述显示内容执行截图,以生成多个画面截图;9.将多个所述画面截图拼接为全景图像;10.识别所述全景图像中的特征目标,以生成特征目标信息,以及控制所述显示器显示所述特征目标信息。11.第二方面,本技术还提供一种图像识别方法,包括:12.响应于特征目标识别指令,获取用户界面的显示内容,所述显示内容包括视频内容和/或图像内容;13.读取所述显示内容的分类标签;14.如果所述显示内容的分类标签中包括特征目标标识,则在预设时间内连续对所述显示内容执行截图,以生成多个画面截图;15.将多个所述画面截图拼接为全景图像;16.识别所述全景图像中的特征目标,以生成特征目标信息,以及控制显示器显示所述特征目标信息。17.由以上技术方案可知,本技术提供的显示设备及图像识别方法可以响应于特征目标识别指令,获取用户界面的显示内容。其中,显示内容包括视频内容和/或图像内容。所述方法可以在显示内容的分类标签中包括特征目标标识时,在预设时间内连续对显示内容执行多次截图,生成多个特征目标的画面截图。将多个画面截图拼接为特征目标的全景图像,并对全景图像进行识别,生成特征目标信息,进而解决了特征目标识别召回率低的问题,提高用户体验。附图说明18.为了更清楚地说明本技术的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。19.图1为本技术一些实施例提供的显示设备与控制装置之间操作场景的示意图;20.图2为本技术一些实施例提供的显示设备的硬件配置示意图;21.图3为本技术一些实施例提供的控制装置的硬件配置示意图;22.图4为本技术一些实施例提供的显示设备的软件配置示意图;23.图5为本技术一些实施例提供的显示设备应用程序的图标控件界面示意图;24.图6为本技术一些实施例提供的分类标签的推荐界面示意图;25.图7为本技术一些实施例提供的特征目标信息的识别结果界面示意图;26.图8为本技术一些实施例提供的检测截图工具的提示信息界面示意图;27.图9为本技术一些实施例提供的在观看媒资时进行特征目标识别的效果示意图;28.图10为本技术一些实施例提供的在观看媒资时进行非特征目标识别的效果示意图;29.图11为本技术一些实施例提供的一种画面截图的效果示意图;30.图12为本技术一些实施例提供的另一种画面截图的效果示意图;31.图13为本技术一些实施例提供的一种全景图像的效果示意图;32.图14为本技术一些实施例提供的进行画面截图拼接的流程示意图;33.图15为本技术一些实施例提供的一种过渡不自然的全景图像效果示意图;34.图16为本技术一些实施例提供的特征目标识别的流程示意图;35.图17为本技术一些实施例提供的图像识别方法的流程示意图。具体实施方式36.为使本技术的目的和实施方式更加清楚,下面将结合本技术示例性实施例中的附图,对本技术示例性实施方式进行清楚、完整地描述,显然,描述的示例性实施例仅是本技术一部分实施例,而不是全部的实施例。37.需要说明的是,本技术中对于术语的简要说明,仅是为了方便理解接下来描述的实施方式,而不是意图限定本技术的实施方式。除非另有说明,这些术语应当按照其普通和通常的含义理解。38.本技术中说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”等是用于区别类似或同类的对象或实体,而不必然意味着限定特定的顺序或先后次序,除非另外注明。应该理解这样使用的用语在适当情况下可以互换。39.术语“包括”和“具有”以及他们的任何变形,意图在于覆盖但不排他的包含,例如,包含了一系列组件的产品或设备不必限于清楚地列出的所有组件,而是可包括没有清楚地列出的或对于这些产品或设备固有的其它组件。40.本技术实施方式提供的显示设备可以具有多种实施形式,例如,可以是电视、激光投影设备、显示器(monitor)、电子白板(electronicbulletinboard)、电子桌面(electronictable)等。41.图1为根据实施例中显示设备与控制装置之间操作场景的示意图。如图1所示,用户可通过终端设备300或控制装置100操作显示设备200。42.在一些实施例中,控制装置100可以是遥控器,遥控器和显示设备的通信包括红外协议通信或蓝牙协议通信,及其他短距离通信方式,通过无线或有线方式来控制显示设备200。用户可以通过遥控器上按键、语音输入、控制面板输入等输入用户指令,来控制显示设备200。43.在一些实施例中,也可以使用终端设备300(如移动电话、平板电脑、计算机、笔记本电脑等)以控制显示设备200。例如,使用在终端设备300上运行的应用程序控制显示设备200。44.在一些实施例中,显示设备200可以不使用上述的终端设备300或控制装置100接收指令,而是通过触摸或者手势等接收用户的控制。45.在一些实施例中,显示设备200还可以采用除了控制装置100和终端设备300之外的方式进行控制,例如,可以通过显示设备200设备内部配置的获取语音指令的模块直接接收用户的语音指令控制,也可以通过显示设备200设备外部设置的语音终端设备来接收用户的语音指令控制。46.在一些实施例中,显示设备200还与服务器400进行数据通信。可允许显示设备200通过局域网(lan)、无线局域网(wlan)和其他网络进行通信连接。服务器400可以向显示设备200提供各种内容和互动。服务器400可以是一个集群,也可以是多个集群,可以包括一类或多类服务器。47.如图2所示,显示设备200可以包括调谐解调器210、通信器220、检测器230、外部装置接口240、控制器250、显示器260、音频输出接口270、存储器、供电电源、用户接口中的至少一种。48.在一些实施例中,控制器250可以包括处理器,视频处理器,音频处理器,图形处理器,ram,rom,用于输入/输出的第一接口至第n接口。49.显示器260可以包括以下组件,即:用于呈现画面的显示屏组件;驱动图像显示的驱动组件;用于接收源自控制器250输出的图像信号,进行显示视频内容、图像内容以及菜单操控界面的组件以及用户操控ui界面的组件等。50.显示器260可为液晶显示器、oled显示器、以及投影显示器,还可以为一种投影装置和投影屏幕。51.通信器220是用于根据各种通信协议类型与外部设备或服务器进行通信的组件。例如:通信器可以包括wifi模块,蓝牙模块,有线以太网模块等其他网络通信协议芯片或近场通信协议芯片,以及红外接收器中的至少一种。显示设备200可以通过通信器220与外部控制设备100或服务器400建立控制信号和数据信号的发送和接收。52.用户接口,可用于接收控制装置100(如:红外遥控器等)的控制信号。53.检测器230用于采集外部环境或与外部交互的信号。例如,检测器230包括光接收器,用于采集环境光线强度的传感器;或者,检测器230包括图像采集器,如摄像头,可以用于采集外部环境场景、用户的属性或用户交互手势,再或者,检测器230包括声音采集器,如麦克风等,用于接收外部声音。54.外部装置接口240可以包括但不限于如下:高清多媒体接口(hdmi)、模拟或数据高清分量输入接口(分量)、复合视频输入接口(cvbs)、usb输入接口(usb)、rgb端口等任一个或多个接口。也可以是上述多个接口形成的复合性的输入/输出接口。55.调谐解调器210通过有线或无线接收方式接收广播电视信号,以及从多个无线或有线广播电视信号中解调出音视频信号,如以及epg数据信号。在一些实施例中,控制器250和调谐解调器210可以位于不同的分体设备中,即调谐解调器210也可在控制器250所在的主体设备的外置设备中,如外置机顶盒等。56.控制器250,通过存储在存储器上中各种软件控制程序,来控制显示设备的工作和响应用户的操作。控制器250控制显示设备200的整体操作。例如:响应于接收到用于选择在显示器260上显示ui对象的用户命令,控制器250便可以执行与由用户命令选择的对象有关的操作。57.在一些实施例中,控制器250包括中央处理器(centralprocessingunit,cpu),视频处理器,音频处理器,图形处理器(graphicsprocessingunit,gpu),ramrandomaccessmemory,ram),rom(read-onlymemory,rom),用于输入/输出的第一接口至第n接口,通信总线(bus)等中的至少一种。58.图3示出了根据一些实施例的控制装置100的硬件配置框图。如图3所示,控制装置100包括控制处理器110、通信接口130、用户输入/输出接口140、存储器、供电电源。控制装置100可接收用户的输入操作指令,且将操作指令转换为显示设备200可识别和响应的指令,起到用户与显示设备200之间交互中介作用。59.如图4所示,将显示设备的系统分为三层,从上至下分别为应用层、中间件层和硬件层。60.应用层主要包含电视上的常用应用,以及应用框架(applicationframework),其中,常用应用主要是基于浏览器browser开发的应用,例如:html5apps;以及原生应用(nativeapps);61.应用框架(applicationframework)是一个完整的程序模型,具备标准应用软件所需的一切基本功能,例如:文件存取、资料交换...,以及这些功能的使用接口(工具栏、状态列、菜单、对话框)。62.本技术实施例中应用程序框架层包括管理器(managers),内容提供者(contentprovider)等,其中管理器包括以下模块中的至少一个:活动管理器(activitymanager)用与和系统中正在运行的所有活动进行交互;位置管理器(locationmanager)用于给系统服务或应用提供了系统位置服务的访问;文件包管理器(packagemanager)用于检索当前安装在设备上的应用程序包相关的各种信息;通知管理器(notificationmanager)用于控制通知消息的显示和清除;窗口管理器(windowmanager)用于管理用户界面上的括图标、窗口、工具栏、壁纸和桌面部件。63.在一些实施例中,活动管理器用于管理各个应用程序的生命周期以及通常的导航回退功能,比如控制应用程序的退出、打开、后退等。窗口管理器用于管理所有的窗口程序,比如获取显示屏大小,判断是否有状态栏,锁定屏幕,截取屏幕,控制显示窗口变化(例如将显示窗口缩小显示、抖动显示、扭曲变形显示等)、检测是否开启光标模式、开启光标模式后控制光标移动至对应的位置等,例如,窗口管理器可以在检测到光标模式被开启后,调用光标的显示参数,并根据光标的显示参数控制在屏幕中显示所述光标,以及,可以根据接收到的光标移动指令,将光标移动至屏幕上的目标位置。64.原生应用(nativeapps)可以支持在线或离线,消息推送或本地资源访问。65.中间件层包括各种电视协议、多媒体协议以及系统组件等中间件。中间件可以使用系统软件所提供的基础服务(功能),衔接网络上应用系统的各个部分或不同的应用,能够达到资源共享、功能共享的目的。66.硬件层主要包括hal接口、硬件以及驱动,其中,hal接口为所有电视芯片对接的统一接口,具体逻辑由各个芯片来实现。驱动主要包含:音频驱动、显示驱动、蓝牙驱动、摄像头驱动、wifi驱动、usb驱动、hdmi驱动、传感器驱动(如指纹传感器,温度传感器,压力传感器等)、以及电源驱动等。67.图5为本技术一些实施例提供的显示设备能够提供的应用程序的示意图,如图5中所示,应用程序层包含至少一个应用程序可以在显示器中显示对应的图标控件,如:直播电视应用程序图标控件、视频点播应用程序图标控件、媒体中心应用程序图标控件、应用程序中心图标控件、游戏应用图标控件等。68.在一些实施例中,直播电视应用程序,可以通过不同的信号源提供直播电视。例如,直播电视应用程可以使用来自有线电视、无线广播、卫星服务或其他类型的直播电视服务的输入提供电视信号。以及,直播电视应用程序可在显示设备200上显示直播电视信号的视频。69.在一些实施例中,视频点播应用程序,可以提供来自不同存储源的视频。不同于直播电视应用程序,视频点播提供来自某些存储源的视频显示。例如,视频点播可以来自云存储的服务器端或来自包含已存视频节目的本地硬盘储存器等。70.在一些实施例中,媒体中心应用程序,可以提供各种多媒体内容播放的应用程序。例如,媒体中心,可以为不同于直播电视或视频点播,用户可通过媒体中心应用程序访问各种图像或音频所提供服务。71.在一些实施例中,应用程序中心,可以提供储存各种应用程序。应用程序可以是一种游戏、应用程序,或某些和计算机系统或其他设备相关但可以在智能电视中运行的其他应用程序。应用程序中心可从不同来源获得这些应用程序,将它们储存在本地储存器中,然后在显示设备200上运行。72.显示设备200可以通过上述实施例中的任一方式,通过服务器400从对应的媒资库中获取目标媒资,并在线播放目标媒资。即在一些实施例中,在播放媒资项目的过程中,服务器400可以实时地从对应的媒资库中获取媒资数据,并通过解码、渲染等处理,持续形成媒资画面。73.并且,在一些实施例中,服务器400还可以实时监控媒资项目的播放过程,当媒资项目播放过程中断时,服务器400会自动记录媒资项目的播放进度,以生成历史记录。历史记录可以使用户再次对该媒资项目进行播放时,直接按照记录的播放进度继续进行播放,以满足用户继续观看的需求。74.为了便于服务器400获取媒资,在一些实施例中,服务器400还可以根据媒资的具体内容,为每个媒资设置分类标签。分类标签的内容可以为媒资名称、媒资类别、媒资作者、媒资长度分类等能够反映媒资项目特点的内容。并且,服务器400还可以根据这些分类标签在历史记录中出现次数统计结果,确定用户观影偏好,进而根据确定的观影偏好向显示设备200推送带有相同分类标签的媒资项目。75.由于媒资项目的数量和类型众多,在一些实施例中,服务器400还可以对媒资项目进行分类,形成几个大类别,如电影、电视剧、纪录片、少儿、教育等。又由于用户的观影偏好不局限于单一形式,服务器400还可以将大类别分为多个子类别,再将子类别进一步划分为多个小类别,以精准地为用户推荐或筛选每个类型的媒资。76.例如:服务器400可以为媒资设置三个等级的分类标签。一级分类标签包括:“电影”、“电视剧”、“综艺”、“少儿”、“纪录片”等,二级分类标签为一级分类标签的细化,三级分类标签则为二级分类标签的细化。如图6所示,以一级分类标签“电影”为例,一级分类标签“电影”包含的二级分类标签包括;“爱情”、“动作”、“惊悚”、“科幻”、“景点”等;二级分类标签“景点”包含的三级分类标签包括“亚洲”、“非洲”、“欧洲”、“南美洲”、“北美洲”、“大洋洲”、“南极洲”。则图6中的《媒资a》包含的分类标签至少包括“电影”、“景点”与“亚洲”。77.在一些实施例中,显示设备200在播放媒资时,还可以显示器260中显示的内容进行图像识别,以获取当前显示内容中包含的特征目标的信息。即用户在观看过程中,可以随时向显示设备200发送指定的控制指令,以识别显示内容中特征目标的信息。显示设备200可以获取用户输入的多种控制指令,其中,部分用于控制显示设备200进行图像识别的控制指令,被称为特征目标识别指令。用户可以通过不同的交互方式或基于不同的用户界面在显示设备200端输入特征目标识别指令,以触发显示设备200的图像识别功能。78.向显示设备200发送特征目标识别指令的方式存在很多种,在一些实施例中,特征目标识别指令可以由用户直接向显示设备200发送,也可以由用户通过控制装置100,比如手机、遥控器等设备,向显示设备200发送。例如,用户可以通过操作遥控器的指定识图按键,向显示设备200发送特征目标识别指令。79.又例如,当显示设备200内置智能语音系统时,用户还可以通过向显示设备200输入语音进行交互。即在一些实施例中,用户还可以通过语音的方式向显示设备200发送特征目标识别指令。例如,用户可以向显示设备200说出“这个人是谁?”、“这件衣服是哪一品牌的?”、“这个花是什么品种?”、“这是哪里?”等类似的语音指令,显示设备200则通过预置的语音指令识别模型对上述的语音指令进行语音识别分析,然后响应于语音指令执行对应的操作。即当显示设备200接收到“这个人是谁?”、“这件衣服是哪一品牌的?”、“这个花是什么品种?”、“这是哪里?”等语音指令后,则对当前显示的画面执行截图,以识别当前画面截图中的特征目标。80.然而,由于图像识别功能需要对静态的画面进行识别。因此,在一些实施例中,显示设备200具有截图识别功能,即显示设备200在接收到特征目标识别指令时,对显示器260显示的画面内容进行截图,再对画面截图中的特征目标进行识别。识别完毕后,显示设备200还会在显示器260中显示特征目标的识别结果。其中,识别结果的界面中可以包括特征目标的信息资料;或者,还可以根据分类标签,在识别结果的界面中推荐特征目标相关的媒资项目,以供用户进行选择。除此之外,如果特征目标为景点或店铺等地点类型的特征,识别结果中还可以包括特征目标的位置信息。81.在一些实施例中,特征目标可以为一个也可以为多个;相应的,识别结果也可以为一个或多个。每一个识别结果可以对应一个特征目标,每一个特征目标则可以对应多个识别结果。特征目标的类别可以包括人像、物品、动物、植物、建筑、文字、景点以及图形等,同一张画面截图中识别出的特征目标可以为相同类别或不同类别。82.例如:如图7所示,用户正在通过显示设备200观看综艺a,当综艺a播放至图7所示的时间点时,显示设备200的显示画面中仅出现了一个特征目标:明星x。此时,用户想得知明星x的信息资料,则向显示设备200语音发送“这是谁”的特征目标识别指令,以对明星x进行识别搜索。显示设备200则响应于特征目标识别指令,对显示画面执行截图,同时对画面中的明星x进行识别搜索,得出图7所示的识别结果界面。通过观看识别结果界面,用户不仅可以获得明星x的信息资料,还可以在识别结果界面中选择明星x参演的作品进行观看。83.显然,显示设备200在任意的观看场景下,都可以对显示器260中显示的画面内容进行图像识别。即在一些实施例中,显示设备200可以在播放媒资时、外接存储设备播放媒资时、游戏过程中以及首页浏览时等所有处于亮屏状态的场景下,接收并响应用户输入的特征目标识别指令,进而对当前画面中的特征目标进行图像识别。84.然而,如果在用户发出特征目标识别指令时,显示器260当前播放的画面仅包括特征目标的局部特征,则可能会出现识别失败或识别错误的问题。比如,用户在显示器260显示的画面仅包括某景观的一半外观时,向显示设备200发送特征目标识别指令,显示设备200则响应特征目标识别指令对当前显示内容的画面执行截图。此时,由于画面中景观的外观特征不全,显示设备200则无法识别出景观的信息或者识别出多个相似的景观信息,进而导致显示设备200的识别召回率及准确率较低,降低用户体验。85.基于上述应用场景,为了提升用户的体验感,改善显示设备200中识别召回率及准确率低的问题,本技术一些实施例提供了一种图像识别方法。所述方法具体包括如下内容:86.s100:响应于特征目标识别指令,获取用户界面的显示内容。87.显示设备200的显示器260用于显示用户界面,显示设备200在接收到特征目标识别指令后即获取用户界面的显示内容。其中,显示内容包括视频内容和/或图像内容。视频内容可以为显示设备200播放的视频媒资,图像内容可以为显示设备200播放的照片或显示设备中的主页界面、媒资推荐界面等。88.此外,由于特征目标识别指令为用于控制显示设备200进行图像识别的指令,而图像识别功能又需要通过对静态的图像进行识别分析。因此,在一些实施例中,显示设备200还获取用户输入的启动指令,并响应于启动指令检测截图工具或截图服务的启用状态。所述启用状态为开启状态或非开启状态,所述启动指令为用于开启显示设备的控制指令。也就是说,在显示设备200开机时,则可以自动检测截图工具或截图服务的启用状态。如果所述截图工具或截图服务处于开启状态,则执行响应于特征目标识别指令,获取所述用户界面的显示内容的步骤,即执行步骤s100;如果所述截图工具或截图服务处于非开启状态,则控制显示器260显示不可进行图像识别的提示信息。89.在一些实施例中,显示器260显示的不可进行图像识别的提示信息中,还可以包括开启截图工具或截图服务的选项卡或诊断截图工具或截图服务的选项卡。当截图工具或截图服务处于手动关闭状态时,显示器260则显示开启截图工具或截图服务的选项卡;当截图工具或截图服务处于异常关闭状态时,显示器260则显示诊断截图工具或截图服务的选项卡。90.例如:以截图工具为例,用户将显示设备200开机后,显示设备200则自动检测截图工具的启用状态。如图8所示,显示设备200检测到截图工具处于关闭状态后,显示设备200的显示器260则显示图8所示的提示信息。用户在看到提示信息后,则可以得知当前显示设备200处于不可截图且无法进行图像识别的状态。同时,图8所示的提示信息中还包括开启截图工具的选项卡,则表明当前显示设备200的截图工具是用户手动关闭的。因此,用户可以点击开启截图工具的选项卡,根据显示器260显示的索引及提示信息,开启截图工具,进而开启当前显示设备200的图像识别功能。91.s200:读取所述显示内容的分类标签。92.显示设备200在获取显示内容后,还可以对显示内容的标签进行读取,以获取显示内容包含的基础信息。比如,图6所示的《媒资a》的分类标签包括“电影”、“景点”与“亚洲”,因此显示设备200在读取《媒资a》的分类标签后,即获取到当前显示内容包括景点信息。那么,在对显示内容中的特征目标进行识别之前,则可以判断出当前显示内容中包括的特征目标可能为景点。93.s300:如果所述显示内容的分类标签中包括特征目标标识,则在预设时间内连续对所述显示内容执行截图,以生成多个画面截图。94.显示设备200在读取到分类标签中包括特征目标标识后,则在预设的时间段内对显示器260显示的内容执行多次截图,生成多个截图画面,以便于显示设备200获取更多包含特征目标的图像。95.但由于显示设备200通过截图工具或截图服务执行截图时,需要消耗较高的系统资源。因此,为了避免额外增加显示设备200中存储器的容量,在进行一次图像识别的过程中,应尽量减少显示设备200执行截图的次数。并且由于部分特征具有易于识别的特点,仅通过识别其具有的局部特征即可获取到特征的详细信息,比如:植物、动物或汽车等垂类,不需要执行多次截图。所以,在一些实施例中,显示设备200可以限定特征目标的垂类,比如设定特征目标为景点、人像等垂类,特征目标的标识则为景点、景物、景观等语义相近的近义词标识。而且,步骤s300中预设时间并在预设时间内执行截图,也是为了减少显示设备200在执行截图时造成的系统资源消耗,因此可以设置一个较短的时间段数值。96.例如:预设时间为50毫秒,特征目标为景点,特征目标标识为景点、景物、景观。如图9所示,用户在观看图9所示的《媒资c》时,想要对图9中显示内容的信息进行识别,则通过遥控器向显示设备200发送了特征目标识别指令。显示设备200则响应于特征目标识别指令,读取《媒资c》的分类标签,且读取到《媒资c》的分类标签包括一级标签“纪录片”、二级标签“景点”与三级标签“亚洲”。显示设备200在读取到分类标签中包括“景点”标识后,则在50毫秒内对显示器260显示的内容执行多次截图,生成多个截图画面。97.在一些实施例中,如果显示内容的分类标签中不包括特征目标标识,则仅对显示内容执行一次截图,以获取待识别图像。然后识别待识别图像中的非特征目标,以生成非特征目标识别信息,同时控制显示器260显示非特征目标识别信息,进而可以有效地节省系统资源消耗。98.例如:特征目标为景点,特征目标标识为景点、景物、景观。如图10所示,用户在观看图10所示的《媒资d》时,想要对图10中显示内容的信息进行识别,则通过语音功能向显示设备200说出“这是谁?”的特征目标识别指令。显示设备200则响应于特征目标识别指令,读取《媒资d》的分类标签,且读取到《媒资d》的分类标签包括一级标签“电影”、二级标签“爱情”与三级标签“悬疑”。由于《媒资d》的分类标签中不包括景点、景物或景观的标识,显示设备200则当前显示内容执行一次截图,以获取待识别图像。同时,对待识别图像中的非特征目标识别信息,即图10所示的女孩,进行识别,并控制显示器260显示识别结果。识别结果界面包括女孩的资料信息以及相关参演作品。99.此外,在一些实施例中,显示设备200在读取到显示内容的分类标签中包括特征目标标识后,还获取显示内容的播放场景。其中,播放场景为静态播放场景或动态播放场景。如果所述播放场景为动态播放场景,则在预设时间内连续对所述显示内容执行截图。如果所述播放场景为静态播放场景,则对所述显示内容执行一次截图,以获取特征图像。以及识别所述特征图像中的特征目标,生成特征目标信息。100.显然,静态播放场景为持续地进行画面变更的播放场景,例如用户在浏览显示设备200的首页时,首页中可能包括静态图像信息,此时显示设备200的播放场景即为静态播放场景。动态播放场景可以为视频播放场景,例如用户通过显示设备200观看电视剧时,显示器260显示的电视剧视频会持续出现的画面变换,则此时显示设备200的播放场景为动态播放场景;又例如,当用户在显示设备200中滚动浏览一些图像内容时,显示器260显示的显示内容也会持续发生变换,则此时显示设备200的播放场景也为动态播放场景。101.由于在播放场景为静态播放场景时,显示内容的画面不会发生变更,即使进行多次截图获取的也为相同的画面截图。所以在读取到显示内容的分类标签中包括特征目标标识后,如果显示设备200的播放场景为静态播放场景时,则不执行多次的截图,仅执行一次截图进行图像识别,以减少系统资源的消耗。102.此外,显示设备200在播放视频时,如果视频的媒资类型为非直播信号,则会按照一定的帧率播放显示视频资源,即视频的内容是由一帧帧的画面组合构成。如果显示设备200在执行截图时,截取的画面为同一帧画面,则会导致生成的多个画面截图中包括的特征完全相同,也会产生系统资源的浪费。103.因此,在一些实施例中,如果显示内容为视频内容,还获取视频内容的媒资类型。如果媒资类型为非直播信号,则获取视频内容的帧率信息,然后计算所述视频内容中每帧画面的间隔时间。如果媒资类型为直播信号,则根据显示设备200中预设的配置信息设定所述间隔时间。最后,在预设时间内,每隔所述间隔时间后对所述显示内容执行一次截图。104.例如:预设时间为45毫秒,显示设备200播放的视频为非直播信号的媒资,视频的帧率为60帧,那么单张图片的时间间隔为15毫秒,则设置间隔时间为15毫秒。显示设备200在45毫秒内,每隔15毫秒则对显示器260中的显示内容执行一次截图,即显示设备200在进行本次图像识别的过程中,会执行三次截图,共计生成三张画面截图。105.又例如:预设时间为45毫秒,显示设备200播放的的视频为直播信号的媒资,显示设备200中预设的间隔时间为10毫秒。那么,显示设备200在45毫秒内,每隔10毫秒则对显示器260中的显示内容执行一次截图,即显示设备200在进行本次图像识别的过程中,会执行四次截图,共计生成四张画面截图。106.并且,在一些实施例中,显示设备200还可以设置执行截图的次数阈值。当对所述显示内容执行截图的次数等于所述次数阈值时,则停止对所述显示内容执行截图。由于显示设备200显示播放的视频的帧率为多种,所以可以通过设置次数阈值,避免显示设备200执行的截图次数过多,造成资源的浪费。107.例如:次数阈值为2次,预设时间为45毫秒,间隔时间为15毫秒。显示设备200在45毫秒内,每隔15毫秒则会对显示器260中的显示内容执行一次截图。由于次数阈值为2次,显示设备200则在执行第二次截图后,立即停止对显示内容执行截图。即显示设备200在进行本次图像识别的过程中,会执行二次截图,共计生成二张画面截图。108.s400:将多个所述画面截图拼接为全景图像。109.为了获取特征目标的全景图像,显示设备200需要将截取到的多个画面截图进行图像拼接及融合,进而获取一张包含更多特征目标中特征的图像。110.例如:特征目标为山脉。如图11及图12所示的山脉画面,显示设备200分别截取到如图11及图12的画面截图。图11与图12中分别包括山脉中不同位置的局部特征,为了准确地对山脉的信息进行识别,显示设备200则将图11、图12的画面截图拼接为一张、如图13所示的山脉全景图像。111.然而,由于多个画面截图中会存在重复的特征点,直接将画面截图进行拼接会出现重复的景象或留白,不能直接得出特征目标的全景图像。因此,在一些实施例中,在对多个画面截图进行拼接时,显示设备200还提取每个画面截图的特征点。然后根据特征点确定多个画面截图中的拼接区域。其中,特征点为每个画面截图中包含特征因子的像素点,比如:sift、surf、harris角点、orb等特征因子;拼接区域为画面截图中包含相同特征因子的特征点集。最后根据特征点集将画面截图设置到拼接区域,以对多个画面截图进行拼接。112.例如:特征目标为山脉,如图14所示,图14为图11、图12的拼接过程。显示设备200在对图11、图12的画面截图进行拼接时,首先对图11、图12进行特征点的提取,并对相同的特征点进行匹配。其中,图14中一条双箭头指向的两个特征点即为匹配成功的特征点。如图14所示,通过匹配成功的特征点集,可以确定出图11、图12中进行拼接的拼接区域,即可以拼接出图13中山脉的全景图像。113.此外,为了准确地在截图画面的拼接区域进行拼接,在一些实施例中,显示设备200还建立配准坐标系。然后基于特征点集与配准坐标系生成变换矩阵。其中,变换矩阵用于将所述画面截图中像素点的坐标点转换为所述配准坐标系下的坐标点。按照转换后的所述坐标点将多个所述画面截图拷贝到所述配准坐标系中。114.例如:显示设备200可以通过findhomography函数求得变换矩阵,再通过所述变换矩阵将画面截图中像素点的坐标点进行转换。最后按照转换后的坐标点将多个画面截图拷贝到配准坐标系中,即可拼接出特征目标的全景图像。115.然而,显示设备200播放的画面在发生改变时,可能会由于在拍摄过程中的光线、拍摄角度、焦距不相同等因素,导致其形成的每一帧画面中的亮度、角度或特征目标大小等元素也不相同。因此,拼接后的全景图像中可能会出现过渡不自然的问题。116.对此,在一些实施例中,显示设备200还获取多个画面截图拼接的重叠部分图像。然后提取重叠部分图像的像素值信息,基于加权融合算法将像素值信息相加,以调整融合多个画面截图中的透视关系及亮度。117.例如:如图15所示,图15为拼接后的全景图像。由于光照色泽不同,图15中全景图像在交界处的过渡很差。因此,显示设备200可以将画面截图拼接后重叠区域的像素值按一定的权值相加,像素值相加后的图像,即可以重新合成一个如图13所示的过渡自然的全景图像。118.需要说明的是,本技术中画面截图的拼接及融合方法还可以采取其他的图像拼接及融合等图像处理方法,比如图像融合的方法还可以采用小波变换等。对此,本技术不作限制。119.s500:识别所述全景图像中的特征目标,以生成特征目标信息,以及控制显示器显示所述特征目标信息。120.显示设备200对全景图像进行识别,通过对全景图像中特征目标进行提取,对特征目标的信息进行搜索、匹配,最终在显示器260中显示特征目标信息。特征目标信息即为显示设备200进行图像识别后的识别结果。其中,识别结果与上述实施例所述的识别结果相同,在此不做赘述。121.在一些实施例中,识别结果的界面中还可以包含其他用于辅助显示设备200对识别结果进行显示的辅助信息。例如,识别结果的界面还可以包括识别结果的置信度、置信度阈值、识别结果的置信度是否超过置信度阈值、特征目标在画面截图中的位置、识别结果的显示方式参数、与置信度对应的附加信息等多种信息中的一个或多个。其中,识别结果的置信度是指识别结果的可靠程度,置信度越高表示该识别结果越可靠,置信度越低表示该识别结果越不可靠。识别结果的置信度超过置信度阈值可以表示识别结果可靠,置信度未超过置信度阈值则可以表示识别结果不可靠。122.例如,显示设备200可以根据画面截图的分辨率生成识别结果的置信度,当画面截图的分辨率越高时置信度也越高,当画面截图的分辨率越低时置信度也越低。或者,也可以根据特征目标所在区域的长度和宽度生成识别结果的置信度,当长度和宽度值越大时置信度越高,当长度和宽度值越小时置信度越低。又或者,还可以基于特征目标在画面截图中的位置或占比,生成识别结果的置信度。123.在一些实施例中,如果特征目标为多个,显示设备200则显示多个特征目标信息的提示窗口,即在显示器260中显示多个识别结果提示窗口。124.例如:特征目标为两个,分别为第一特征目标与第二特征目标。显示设备200可以根据全景图像中第一特征目标所在区域的坐标基点(x1,y1)、第一特征目标所在区域的高度h1以及第一特征目标所在区域的宽度w1,在显示器260中显示第一特征目标对应的第一特征目标识别窗口;然后根据全景图像中第二特征目标所在区域的坐标基点(x2,y2)、第二特征目标所在区域的高度h2以及第二特征目标所在区域的宽度w2,在显示器260中显示第二特征目标对应的第二特征目标识别窗口。125.基于上述图像识别方法,本技术的部分实施例中还提供一种显示设备200,如图16所示,包括:显示器260与控制器250。如图17所示,所述控制器250被配置为执行以下程序步骤:126.s100:响应于特征目标识别指令,获取用户界面的显示内容,所述显示内容包括视频内容和/或图像内容;127.s200:读取所述显示内容的分类标签;128.s300:如果所述显示内容的分类标签中包括特征目标标识,则在预设时间内连续对所述显示内容执行截图,以生成多个画面截图;129.s400:将多个所述画面截图拼接为全景图像;130.s500:识别所述全景图像中的特征目标,以生成特征目标信息,以及控制所述显示器显示所述特征目标信息。131.由以上技术方案可知,本技术一些实施例提供的显示设备及图像识别方法,可以响应于特征目标识别指令,获取用户界面的显示内容。其中,显示内容包括视频内容和/或图像内容。所述方法可以在显示内容的分类标签中包括特征目标标识时,在预设时间内连续对显示内容执行多次截图,生成多个特征目标的画面截图。将多个画面截图拼接为特征目标的全景图像,并对全景图像进行识别,生成特征目标信息,进而解决了特征目标识别召回率低的问题,提高用户体验。132.本技术提供的实施例之间的相似部分相互参见即可,以上提供的具体实施方式只是本技术总的构思下的几个示例,并不构成本技术保护范围的限定。对于本领域的技术人员而言,在不付出创造性劳动的前提下依据本技术方案所扩展出的任何其他实施方式都属于本技术的保护范围。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1