遥控设备及其多语音模型切换方法、显示控制系统与流程

文档序号:32742970发布日期:2022-12-30 20:13阅读:55来源:国知局
1.本发明涉及遥控
技术领域
:。更具体的讲,尤其涉及一种遥控设备及其多语音模型切换方法、显示控制系统。
背景技术
::2.伴随着人工智能技术的发展,交互模式也在不断发生着变化。从简单的交互到多种交互模式共同发展,其中,语音交互所起的作用越来越明显。例如,在显示设备的应用场景中,用户可以向遥控设备输入语音指令,遥控器将语音指令传输至显示设备,显示设备响应用户输入的语音指令执行对应的后续操作。3.目前当用户需要通过遥控设备与对应的显示设备进行语音交互时,用户需要按压遥控设备上的语音输入按钮,然后向遥控设备输入语音指令,进而实现遥控设备与显示设备的近场语音交互。但是,近场语音交互方式按压按钮的操作较为繁琐,影响用户的使用体验。为解决前述问题,目前可以采用实时监听用户语音输入和通过识别唤醒词的方式,但是,对于不同的语言需要多个语音模型进行唤醒词识别,遥控设备中增加运行的语音模型,遥控设备的功耗就会大幅增加,导致遥控设备端的语音处理系统只能运行单一的语音模型,如何使得遥控设备实现低功耗多语音模型的切换成为亟待解决的问题。技术实现要素:4.为了解决上述
背景技术
:中阐述的问题,本发明实施例提供了一种遥控设备及其多语音模型切换方法、显示控制系统,在满足低功耗要求的同时,在遥控设备端实现多语音模型的切换。5.第一方面,本发明提供了一种遥控设备,包括:6.中场语音接收模块,被配置为接收用户输入的中场语音;7.与所述中场语音接收模块连接的语音处理模块,被配置为校验中场语音唤醒词;8.外挂存储模块,被配置为存储有多种语音模型以及对应所述语音模型的语音驱动固件;9.分别与所述语音处理模块以及所述外挂存储模块连接的数据传输模块,被配置为接收所述语音处理模块发送的语音数据并与显示设备通信连接,以及获取所述显示设备发送的模型切换指令,根据所述模型切换指令从所述外挂存储模块中加载所需语音模型和所需语音驱动固件至所述语音处理模块。10.第二方面,本发明还提供了一种显示控制系统,包括显示设备和如第一方面所述的遥控设备,所述显示设备和所述遥控设备通信连接。11.第三方面,本发明还提供了一种遥控设备的多语音模型切换方法,包括:12.获取显示设备发送的模型切换指令;13.根据所述模型切换指令从外挂存储模块中加载所需语音模型和所需语音驱动固件至语音处理模块。14.由以上技术方案可知,本发明实施例设置遥控设备包括中场语音接收模块,被配置为接收用户输入的中场语音;与所述中场语音接收模块连接的语音处理模块,被配置为校验中场语音唤醒词;外挂存储模块,被配置为存储有多种语音模型以及对应所述语音模型的语音驱动固件;分别与所述语音处理模块以及所述外挂存储模块连接的数据传输模块,被配置为获取语音并与显示设备通信连接,以及获取所述显示设备发送的模型切换指令,根据所述模型切换指令从所述外挂存储模块中加载所需语音模型和所需语音驱动固件至所述语音处理模块。由此,本发明实施例遥控设备通过接收显示设备发送的模型切换指令来智能化地提取外挂存储模块中预置的所需语音模型和对应的所需语音驱动固件,避免了在语音处理模块中存储多个语音模型和对应的语音驱动固件以实现多语音模型切换,导致的对应多个语音模型和语音驱动固件的语音程序同时运行,造成的遥控设备功耗增加的问题,即可在满足遥控设备中场语音功能低功耗要求的同时,在遥控设备端实现多种语音模型的智能化切换,以兼容不同的中场语音唤醒词,提高遥控设备的通用化程度,提升用户体验。附图说明15.为了更清楚地说明本发明的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。16.图1为本发明根据示例性实施例示出的一种显示设备与遥控设备之间操作场景的示意图;17.图2为本发明根据示例性实施例示出的一种显示设备的配置框图;18.图3为本发明根据示例性实施例示出的一种遥控设备的结构示意图;19.图4为本发明根据示例性实施例示出的一种遥控设备的多语音模型切换方法的流程示意图;20.图5为本发明根据示例性实施例示出的一种显示设备端发送模型切换指令的方法流程示意图;21.图6为本发明根据示例性实施例示出的一种遥控设备的多语音模型切换方法的具体流程示意图;22.图7为本发明根据示例性实施例示出的一种显示设备端的语音服务切换方法的流程示意图;23.图8为本发明根据示例性实施例示出的一种显示设备与遥控设备的双端交互逻辑示意图;24.图9为本发明根据示例性实施例示出的一种显示控制系统的结构示意图。具体实施方式25.为使本发明的目的和实施方式更加清楚,下面将结合本发明示例性实施例中的附图,对本发明示例性实施方式进行清楚、完整地描述,显然,描述的示例性实施例仅是本发明一部分实施例,而不是全部的实施例。26.需要说明的是,本发明中对于术语的简要说明,仅是为了方便理解接下来描述的实施方式,而不是意图限定本发明的实施方式。除非另有说明,这些术语应当按照其普通和通常的含义理解。27.本发明中说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”等是用于区别类似或同类的对象或实体,而不必然意味着限定特定的顺序或先后次序,除非另外注明。应该理解这样使用的用语在适当情况下可以互换。28.术语“包括”和“具有”以及他们的任何变形,意图在于覆盖但不排他的包含,例如,包含了一系列组件的产品或设备不必限于清楚地列出的所有组件,而是可包括没有清楚地列出的或对于这些产品或设备固有的其它组件。29.图1为本发明根据示例性实施例示出的一种显示设备与遥控设备之间操作场景的示意图。如图1所示,用户可通过智能设备300或遥控设备100操作显示设备200。本发明实施方式提供的显示设备可以具有多种实施形式,例如可以是电视、智能电视、激光投影设备、显示器(monitor)、电子白板(electronicbulletinboard)、电子桌面(electronictable)等。30.在一些实施例中,遥控设备100可以是遥控器,遥控设备100和显示设备200的通信可以包括红外协议通信或蓝牙协议通信,及其它短距离通信方式,通过无线或有线方式来控制显示设备200。用户可以通过遥控设备100上按键输入、语音输入、控制面板输入等输入用户指令,来控制显示设备200。遥控设备100可接收用户的输入操作指令,遥控设备100将操作指令转换为显示设备200可识别和响应的指令,起到用户与显示设备200之间交互中介作用。31.在一些实施例中,也可以使用智能设备300,例如移动终端、平板电脑、计算机、笔记本电脑等控制显示设备200。例如,使用在智能设备上运行的应用程序控制显示设备200。32.在一些实施例中,显示设备200可以不使用上述的智能设备或控制设备接收指令,而是通过触摸或者手势等接收用户的控制。33.在一些实施例中,显示设备200还可以采用除了遥控设备100和智能设备300之外的方式进行控制,例如,可以通过显示设备200设备内部配置的获取语音指令的模块直接接收用户的语音指令控制,也可以通过显示设备200设备外部设置的语音控制设备来接收用户的语音指令控制。34.在一些实施例中,显示设备200还与服务器400进行数据通信。可允许显示设备200通过局域网(lan)、无线局域网(wlan)和其它网络通信连接连接。服务器400可以向显示设备200提供各种内容和互动。服务器400可以是一个集群,也可以是多个集群,可以包括一类或多类服务器。35.图2为本发明根据示例性实施例示出的一种显示设备的配置框图。如图2所示,显示设备200包括调谐解调器210、通信器220、检测器230、外部装置接口240、控制器250、显示器260、音频输出接口270、存储器、供电电源、用户接口中的至少一种。36.在一些实施例中控制器250包括处理器,视频处理器,音频处理器,图形处理器,ram,rom,用于输入/输出的第一接口至第n接口。37.显示器260用于显示界面,包括用于呈现画面的显示屏组件,以及驱动图像显示的驱动组件,用于接收源自控制器输出的图像信号,进行显示视频内容、图像内容以及菜单操控界面的组件以及用户操控ui界面。38.显示器260可为液晶显示器、oled显示器、以及投影显示器,还可以为一种投影装置和投影屏幕。39.通信器220是用于根据各种通信协议类型与外部设备或服务器通信连接的组件。例如:通信器可以包括wifi模块,蓝牙模块,有线以太网模块等其它网络通信协议芯片或近场通信协议芯片,以及红外接收器中的至少一种。显示设备200可以通过通信器220与遥控设备100或服务器400通信连接,即建立控制信号和数据信号的发送和接收。40.用户接口,可用于接收遥控设备100(如:红外遥控设备等)的控制信号。41.检测器230用于采集外部环境或者用于采集与外部交互的信号。例如,检测器230包括光接收器,用于采集环境光线强度的传感器;或者,检测器230包括图像采集器,如摄像头,可以用于采集外部环境场景、用户的属性或用户交互手势,再或者,检测器230包括声音采集器,如麦克风等,用于接收外部声音。42.外部装置接口240可以包括但不限于如下:高清多媒体接口(hdmi)、模拟或数据高清分量输入接口(分量)、复合视频输入接口(cvbs)、usb输入接口(usb)、rgb端口等任一个或多个接口。也可以是上述多个接口形成的复合性的输入/输出接口。43.调谐解调器210通过有线或无线接收方式接收广播电视信号,以及从多个无线或有线广播电视信号中解调出音视频信号,如以及epg数据信号。44.在一些实施例中,控制器250和调谐解调器210可以位于不同的分体设备中,即调谐解调器210也可在控制器250所在的主体设备的外置设备中,如外置机顶盒等。45.控制器250,通过存储在存储器上中各种软件控制程序,来控制显示设备的工作和响应用户的操作。控制器250控制显示设备200的整体操作。例如:响应于接收到用于选择在显示器260上显示ui对象的用户指令,控制器250便可以执行与由用户指令选择的对象有关的操作。46.在一些实施例中控制器250包括中央处理器(centralprocessingunit,cpu),视频处理器,音频处理器,图形处理器(graphicsprocessingunit,gpu),ramrandomaccessmemory,ram),rom(read-onlymemory,rom),用于输入/输出的第一接口至第n接口,通信总线(bus)等中的至少一种。47.用户可在显示器260上显示的图形用户界面(gui)输入用户指令,则用户输入接口通过图形用户界面(gui)接收用户输入指令。或者,用户可通过输入特定的声音或手势进行输入用户指令,则用户输入接口通过传感器识别出声音或手势,来接收用户输入指令。48.用户界面,是应用程序或操作系统与用户之间进行交互和信息交换的介质接口,它实现信息的内部形式与用户可以接受形式之间的转换。用户界面常用的表现形式是图形用户界面(graphicuserinterface,gui),是指采用图形方式显示的与计算机操作相关的用户界面。它可以是在电子设备的显示屏中显示的一个图标、窗口、控件等界面元素,其中控件可以包括图标、按钮、菜单、选项卡、文本框、对话框、状态栏、导航栏、widget等可视的界面元素。49.随着显示设备的飞速发展,遥控设备迅速普及,遥控设备作为一种通用的短距离无线控制设备,在越来越多的终端设备上批量使用。随着遥控设备使用的普及,其应用也越来越广泛,遥控设备如何更好地优化与用户之间的交互操作,以方便用户使用,以及如何提升用户的操控体验是遥控设备当前需要重点考虑的问题。50.目前部分遥控设备具有语音功能,例如当用户需要通过遥控设备,例如遥控设备与对应的显示设备,例如电视进行语音交互时,用户可以通过按压遥控设备上的语音输入按钮,并在按压语音输入按钮的同时向遥控设备输入语音指令,遥控设备与显示设备短距离无线通信连接,遥控设备接收语音指令并将语音指令发送至对应的显示设备,显示设备执行对应语音指令的操作,以完成遥控设备与显示设备的近场语音交互。51.另外,区别于近场语音模式,中场语音交互模式是用户输入语音指令前无需按压遥控设备上的任何按键,可以设置遥控设备识别预设的中场语音唤醒词,当用户向遥控设备输入预设的中场语音唤醒词时,遥控设备识别到预设的中场语音唤醒词并开启中场语音功能,同样利用遥控设备与显示设备短距离无线通信连接,后续遥控设备可以接收用户发出的语音指令并将语音指令发送至对应的显示设备,显示设备执行对应语音指令的操作,以完成通过遥控设备与显示设备的中场语音交互,使得用户进行语音交互的过程更便捷。52.另外,近场语音模式下,用户通过按压遥控设备上的按钮输入语音,用户与遥控设备距离较近。中场语音模式下,用户无需按压遥控设备即可进行语音输入,遥控设备可以位于用户与显示设备之间区域。另外,显示设备,例如电视端也可以实现远场拾音,即显示设备中设置有麦克风,使得显示设备直接侦听用户输入的远场语音并在判断侦听到有效唤醒词后进行后续远场语音指令的接收。中场语音模式对应的语音输入距离就是相对于远场语音模式对应的语音输入距离定义的。但是显示设备为实现前述远场拾音过程,需要在显示设备前侧外观面板的区域,例如但不限于下方区域设置多个远程拾音用的麦克风,这就导致显示设备的外观受到影响,影响用户的使用体验。53.需要说明的是,中场语音控制的概念是基于已有的近场语音控制和远场语音控制提出的,指的就是用户不需要手动去按下遥控设备的按键,只需在距离遥控设备一定距离的地方说话从而实现语音控制的场景。54.对应远场语音通信,显示设备能够实现不同语音模型的切换,显示设备可以将多个语音模型直接打包到显示设备的显示设备软件中,显示设备为不同的语音模型提供不同的软件接口,根据显示设备中麦克风获取到的用户输入语音,显示设备的语音服务可以通过调用不同的接口来实现不同语音模型的运行和切换。另外,由于显示设备中存储的语音模型较多,且不同语音模型的切换直接在显示设备端进行,导致显示设备对应远场语音通信实现多语音模型切换的功耗较大。55.本发明实施例在遥控设备端,利用中场语音接收模块和语音处理模块实现了与用户的中场语音交互,用户输入语音指令前无需按压遥控设备上的任何按键,且无需在显示设备端设置影响其外观的麦克风,即可通过遥控设备实现与显示设备的语音交互。遥控设备处于中场语音模式时,为实现对中场语音唤醒词的侦听,遥控设备需一直处于工作状态,功耗较大,因此遥控设备有低功耗的需求。但是,遥控设备中增加运行的语音模型,遥控设备的功耗就会大幅增加,例如遥控设备中每增加运行一个语音模型,遥控设备的功耗增加30%左右,导致遥控设备端的语音处理系统只能运行单一的语音模型,如何使得遥控设备实现低功耗多语音模型的切换成为亟待解决的问题。56.为了解决上述技术问题,本发明一些实施例提供了一种遥控设备。图3为本发明根据示例性实施例示出的一种遥控设备的结构示意图。如图3所示,遥控设备包括近场语音接收模块510,也可称为第一语音接收模块,被配置为接收用户输入的近场语音,即第一语音,用户通过按压遥控设备上的按键输入近场语音;中场语音接收模块520,也称为第二语音接收模块,被配置为接收用户输入的中场语音,即第二语音,用户不需要手动去按下按键,只需在距离遥控设备一定距离的地方说话;语音处理模块530,与中场语音接收模块520电连接,被配置为校验中场语音唤醒词;外挂存储模块550,被配置为存储有多种语音模型以及对应语音模型的语音驱动固件;数据传输模块540,分别与近场语音接收模块510、语音处理模块530以及外挂存储模块550电连接,被配置为获取显示设备发送的模型切换指令,根据模型切换指令从外挂存储模块550中加载所需语音模型和所需语音驱动固件至语音处理模块530,以及接收语音处理模块和近场语音接收模块发送的语音数据并与显示设备通信连接。57.另外,数据传输模块540是通过蓝牙进行数据信息传输的功能模块,数据传输模块540将操作按键数据进行打包,通过hid(humaninterfacedevice,人机交互设备)数据通道发送至显示设备。数据传输模块540可以通过某种传输媒介,例如有线或无线方式将数据发送给数据接收模块,数据传输模块540需具有数据传输或传送功能,但数据传输模块540并不局限于某种特定的器件,可以是一个功能模块,也可以一个逻辑数据通道。58.本发明实施例中,数据传输模块540优选可以为蓝牙模块。另外,数据传输模块540也可以为红外模块。在一些实施例中,遥控设备具有空鼠、语音、按键及红外等功能,遥控设备的按键控制模式包括蓝牙和红外两种工作模式,可以单独使用一种模式,也可以在蓝牙模式不能连接时自动切换到红外工作模式。显示设备可以通过蓝牙模块或者红外模块,实时接收遥控设备发送的数据包,并将接收到的数据包所包含的数据按照用户操作的指示进行数据筛选、重组以及变换等操作。59.在一些实施例中,遥控设备具有三个语音接收模块,例如麦克风设计,近场语音接收模块510用来实现遥控设备的近场语音功能,其对应的语音信号输出端连接至遥控设备中的数据传输模块540,即蓝牙soc(systemonchip,片上系统)上,通过数据传输模块540控制遥控设备实现近场语音功能。60.近场语音功能对应的语音处理过程为:用户按压遥控设备上对应近场语音的按键后,近场语音接收模块510,例如第一麦克风接收用户输入的语音指令并传输至数据传输模块540,数据传输模块540对语音指令进行压缩后,利用与显示设备的短距离无线通信连接,将压缩后的语音指令发送至显示设备,显示设备对语音指令进行解码以及预设处理,从而实现利用遥控设备对显示设备的近场语音控制。61.第一中场语音接收模块和第二中场语音接收模块,例如第二麦克风和第三麦克风用来实现遥控设备的中场语音功能,其对应的语音信号输出端连接至遥控设备中的语音处理模块530,即dsp(digitalsignalprocessing,数字信号处理)芯片上,通过语音处理模块530控制遥控设备实现中场语音功能。62.中场语音对应的语音处理过程为:第一中场语音接收模块和第二中场语音接收模块实时侦听用户输入的语音并传输至语音处理模块530,语音处理模块530被配置为判断接收到的用户输入语音中是否包含有效中场语音唤醒词。若包含有效中场语音唤醒词,则语音处理模块530将唤醒后用户输入的语音指令传输至数据传输模块540,数据传输模块540对语音指令进行压缩后,利用与显示设备的短距离无线通信连接,将压缩后的语音指令发送至显示设备,显示设备对语音指令进行解码以及预设处理,从而实现利用遥控设备对显示设备的中场语音控制。另外,语音处理模块530可以对接收的语音数据进行降噪处理。63.需要说明的是,本技术中,中场语音模式下有两个麦克风工作,但不限于此,只要能实时侦听用户的语音输入,一个或者两个以上的麦克风都可以,同时,拾音设备也不限于麦克风。64.如图3所示,语音处理模块530,即语音唤醒芯片,也即dsp主要负责中场语音音频数据的采集、数据降噪处理、中场语音唤醒词或激活词的识别、语音向数据传输模块540的输出。65.数据传输模块540,即蓝牙soc负责加载不同语音模型以及对应的语音驱动固件,并发送至语音处理模块530以触发语音处理模块530进行中场语音唤醒词识别,数据传输模块540通过spi(serialperipheralinterface,串行外设接口)与语音处理模块530进行数据通讯,数据传输模块540芯片通过spi获取语音,并与显示设备进行红外和/或蓝牙数据的通信,如红外按键、蓝牙按键等。66.图4为本发明根据示例性实施例示出的一种遥控设备的多语音模型切换方法的流程示意图。在一些实施例中,遥控设备中的数据传输模块540执行图4中示出的下述步骤:67.s601、获取显示设备发送的模型切换指令。68.s602、根据模型切换指令从外挂存储模块中加载所需语音模型和所需语音驱动固件至语音处理模块。69.在一些实施例中,如图3所示,本发明实施例设置遥控设备还包括外挂存储模块550,外挂存储模块550例如可以为外挂flash,即外挂闪存,外挂存储模块550与数据传输模块540通信连接,外挂存储模块550被配置为存储有多种语音模型以及与语音模型对应的驱动固件。70.遥控设备通过接收显示设备发送的模型切换指令来智能化地提取外挂存储模块550中预置的所需语音模型和对应的所需语音驱动固件,即利用外挂存储模块550,根据显示设备发送的模型切换指令选择运行对应一种语音模型和语音驱动固件的程序,避免了在语音处理模块530中存储多个语音模型和对应的语音驱动固件以实现多语音模型切换,导致的对应多个语音模型和语音驱动固件的语音程序同时运行,造成的遥控设备功耗增加的问题,即本发明实施例可在满足遥控设备中场语音功能低功耗要求的同时,在遥控设备端实现多种语音模型的智能化切换,以兼容不同的中场语音唤醒词,提高遥控设备的通用化程度,提升用户体验。71.图5为本发明根据示例性实施例示出的一种显示设备端发送模型切换指令的方法流程示意图。在一些实施例中,显示设备中的控制器执行图5中示出的下述步骤:72.s701、开始。73.s702、判断显示设备是否开启语音服务。若是,执行s703;若否,执行s705。74.在一些实施例中,显示设备判断其自身是否开启了语音服务,若显示设备开启了语音服务,则进入后续判断过程。75.s703、判断显示设备是否与遥控设备无线连接。若是,执行s704;若否,执行s705。76.在一些实施例中,显示设备中的控制器可以判断显示设备是否与遥控设备例如通过蓝牙无线连接。基于显示设备判断与遥控设备无线连接,显示设备可以与遥控设备之间进行数据的传输,显示设备中的控制器根据用户选择的语言向遥控设备发送模型切换指令。基于显示设备判断与遥控设备断开连接,流程结束。77.s704、根据用户选择的语言向遥控设备发送模型切换指令。78.在一些实施例中,用户选择的语言可以包含有用户选择的语音服务信息以及对应语音服务下的语种信息,用户选择的语音服务例如可以为alexa语音服务和vidaa语音服务,语种包括但不限于英语、法语、德语等等。显示设备接收到用户选择的语言,确认对应用户选择语言的语音模型,进而根据自定义的通讯协议sc_spec,向遥控设备下发不同的模型切换指令,通讯协议sc_spec可以是包含有显示设备要求遥控设备切换的语音模型信息的通讯协议。79.以用户选择的语言为法语的alexa为例,即用户选择的语音服务为亚马逊的alexa,用户选择的语种为法语,通讯协议sc_spec如表1所示。80.表1[0081]datatypepacketnumberlengthdatalengthxxxxxxxxdataxxxxxxxx[0082]表1的横向表头,datatype表示语音模型的类型,packetnumber表示打包数据的包序号,length表示语音模型对应的16进制数据的长度,data表示语音模型对应的16进制数据,表1的纵向表头,length表示对应每个部分所占字节的长度,data表示对应每个部分的数据值。显示设备接收到用户选择的语言,确认对应用户选择语言的语音模型,并设置通讯协议sc_spec包含有显示设备要求遥控设备切换的语音模型信息,即包含有表1中示出的语音模型类型、语音模型对应的16进制数据以及语音模型对应的16进制数据的长度信息,以使遥控设备通过获取通讯协议sc_spec获取需切换的语音模型。需要说明的是,表1中的xx不表示实际含义,并非对具体内容的限定。[0083]s705、结束。[0084]图6为本发明根据示例性实施例示出的一种遥控设备的多语音模型切换方法的具体流程示意图。在一些实施例中,遥控设备中的数据传输模块540执行图6中示出的下述步骤:[0085]s801、开始。[0086]s802、判断是否与显示设备无线连接。若是,执行s803;若否,执行s812。[0087]在一些实施例中,遥控设备判断是否与显示设备例如通过蓝牙无线连接,若遥控设备判断与显示设备无线连接,则遥控设备可以与显示设备之间进行数据的传输。基于显示设备判断与遥控设备断开连接,流程结束。[0088]s803、接收到显示设备发送的模型切换指令。[0089]在一些实施例中,显示设备可以根据用户选择的语言,根据自定义的通讯协议sc_spec,向遥控设备下发不同的模型切换指令,通讯协议sc_spec可以是包含有显示设备要求遥控设备切换的语音模型信息的通讯协议。[0090]遥控设备接收到显示设备发送的模型切换指令,数据传输模块540可以通过对自定义的通讯协议sc_spec所包含信息的分析,获取用户选择的语言,即根据上述自定义的通讯协议sc_spec提取需要加载的语音模型信息。[0091]s804、根据模型切换指令判断外挂存储模块中是否存储有所需语音模型和对应的语音驱动固件。若是,执行s805;若否,执行s812。[0092]在一些实施例中,数据传输模块540判断外挂存储模块550,例如外挂flash中是否预置有所需的语音模型以及对应的语音驱动固件,数据传输模块540可以按照外挂flash配置表进行所需语音模型以及对应的语音驱动固件的查询。[0093]基于外挂存储模块550中存储有所需语音模型和对应的语音驱动固件,根据模型切换指令从外挂存储模块550中加载所需语音模型和所需语音驱动固件至语音处理模块530;基于外挂存储模块550中未存储有所需语音模型和对应的语音驱动固件,发送语音模型缺失反馈信号至显示设备。[0094]在一些实施例中,若数据传输模块540判断外挂flash中存储有所需的语音模型以及对应的语音驱动固件,则继续执行后续步骤;若数据传输模块540判断外挂flash中未存储有所需的语音模型以及对应的语音驱动固件,可以控制执行过程结束,或者也可以发送语音模型缺失反馈信号至显示设备,显示设备获取到遥控设备发送的语音模型缺失反馈信号后,判断外挂flash无用户所选择语言对应的语音模型以及对应的语音驱动固件,可以通过显示或声音像用户进行提示,以提示用户切换其它语音模型,进一步优化了用户体验。[0095]s805、根据模型切换指令从外挂存储模块中加载所需语音模型和所需语音驱动固件至语音处理模块。[0096]在一些实施例中,数据传输模块540根据模型切换指令可以得知所需语音模型以及对应的语音驱动固件,数据传输模块540由此按照外挂flash配置表,获取所需语音模型的存储地址,以及所需语音模型对应的固件驱动的存储地址,并从外挂flash的对应地址处读取相应的数据,将读取到的数据通过spi通信接口写入到语音处理模块530的rom中,即从外挂存储模块550中读取所需语音模型和所需语音驱动固件至语音处理模块530,该过程即为数据传输模块540加载语音模型和语音驱动固件的过程。在一些实施例中,数据传输模块540可以根据语音处理模块530对应的语音模型驱动配置信息表,即语音处理模块530中对应所需语音模型的固件驱动值,根据获取的所需语音模型获取所需语音模型的固件参数,并更新语音处理模块530的相关参数配置信息,使得语音处理模块530可以校验对应所需语音模型的中场语音唤醒词以及语音服务指令。[0097]s806、判断是否成功加载所需语音模型和语音驱动固件。若是,执行s808;若否,执行s807。[0098]在一些实施例中,数据传输模块540判断成功加载所需语音模型和语音驱动固件,即数据传输模块540判断成功读取所需语音模型和语音驱动固件至语音处理模块530,控制语音处理模块530校验中场语音唤醒词;数据传输模块540判断未成功加载所需语音模型和语音驱动固件,即数据传输模块540判断未成功读取所需语音模型和语音驱动固件至语音处理模块530,数据传输模块540再次从外挂存储模块550中加载所需语音模型和所需语音驱动固件至语音处理模块530,直至成功加载所需语音模型和语音驱动固件。[0099]s807、获取所需语音模型和语音驱动固件的循环加载次数,判断加载次数是否小于预设次数。若是,执行s805;若否,执行s811。[0100]在一些实施例中,数据传输模块540获取所需语音模型和语音驱动固件的循环加载次数,数据传输模块540判断循环加载次数小于等于预设加载次数,控制语音处理模块530校验中场语音唤醒词;数据传输模块540判断循环加载次数大于预设加载次数,控制遥控设备关闭中场语音模式。[0101]在一些实施例中,预设次数例如但不限于三次,若在循环三次之内成功加载所需的语音模型和所需语音模型对应的语音驱动固件,遥控设备则进入中场语音唤醒词侦听状态;若循环三次后仍未成功加载所需的语音模型和所需语音模型对应的语音驱动固件,遥控设备关闭中场语音功能。[0102]s808、遥控设备进入侦听状态。[0103]在一些实施例中,数据传输模块540成功加载所需语音模型以及所需语音模型对应的语音驱动固件,即数据传输模块540成功读取所需语音模型以及所需语音模型对应的语音驱动固件至语音处理模块530,语音处理模块530自动进行固件驱动的配置,使得遥控设备进入侦听状态,能够有效侦听对应用户所选择语言的中场语音唤醒词,实现中场语音服务。[0104]s809、获取显示设备发送的模型切换更新指令。[0105]在一些实施例中,当用户通过显示设备更改选择的语言时,显示设备确认对应用户新选择语言的语音模型,根据自定义的通讯协议sc_spec,显示设备向遥控设备发送模型切换更新指令,遥控设备获取显示设备发送的模型切换更新指令。[0106]s810、判断模型切换更新指令与模型切换指令是否一致。若是,执行s811;若否,执行s805。[0107]在一些实施例中,数据传输模块540判断模型切换更新指令与模型切换指令是否一致,即判断模型切换更新指令对应的语音模型与已加载的语音模型是否相同。[0108]数据传输模块540判断模型切换更新指令与模型切换指令不同,即判断模型切换更新指令对应的语音模型与已加载的语音模型不同,例如由英语的vidaa语音服务变换为英语的alexa语音服务,根据模型切换更新指令从外挂存储模块550中重新加载英语的alexa语音服务对应的所需语音模型和所需语音驱动固件至语音处理模块530,即重复循环执行加载所需语音模型和语音驱动固件,以及加载成功与否的判断过程。数据传输模块540判断模型切换更新指令与模型切换指令一致,例如前后均对应英语的vidaa语音服务,则无需做任何处理。[0109]s811、结束。[0110]图7为本发明根据示例性实施例示出的一种显示设备端的语音服务切换方法的流程示意图。在一些实施例中,显示设备中的控制器执行图7中示出的下述步骤:[0111]s901、开始。[0112]s902、收到遥控设备上传的语音开始指令。[0113]在一些实施例中,当遥控设备处于侦听状态下并判断侦听到对应的中场语音唤醒词后,遥控设备自动进入唤醒状态,并向显示设备发送语音开始指令,并同步上传录音数据至显示设备。[0114]s903、判断是否需要按键触发语音功能。若是,执行s904;若否,执行s905。[0115]s904、显示设备调用近场语音服务。[0116]在一些实施例中,显示设备收到遥控设备发送的语音开始指令之后,根据语音指令的标示位,判断是否为语音按键唤醒,若为语音按键唤醒,即需要按下遥控设备上的按键才能进行语音输入,则显示设备调用近场语音服务。[0117]s905、显示设备判断是否为中场alexa语音唤醒。若是,执行s906;若否,执行s907。[0118]在一些实施例中,显示设备收到遥控设备发送的语音开始指令之后,根据语音指令的标示位,判断是否为语音按键唤醒,若不为语音按键唤醒,即无需要按下遥控设备上的按键即可进行语音输入,则显示设备调用中场语音服务。[0119]s906、显示设备调用alexa语音服务。[0120]在一些实施例中,显示设备根据语音指令的标示位判断,若为中场alexa语音唤醒,则调用中场alexa语音服务。[0121]s907、显示设备判断是否为中场vidaa语音唤醒。若是,执行s908;若否,执行s909。[0122]s908、显示设备调用vidaa语音服务。[0123]在一些实施例中,显示设备根据语音指令的标示位判断,若为中场vidaa语音唤醒,例如用户输入“heyvidaa”语音,则显示设备调用中场vidaa语音服务。[0124]s909、结束。[0125]示例性地,本发明一些实施例中的遥控设备例如但不限于支持9种中场语音唤醒词唤醒,包含对应alexa语音服务的英语、法语、德语、意大利语、西班牙语、阿拉伯语、澳洲英语、印度英语,以及对应vidaa语音服务的英语唤醒功能。其中,alexa语音服务为亚马逊使用的语音服务,vidaa语音服务为海信使用的语音服务,alexa语音服务和vidaa语音服务支持中场语音功能。[0126]图8为本发明根据示例性实施例示出的一种显示设备与遥控设备的双端交互逻辑示意图。如图8所示,显示设备与遥控设备的双端交互逻辑包括如下步骤:[0127]显示设备获取用户通过显示设备选择的语言以生成模型切换指令,并发送至遥控设备。[0128]遥控设备接收到显示设备下发的模型切换指令,从外挂存储模块中加载所需语音模型和对应的语音驱动固件。[0129]遥控设备进入到侦听状态,当判断侦听到对应的中场语音唤醒词之后,遥控设备自动唤醒并上传语音服务数据至显示设备。[0130]显示设备将语音服务数据上传对应的语音服务和语音引擎进行处理后,反馈识别结果。[0131]由此,本发明一些实施例设置遥控设备包括外挂存储模块550,外挂存储模块550中存储有多种语音模型以及对应的驱动固件,遥控设备通过接收显示设备发送的语音模型指令来智能化地提取外挂存储模块550中预置的对应语音模型和驱动固件,避免了在语音处理模块530中存储多个语音模型和对应的语音驱动固件以实现多语音模型切换,导致的对应多个语音模型和语音驱动固件的语音程序同时运行,造成的遥控设备功耗增加的问题,即可在满足遥控设备中场语音功能低功耗要求的同时,在遥控设备端实现多种语音模型的智能化切换,以兼容不同的中场语音唤醒词,提高遥控设备的通用化程度,提升用户体验。[0132]基于同一发明构思,本发明一些实施例还提供了一种显示控制系统,图9为本发明根据示例性实施例示出的一种显示控制系统的结构示意图。如图9所示,显示控制系统包括显示设备和如上述实施例所述的遥控设备,因此具备上述实施例所述的有益效果,这里不再赘述。[0133]显示设备和遥控设备通信连接,例如遥控设备与显示设备之间可以短距离无线通信连接,以实现二者之间的数据交互,交互的数据例如包括但不限于语音数据和按键数据。[0134]根据上述实施例提供的遥控设备,本发明实施例还提供一种遥控设备的多语音模型切换方法,该遥控设备的多语音模型切换方法的执行主体包括但不限于上述遥控设备中的数据传输模块。该遥控设备的多语音模型切换方法的具体实施方式可以参考上述实施例中对于遥控设备的描述,尤其是图6所示实施例,这里不再赘述。[0135]具体实现中,本发明还提供一种计算机存储介质,其中,该计算机存储介质可存储有程序,该程序执行时可包括本发明实施例提供的方法的各实施例中的部分或全部步骤。存储介质可为磁碟、光盘、只读存储记忆体(英文:read-onlymemory,简称:rom)或随机存储记忆体(英文:randomaccessmemory,简称:ram)等。[0136]本领域的技术人员可以清楚地了解到本发明实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明实施例中的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分的方法。[0137]需要说明的是,本发明一些实施例所描述的技术方案适用于所有带有本地唤醒功能的蓝牙遥控
技术领域
:,不限于上述实施例提供的遥控设备遥控显示设备的应用场景。另外,本发明实施例对显示设备的具体类型不作限定。另外,本发明各实施例之间相同相似的部分互相参照即可,相关内容不再赘述,且本发明实施例并未罗列出所有的可能组合方式,本发明各实施例中的技术特征之间的任意组合同样属于本发明的保护范围。[0138]最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。[0139]为了方便解释,已经结合具体的实施方式进行了上述说明。但是,上述示例性的讨论不是意图穷尽或者将实施方式限定到上述公开的具体形式。根据上述的教导,可以得到多种修改和变形。上述实施方式的选择和描述是为了更好的解释原理以及实际的应用,从而使得本领域技术人员更好的使用实施方式以及适于具体使用考虑的各种不同的变形的实施方式。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1