专利名称:用于指示听写应用程序能够接受音频的标记的制作方法
技术领域:
本申请的技术一般涉及激活或调用计算机化工作环境中的应用程序,并且更尤其 地,涉及提供被激活的应用程序已准备好接受输入的标记(indicia)。
背景技术:
计算机和处理器是现今普遍存在的工具。一些普通的个人和商业应用程序通过使用日常计算机和处理器,诸如,例如桌上型计算机、膝上型计算机、MP3播放器、电子个人数字助理、智能电话等来完成。然而,应用程序通常是通过利用最新技术的计算机和处理器开发的。而使用者通常并不具有最新的计算机和处理器。因此,应用程序经常是为性能比存储和运行应用程序的处理器或计算机高的计算机和处理器设计的。性能较低的计算机或处理器可能能够执行应用程序,但这种执行会引入滞后或等待时间的形式的处理延迟。此外,许多应用程序现今在利用瘦客户端(thin client)结构的计算机或处理器上执行。瘦客户端结构是以下这样的结构,其中,使用者操作提供界面(诸如图形用户界面)的客户端计算机,但对应用程序的实际处理是由主机执行的,该主机经由网络连接被连接到客户端计算机。该网络连接可以是,例如,万维网或另一种公共网络,或专用网络。数据的传输,无论是批量传输还是流传输,均可引入额外的滞后或等待时间延迟。与瘦客户端应用程序相关联的滞后或等待时间的延迟可能会因为缺乏足够的处理速度和性能的较老计算机和处理器而加剧。在一些实例中,滞后和等待时间只会对使用带来麻烦,因为数据并不会丢失,而仅仅高速缓存在缓冲器中,以便在计算机或处理器有能力处理时进行最终的处理。然而,在一些应用中,直到应用程序被激活或特定操作被调用,计算机或处理器才能接收到所需的数据。对于语音听写,尤其如此。具体而言,在听写应用程序被调用时发送命令的时间到计算机或处理器能够接收音频时的时间之间的滞后或等待时间可能相当长。如果使用者例如在计算机、处理器或录音设备准备好接收音频数据前就开始说话,则数据的一部分将会丢失。因此,鉴于这种背景,期望能提供存储的应用程序处于准备好接收输入的状态的标记。
发明内容
描述了一种用于提供应用程序能够接收数据的指示的计算机实施方法。向处理器提供指令,以激活或调用应用程序。处理器从存储器取出(fetch)应用程序并执行命令,以激活或调用应用程序。将关于应用程序的状态的标记设置成第一配置,该第一配置指示应用程序被激活或调用但还不能接受数据。一旦应用程序被激活并能接收数据,将关于应用程序的状态的标记设置成第二配置,该第二配置不同于第一配置,指示应用程序被激活并准备好接收数据。在一种配置中,该标记可以是麦克风图像,表示经由实际的麦克风记录音频。该麦克风可以是第一颜色,诸如,例如红色,以向使用者指示应用程序还不能接收音频。该麦克风可以是第二颜色,诸如,例如绿色,以向使用者指示应用程序现在能够接收音频。当说出的音频将被记录和转录时,红色的和绿色的标记会通知使用者。在另一种配置中,该标记可以是指示经由实际麦克风记录音频的情况的文件的音 频播放。当应用程序能够接收音频信号时,该音频文件的播放可以是特定声音。根据本文描述的一般性原理,任意上述实施例的特征可以彼此结合地使用。在与附图和权利要求相结合地阅读了以下详细描述后,将可以更透彻地理解这些和其他实施例、特征和优点。
了多个示例性实施例,并且是说明书的一部分。这些附图与以下描述一起说明和解释了本申请的技术的各种原理。图I是具有标记的图形用户界面的示例性实施例,该标记被配置成在视觉上指示应用程序还没准备好接受数据,其中该标记处于第一配置;图2是具有标记的图形用户界面的示例性实施例,该标记被配置成在视觉上指示应用程序已准备好接受数据,其中该标记处于第二配置;图3A和图3B示出了与本申请的技术相关联的可视标记;图4是说明与本申请的技术相关联的操作步骤的示例性流程图;和图5是示例性计算机的功能框图,该示例性计算机具有符合本申请的技术的操作系统。在各图中,同样的参考符号和描述指示类似的但并不必然是同样的元件。尽管本文中描述的示例性实施例可以有各种修改形式和备选形式,但在附图中是以举例的方式显示了具体实施例,并且本文中将详细描述这些具体实施例。然而,本文中所描述的示例性实施例并不旨在被限制到所公开的特定形式。而是,此刻的公开内容覆盖了落入权利要求的范围内的所有修改、等同和备选形式。
具体实施例方式现在将参考听写或录音应用程序来解释本发明的技术,其中应用程序接收的数据是音频。该技术一般地被描述为从作为数据输入的使用者接收音频,但本申请的技术也可用于音频以外的数据。此外,本申请的技术是利用常规操作系统(诸如,例如可从微软公司买到的WINDOWS )解释的。一个本领域普通技术人员在阅读了本公开内容后,将会认识到本申请的技术也可以用于其他环境和其他操作系统。其他操作系统包括,例如,Linux、Mac OS X、Solaris等仅作为举例的常规操作系统。此外,尽管本申请的技术被描述为是在瘦客户端上运行的,但是本申请的技术也可用于胖客户端(fat client)。瘦客户端使用远程服务器或其他处理器来运行应用程序,该应用程序被瘦客户端访问,而不是像在胖客户端中那样被本地处理器访问。此外,本申请的技术可能对于自动的听写转录尤其有用,这是因为自动转录引擎较为不能“猜测出”被削波(clipped)或否则未被记录的音频。而且,本申请的技术是针对一定的示范性实施例来说明的。在此使用的措辞“示范性”意思是“起到举例、描述场景,或说明的作用”。在此所说明的任何“示范性”实施例无需被直译成比其它实施例更优选或具有优点。此外,在此所描述的所有实施例都应被认为是示范性的,除非另外声明。首先参考图1,显示了图形用户界面100的一部分。图形用户界面被显示在计算机10的显示器12或类似装置上。计算机10可以是常规的桌上型电脑或膝上型电脑。本申请的技术被描述为其涉及了瘦客户端客户操作系统,诸如可驻留在通过通信网16连接到远程服务器14的计算机10上。如上所述,通信网络16在某些实施例中可以是公共通信网16,诸如,例如互联网、万维网、其他基于分组的网络、蜂窝式网络、无线网络(诸如,例如
WiFi和WiMax网络)、其他局域网、广域网、无线局域网、以太网连接、公共交换网、PSTN网,或类似网络。对于此示例性实施例,图形用户界面100具有在工具栏中的具有麦克风形状的示例性图形图标102,其处于指示应用程序没有准备好接受音频的第一配置104中。在这种情形下,标记具有麦克风上的颜色,其指示系统没有准备好接受音频信号。通常可计划将该颜色设置为使用指示停止的红色。当然,也可以使用其他颜色。还可以提供备选的标记。例如,如图3A所示,麦克风图形300上可带有划过麦克风的线302,指示被普遍接受的用于“NO”的图像,其将指示当前没有麦克风可用。现在参考图2,图2类似于图1,但麦克风的图形图标102已经被激活,并且可通过图形用户界面100访问的突显(underlining)程序已经被激活。因此,图形图标102处于第二配置204。在此示例性实施例中,可计划将图形图标102的第二配置204设置为使用绿色的麦克风,指示正常工作(go)。也可以提供成除例如颜色以外的其他可视标记。参考图3B,麦克风300被显示为不带有划过该麦克风的线302。其他可视标记可包括,例如,图形图标一 “X”或“0”、“0N”或“OFF”、轻触开关(flip switch)或类似图标的较小或较大的图像。尽管当前计划使用可视指示,但是也可以使用来自连接到计算机10的扬声器18发出的声音来代替这种可视指示。例如,当诸如通过点击图形图标102来操作图形图标102时,如果应用程序正在被存取和启用,则扬声器18可提供第一声音,其指示麦克风还不可用。一旦被激活并已准备好,扬声器18将提供第二声音或声响(audible),指示麦克风现在是可用的。第一和第二声音可以是相同的也可以是不同的。例如,第一电子啁啾声(chirp)可指示应用程序功能正在被激活或调用,但应用程序还没有准备好接收音频。第二电子啁啾声可指示应用程序功能已经被激活,并且该应用程序已准备好接收音频。备选地,第一声音可以是连续的声音或连续的一串电子啁啾声,指示应用程序还没准备好接收音频;而第二声音可以是连续的声音或连续的一串电子啁啾声的改变或结束,指示该应用程序现在准备好接收音频。备选地,第一声音可以是电子啁啾声,第二声音可以是电子铃声,等等。尽管本申请可用于若干种数据输入,但对于音频应用程序和与图形用户界面协同工作使得应用程序被激活或调用并在其他应用程序内工作的应用程序,本申请是尤其有用的。例如,通过利用听写,用户可以点击图形图标以激活听写/转录程序,诸如例如可从Nuance Communications 公司买到的DRAGON NATURALLYSPEAKING 。人们可
能在点击图形图标以激活程序后立即,或者基本上在点击图形图标的同时,或者甚至在某些情况可能在点击图形图标以前,开始向麦克风说话。然而,听写/转录程序还没有被完全激活和准备好接受音频输入。因此,在程序被激活时说出的音频没有被记录、没有被转录,并且可能不可恢复。图4提供了表示示例性方法的流程图400,该示例性方法提供了在程序准备好接受数据时的指示。虽然流程图400是一些离散的步骤说明的,但是本领域普通技术人员将认识到,所说明的步骤也可以分解成多个步骤,或者流程图中的多个步骤也可以组合成单个步骤。而且,该流程图所说明的事件的顺序可以被改变或重新安排,而不会脱离本申请的技术。要注意的是,该处理是因为用户激活应用程序而在步骤402处开始的。该激活步骤可以是本领域中公知的激活应用程序的任何常规手段,但典型地是“点击”与应用程序相关联的代表性图形图标。在以上示例性实施例中,用户例如点击图形图标102。在步骤404,提供处于第一、初始或空闲配置的与应用程序空闲状态相关联的标记。在以上描述的其中一个实施例中,例如,图形图标102被设置成处于第一或空闲配置104,同时为红色。红色指 示应用程序不能接收输入,并且例如听写/转录应用程序的用户不应开始说话。如果这是初次使用,计算机10将激活应用程序,也可以是存取并激活应用程序。如上所述,计算机10可以是瘦客户站,使得计算机10访问远程服务器14。接下来,在步骤406,确定激活的应用程序在何时准备好接受数据。如果激活的应用程序还没有准备好接受数据,则控制返回步骤404。然而,如果确定了激活的应用程序已准备好或能够接收输入,则在步骤408,图形图标102被设置成处于第二配置204,同时为绿色。例如,激活的与听写/转录相关联的程序的最后指令可以是更新计算机10的显示器12,以显示处于第二配置204的图形图标102。在一些实例中,对应用程序能够接受音频的指示可以在应用程序完全有效的时间点之后提供。如上所说明的,计算机10可以是瘦客户端。但是,计算机10也可以是能够进行其本身处理的胖客户端。在任何情况下,将参考能够实施本申请的技术的示例性操作系统来描述计算机10。通常,计算机10包括处理单元502、系统存储器504和系统总线506。系统总线506耦合不同的系统部件,并允许在部件之间交换数据和控制信号。数据总线506可根据任意编号的常规总线协议工作。系统存储器504通常包括随机存取存储器(RAM) 508和只读存储器(ROM) 510。ROM 510通常存储基本操作信息系统,诸如基本输入/输出系统(BIOS) 512。RAM 508经常包含基本操作系统(OS) 514、应用程序软件516和518以及数据520。计算机10通常包括硬盘驱动器522、磁盘驱动器524或光盘驱动器526中的一个或多个。驱动器经由硬盘驱动接口 528、磁盘驱动接口 530或光盘驱动接口 532连接到总线506。应用程序模块和数据可存储在磁盘(诸如,例如安装在磁盘驱动器(未示出)中的硬盘)上。计算机10还可具有用于连接到局域网(LAN)、无线网、以太网或类似网络的网络连接534,以及用于连接到外围设备(诸如鼠标、键盘、调制解调器或打印机)的一个或多个串行端口接口 536。计算机10还可具有未示出的USB端口或无线部件。计算机10通常具有显示器或监视器538,其通过诸如视频适配器540的适当接口连接到总线506。监视器538可作为使用触摸屏、光笔或类似物的输入机构使用。在阅读了本文公开的内容后,那些本领域技术人员将认识到,一些被描述为分离单元的部件可以被组合成一个单元,并且单独的单元可分解成若干不同的单元。进一步地,各种功能可包含在一台个人计算机中或分布在若干个联网的个人计算机中。如果将计算机10连接到网络,通常存在一个或多个远程网络服务器用于管理网络资源。该网络服务器可以是另一台计算机(或计算机10可充当服务器)、服务器或其它等同装置。那些本领域技术人员将理解,可使用任意各种不同的技术和技巧来表达信息和信号。例如,在以上描述中所提及的数据、指令、命令、信息、非瞬时信号、比特、符号和码片可通过非瞬时电压、非瞬时电流、非瞬时电磁波形、非瞬时磁场或粒子、非瞬时光场或粒子,或者它们的任意组合来体现。 那些技术人员将进一步体会到,结合在此所揭示的实施例所说明的各种说明性的逻辑框、模块、电路和算法步骤可被实施成电子硬件、计算机软件,或者二者的结合。为了清楚地说明硬件和软件的这种可互换性,以上基本上按照它们的功能描述了各种说明性部件、框、模块、电路和步骤。这样的功能是被实施成硬件还是软件取决于特定应用,以及施加到整个系统的设计限制。技术人员可针对每一种特定的应用以不同的方式实施所描述的功能,但是这样的实施决策不应被解释成导致背离了本发明的范围。结合本文公开的实施例所描述的不同的说明性逻辑框、模块,和电路可使用在此所描述的功能的通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其它可编程逻辑装置、离散门或晶体管逻辑、离散硬件部件,或者它们的任意组合来实施或执行。通用处理器可以是微处理器,而备选地,该处理器可以是任意常规的处理器、控制器、微处理器,或状态机。处理器还可以被实施成运算装置的组合,例如DSP和微处理器的组合、多个微处理器、与DSP内核相结合的一个或多个微处理器,或者任意其它这样的配置。结合本文公开的实施例描述的方法或算法的步骤可以直接在硬件中实现,或在由处理器执行的软件中实现,或由二者的结合实现。软件模块可驻留在随机存取存储器(RAM)、闪存、只读存储器(ROM)、可电气编程的ROM (EPR0M)、可电气擦除的可编程ROM(EEPR0M)、寄存器、硬盘、可拆卸磁盘、⑶-R0M,或本领域已知的任意其他形式的存储介质中。示例性存储介质耦合到处理器,使得处理器可从该存储介质读取信息和将信息写到存储介质中。在备选形式中,存储介质可以与处理器成为一体。处理器和存储介质可驻留在ASIC中。ASIC可驻留在用户终端中。在备选形式中,处理器和存储介质可作为分立的部件驻留在用户终端中。之前对公开实施例的描述被提供来使得任何本领域技术人员都能够制造和使用本发明。对于本领域技术人员来说,对这些实施例的各种修改将是显而易见的,并且本文定义的一般原理可被应用到其它实施例中,而不背离本发明的精神和范围。因此,本发明并非意图被限制在本文所示出的实施例中,而是旨在符合与所揭示的原理和新颖特征相一致的最为广泛的范围。
权利要求
1.一种计算机实施方法,用于向听写客户端提供听写应用程序能够接收数据输入的标记,该方法包括启动听写应用程序,其使用从客户站处的麦克风接收的音频输入;在所述客户站通过使用至少一个具有第一配置的标记指示,所述麦克风不能够接受音频输入;确定是否在所述客户站处的所述麦克风能够接收用于所述听写应用程序的音频输入;以及如果在所述确定步骤中确定了在所述客户站处的所述麦克风能够接收用于所述听写应用程序的音频输入,将所述至少一个标记从所述第一配置转变成第二配置,该第二配置指不所述麦克风能够接受首频输入。
2.如权利要求I所述的方法,其中所述启动步骤包括点击图形图标,并且所述至少一个具有第一配置的标记是所述被点击的图形图标。
3.如权利要求2所述的方法,其中所述第一配置包括第一颜色。
4.如权利要求3所述的方法,其中所述至少一个标记的所述第二配置是具有不同于所述第一颜色的第二颜色的图形图标。
5.如权利要求2所述的方法,其中所述第一配置是有线划过所述图形图标,并且所述至少一个标记的所述第二配置是没有划过所述图形图标的线的图形图标。
6.如权利要求2所述的方法,其中所述第一配置是具有第一尺寸的所述图形图标,并且所述至少一个标记的所述第二配置是具有不同于所述第一尺寸的第二尺寸的所述图形图标。
7.如权利要求I所述的方法,其中所述至少一个具有第一配置的标记包括第一音调, 并且所述至少一个具有第二配置的标记包括不同于所述第一音调的第二音调。
8.如权利要求I所述的方法,其中所述第一音调或所述第二音调中的至少一个是静曰
9.一种设备,包括处理器;和显示器;所述显示器提供具有工具栏的图形用户界面,所述工具栏具有至少一个图形图标,该图形图标指示应用程序可由所述图形用户界面访问;所述显示器提供具有第一配置和第二配置的第一标记,所述第一配置指示所述应用程序不能够接收输入,并且所述第二配置指示所述应用程序能够接收输入,所述第一配置不同于所述第二配置;并且所述处理器用于在所述至少一个图形图标被激活时启动所述应用程序,并且所述处理器使所述第一标记处于所述第一配置,所述处理器具有确定模块,所述确定模块用于确定何时所述应用程序能够接收输入,并且在确定了所述应用程序能够接收输入时,所述处理器使所述第一标记处于指示所述应用程序能够接收输入的所述第二配置。
10.如权利要求9所述的设备,其中所述应用程序是听写应用程序,并且在所述麦克风能够向所述应用程序发送音频数据时,所述应用程序能够接收输入。
11.如权利要求10所述的设备,其中所述第一标记是图形图标。
12.如权利要求11所述的设备,其中所述第一配置显示为具有第一颜色的所述图形图标,并且所述第二配置显示为具有第二颜色的所述图形图标,所述第二颜色不同于所述第一颜色。
13.如权利要求12所述的设备,其中所述图形图标是麦克风。
14.如权利要求10所述的设备,其中所述第一标记是可听见的音调,并且所述第一配置是第一音调,且所述第二配置是第二音调,其中所述第二音调不同于所述第一音调。
15.如权利要求14所述的设备,其中所述第一音调或所述第二音调中的至少一个是静曰
16.一种听写/转录系统,包括至少一个处理器,所述至少一个处理器包括将音频数据转换成文本数据的语音识别引耦合到所述至少一个处理器的显示器,所述显示器具有图形用户界面,以允许使用者向所述至少一个处理器提供指令;以及耦合到所述至少一个处理器的麦克风,所述麦克风用于从使用者接收音频输入和将音频数据提供给所述至少一个处理器,以便所述语音识别引擎将所述音频数据转换成文本数据;其中所述处理器在所述图形用户界面上显示具有第一配置和第二配置的第一图形图标,所述第一配置指示所述麦克风不能向所述语音识别引擎提供音频,所述第二配置指示所述麦克风能向所述语音识别弓I擎提供音频。
全文摘要
提供了一种能够访问应用程序的客户站。该应用程序具有至少一个标记,该标记具有第一配置和不同于第一配置的第二配置。第二配置指示应用程序能够接受输入。
文档编号G06F3/14GK102934078SQ201180027050
公开日2013年2月13日 申请日期2011年3月17日 优先权日2010年3月30日
发明者R.海因斯, E.基兹纳 申请人:Nvoq股份有限公司