于参数指定用于每个训练资源的预测输出的标准(步骤304)。也就是说,对于每个资源,系统基于参数指定用于系统生成的概念术语分值的标准。例如,对于任何训练资源,参数可以指定与资源相关联的概念术语的分值应该高于概念术语组中的任何其他概念术语或者概念术语组中的其他概念术语的随机选择样本的任何分值。可选地,参数可以要求与资源相关联的概念术语的分值超过其他分值达阈值。作为另一示例,对于任何训练资源,参数可以指定与资源相关联的概念术语的分值应该都高于指定的阈值。作为另一示例,参数可以指定与资源相关联的概念术语应该都处于指定数量的最高评分的概念术语中。用于生成标准的参数可以被提供给系统,例如由系统管理员,并且可以是静态的,即在训练开始是预定的,或者动态的,即在系统的整个训练中可以自动调整。例如,在训练期间可以放宽参数,直到系统的性能下降,然后使其更严格。
[0048]对于参数和训练数据组,系统使用指定的标准和训练资源的特征来执行训练过程以训练分类器(步骤306)。此外,训练过程使用反向传播的方法来调整深度网络(例如,图1的深度网络106)的所有组件的参数。
[0049]作为训练过程的一部分,如果分类器为特定训练资源预测的标签与该特定训练资源的已知期望标签不同,即,分类器生成的概念分值不满足用于训练资源的标准,则分类器将调整其参数,以使用常规基于梯度的方法对该特定输入减小预期误差。另外,作为反向传播方法的一部分,分类器向深度网络发送错误信号,其允许深度网络调整其内部组件的参数和反向传播的连续阶段的嵌入函数组的参数。
[0050]在一些情况下,例如,对于大训练数据组,可以以多种方式中的任何一种并行训练过程。例如,可以使用并行〃Large Scale Distributed Deep Networks, "Jeffrey Dean, etal., Neural Informat1n Processing Systems Conference.2012 中描述的机器学习模型的训练的一种或多种技术来并行训练过程。
[0051 ] 主题的实施例和本说明书中描述的功能操作可以被实现在数字电子电路中、有形实现的计算机软件或固件中、计算机硬件中,包括本说明书中公开的结构及其结构等同物,或者它们中的一个或多个的组合中。本说明书中描述的主题的实施例可以被实现为一个或多个计算机程序,即编码在有形的非临时性程序载体上的计算机程序指令的一个或多个模块,用于由数据处理装置执行,或者控制数据处理装置的操作。替选地或另外地,程序指令可以编码在人工生成的传播信号上,例如机器生成的电、光或电磁信号,其被生成以对用于传输到适当的接收器装置的信息进行编码,用于由数据处理装置执行。计算机存储介质可以是机器可读存储设备、机器可读存储基片、随机或串行存取存储器设备、或它们中的一个或多个的组合。
[0052]术语“数据处理装置”涵盖用于处理数据的各种装置、设备和机器,例如包括可编程处理器、计算机、或多个处理器或计算机。该装置可以包括专用逻辑电路,例如FPGA(现场可编程门阵列)或ASIC(专用集成电路)。除了硬件之外,该装置还可以包括用于创建讨论的计算机程序的执行环境的代码,例如构成处理器固件、协议栈、数据库管理系统、操作系统、或它们中的一个或多个的组合的代码。计算机程序(其也可以被称为或被描述为程序、软件、软件应用、模块、软件模块、脚本或代码)可以用任何形式的编程语言编写,包括编译或解释语言或者声明或过程语言,并且其可以以任何形式部署,包括作为独立程序或作为模块、组件、子程序或适于在计算环境中使用的其它单元。计算机程序可以但不必对应于文件系统中的文件。可以将程序存储在保持其它程序或数据的文件的一部分中,例如标记语言文档中存储的一个或多个脚本、专用于所讨论的程序的单个文件中、或存储在多个协同的文件中,例如存储一个或多个模块、子程序或代码的一部分的文件。计算机程序可以被部署为在一个计算机或在位于一个地点或分布在多个地点并通过通信网络互连的多个计算机上执行。
[0053]本说明书中描述的过程和逻辑流可以通过执行一个或多个计算机程序的一个或多个可编程计算机来执行,以通过对输入数据操作和生成输出来执行功能。还可以通过专用逻辑电路来执行过程和逻辑流,并且装置也可以实现为专用逻辑电路,所述专用逻辑电路例如FPGA (现场可编程门阵列)或ASIC (专用集成电路)。
[0054]适合于计算机程序的执行的计算机包括、例如可以基于通用或专用的微处理器或二者,或任何其他类型的中央处理单元。通常,中央处理单元从只读存储器或随机存取存储器或两者接收指令和数据。计算机的主要元件是用于执行或运行指令的中央处理单元和用于存储指令和数据的一个或多个存储器设备。通常,计算机还将包括或者可操作地耦合以从用于存储数据的一个或多个大容量存储设备接收数据或向其传送数据或两者,所述一个或多个大容量存储设备例如磁光盘或光盘。然而,计算机不必具有这样的设备。此外,计算机可以被嵌入另一设备,例如移动电话、个人数字助理(PDA)、移动音频或视频播放器、游戏控制台、全球定位系统(GPS)接收器或便携式存储设备,例如通用串行总线(USB)闪存驱动器,仅举几例。
[0055]适于存储计算机程序指令和数据的计算机可读介质包括所有形式的非易失性存储器、介质和存储器设备,例如包括半导体存储设备,例如EPROM、EEPROM和闪存设备;磁盘,例如内部硬盘或可移动盘;磁光盘;以及⑶ROM和DVD-ROM盘。处理器和存储器可以被补充或并入专用逻辑电路。
[0056]为了提供与用户的交互,本说明书中描述的主题的实施例可以实现在具有用于向用户显示信息的显示设备(例如,CRT(阴极射线管)或LCD(液晶显示器)监视器)以及键盘和指示设备(例如,鼠标或轨迹球)的计算机上,用户利用键盘和指示设备可以提供到计算机的输入。其他种类的设备也可以用于提供与用户的互动;例如,提供给用户的反馈可以是任何形式的感知反馈,例如视觉反馈、听觉反馈或触觉反馈;以及来自用户的输入可以以任何形式被接收,包括声音、语音或触觉输入。此外,计算机可以通过向用户使用的设备发送文档和从用户使用的设备接收文档与用户交互;例如,通过响应于从web浏览器接收的请求向用户的客户端设备上的web浏览器发送网页。
[0057]本说明书中描述的主题的实施例可以实现在计算系统中,该计算系统包括后端组件,例如作为数据服务器,或该计算系统包括中间件组件,例如应用服务器,或该计算系统包括前端组件,例如具有图形用户界面或Web浏览器的客户端计算机,通过图形用户界面或Web浏览器,用户可以与本说明书中描述的主题的实现方式交互,或该计算系统包括一个或多个这样的后端组件、中间件组件和前端组件的任意组合。系统的组件可以通过任何形式或介质的数字数据通信互连,例如通信网络。通信网络的示例包括局域网(“LAN”)和广域网(“WAN”),例如互联网。
[0058]计算系统可以包括客户端和服务器。客户端和服务器通常彼此远程,并且通常通过通信网络交互。客户端和服务器的关系依靠在相应计算机上运行并且彼此具有客户端-服务器关系的计算机程序产生。
[0059]虽然本说明书包含许多特定实现方式细节,但是这些不应被解释为限制可以主张的任何发明的范围,而是作为可以特定于特定发明的特定实施例的特征的描述。在本说明书中在分立实施例的上下文中描述的某些特征也可以组合在单个实施例中实现。相反地,在单个实施例的上下文中描述的各种特征也可以分立地在多个实施例或在任何合适的子组合中实现。此外,虽然特征在上面被描述为在特定组合中起作用,甚至最初主张如此,但是,来自所要求组合的一个或多个特征在某些情况下可以从该组合中去除,并且所要求保护的组合可以指向子组合或子组合的变体。
[0060]类似地,虽然在附图中以特定的顺序描述操作,但是这不应被理解为需要以所示的特定顺序或以连续顺序执行这样的操作,或者需要执行所有图示的操作才能达到期望的结果。在某些情况下,多任务和并行处理可能是有利的。此外,上述实施例中的各种系统模块和组件的分离不应被理解为在所有实施例中需要这样的分离,并且应当理解,所描述的程序组件和系统通常可以一起集成在单个软件产品或封装到多个软件产品中。
[0061]已经描述本主题的具体实施例。其他实施例在所附权利要求的范围内。例如,权利要求中记载的动作可以以不同顺序来执行并且仍然获得期望的结果。作为一个示例,在附图中描绘的过程不要求所示的特定顺序或连续顺序才