专利名称:信息处理设备、信息处理方法以及程序的制作方法
技术领域:
本发明涉及一种信息处理设备、信息处理方法以及程序。更具体地说, 本发明涉及一种可以提供多个具有评估指标间的折衷关系的算法的信息 处理设备、信息处理方法以及程序。
背景技术:
已经提出了一种通过使用基因搜索技术来自动配置特征量提取算法 的技术(自动算法配置技术),其中特征量提取算法用于提取表示给定数据 的特征的特征量。在自动算法配置技术中,可以自动地配置用于语音识别、 图像识别等的算法。
例如,本受让人已经提出了一种这样的技术(例如,参考国际专利公
布No. WO2007/049641),其用于配置可以以高准确度从诸如音乐教:据的 内M据中快速地提取特征量的算法。
发明内容
在自动算法配置技术中,仅仅最高性能(最高准确度)的算法被输出。 因此,例如,当存在诸如性能(准确度)和速度(处理时间)的两个评估指标 时,即使可以稍微降低性能,要获得以高速度操作的算法也是困难的。虽 然一旦算法被配置就可以减小评估指标中的一个,但是相关领域中的技术 典型地不可以处理变化,例如,期望增大评估指标中的一个。
本发明是鉴于这种情形而设计的,并且期望有可能提出多个具有评估 指标间的折衷关系的算法。
根据本发明的一个实施例,提供了一种信息处理设备。该信息处理i殳 备包括算法配置装置,用于通过使用基因搜索技术来配置用于对输入信 号执行辨别的算法;以及折衷分析装置,用于通辻基于算法执行折衷分析 来确定算法关于评估指标的帕累托最优解。信息处理设备还可以包括最佳算法确定装置,用于在帕累托最优解当 中确定与所要求的评估指标条件相匹配的最佳算法。
由算法配置装置配置的算法可以具有特征提取表达式和信息估计表 达式,其中信息估计表达式是特征提絲达式的组合。
折衷分析装置可以通过使用具有不同数目的特征提取表达式的算法 来生成初始状态中的帕累托最优解,其中该算法通过从由算法配置装置配 置的算法中逐个地删除特征提M达式来创建。
折衷分析装置可以使用由算法配置装置配置的算法作为初始状态中 的帕累托最优解。
折衷分析装置可以通过随机地改变初始状态中的帕累托最优解中的 每个特征提取表达式的使用或不使用,更新帕累托最优解。
最佳算法确定装置可以基于所要求的处理时间和准确度而在帕累托 最优解当中确定最佳算法。
信息处理设备还可以包括评估值计算装置,用于确定信息估计表达式 中的特征提取表达式的评估值,并且算法配置装置可以基于所确定的特征 提取表达式的评估值而更新信息估计表达式中的特征提M达式。
当算法配置装置配置多个信息估计表达式作为算法时,信息估计表达 式中的相同特征提取表达式的贡献率的总值可以被用作对应的特征提取 表达式的评估值。
根据本发明的另 一实施例,提供了 一种用于信息处理设备的信息处理
方法,其中信息处理i殳备包括算法配置装置,用于配置算法;以;^折衷 分析装置,用于确定算法的帕累托最优解。该信息处理方法包括以下步骤 通迚基因搜索技术来配置用于对输入信号执行辨别的算法;以及通过基于 算法执行折衷分析来确定算法关于评估指标的帕累托最优解。
根据本发明的另一实施例,提供了一种程序。该程序使计算机用作以 下装置算法配置装置,用于通过使用基因搜索技术来配置用于对输入信 号执行辨别的算法;以及折衷分析装置,用于通过基于算法执行折衷分析 来确定算法关于评估指标的帕累托最优解。
根据本发明的实施例,配置用于对输入信号执行辨别的算法,并且基 于所配置的算法执行折衷分析。结果,确定出算法关于评估指标的多个帕 累托最优解。根据本发明的实施例,可以提供多个具有评估指标间的折衷关系的算法。
图1是示出根据本发明实施例的信息处理设备的配置的示例的框图2示出输入到信息处理设备的釆样信号的示例;
图3是图示要被生成的算法的结构的图4是示出异常声音辨别表达式的结构;
图5是图示要被生成的算法的另一结构的图6是示出信息提取器的配置示例的框图7示出特征提M达式的示例;
图8示出一个特征提取表达式的示例;
图9图示输入信号的类型;
图10图示输入信号的类型;
图11图示输入信号的类型;
图12图示操作符的类型;
图13是示出由自动算法配置部件执行的自动算法配置的示例的图; 图14图示选择生成; 图15图示交叉生成; 图16图示变异生成;
图17图示下一代特征提^达式的生成的示例;
图18图示下一代特征提取表达式;
图19是示出自动算法配置部件的详细配置的示例的框图20图示由学习数据剪截部件执行的处理;
图21示出由特征量计算部件计算的特征量的示例;
图22示出被提供到机器学习部件的数据的示例;
图23A和23B图示由机器学习部件执行的处理图24图示由机器学习部件执行的处理;
图25图示由机器学习部件执行的处理;
图26A和26B图示由机器学习部件执行的处理;
图27图示帕累托最优解;
图28图示帕累托最优解的初始化;
图29图示帕累托最优解的初始化;
图30图示帕累托最优解的初始化;
图31图示帕累托最优解的初始化;
图32图示帕累托最优解的更新;
图33是图示帕累托最优解的更新的图表;
图34是图示帕累托最优解的更新的图表;
图35是图示帕累托最优解的更新的图表;
图36图示最佳算法的确定;
图37图示异常声音辨别处理;
图38是图示自动算法配置处理的流程图39是图示特征提取表达式列表生成处理的流程图40是图示随机生成处理的流程图41是图示下一代列表生成处理的流程图42是图示选择生成处理的流程图43是图示交叉生成处理的流程图44是图示变异生成处理的流程图45是图示随机生成处理的$錄图46是图示特征量计算处理的流程图47是图示机器学习处理的流程图48是图示折衷分析处理的流程图49是图示帕累托最优解初始化处理的流程图50是示出根据本发明另 一实施例的自动算法配置系统的框图;图51示出教师数据的示例;
图52示出被提供到评估值计算部件的特征量和平均时间的示例; 图53A和53B示出每个特征量的使用/不使用的示例; 图54示出所计算的特征量的示例; 图55示出总计算时间的计算的示例;
图56示出M评估参考值、亮度评估参考值和总计算时间的示例;
图57图示帕累托最优解的更新;
图58是图示帕累托最优解搜索处理的流程图59是图示特征量计算处理的流程图60是图示评估值计算处理的流程图61是图示评估值确定处理的流程图;以及
图62是示出根据本发明的一个实施例的计算机的配置示例的框图。
具体实施例方式
图1示出根据本发明的一个实施例的信息处理设备的配置的示例。
信息处理设备1执行用于检测异常声音的处理,基于作为学习数据输 入的样本信号自动地配置算法,其中样本信号是异常声音还是正常声音是 已知的。信息处理i殳备1才艮据自动配置的算法来确定新的输入信号(在下 文中,被称为"新信号")是具有异常声音还是具有正常声音。
信息处理设备l包括样本信号输入部件ll、样本信号存储部件12、 自动算法配置部件13、折衷分析部件14、帕累托最优解存储部件15、使 用算法确定部件16、新信号输入部件17、自动异常声音辨别部件18、异 常声音辨别结果输出部件19和校正信息输入部件20。
用于算法配置的样本信号从信息处理设备1中的另一区块(未示出)或 从另一设备输入到样本信号输入部件11。响应于用于算法配置的样本信 号,样本信号输入部件11将样本信号提供到样本信号存储部件12。
样本信号存储部件12存储从样本信号输入部件11提供的样本信号, 作为教师数据。自动异常声音辨别部件18和校正信息输入部件20将信号 (在下面描述)提供到样本信号存储部件12。表示输入到样本信号输入部件11的样本信号是否具有正常声音或异 常声音的数据作为标注被附连到样本信号。
图2是输入到样本信号输入部件11的样本信号的示例。在图2中, 水平轴表示时间,并且样本信号和标注在每个时间点具有一对一的对应关 系。表示样本信号是正常声音还是异常声音的标注可以皿定为具有高电 平或低电平的信号。
通it&于基因搜索技术来执行学习,自动算法配置部件13配置(生成) 用于针对不知道是异常声音还是正常声音的新信号辨别异常声音或正常 声音的算法。所配置的算法是这样的算法(特征量提取算法),其用于提取 表示输入信号的预定特征的特征量并且使得有可能基于由算法提取的特 征量(值)是否大于或等于预定阈值而辨别异常声音和正常声音。下面参考 图3及后续图来描述算法配置的细节。
折衷分析部件14通过基于由自动算法配置部件13配置的算法而扭^行 折衷分析,确定帕累托最优解作为算法。然后,折衷分析部件14将作为 帕累托最优解的多个算法提供到帕累托最优解存储部件15。帕累托最优解 存储部件15存储从折衷分析部件14提供的多个算法(其是帕累托最优解)。
在存储在帕累托最优解存储部件15中的多个算法当中,使用算法确 定部件16确定与所要求的用于评估指标的条件相匹配的最佳算法,并且 将所确定的最佳算法提供到自动异常声音辨别部件18。评估指标例如包括 信息处理设备1的当前可用资源状态和所要求性能。
新信号输入部件17接收所输入的将要进行异常声音辨别的新信号, 并且将所接收的新信号提供到自动异常声音辨別部件18。
自动异常声音辨别部件18 ^吏用从使用算法确定部件16提供的算法来 对从新信号输入部件17提供的新信号辨別异常声音和正常信号,并且将 辨别结果提供到异常声音辨别结果输出部件19。自动异常声音辨别部件 18还将辨别结果作为标注加到从新信号输入部件17提供的新信号,并且 将所得到的信号提供到样本信号存储部件12以便存储。这样,从新信号 输入部件17提供的新信号作为新的样本信号被存储在样本信号存储部件 12中。
异常声音辨别结果输出部件19以声音或图像形式输出从自动异常声 音辨别部件18提供的辨别结果。例如,当新信号具有异常声音时,异常 声音辨别结果输出部件19输出表示异常声音的声音,或者在屏幕上显示示出文字"正常声音"或"异常声音"的视频。
当存储在样本信号存储部件12中的样本信号的标注有错误时,校正 信息输入部件20对标注进行校正。也就是说,校正信息输入部件20响应 于用户操作而改写样4^信号的标注。
因此,不但来自样本信号输入部件11的加有标注的样本信号,而且 来自自动异常声音辨别部件18的加有标注的样本信号被输入到样本信号 存储部件12。当从自动异常声音辨别部件18提供的样本信号的标注有错 误时,校正信息输入部件20对该标注进行校正。
接下来,将详细地描述由自动算法配置部件13执行的算法配置。
图3是图示要被配置的算法的结构的图。
所配置算法包括m个特征提M达式1到m(m是大于1的整数)、以 及由m个特征提取表达式1到m的线性组合表达式表示的信息估计表达 式。每个特征提取表达式对输入信号执行预定计算,并且输出第一阶值作 为计算结果。信息估计表达式使用从特征提取表达式输出的第一阶值来估 计表示输入信号特征的信息。自动算法配置部件13确定异常声音辨别表 达式U作为信息估计表达式。
图4示出异常声音辨别表达式U的具体示例。要被输出的辨别结果是 表示异常声音或正常声音的二进制码。因此,基于异常声音辨别表达式U 的计算结果是小于或等于预定阈值Th还是大于预定阈值Th而辨别输入 信号是具有异常声音还是具有正常声音。例如,如图4所示,当异常声音 辨别表达式U的计算结果小于或等于预定阈值Th时,要被输出的辨别结 果表示输入信号具有正常声音,而当异常声音辨别表达式U的计算结果大 于预定阈值Th时,要被输出的辨别结^示输入信号具有异常声音。在 图4所示的异常声音辨别表达式U的示例中,只有特征提^达式1到m 中的特征提取表达式l、 2、 5和15被4吏用。这是因为其他特征提M达 式的线性组合系数为0。
要被配置的算法可以是用于估计例如预定范围内的数值而不是表示 异常声音或正常声音的二进制码的算法,其中预定范围内的数值例如为音 乐速度和亮度的程度(级别)。在这种情况下,如图5所示,根据由m个特 征提取表达式1到m的线性组合表达式表示的速度估计表达式的计算结 果,确定表示输入信号速度的值,并且根据由m个特征提^达式1到m 的线性组合表达式表示的亮度估计表达式的计算结果,确定表示输入信号亮度的值。
在下面参考图50及后续图描述的下一实施例中描述了这样的示例, 其中在新信号被输入时用作用于提取速度和亮度的值的特征提取器的算 法被配置成如图6所示。
图7示出特征提^达式1到m的示例。
特征提M达式可以处理可以以多阶值表示的输入信号,直至其具有 一个值,也就是说,其具有标量。图8示出特征4^取表达式的一个示例。
图8所示的这个特征提取表达式由表示输入信号的类型的信息和提供 表示要对输入信号执行的信号处理的信息的操作符构成。每个操作符包括 处理目标轴和处理描述,并且可选地包括用于处理的^lt。在图8所示的 示例中,"12TonesM,, g—表示输入信号类型的信息,并且接着为四个操作 符"F弁Differential" 、 "F#MaxIndex,, 、 "T#LPF—1 ;0.861"和"T#UVariance"。
表示输入信号类型的信息除包括"12TonesM"(在图8的示例中示出) 之外还包括例如"wav"和"Spectrum",其中"12TonesM"表示单声道 PCM(脉冲编码调制)声源波形数据受到沿着时间轴的区间分析,"wav"表 示波形,"Spectrum"表示二维图像(其示出声镨)。
特征提取表达式表示从与表示输入信号类型的信息较接近的信息开 始,顺序地对输入信号执行由操作符表示的信号处理。每个操作符的开头 表示要被处理的轴(处理目标轴)。在要被处理的轴中,T表示时间方向并 且F表示频率(区间)方向。
关于操作符的处理目标轴之后的处理描述,"Differential"表示微分, "MaxIndex"表示获取最大值索引,"LPF_1"表示低通滤波,并且 "UVariance"表示计算均方差。适当时,每个—^作符可以带参数。在图8 所示的示例中,"LPF_1"(低通滤波)的处理带有参数"0.861"。
因此,图8所示的特征提^达式是要沿着区间方向,对通过在时 间轴上对PCM波形数据执行区间分析而获得的数据进行微分;计算表示 沿区间方向的最大值的"Index"(即,获得具有最强声音的区间的号);沿 时间轴方向应用低通滤波器;以及最后计算均方差。输出该计算的结果。
在本实施例中,输入信号采用"wav",其表示声音表示信号中的波形, 但是特征提^4达式不仅可以具有声音信号,还可以具有任何可以以矩阵 形式(以具有值的多维矩阵形式)来表达的信号。示例包括静态图像信号和 运动图像信号。例如,输入信号可以是音频波形信号,如图9所示,其^L视为振幅、 时间和信道的矩阵;输入信号可以是图像信号,如图10所示,其被视为 帧的X和Y轴、以及RGB(R:红、G:绿和B:蓝)的矩阵;或者可以是 运动图像信号,如图11所示,其被视为帧的X和Y轴、RGB、以及时间 的矩阵。另外,输入信号可以是例如可以由矩阵表示的二进制数据。
作为示例,在图12中示出了操作符类型。例如,IMt符类型包括 平均值(Mean)、快速傅氏变换(FFT)、标准偏差(StDev)、 ^L比(Ratio)、 低通滤波器(LPF」)、高通滤波器(HPF—1)、绝对值(ABS)、平方(Sqr)、平 方才艮(sqrt)、标准化(Normalize)、微分(Differential)、积分(Integrate)、最 大值(MaxIndex)、均方差(UVariance)和下采样(DownSampling)。依赖于 所确定的操作符,处理目标轴可以是固定的。在这种情况下,该操作符使 用固定的处理目标轴。当确定使用^的操作符时,该参数也被确定为具 有随机或预设值。
接下来,将参考图13到18来描述自动算法配置部件13基于基因搜 索技术而执行的自动算法生成的流程。
如图13所示,关于当前代特征提取表达式1到m,自动算法配置部 件13确定用于评估特征4I:取表达式的评估值。自动算法配置部件13以评 估值的降序来重新排列当前代特征提取表达式1到m,然后执行选择生成、 交叉生成、变异生成和随机生成,以生成下一代特征4^取表达式l到m。 以评估值的降序重新排列当前代特征4C取表达式1到m的原因是为了允 许以评估值的降序选择用于生成下一代特征提取表达式的特征提取表达 式。因此,重复这样的处理,其中下一代特征提取表达式1到m变为当 前代特征提M达式1到m并且基于当前4戈特征提M达式1到m而生 成下一代特征提M达式1到m。
现在将详细地描M择生成、交叉生成、变异生成和随机生成。 术语"选择生成"是指通过从当前代特征提取表达式中以评估值的降
为下一代特征提M达式,生成新的特征4I:取表达式。
例如,如图14所示,在当前代特征提取表达式l、 2和3的评估值分 别为0.53、 0.85和0.74时,具有最高评估值的当前代特征4C取表达式2 被选择,并且被用作下一代特征提取表达式l。
术语"交叉生成"是指通过在为了有助于选择具有更高评估值的特征提取表达式而分配权重的情况下随机地选择两个特征提取表达式并且交 换(交叉)随机位置处的所选特征提M达式,生成新的特征提M达式。
例如,如图15所示,选择具有高评估值的第一和第二特征提取表达 式,第一特征H^^达式"Wav,T#Differential,T#IndexLRO"和笫二特征 提取表达式"Wav,T#HPF_l;0.262544,T#Mean,,,并且组合第一特征提取 表达式中的部分"Wav,T#Differential"和第二特征提取表达式中的部分
"T#Mean",换句话说,第一特征提取表达式中的部分"T弁IndexLR0" 被换成第二特征提^^达式中的部分"T弁Mean",从而生成新的特征提取 表达式。
术语"变异生成"是指通过在为了有助于选择具有更高评估值的特征 提取表达式而分配权重的情况下随机地选择特征提取表达式并且随机地 改变所选特征提M达式的一部分,生成新的特征提M达式。
例如,如图16所示,选择具有高评估值的特征提取表达式 "Wav,T#LPF_l;0.3,T#IndexLR0"作为变异源,并且删除所选特征提取 表达式中的一;操作符"T#LPF_1;0.3,,(变异示例1),加上操作符"Sqr" (变异示例2),或者将特征提M达式中的一个操作符"T#LPF—1;0.3"的 Wt变成0.7(变异示例3),从而生成新的特征提M达式。
术语"随机生成"是指通过随机地组合操作符来生成新的特征提^ 达式,使得输入信号具有一个值(标量)。第一代特征提M达式l到m没 有变为其来源的上一代特征提M达式,因此全部通过随机生成来生成。
例如,如图17所示,自动算法配置部件13^"吏用选择生成来确定下一 代特征4^^达式1到3, j吏用交叉生成来确定下一代特征^:取表达式4 到7,使用变异生成来确定下一代特征提^达式8到13,并且使用随机 生成来确定下一代特;^M达式14到m。
图18示出根据当前代特征4CW^达式1到m生成下一4戈特征4^取表 达式1到m的示例。
图19是示出自动算法配置部件13的详细配置的示例的框图。
自动算法配置部件13包括学习数据剪截部件31、特征提取表达式 列表生成部件32、特征量计算部件33、机器学习部件34和特征量提取算 法输出部件35。
学习数据剪截部件31剪截存储在样本信号存储部件12中的学习数 据,并且将学习数据提供到特辟量计算部件33和机器学习部件34。更具体地说,学习数据剪截部件31将存储在样本信号存储部件12中的样本信 号、以及样本信号的标注分成预定单位时间中的部分,并且将各个单位时 间中的经划分样本信号提供到特征量计算部件33,并且还将单位时间中的 经划分标注提供到机器学习部件34。
现在假定,如图20所示,学习数据剪截部件31将存储在样本信号存 储部件12中的样本信号、以及样本信号的标注分成n个单位时间中的n 部分。单位时间中的第一个到第n个样本信号分别被称为数据A到Dn,
并且与数据Di到Dn相关联的标注被称为标注数据。在这种情况下,学习
数据剪截部件31将数据A到Dn提供到特征量计算部件33,并且将数据 A到DD的标注数据提供到机器学习部件34。
机器学习部件34将当前代特征提取表达式1到m的评估值提供到特 征提取表达式列表生成部件32。基于评估值,特征提取表达式列表生成部 件32生成下一代特征4C^达式1到m,并且将所生成的下一代特征提 取表达式1到m提供到特征量计算部件33。更具体地i兌,特征提^达 式列表生成部件32以评估值的降序重新排列当前代特征4CM达式1到 m,然后对当前代中的预定特征提取表达式执行选择生成、交叉生成、变 异生成和随机生成,从而生成下一代特征提^达式1到m。
关于从学习数据剪截部件31提供的各个数据A到Dn,特征量计算部 件33对从特征^LM达式列表生成部件32拔_供的特征提取表达式1到m 执行计算,并且将计算结果,即,数据Di到Dn的特征量提供到机器学习 部件34。
图21示出由特征量计算部件33计算并且被提供到机器学习部件34 的特征量的示例。
通过使用数据Di到Dn的特征量及其标注数据,其中特征量从特征量 计算部件33提供,而标注数据从学习数据剪截部件31提供,机器学习部 件34通过特征选择执行线性辨别,以估计异常声音辨别表达式U。换句 话说,通过使用数据"到Dn的特征量(该特征量从特征量计算部件33提 供),机器学习部件34估计异常声音辨别表达式U,其中异常声音辨别表 达式U使用特征提M达式并且与数据A到Dn的标注数据(标注数据从 学习数据剪截部件31提供)匹配最佳。机器学习部件34确定在使用所估 计的异常声音辨别表达式U时各个特征提取表达式的评估值,并且将所确 定的评估值提供到特征提取表达式列表生成部件32。现在将更详细地描述由机器学习部件34执行的处理。
图22示出从特征量计算部件33和学习数据剪截部件31提供到机器 学习部件34的数据的示例。
机器学习部件34评估将^f吏用当前代特征提^达式1到m中的哪
些,以便与数据Di到Dn的标注数据匹配最佳,并且确定务使用的特征提
M达式的最佳组合。
首先,基于当前代特征提取表达式1到m中的任何一个都未被使用 (即,特征提取表达式1到m没有被使用)的参考状态(图所示),机器 学习部件34确定m个特征提取表达式的使用组合(图23B所示),每个特 征提取表达式中的使用/不使用被顺序地反转。在图23A和23B中,在一 行的0和1的排列中,"1"表示特征提^达式1到m中的每个被使用 的情况且"0"表示特征提^达式l到m中的每个未被使用的情况,并
且在一行中从左ii^顺序地表示特征提取表达式l、 2、 3.....和m的使
用或不使用。
接下来,关于m个特征提取表达式的使用组合中的每个,机器学习 部件34生成(估计)异常声音辨别表达式U。异常声音辨别表达式U由下 式给出
U = + b2X2 + b3X3 +,.." +bmXm+b0 (1) 其中&到Xm表示从特征提取表达式1到m得到的特征量,h到K表示
线性组合系数,并且b。表示截距。
在表达式(l)中,对于每个未被使用的特征提取表达式的特征量,线性 组合系数的值为零。
可以使用最小平方法来确定线性组合系数lh到bm以及截距b。。也就 是说,当以Uk表示数据A到Dn的标注数据(标注数据从特征量计算部件
33提供)的第K个标注数据(真值),并且以Uk'表示M达式(l)获得的真值 Uk的估计值时,估计误差ek可以因此由下式给出ek={Uk- Uk'}。确定使 关于数据A到Dn的每个标注数据的估计误差ek的均方误差"E = Z ek2" 变为最小的线性组合系数lh到bm以及截距b。,使得有可能确定最佳线性 组合系数到bm以及最佳截距bo 。
例如,所确定的异常声音辨别表达式U由下式给出
U = 0.5xXi + 0.3xX2 + 0.0xX3 +, " +0.7Xm + 0.2。在该异常声音辨别表达式U的示例中,线性组合系数lh、 b2、 b3.....
和bm分别为0.5、 0.3、 0.0.....和0.7,截距b。为0.2,并且从线性组合
系数为0的特征提取表达式3得到的特征量未被使用。
接下来,机器学习部件34计算关于m个特征提^达式的使用组合 中的每个而生成的异常声音辨别表达式U的评估值。在下文中,异常声音 辨别表达式U的评估值被称为"评估参考值",以便与每个特征提取表达 式的评估值相区别。
例如,AIC(Akaike信息标准)可以用作用于确定评估参考值的评估函 数。AIC是表示值越小越好(即,具有更高的评估)的函数,并且由下式给 出
AIC = nx(iog(2xPI)+l+l0g(||E||2+n))
+2x(m, + l) …(2)
其中n表示教师数据的条数,即从学习数据剪截部件31提供的数据的条 数,并且PI表示圆周率。"||E||2+n"表示针对每条数据Di到Dn的均方差 并且m'表示所使用的特征提取表达式的数目。
图24示出关于图23B所示的m个特征提M达式的使用组合而生成 的各个异常声音辨别表达式U的评估参考值。
机器学习部件34选择具有最高评估的特征提取表达式的使用组合(其 具有最小评估参考值),作为下一参考状态。在图24所示的示例中,对于 仅仅使用特征提取表达式4的使用组合,异常声音辨别表达式U的评估参 考值为最小。因此,如图25所示,机器学习部件34选择仅仅使用特征提 取表达式4的使用组合,作为下一参考状态。
关于仅仅使用特征提取表达式4的使用组合(图26A所示的参考状 态),机器学习部件34确定m个特征提取表达式的使用组合,如图26B 所示地顺序地反转每个特征提取表达式的使用/不使用。
机器学习部件34重复处理,其中该处理用于通过针对所确定的m个 特征提取表达式的使用组合而生成(估计)异常声音辨别表达式U并且计算 异常声音辨别表达式U的评估参考值来确定下一参考状态。重复上述参考 状态的确定、异常声音辨别表达式U的生成、及其评估参考值的计算,直 至评估参考值不再被更新,也就是说,直至没有更小的评估参考值被计算 出。当获得评估参考值不再被更新的异常声音辨别表达式u时,机器学习
部件34基于所获得的异常声音辨别表达式U的线性组合系数,确定特征 提取表达式1到m的评估值。
具体地说,机器学习部件34计算第i个特征量的贡献率Ci,作为特 征提取表达式i的评估值,如由下式给出
Cj = bj + StDev(Xj) x StDev(T) x Correl(Xj,T) (3)
其中StDev(Xi)表示数据Di到Dn的特征提取表达式i的值(特征量XO的标 准偏差,并且StDev(T)表示数据Di到数据Dn的标注数据T的标准偏差。 Correl(T)表示数据Di到Dn的特征提:^达式i的值(特征量X;)与其标注 数据T之间的Pearson相关系数。
将如上所述计算出的特征4^取表达式1到m的评估值与所生成的异 常声音辨别表达式U —起提供到特征提^达式列表生成部件32。
当满;t预定完成条件时,例如,当用于生成下一代特征提M达式的
处理被执行预定次数时,机器学习部件34将最后代特征提取表达式和异 常声音辨别表达式U提供到特征量提取算法输出部件35。最后代特征提 取表达式从特征提取表达式列表生成部件32或特征量计算部件33获得。
特征量提取算法输出部件35将从机器学习部件34提供的最后代特征 提取表达式和异常声音辨别表达式U提供到折衷分析部件14(图1所示)。
接下来,将描述折衷分析部件14的详细处理。
通过使用由自动算法配置部件13配置的算法(异常声音辨别表达式 U)作为第一帕累托最优解,折衷分析部件14通过使用两个评估指标,即 算法执行速度和准确度执行折衷分析来确定新的帕累托最优解。对于用于 确定新的帕累托最优解的帕累托最优解搜索,折衷分析部件14采用简单 的基因算法,其中该算法用于仅仅通it^作为当前帕累托最优解的特征量 提取算法的变异来生成下一个候选帕累托最优解。
现在将参考图27描述帕累托最优解。
为了通过4吏用两个评估指标来评估算法,当不存在具有所有评估指标 上的高评估的另一解时,当前考虑的解可以被认为是帕累托最优解。相反, 当存在具有所有评估指标上的高评估的另一解时,当前考虑的解不是帕累 托最优解。在图27中,黑圆表示帕累托最优解而白圆表示非帕累托最优 解。为了确定作为帕累托最优解的异常声音辨别表达式U,如图27所示, 折衷分析部件14首先初始化帕累托最优解。也就是说,折衷分析部件14 以特征提取表达式的标注数据相关性(上面提及的Correl(T))的升序,逐一 顺序地设置包括在由自动算法配置部件13配置的异常声音辨别表达式U 中的特征提M达式,使得该特征提取表达式不被使用。通过这么做,折 衷分析部件14生成多个异常声音辨别表达式U,其中所使用的特征提取 表达式的数目相差一个。在这种情况下,特征提取表达式的最大数目是包 括在由自动算法配置部件13配置的异常声音辨别表达式U中的特征提取 表达式的数目,并且特征提取表达式的最小数目是一。
基于由自动算法配置部件13配置的异常声音辨别表达式U而生成异 常声音辨别表达式U被称为帕累托最优解初始化,其中每个异常声音辨别 表达式U要使用不同数目的特征提取表达式。由于从自动算法配置部件 13提供的异常声音辨别表达式U不必使用所有特征提^达式,因此包 括在由自动算法配置部件13配置的异常声音辨别表达式U中的特征提取 表达式的数目可以小于m。然而,在本实施例中,为了筒化描述,将假定 从自动算法配置部件13提供的异常声音辨别表达式U使用所有特征提取 表达式来给出描述。
将参考图28到31进一步描述帕累托最优解的初始化。
如图28所示,折衷分析部件14创建列表,其包括为计算各个特征提 取表达式所花费的平均时间(平均计算时间)、以及使用各个特征提取表达 式计算出的标注数据相关系数。平均计算时间可以通过计算输入数据" 到Dn来确定,并Jbt目关系数可以由表达式(3)中的Correl(T)来确定。
接下来,折衷分析部件14设置在被使用的特征提取表达式当中具有 最小相关系数的特征提取表达式,使得该特征提取表达式不被使用,并且 仅仅使用利用其余特征提取表达式提取的特征量来确定线性组合系数bi 到bm以及截距b。,并且确定新的异常声音辨别表达式U。折衷分析部件 14还计算在新确定的异常声音辨别表达式U被用来执行异常声音辨别时 所花费的时间(总的计算时间)以及所获得的准确度(所估计的准确度)。
在图28所示的数据示例中,特征提取表达式3的相关系U 0.05, 其是最低的,因此特征提取表达式3被设置成不被使用,如图29所示。 其后,确定在使用除特征提M达式3之外的特征提M达式1到m时 的新的异常声音辨别表达式U及其准确度,并且计算把为特征提M达式 3所花费的计算时间(0.11ms)排除在外的总计算时间类似地,以相关系数的升序逐一顺序地设置特征提取表达式,使得该特征提M达式不被使用,确定新的异常声音辨别表达式u,并且计算总计算时间和准确度。然后,创建图30所示的候选帕累托最优解列表。折衷分析部件14仅M图30所示的候选帕累托最优解列表提取帕累 托最优解(即,删除非帕累托最优解)。更具体地说,在包括使用m个特征 ^1^达式的解1到仅仅使用一个特征提^达式的解m(每个解是候选 帕累托最优解)的异常声音辨别表达式U当中,删除作为非帕累托最优解 的解3到5并且将其余解用作帕累托最优解,其中解3到5中的每个具有 准确度更高和总计算时间更短的另一解。一般而言,当特征4^队良达式的数目减小时,虽然总的计算时间量变 少,但是准确度往往降低。因此,由帕累托最优解初始化生成的异常声音 辨别表达式U的总计算时间和准确度可以被绘制到如图31所示的图表上。 图31的图表上的水平轴表示总计算时间(ms),而垂直轴表示F值的准确 度(FMs:F量度)。作为上述帕累托最优解初始化的结果,确定了初始状态中的帕累托最 优解。接下来,折衷分析部件14引起初始状态中的帕累托最优解的变异, 以生成新的解,从而执行帕累托最优解的更新,以便搜索更好的帕累托最 优解。当帕累托最优解被更新为更好的帕累托最优解时,连接帕累托最优 解的线如图31的箭头所示沿左上方向移位。更具体地说,折衷分析部件14随机地选择初始状态中的帕累托最优 解中的一个,并且生成新解,其中随机地改变所选解中的特征提取表达式 (例如, 一到三)的使用或不使用。图32示出变异的示例,其中所选解中的特征提:^达式7从"使用" 变为"不使用,,并且特征提^达式8从"不使用"变为"使用",从而 生成新解。然后,折衷分析部件14计算关于新解的总计算时间和准确度,重新 创建图30所示的列表,并且删除非帕累托最优解。折衷分析部件14执行如下处理直至满足完成条件,例如,直至处理 被重复预定次数,其中该处理用于通过随机地重新选择其余帕累托解中的 一个并且基于所选解的变异生成新的解来搜索更好的帕累托最优解。图33示出在从初始状态中的帕累托最优解重复200次用于搜索帕累托最优解的处理之后获得的帕累托最优解。在图33中,连接黑圆的实线表示在处理被重复执行200次之后获得 的帕累托最优解,并且虚线表示初始状态中的帕累托最优解。白圓(O)表 示由帕累托最优解搜索处理计算出的非帕累托最优解。类似地,图34示出在帕累托最优解搜索处理被重复执行1000次之后 的帕累托最优解,并且图35示出在搜索处理被重复执行5000次之后的帕 累托最优解。搜索处理被重复的次M大,可以获得的帕累托最优解就越 好。然而,不能识别在执行1000次处理的情况与执行5000次处理的情况 之间的明显差别,因此可以理解成可以通过执行预定次数的处理来获得令 人满意的帕累托最优解。接下来,将给出关于使用算法确定部件16和自动异常声音辨别部件 18的处理的描述。如上所述,基于所要求的处理时间和准确度,使用算法确定部件16 从由折衷分析部件14确定的且存储在帕累托最优解存储部件15中的用作 帕累托最优解的算法(异常声音辨别表达式U)之中确定最佳算法。然后, 使用算法确定部件16将所确定的最佳算法提供到自动异常声音辨别部件 18。例如,如图36所示,当存在足够资源并且存在即使增加处理时间量 也要最高性能(最高准确度)的要求时,使用算法确定部件16确定具有最高 准确度的帕累托最优解51的算法(异常声音辨别表达式U),并且将所确定 的算法提供到自动异常声音辨别部件18。例如,当要求准确度为0.76(FMs)或更多时,使用算法确定部件16确 定在满足该要求的同时具有最短的总计算时间(处理时间)的帕累托最优解 52的算法(异常声音辨别表达式U),并且将所确定的算法提供到自动异常 声音辨别部件18。另外,当要求每条数据的处理时间为2 ms或更少作为总计算时间(处 理时间)时,使用算法确定部件16确定帕累托最优解53的算法(异常声音 辨别表达式U),并且将所确定的算法提供到自动异常声音辨别部件18。如图37所示,自动异常声音辨别部件18将从新信号输入部件17提 供的新信号分成单位时间的信号,这与学习数据剪截部件31中的单位时 间的信号相类似。然后,自动异常声音辨别部件18通过使用从使用算法 确定部件16提供的算法来辨别每个经划分的每单位时间的新信号是异常声音还是正常声音,并且将辨别结果提供到异常声音辨别结果输出部件19。如上所述,每个单位时间的新信号的辨别结果也被提供到样本信号存 储部件12以便存储。接下来,将参考图38所示的流程图来描述由自动算法配置部件13执 行的自动算法配置处理。首先,在步骤S1中,学习数据剪截部件31剪截存储在样本信号存储 部件12中的学习数据,并且将该学习数据提供到特征量计算部件33和机 器学习部件34。更具体地说,学习数据剪截部件31从学习数据剪截出数据Di到Dn,并且将数据Di到Dn提供到特征量计算部件33,并且将数据A到Dn的标注数据提供到机器学习部件34。在步骤S2中,基于当前代特征提取表达式1到m的评估值(评估值 a器学习部件34提供),特征4C取表达式列表生成部件32执行用于生 成下一代特征提M达式1到m(特征提取表达式列表)的特征提:^达式 列表生成处理。重复地执行步骤S2中的处理。当第一次执行步骤S2中的 处理时,不存在当前代特征提取表达式l到m,因此通过随机生成来生成 下一代特征提取表达式1到m。下面参考图39来描述特征提取表达式列 表生成处理的细节。在步骤S3中,特征量计算部件33执行特征量计算处理。也就是说, 关于从学习数据剪截部件31提供的各个数据"到Dn,特征量计算部件 33根据从特征提取表达式列表生成部件32提供的特征提取表达式1到m执行计算,并且将计算结果,即数据Di到Dn的特征量提供到机器学习部件34。下面参考图46来描述特征量计算处理的细节。在步骤S4中,机器学习部件34执行机器学习处理。也就是说,通过 使用数据A到Dn的特征量,(该特征量从特征量计算部件33提供),机器 学习部件34估计异常声音辨别表达式U,其中异常声音辨别表达式U使 用特征提取表达式并且与从学习数据剪截部件31提供的数据A到Dn的 标注数据匹配最佳。机器学习部件34确定在使用所估计的异常声音辨别 表达式U时的各个特征提取表达式的评估值,并且将所确定的评估值提供 到特征提取表达式列表生成部件32。下面参考图47来描i^L器学习处理 的细节。在步骤S5中,机器学习部件34确定是否满足完成条件。更具体地说, 例如,当步骤S2到S4中的处理被重复执,定次数时或者当检测到用于停止的操作时,机器学习部件34确定满足完成条件。当在步骤S5中确定不满足完成条件时,处理返回到步骤S2并且重复 其后的处理。另一方面,当在步骤S5中确定满足完成条件时,处理进入步骤S6。 在步骤S6中,机器学习部件34将最后代特征提取表达式和异常声音辨别 表达式U提供到特征量提取算法输出部件35。然后,特征量提取算法输 出部件35将最后代特征提取表达式和异常声音辨别表达式U输出到折衷 分析部件14,从而结束处理。接下来,将参考图39所示的流程图来描述在图38所示的步骤S2中 执行的特征提取表达式列表生成处理。在步骤S21中,特征提M达式列表生成部件32确定要被生成的特 征提取表达式列表是否是第二代或更后。当在步骤S21中确定要被生成的特征提取表达式列表不是第二代或 更后时,也就是说,是第一代时,处理进入步骤S22。在步骤S22中,特 征提取表达式列表生成部件32执行随机生成处理,下面参考图40对其进 行描述。当在步骤S21中确定特征提取表达式列表是第二代或更后时,处理进 入步骤S23。在步骤S23中,特征^:取表达式列表生成部件32执行下一 代列表生成处理,下面参考图41对其进行描述。在完成步骤S22或S23中的处理之后,处理进入步骤S24,其中特征 提取表达式列表生成部件32将由步骤S22或S23中的处理生成的特征提 取表达式列表提供到特征量计算部件33。然后,处理返回到图38所示的 步骤S2并且ii^步骤S3。如上所述,对于第一代,随机地生成所有特征提M达式,并且对于 第二代或更后,使用基因搜索技术来执行下一代列表生成处理。接下来,将参考图40所示的流程图来描述在图39所示的步骤S22中 执行的随机生成处理。在步骤S41中,特征提取表达式列表生成部件32将表达式循环M M初始化为l,并且开始表达式循环。该表达式循环被重复与包括在特征 提取表达式列表中的特征提取表达式的数目"m"相对应的次数。在步骤S42中,特征提取表达式列表生成部件32确定第M个特征提取表达式(在下文中,也被称为"特征提取表达式[M")的输入信号的类型。 在本实施例中,确定输入信号的类型为表示波形的"wav"。在步骤S43中,特征提取表达式列表生成部件32为要被生成的特征 提M达式[M随机地确定处理目标轴和一个操作符。在步骤S44中,特征提取表达式列表生成部件32确定直到当前时间 点已经生成的特征提取表达式[M的计算结果是否为标量(第一阶值)。当在 步骤S44中确定计算结果不是标量,则处理返回到步骤S43并且重复其后 的处理,以便添加一个操作符。当在步骤S44中确定计算结果为标量时,处理进入步骤S45,其中特 征提取表达式列表生成部件32确定表达式循环M M是否小于最大值 m。当在步骤S45中确定表达式循环参数M小于最大值m时,表达式循 环参数M按1递增。然后,处理返回到步骤S42并且重复其后的处理。另一方面,当在步骤S45中确定表达式循环参数M不小于最大值 m(即,等于最大值m)时,退出表达式循环。然后,处理返回到图39中的 步骤S22并且进入步骤S24。作为上述处理的结果,生成了第一代的特征提取表达式列表。接下来,将参考图41所示的流程图来描述在图39所示的步骤S23中 执行的下一代列表生成处理。在步骤S61中,特征提取表达式列表生成部件32确定使得满足ms + mx + mm + mr = m(特征提:^达式的总数)的值,其中ms表示由选择生 成处理生成的特征提取表达式的数目(选择的数目),mx表示由交叉生成处 理生成的特征4I:^^达式的数目(交叉的数目),mm表示由变异生成处理 生成的特征提取表达式的数目(变异的数目),并且mr表示由随机生成处 理生成的特征提取表达式的数目(随机生成的数目)。值的比率可以被预先确定或者该值可以被随机地确定,使得满足ms + mx + mm + mr = m。在步骤S62中,特征提^达式列表生成部件32执行选择生成处理, 下面参考图42对其进行描述。在步骤S63中,特征提取表达式列表生成部件32执行交叉生成处理, 下面参考图43对其进行描述。在步骤S64中,特征提取表达式列表生成部件32执行变异生成处理,下面参考图44对其进行描述。
在步骤S65中,特征提^达式列表生成部件32执行随机生成处理,下面参考图45对其进行描述。在完成随机生成处理之后,处理返回到图39中的步骤S23并且进入步骤S24。
作为上述处理的结果,基于基因搜索技术生成了第二代或更后的特征提取表达式列表。
接下来,将参考图42所示的流程图来描述在图41所示的步骤S62中执行的选择生成处理。
在步骤S91中,特征提^达式列表生成部件32以评估值的降序对当前代特征提取表达式进行排序。
在步骤S92中,特征提取表达式列表生成部件32使用最上面的ms个特征提取表达式作为下一代特征提取表达式。然后,处理返回到图41中的步骤S62并且ii^步骤S63。
作为该处理的结果,具有较高评估值的特征提取表达式可以被选择并且可以被拷贝到下一代特征提M达式列表。
接下来,将参考图43所示的流程图来描述在图41所示的步骤S63中执行的交叉生成处理。
在步骤S121中,特征"R^达式列表生成部件32将交叉循环参数MX初始化为1并且开始交叉循环。交叉循环被重复与交叉数"mx"相对应的次数。
在步骤S122中,特征提取表达式列表生成部件32从包括在当前代特征提取表达式列表内的所有特征提取表达式中随机地选择一个表达式(被称为"表达式A"),同时分配权重以便有助于选择具有更高评估值的特征
提:^达式。
在步骤S123中,特征提取表达式列表生成部件32从包括在当前代特征提取表达式列表内的所有特征提取表达式中随机地选择一个表达式(被称为"表达式B"),同时分配权重以便有助于选择具有更高评估值的特征提取表达式。
在步骤S124中,特征提取表达式列表生成部件32确定表达式B是否不同于表达式A。当在步骤S124中确定表达式B与表达式A相同时,处理返回到步骤S123并且重复其后的处理,以便重新选择表达式B,直至确定表达式B不同于表达式A。
当在步骤S124中确定表达式B不同于表达式A时,处理进入步骤S125,其中特征提取表达式列表生成部件32交换表达式A和B的部分,从而创建新的特征提^达式。
在这种情况下,特征4^取表达式列表生成部件32组合表达式A和B的部分,使得可以通过计算组合之后的特征提取表达式来从输入数据获得标量,也就是说,使得当从开始顺序地执行计算处理时,在处理轴中不发生矛盾。
在步骤S126中,特征提取表达式列表生成部件32将在步驟S125中生成的新的特征提取表达式加到下一代特征4^取表达式。
在步骤S127中,特征提取表达式列表生成部件32确定交叉循环^ltMX是否小于交叉数"mx", "mx,,为交叉循环^lt MX的最大值。当在步骤S127中确定交叉循环^ltMX小于交叉数"mx"时,交叉循环^MX按1递增。然后,处理返回到步骤S122并且重复其后的处理。另一方面,当在步骤S127中确定交叉循环^MX不小于交叉数"mx",即等于交叉数"mx"时,退出交叉循环。于是,处理返回到图41中的步骤S63并且iS^v步骤S64。
形成交叉循环的步骤S122到S126中的处理每被执行一次,就生成要包括在下一代特征提取表达式列表内的特征提取表达式中的一个特征提取表达式。当完成交叉循环时,生成了包括在特征提取表达式列表中的特征4I^取表达式的mx个特征^^J^达式.
在这种处理中,选择当前代特征提取表达式列表中的特征提取表达式,同时分配权重以便有助于选择具有更高评估值的特征提取表达式,并且所选特征提:^达式被用来执行交叉生成处理,以生成包括在下一代特征提取表达式列表中的特征提取表达式。
接下来,将参考图44所示的流程图来描述在图41所示的步骤S64中执行的变异生成处理。
在步骤S151中,特征提取表达式列表生成部件32将变异循环MMM初始化为1并且开始变异循环。变异循环被重复与变异数"mm"相对应的次数。
在步骤S152中,特征提取表达式列表生成部件32从包括在当前代特征提取表达式列表内的所有特征提取表达式中随机地选择一个表达式(被称为"表达式A"),同时分配权重以便有助于选择具有更高评估值的特征提M达式。
在步骤S153中,特征提M达式列表生成部件32通过执行例如改变或删除所选表达式A的一部分或者改变其中的M的处理来引起变异,从而创建新的特征提取表达式。
在这种情况下,通过使用使得可以通过计算改变表达式的一部分之后的特征提取表达式来从输入数据获得标量的方法,也就是说,通过使用使得当从开始顺序地执行计算处理时在处理轴中不发生矛盾的方法,特征提取表达式列表生成部件32改变表达式的一部分。
在步骤S154中,特征提取表达式列表生成部件32将在步骤S153中生成的新的特征提取表达式加到下一代特征提M达式。
在步骤S155中,特征提取表达式列表生成部件32确定变异循环^MM是否小于变异数"mm", "mm"为变异循环^ltMM的最大值。当在步骤S155中确定变异循环参数MM小于变异数"mm"时,变异循环参数MM按1递增。然后,处理返回到步骤S152并且重复其后的处理。另一方面,当在步骤S155中确定变异循环^ltMM不小于变异数"mm",即等于变异数"mm"时,退出变异循环。于是,处理返回到图41中的步骤S64并且ii^步骤S65。
形成变异循环的步骤S152到S154中的处理每被执行一次,就生成要包括在下一代特征提^达式列表内的一个特征提取表达式。当完成变异循环时,生成了包括在特征提取表达式列表中的特征提取表达式的mm个特征4C取表达式。
在这种处理中,从当前代特征提取表达式列表中选择当前代特征提取表达式列表中的特征提取表达式,同时分配权重以便有助于选择具有更高评估值的特征4^取表达式,并且所选特征4I:取表达式被用来执行变异生成处理,以生成要包括在下一代特征提取表达式列表中的特征提取表达式。
接下来,将参考图45所示的流程图来描述在图41所示的步骤S65中执行的随机生成处理。
在步骤S181中,特征提取表达式列表生成部件32将随机生成循环参数MR初始化为1并且开始随机生成循环。随机生成循环被重复与包括在特征提取表达式列表中的特征提取表达式数"mr"相对应的次数。
在步骤S182中,特征提取表达式列表生成部件32确定第MR个特征提取表达式(在下文中,也被称为"特征提取表达式[MR")的输入信号的类型。在本实施例中,确定输入信号的类型为表示波形的"wav"。
在步骤S183中,特征提取表达式列表生成部件32为要被生成的特征提M达式[MR随机地确定处理目标轴和一个^Mt符。
在步骤S184中,特征提取表达式列表生成部件32确定直到当前时间点已经生成的特征提^达式MR的计算结果是否为标量(第一阶值)。当在步骤S184中确定计算结果不是标量时,处理返回到步骤S183并且重复其后的处理,以便添加一个操作符。
当在步骤S184中确定计算结果是标量时,处理进入步骤S185,其中特征提M达式列表生成部件32确定随机生成循环^ MR是否小于最大值mr。当在步骤S185中确定随机生成循环^MR小于最大值mr时,随机生成循环MMR按1递增。然后,处理返回到步骤S182并且重复其后的处理。另一方面,当在步骤S185中确定随机生成循环参数MR不小于最大值mr(即,等于最大值mr)时,退出随机生成循环。然后,处理返回到图41中的步骤S65,进一步返回到图39中的步骤S23并且i^步骤S24。
形成随机生成循环的步骤S182到S185中的处理每被执行一次,就生成要包括在下一代特征提M达式列表内的一个特征提取表达式。当完成随机生成循环时,生成了包括在特征提^达式列表中的特征提取表达式的mr个特征^^^4达式。
在这种处理中,通过随机生成处理来生成要包括在下一代特征提取表达式列表内的特征提M达式中的一些表达式。
接下来,将参考图46所示的流程图来描述在图38所示的步骤S3中执行的特征量计算处理。
在步骤S2U中,特征量计算部件33从特征提取表达式列表生成部件32获得特征提取表达式列表,将表达式循环参数M初始化为1,并且开始表达式循环。表达式循环被重复与包括在特征提取表达式列表中的特征提取表达式数"m"相对应的次数。
在步骤S212中,特征量计算部件33将数据循环^lt N初始化为1并且开始数据循环。数据循环被重复与由学习数据剪截部件31剪截出的数据D的条数"n"相对应的次数。 在步骤S213中,关于数据DN,特征量计算部件33计算在使用第M个特征提取表达式(特征提^达式[M)时的特征量。
在步骤S214中,特征量计算部件33确定数据循环M N是否小于最大值n。当在步骤S214中确定数据循环参数N小于最大值n时,数据循环^ltN按l递增。然后,处理返回到步骤S213并且重复其后的处理。
另一方面,当在步骤S214中确定数据循环参数N不小于最大值n(即,等于最大值n)时,退出数据循环并且处理ii^步骤S215。
在步骤S215中,特征量计算部件33确定表达式循环参数M是否小于最大值m。当在步骤S215中确定表达式循环^M小于最大值m时,表达式循环参数M按1递增。然后,处理返回到步骤S212并且重复其后的处理。另一方面,当在步骤S215中确定表达式循环参数M不小于最大值m(即,等于最大值m)时,退出表达式循环。然后,处理返回到图38中的步骤S3并且进入步骤S4。
作为上述处理的结果,计算出使用每个特征提取表达式提取的特征量。
接下来,将参考图47所示的流程图来描述在图38所示的步骤S4中执行的机器学习处理。
在步骤S241中,机器学习部件34创建当前代特征^C取表达式1到m的参考状态。也就是说,机器学习部件34将所有当前代特征提取表达式1到mi殳成不被4吏用。
在步骤S242中,机器学习部件34将特征量循环参数M初始化为1并且开始特征量循环。特征量循环被重复与包括在特征提取表达式列表中的特征4CM达式数"m"相对应的次数。
在步骤S243中,基于参考状态中的特征提取表达式1到m,机器学习部件34确定特征提取表达式的使用组合,其中反转从第M个特征提取表达式得到的特征量的使用/不使用(在下文中,该使用组合可以被称为特征提取表达式的使用组合[M)。
在步骤S244中,机器学习部件34针对经反转的特征提取表达式的使用组合[M生成(估计)异常声音辨别表达式U。
在步骤S245中,机器学习部件34计算所生成的异常声音辨别表达式U的评估参考值(AIC)。
在步骤S246中,机器学习部件34确定特征量循环参数M是否小于最大值m。当在步骤S246中确定特征量循环参数M小于最大值m时, 特征量循环MM按1递增。然后,处理返回到步骤S243并且重复其后 的处理。另一方面,当在步骤S246中确定特征量循环参数M不小于最大 值m(即,等于最大值m)时,退出特征量循环并且处理进入步骤S247。
在步骤S247中,机器学习部件34选择具有最高评估(即,具有最小 评估参考值)的经反转特征提取表达式的使用组合作为新的参考状态。
在步骤S248中,机器学习部件34确定是否所生成的异常声音辨别表 达式U的评估参考值不再被更新。当在步骤S248中确定评估参考值仍然 被更新时,处理返回到步骤S242并且重复其后的处理。
另一方面,当在步骤S248中确定评估参考值不再被更新时,处理返 回到图38所示的步骤S4并且进入步骤S5。
现在将参考图48所示的流程图来描述由折衷分析部件14执行的折衷 分析处理。
在步骤S271中,折衷分析部件14执行帕累托最优解初始化处理,下 面参考图49对其进行描述。在初始化处理中,生成多个初始状态中的帕 累托最优解。
在步骤S272中,折衷分析部件14随机地选择初始状态中的帕累托最 优解中的一个并且通过所选解的变异来生成新的解。例如,关于所选解中 的一至三的特征提取表达式,折衷分析部件14生成随机改变使用/不使用
的新解。
在步骤S273中,折衷分析部件14计算在使用新解时的总计算时间和 准确度。
其后,在步骤S274到S277中,折衷分析部件14更新帕累托最优解。 也就是说,在步骤S274中,折衷分析部件14将新解加到帕累托最优解, 将解循环参数K初始化为1,并且开始解循环。解循环被重复与当前* 的帕累托最优解的总数"k"相对应的次数。
在步骤S275中,折衷分析部件14确定是否存在具有比第K个帕累 托最优解(在下文中,也被称为"帕累托最优解[K1")更高的速度和更高的 准确度的解。当在步骤S275中确定存在具有比帕累托最优解[K1更高的速 度和更高的准确度的解时,处理进入步骤S276。在步驟S276中,折衷分 析部件14从帕累托最优解中删除帕累托最优解[K。当在步骤S275中确定不存在具有比帕累托最优解[K]更高的速度和更 高的准确度的解时,处理i^步骤S277。在步骤S277中,折衷分析部件 14确定解循环参数K是否小于最大值k。当在步骤S277中确定解循环参 数K小于最大值k时,解循环^K按1递增。然后,处理返回到步骤 S275并且重复其后的处理。
另一方面,当确定解循环^K不小于最大值k(即,等于最大值k) 时,退出解循环并且处理ii^步骤S278。
在步骤S278中,折衷分析部件14确定通过执行经由从帕累托最优解 的变异来生成新解的处理来搜索帕累托最优解是否已被重复预定次数。当 在步骤S278中确定搜索帕累托最优解的处理尚未被重复预定次数时,处 理返回到步骤S272并且重复其后的处理。
另一方面,当在步骤S278中确定搜索帕累托最优解的处理已被重复 预定次数时,处理结束。
接下来,将参考图49所示的流程图来描述在图48所示的步骤S271 中执行的帕累托最优解初始化处理。
在步骤S301中,折衷分析部件14将特征量循环参数M初始化为1, 并且开始特征量循环。特征量循环被重复与包括在特征提取表达式列表中 的特征4C取表达式数"m"相对应的次数。
在步骤S302中,折衷分析部件14计算为计算第M个特征提取表达 式(在下文中,可以被称为"特征提取表达式[M")所花费的平均时间(平 均计算时间)以及标注数据相关系数。
在步骤S303中,折衷分析部件14确定特征量循环参数M是否小于 最大值m。当在步骤S303中确定特征量循环参数M小于最大值m时, 特征量循环参数M按1递增。然后,处理返回到步骤S302并且重复其后 的处理。另一方面,当在步骤S303中确定特征量循环参数M不小于最大 值m(即,等于最大值m)时,退出特征量循环并且处理i^步骤S304。
在步骤S304中,在使用中的特征提取表达式当中,折衷分析部件14 设置具有最小相关系数的特征提取表达式,使得其不被使用。
在步骤S305中,折衷分析部件14仅仅使用通过除了被设置为不被使 用的特征提取表达式之外的其余特征提取表达式提取的特征量来执行线 性辨别,并且确定新的异常声音辨别表达式U。在步骤S305中,折衷分 析部件14还计算在所确定的新异常声音辨别表达式U被用来执行异常声音辨别时的准确度。
在步骤S306中,折衷分析部件14计算在所确定的新异常声音辨别表 达式U被用来执行异常声音辨别时所花费的时间(总计算时间),并且将所 确定的总计算时间加到候选帕累托最优解列表中。
在步骤S307中,折衷分析部件14确定其余特征提取表达式的数目是 否为一。当在步骤S307中确定其余特征^取表达式的数目不为一时,处 理返回到步骤S304并且重复其后的处理。
另一方面,当确定其余特征提取表达式的数目为一时,处理进入步骤 S308,其中折衷分析部件14执行用于更新帕累托最优解的处理。该帕累 托最优解的更新处理与上面描iOL在图48中示出的步骤S274到S277的 处理相类似,因此在下文中不给出其描述。在步骤S308之后,处理返回 到图48中的步骤S271并且i^步骤S272。
如上所述,在帕累托最优解被初始化之后,搜索更多适当的帕累托最 优解,以便执行更新。
基于诸如信息处理设备1的当前可用资源状态和所要求性能的信息, 使用算法确定部件16从作为由上述折衷分析处理确定且存储在帕累托最 优解存储部件15中的帕累托最优解的算法(异常声音辨别表达式U)中确定 最佳算法。然后,使用算法确定部件16将所确定的最佳算法提供到自动 异常声音辨别部件18。基于从使用算法确定部件16提供的算法,自动异 常声音辨别部件18辨别所输入的新信号是具有异常声音还是具有正常声 音。
因此,信息处理设备1可以提出多个具有评估指标间的折衷关系的算 法,其中评估指标例如为可用资源状态(处理速度)和所要求的性能(准确 度)。根据当前的情形,信息处理设备1还可以确定多个具有评估指标间 的折衷关系的算法中的最优算法,并且可以使用所确定的算法来执行辨 别。
现在将描述使用上述帕累托最优解的概念的其他实施例。
图50是示出根据本发明另一实施例的自动算法配置系统101的框图。 与上述实施例中的部件相对应的部件以相同的标号来表示,并且不给出其
描述o
自动算法配置系统101包括教师数据获得部件131、特征提M达 式列表生成部件32、特征量计算部件132、评估值计算部件133和算法输出部件134。
教师数据获得部件131获得作为教师数据输入的波形信号(波形数 据)、以及要从该数据提取的目标变量的值,将波形信号提供到特征量计 算部件132,并且还将波形信号的目标变量的值提供到评估值计算部件 133。
例如,如图51所示,教师数据获得部件131获得1条波形数据 到DD,及其目标变量的值作为教师数据,并且将波形数据块DR到DD,以 及目标变量的值分别提供到特征量计算部件132和评估值计算部件133。
特征量计算部件132对从教师数据获得部件131提供的波形数据 到DD,执行从特征提取表达式列表生成部件32提供的特征提取表达式1 到m的计算。然后,特征量计算部件132将计算结果即波形数据D^到 DD,的特征量提供到评估值计算部件133。
特征量计算部件132计算为计算每个特征提M达式所花费的平均时 间,并且将所计算的平均时间提供到评估值计算部件133。
图52示出由特征量计算部件132计算出的且被提供到评估值计算部 件133的特征量和平均时间的示例。
评估值计算部件133生成候选解,即候选帕累托最优解。
首先,评估值计算部件133随机地确定是否^f吏用从特征^l:取表达式 1到m得到的特征量中的每个。当已经*了一个或更多个帕累托最优解 时,评估值计算部件133可以通过从所保存的帕累托最优解中随机地选择 一个解并且(通过改变任意特征提取表达式的使用/不使用)引起所选解的 变异,确定是否要使用从特征提取表达式1到m中的每个得到的特征量。
图53A示出随机地确定特征提:^达式1到m中的每个的特征量的 4吏用/不使用的示例,并且图53B示出通过引起从帕累托最优解选择的解 的变异来确定从特征提取表达式1到m中的每个得到的特征量的使用/不 使用的示例。
接下来,评估值计算部件133基于所确定的m个特征提取表达式的 使用组合而生成(估计)信息估计表达式(其是候选解)。也就是说,如图54 所示,评估值计算部件133将波形数据到DD,的特征量与目标变 相 关联,其中该特征量和目标变量从特征量计算部件132提供,并且将关联 值分配给与表达式(l)相类似的信息估计表达式,以确定使得每个目标变量 的估计误差的均方误差变为最小的线性组合系数l^到1v以及截距b。。关于速度和亮度的目标变量两者来创建信息估计表达式。
其后,使用表达式(2),评估值计算部件133为每个目标变量计算用于 评估所生成的信息估计表达式的评估参考值(数量参考)。
评估值计算部件133还计算在所生成的信息估计表达式被用来计算目 标变量时所花费的总计算时间。更具体地i兌,如图55所示,在为计算特 征提取表达式所花费的平均时间(该平均时间从特征量计算部件132提供)
生成的信息估计表达式的总计算时间。在图55所示的示例中,由于特征 提M达式3未被使用,因此特征"R:^达式3的平均时间(0.31118)不包括 在总计算时间内。
图56示出通过对作为候选解的信息估计表达式执行计算而获得的速 度评估参考值、亮度评估参考值、以及总计算时间。
接下来,评估值计算部件133将候选解的速度评估参考值、亮度评估 参考值和总计算时间,与当前M的帕累托最优解的速度评估参考值、亮 度评估参考值和总计算时间相比较,并且删除非帕累托最优解。
图57示出候选解与当前M的p个帕累托最优解相比较的示例。
在图57所示的示例中,在速度评估参考值、亮度评估参考值和总计 算时间的所有评估指标上,帕累托最优解3劣于候选解,因此将其作为非 帕累托最优解从帕累托最优解中删除。
对于每个帕累托最优解或候选解,评估值计算部件133保存表示每个 特征提M达式的使用/不使用的信息、每个目标变量(信息类型)的信息估 计表达式的^t(线性组合系数l^到、以及截距b。)、每个目标变量(信息 类型)的评估参考值、以及总计算时间。
接下来,通过使用其余的帕累托最优解,评估值计算部件133确定特
征4^M达式的评估值。确定特征提M达式的评估值的基4Ma念与上述
实施例中的相类似。在本实施例中,具体地i兌,由于存在多个目标变量(信 息类型)和多个帕累托最优解(信息估计表达式),因此评估值计算部件133 确定通过对帕累托最优解的第i个特征量关于所有目标变量(信息类型)的 贡献率Ci求和而获得的值。
也就是说,使用帕累托最优解o (o = 1到p)的特征量"Xi"关于第j 个目标变量(信息类型)Tj (j = 1到k)的贡献率C(o,Xi,Tj),在上面提及的表达式(3)中的贡献率Q可以被改写为
<formula>formula see original document page 35</formula>
特征提取表达式的评估值可以根据表达式(5)中的SUM一Ci来计算, 其中关于所有帕累托最优解的所有目标变量对贡献率C(o,Xi,Tj)进行求 和。
<formula>formula see original document page 35</formula>
评估值计算部件133计算特征提取表达式的评估值SUM一Ci (由表达 式(5)表示),并且将计算结果提供到特征提取表达式列表生成ip件32。
当通过执行用于更新帕累托最优解和计算每个特征提取表达式的评 估值的处理预定次数而达到预定条件时,评估值计算部件133将最终保留 的帕累托最优解提供到算法输出部件134。
取决于重点是放在速度和亮度的准确度上还是放在所要求的处理速 度(总计算时间)上,算法输出部件134从所提供的帕累托最优解中选择最 佳算法。然后,算法输出部件134输出所选算法。可以才艮据例如用户指示 来确定要选择哪个算法。
接下来,将参考图58所示的流程图来描述由特征提取表达式列表生 成部件32、特征量计算部件132和评估值计算部件133执行的帕累托最优 解搜索处理。
首先,在步骤S401中,基于当前代特征提取表达式1到m的评估值 (该评估值从评估值计算部件133提供),特征提取表达式列表生成部件32 执行用于生成下一代特征提取表达式1到m(特征提取表达式列表)的特征 提取表达式列表生成处理。该处理与在上述步骤S2中且在图38中示出的 处理相类似,并且由此在下文中不给出对其的详细描述。
在步骤S402中,特征量计算部件132执行特征量计算处理。也就是 说,关于从教师数据获得部件131提供的波形数据DDi到DD,,特征量计 算部件132计算从每个特征提取表达式得到的特征量、以及为计算每个特 征提M达式所花费的平均时间。下面参考图59所示的流程图来描述特 征量计算处理的细节。在步骤S403中,评估值计算部件133执行评估值计算处理。也就是 说,评估值计算部件133生成作为候选帕累托解的候选解,将候选解与当 前M的帕累托最优解相比较,执行包括删除非帕累托解的帕累托最优解 更新,并且基于其余的帕累托最优解而计算特征提取表达式的评估值。下 面参考图61所示的流程图来描述评估值计算处理的细节。
在步骤S404中,评估值计算部件133确定是否满足完成条件。更具 体地说,例如,当上述步骤S401到S403中的处理被重复执行预设次数时 或者当检测到用于停止的操作时,评估值计算部件133确定满足完成条件。
当在步骤S404中确定不满足完成条件时,处理返回到步骤S401并且 重复其后的处理。
另一方面,当在步骤S404中确定满足完成条件时,处理进入步骤 S405。在步骤S405中,评估值计算部件133将最后代特征提^达式和 信息估计表达式的帕累托最优解输出到算法输出部件134 ,从而结束处理。
例如,取决于重点是放在速度和亮度的准确度上还是放在处理速度 (总计算时间)上,算法输出部件134适当时在从评估值计算部件133提供 的帕累托最优解中选择最佳算法。然后,算法输出部件134输出所选算法。
接下来,将参考图59所示的流程图来描述在图58所示的步骤S402 中执行的特征量计算处理。
在步骤S411中,特征量计算部件132从特征4^取表达式列表生成部 件32获得特征提取表达式列表,将表达式循环^ M初始化为1并且开 始表达式循环。表达式循环被重复与包括在特征提取表达式列表中的特征 提取表达式数"m"相对应的次数。
在步骤S412中,特征量计算部件132将数据循环参数L初始化为1 并且开始数据循环。数据循环被重复与由教师数据获得部件131获得的波 形数据DD的条数"1"相对应的次数。
在步骤S413中,特征量计算部件132计算在关于波形数据DDl使用 第M个特征提M达式(特征提M达式[M)时的特征量,并且M该计 算所花费的时间。
在步骤S414中,特征量计算部件132确定数据循环参数L是否小于 最大值l。当在步骤S414中确定数据循环参数L小于最大值1时,数据循 环^L按1递增。然后,处理返回到步骤S413并且重复其后的处理。另一方面,当在步骤S414中确定数据循环^L不小于最大值1时, (即,等于最大值l),退出数据循环并且处理进入步骤S415。
在步骤S415中,特征量计算部件132计算为计算特征提取表达式[M
所花费的平均时间。也就是说,特征量计算部件132为波形数据D"到 DD,计算特征提取表达式[M的计算时间的平均时间,其中计算时间在步 骤S413中被计算和保存。
在步骤S416中,特征量计算部件132确定表达式循环参数M是否小 于最大值m。当在步骤S416中确定表达式循环^M小于最大值m时, 表达式循环参数M按1递增。然后,处理返回到步骤S412并且重复其后 的处理。另一方面,当在步骤S416中确定表达式循环参数M不小于最大 值m时,(即,等于最大值m),退出表达式循环。然后,处理返回到图 58中的步骤S402并且进入步骤S403。
接下来,将参考图60所示的流程图来描述在图58所示的步骤S403 中执行的评估值计算处理。
在步骤S431中,评估值计算部件133确定是否使用从特征提取表达 式1到m中的每个得到的特征量。评估值计算部件133可以通过改变从 所保存的帕累托最优解中随机地选择的 一个选择项的使用/不使用(通过一 个选择项的变异),确定是否使用从特征提取表达式1到m中的每个得到 的特征量。然而,当第一次执行步骤S431中的处理时,由于没有保存帕 累托最优解,因此随fe^确定特征量的使用/不使用。
在步骤S432中,评估值计算部件133将目标变量循环^lt K初始化 为1并且开始数据循环。目标变量循环^:重复与用于目标变量的信息类型 的数目"k"相对应的次数。
在步骤S433中,评估值计算部件133生成(估计)在步骤S431中确定 的m个特征提取表达式的使用组合被使用时的信息估计表达式,其作为 候选解并且用于估计与目标变量K相对应的信息量。
在步骤S434中,使用上面提及的表达式(2),评估值计算部件133计 算用于评估信息估计表达式的评估参考值,其中信息估计表达式用于估计 与目标变量K相对应的信息量。
在步骤S435中,评估值计算部件133确定目标变量循环参数K是否 小于最大值k。当在步骤S435中确定目标变量循环参数K小于最大值k 时,目标变量循环MK按1递增。然后,处理返回到步骤S433并且重复其后的处理。
另一方面,当在步骤S435中确定目标变量循环MK不小于最大值 k时,(即,等于最大值k),退出目标变量循环并且处理i^步骤S436。
在步骤S436中,基于从特征量计算部件132提供的每个特征提取表 达式的平均时间,评估值计算部件133计算在所生成的信息估计表达式被 用来计算目标变量时所花费的总计算时间。
在步骤S437到S440中,评估值计算部件133更新帕累托最优解。也 就是说,在步骤S437中,评估值计算部件133将候选解加到帕累托最优 解,将解循环参数o初始化为1,并且开始解循环。解循环被重复与当前 保存的包括候选解(一个或多个)的帕累托最优解的总数"p"相对应的次数。
在步骤S438中,评估值计算部件133确定是否存在具有比第o个帕 累托最优解(在下文中,也被称为"帕累托最优解[o")更高速度和更高准 确度的解。当在步骤S438中确定存在具有比帕累托最优解[o更高速度和 更高准确度的解时,处理进入步骤S439。在步骤S439中,评估值计算部 件133从帕累托最优解中删除帕累托最优解[o。
另一方面,当在步骤S438中确定不存在具有比帕累托最优解[o]更高 速度和更高准确度的解时,处理进入步骤S440。在步骤S440中,评估值 计算部件133确定解循环参数o是否小于最大值p。当在步骤S438中确 定解循环^o小于最大值p时,解循环^lto按l递增。然后,处理返 回到步骤S438并且重复其后的处理。
另一方面,当在步骤S438中确定解循环参数o不小于最大值p时,(即, 等于最大值p),退出解循环并且处理ii^步骤S441。
在步骤S441中,评估值计算部件133确定生成候选解并且搜索帕累 托最优解的处理是否被重复预定次数。当在步骤S441中确定搜索帕累托 最优解的处理尚未被重复预定次数时,处理返回到步骤S431并且重复其 后的处理。
另一方面,当在步骤S441中确定搜索帕累托最优解的处理已被重复 预定次数时,处理进入步骤S442。在步骤S442中,使用其余的帕累托最 优解,评估值计算部件133执行用于确定特征提取表达式的评估值的评估 值确定处理。
图61是示出在图60所示的步骤S442中的评估值确定处理的细节的 流程图。首先,在步骤S461中,评估值计算部件133将特征量循环^ i初 始化为1并且开始特征量循环。特征量循环被重复与包括在特征提M达 式列表中的特征提取表达式数"m"相对应的次数。
在步骤S462中,评估值计算部件133重置第i个特征提取表达式的 评估值SUM一Q,该评估值由上面提及的表达式(5)给出。
在步骤S463中,评估值计算部件133将解循环参数o初始化为1并 且开始解循环。解循环被重复与当前保存的帕累托最优解的总数"p"相 对应的次数。
在步骤S464中,评估值计算部件133将目标变量循环^lt j初始化 为1并且开始目标变量循环。目标变量循环被重复与用于目标变量的信息 类型的数目"k"相对应的次数。
在步骤S465中,评估值计算部件133确定帕累托最优解o的第i个 特征量"Xi"关于第j个目标变量Tj的贡献率C(o,Xi,Tj),并且将所确定 的贡献率加到评估值SUM一Ci。
在步骤S466中,评估值计算部件133确定目标变量循环M j是否 小于最大值k。当在步骤S466中确定目标变量循环M j小于最大值k 时,目标变量循环^ltj按l递增。然后,处理返回到步骤S465并且重 复其后的处理。
另一方面,当在步骤S466中确定目标变量循环参数j不小于最大值k 时,(即,等于最大值k),退出目标变量循环并且处理ii^步骤S467。
在步骤S467中,评估值计算部件133确定解循环参数o是否小于最 大值p。当在步骤S467中确定解循环参数o小于最大值p时,解循环参 数o按l递增。然后,处理返回到步骤S464并且重复其后的处理。
另一方面,当在步骤S467中确定解循环^o不小于最大值p时,(即, 等于最大值p),退出解循环并且处理ii^步骤S468。
在步骤S468中,评估值计算部件133确定特征量循环参数i是否小 于最大值m。当在步骤S468中确定特征量循环参数i小于最大值m时, 特征量循环Mi按l递增。然后,处理返回到步骤S462并且重复其后 的处理。
另一方面,当在步骤S468中确定特征量循环参数i不小于最大 m 时,(即,等于最大值m),退出特征量循环。然后,处理返回到图60中的步骤S442,进一步返回到图58中的步骤S403,并且处理进入图58中的 步骤S404。
如上所述,自动算法配置系统101通过随机地确定从特征提取表达式 列表生成部件32所提供的提^达式1到m中的每个得到的特征量的使 用/不使用,创建单个算法作为初始状态中的帕累托最优解。基于初始状态 中的帕累托最优解,自动算法配置系统101通过随机地确定从特征提M 达式1到m中的每个得到的特征量的使用/不使用、或通过经由从所M 的帕累托最优解随机选择的一个解的变异而确定从特征提^^达式1到m 中的每个得到的特征量的使用/不使用,创建帕累托最优解的候选解。然后, 自动算法配置系统101将候选解的评估参考值和总计算时间与作为候选解 保存的帕累托最优解的评估参考值和总计算时间相比较,从而确定多个帕 累托最优解,其中要放在目标变量的准确度或处理速度上的重点的程度互 不相同。
通过该配置,对于输入新信号的速度和亮度量的提取,自动算法配置 系统101可以提出多个作为帕累托最优解的信息提取算法,其中要放在目 标变量的准确度或处理速度上的重点的程度互不相同。也就是说,自动算 法配置系统101可以提出多个具有评估指标间的折衷关系的算法。
然后,用户可以根据每个目标指标的准确度或处理速度的重要程度来 选捧最佳算法,并且可以获得目标变量的提取结果。
在图1所示的信息处理设备1中,自动算法配置部件13和折衷分析 部件14可以被替换成这样的信息提取块,其包括设置在自动算法配置系 统101中的教师数据获得部件131、特征量计算部件132、评估值计算部 件133和特征提^达式列表生成部件32。在这种情况下,信息处理设备 l可以用作用于执行信息提取处理的设备,以便从输入的新信号提^il度 和亮度量。
在相关技术的自动算法配置技术中,仅仅最高性能(最高准确度)的算 法被确定。因此,与手动配置算法的情况不同,配置能够在满足要求的同 时可以以最小资源量和所期望的准确度来执行处理的算法是困难的。然 而,根据本发明实施例的信息处理设备l和自动算法配置系统101可以生 成可执行这种处理的算法。
上迷系列处理可以通过硬件或软件来执行。在这种情况下,上述处理 可以由如图62所示的计算机200来执行。在图62中,CPU(中央处理单元)201根据存储在ROM(只读存储 器)202中的程序或从存储部件208装栽到RAM(随;lM!"取存储器)203的程 序,执行各种类型的处理。RAM 203适当时存储在CPU201执行各种类 型的处理等时使用的数据等。
CPU201、 ROM202和RAM203通过内部总线204相互连接。内部 总线204还连接到输V输出接口 205。
输入部件206、输出部件207、存储部件208和通信部件209也连接 到输V输出接口 205。输入部件206包括例如^tit和鼠标。输出部件207 包括例如扬声器、以及诸如CRT(阴极射线管)显示器或LCD(液晶显示器) 的显示器。存储部件208包括例如硬盘。通信部件209包括调制解调器、 终端适配器等等。通信部件209通过包括电话线或CATV(有线电视)网络 的网络来执行通信处理。
驱动器210也可以连接到输^/输出接口 205,其中诸如磁盘、光盘、 磁光盘或半导体存储器的可拆卸介质适当时附连到输/V输出接口 205。适 当时,将从可拆卸介质221读取的计算机程序安装到存储部件208。
行处理的程序,或者可以是并^地或在调用时执行处理的程序。
在这里,流程图所示的步骤不仅包括根据所述顺序而按时间顺序执行 的处理,还包括并发地或单独地执行而不必按时间顺序进行的处理。
本申请包含与2008年7月14日向日本专利局提交的日本优先权专利 申请JP 2008-183019中公开的主题内斜目关的主题内容,在此通过引用将 其全文合并于此。
本发明的实施例不限于上述实施例,并且可以对其进行各种变化而不 背离本发明的精神和范围。
本领域的技术人员应当理解,可以在所附权利要求或其等同方案的范 围内根据设计需要或其它因素进行各种修改、组合、子组合和变更。
权利要求
1.一种信息处理设备,其包括算法配置装置,用于通过使用基因搜索技术来配置用于对输入信号执行辨别的算法;以及折衷分析装置,用于通过基于所述算法执行折衷分析来确定所述算法关于评估指标的帕累托最优解。
2. 根据权利要求1所述的信息处理设备,还包括最佳算法确定装置, 用于在所述帕累托最优解当中确定与所述评估指标的要求条件相匹配的 最佳算法。
3. 根据权利要求1所述的信息处理设备,其中由所述算法配置装置 配置的所述算法具有特征提^达式、以及作为所述特征提取表达式的组 合的信息估计表达式。
4. 根据权利要求3所述的信息处理设备,其中所述折衷分析装置通 过使用具有不同数目的特征提取表达式的算法来生成初始状态中的帕累 托最优解,其中所述算法通过从由所述算法配置装置配置的所述算法中逐 个地删除所述特征提^达式来创建。
5. 根据权利要求3所述的信息处理设备,其中所述折衷分析装置使 用由所述算法配置装置配置的所述算法,作为初始状态中的帕累托最优 解。
6. 根据权利要求4所述的信息处理设备,其中所述折衷分析装置通 过随机地改变所述初始状态的帕累托最优解中的每个特征提取表达式的 使用或不使用,更新所述帕累托最优解。
7. 根据权利要求2所述的信息处理设备,其中所述最佳算法确定装 置基于所要求的处理时间和准确度而在所述帕累托最优解当中确定所述 最佳算法。
8. 根据权利要求3所述的信息处理设备,还包括评估值计算装置, 用于确定所述信息估计表达式中的所述特征提取表达式的评估值,并且所述算法配置装置基于所确定的所述特征提取表达式的评估值而更 新所述信息估计表达式中的所述特征提M达式。
9. 根据权利要求8所述的信息处理设备,其中当所述算法配置装置配置多个信息估计表达式作为算法时,所述信息估计表达式中的相同特征^:取表达式的贡献率的总值被用作相应特征提:^达式的评估值。
10. —种用于信息处理设备的信息处理方法,其中所述信息处理设备 包括算法配置装置,用于配置算法;以及折衷分析装置,用于确定所述 算法的帕累托最优解,所述信息处理方法包括以下步骤通迚基因搜索技术来配置用于对输入信号执行辨别的所述算法;以及通过基于所述算法执行折衷分析来确定所述算法关于评估指标的帕 累托最优解。
11. 一种使计算机用作以下装置的程序算法配置装置,用于通过使用基因搜索技术来配置用于对输入信号执 行辨别的算法;以及折衷分析装置,用于通迚基于所述算法执行折衷分析来确定所述算法 关于评估指标的帕累托最优解。
12. —种信息处理设备,其包括算法配置部件,其通过使用基因搜索技术来配置用于对输入信号执行 辨别的算法;以及折衷分析部件,其通过基于所述算法执行折衷分析来确定所述算法关 于评估指标的帕累托最优解。
13. 根据权利要求12所述的信息处理设备,还包括最佳算法确定部 件,其在所述帕累托最优解当中确定与所述评估指标的要求4Ht相匹配的 最佳算法。
14. 根据权利要求12所述的信息处理设备,其中由所述算法配置部 件配置的所述算法具有特征提^达式、以及作为所述特征提取表达式的 组合的信息估计表达式。
15. 根据权利要求14所述的信息处理设备,其中所述折衷分析部件累托最优解,其中所述算法通过从由所述算法配置装置配置的所述算法中 逐个地删除所述特征4C取表达式来创建。
16.根据权利要求14所述的信息处理设备,其中所述折衷分析部件 使用由所述算法配置装置配置的所述算法,作为初始状态中的帕累托最优解。
17. 根据权利要求15所述的信息处理设备,其中所述折衷分析部件 通过随机地改变所述初始状态的帕累托最优解中的每个特征提取表达式 的使用或不使用,更新所述帕累托最优解。
18. 根据权利要求13所述的信息处理设备,其中所述最佳算法确定 部件基于所要求的处理时间和准确度而在所述帕累托最优解当中确定所 述最佳算法。
19. 根据权利要求14所述的信息处理设备,还包括评估值计算部件, 其确定所述信息估计表达式中的所述特M取表达式的评估值,并且所述算法配置部件基于所确定的所述特征提取表达式的评估值而更 新所述信息估计表达式中的所述特征提M达式。
20. 根据权利要求19所述的信息处理设备,其中当所述算法配置部 件配置多个信息估计表达式作为算法时,所述信息估计表达式中的相同特 征提取表达式的贡献率的总值被用作相应特征提:^达式的评估值。
21. —种用于信息处理设备的信息处理方法,其中所述信息处理设备 包括算法配置部件,其配置算法;以及折衷分析部件,其确定所述算法 的帕累托最优解,所述信息处理方法包括以下步骤通过基因搜索技术来配置用于对输入信号执行辨别的所述算法;以及通过基于所述算法执行折衷分析来确定所述算法关于评估指标的帕 累托最优解。
22. —种使计算机用作以下部件的程序算法配置部件,其通过使用基因搜索技术来配置用于对输入信号执行 辨别的算法;以及折衷分析部件,其通il基于所述算法执行折衷分析来确定所述算法关 于评估指标的帕累托最优解。
全文摘要
本发明公开了一种信息处理设备、信息处理方法以及程序,其中该信息处理设备包括算法配置部件,其通过使用基因搜索技术来配置用于对输入信号执行辨别的算法;以及折衷分析部件,其通过基于算法执行折衷分析来确定算法关于评估指标的帕累托最优解。
文档编号G10L11/00GK101630508SQ20091015949
公开日2010年1月20日 申请日期2009年7月14日 优先权日2008年7月14日
发明者小林由幸 申请人:索尼株式会社