一种用于电话外拨系统的呼叫进程分析方法和设备的制作方法

文档序号：2823803阅读：309来源：国知局

专利名称：一种用于电话外拨系统的呼叫进程分析方法和设备的制作方法
技术领域：
本发明涉及电话外拨技术领域以及语音识别领域，尤其涉及一种用于电话外拨系统的呼叫进程分析方法和设备。
背景技术：
电话外拨是指拨打电话，并识别被叫方的呼叫状态，根据呼叫状态进行后续处理的操作。所述呼叫状态包括但不限于对方接通、空号、被叫用户关机、被叫不在服务区、被叫停机、有呼叫等待功能被叫忙、无呼叫等待功能被叫忙、中继忙/网络忙、被叫用户设置了呼入限制、其它运营商方向线路故障、被叫久叫不应等。电话外拨系统是指计算机自动拨打电话，并自动判断呼叫状态，根据呼叫状态进行后续处理的系统，根据后续处理的类型，分成自动外拨和预测式外拨两种类型。电话外拨系统被广泛应用于市场营销、商务办公、金融服务、售前售后服务、社会信息调查等方面。电话外拨方案的核心，是准确识别出被叫方的呼叫状态，该过程被称为呼叫进程分析。在现有技术中，电话外拨系统最常用的电信线路为综合业务数字网(ISDN， Integrated Services Digital Network)线路。ISDN线路上的信息分成两类，一类是带外信息，S卩ISDN信令，一类是带内信息，即人可以听到的音频。传统的基于ISDN线路的呼叫进程分析检测方法包括以下三种信令检测方法、标准信息音检测方法和人声检测方法。信令检测方法就是根据ISDN所接收的ISDN信令判断被叫方的呼叫状态。标准信息音检测方法就是通过检测标准信息音来判断被叫方的呼叫状态。标准信息音是带内信息的一种，由单一频率的、有占空比的声音信号组成。常用的标准信息音包括回铃音和忙音。回铃音和忙音都是具有特定频谱特征的声音信号。图1所示为回铃音的波形示意图，采用频率为450士25Hz的交流电源，发送电平为-10士3dBm，它是k 断续的信号音，即Is送，如断。图2所示为忙音的波形示意图，采用频率为450士25Hz的交流电源，发送电平为-10士3dBm，它是0. 7断续的信号音，即0. 35送，0. 35断。标准信息音的检测原则一般为检测到回铃音，回铃音消失，则认为对方接通；检测到忙音，则认为对方没有接通。人声检测方法就是检测ISDN线路接收的带内信息是否符合人声的频谱特征来判断其是否为人声。该方法可以区分出声音信号不是标准信息音，但对于区分此声音是用户说话声，还是彩铃或录音通知的准确率非常低。在实际应用中，可以将三种方法综合使用，以提高检测准确率。以下针对多种呼叫进程的情况进行具体分析。对于被叫方应答的情况，在呼叫端收到的信号序列依次为回铃信令、回铃音或彩铃、接通信令和人声。采用标准信息音检测方式，如果收到的是彩铃而不是回铃音，则无法检测到对方回铃，如果采用人声检测方式，在收到彩铃时就会判定为对方应答，以致出现误判。对于空号、被叫用户关机、被叫停机、有呼叫等待功能被叫忙、无呼叫等待功能被叫忙、中继忙/网络忙、被叫用户设置了呼入限制、其它运营商方向线路故障的情况，在呼叫端收到的信号序列依次为录音通知(持续约10秒，内容为例如“您好！您所拨打的号码是空号，请核对后再拨”、“您好！您所拨打的电话已关机”、“对不起！您拨打的用户暂时无法接通，请稍后再拨”、“对不起！您拨打的电话已停机”等)、忙音(持续约20秒)、用户请求拆线的信令。通过信令检测方法可以检测没有接通，但是有较大的延迟，将近30秒(录音通知10秒，忙音20秒)，并且无法从用户请求拆线信息中获取具体的呼叫状态；通过标准信息音检测方法，可以检测没有接通，但是有较大的延迟，将近10秒，并且无法从用户请求拆线信息中获取具体的呼叫状态；通过真人声检测方法，会将录音通知误判为真人接通，也无法获取具体的呼叫状态。对于寻呼被叫不成功的情况，在呼叫端收到的信号序列依次为静音(持续约15 秒)、录音通知(持续约10秒，内容为“对不起，您拨打的电话暂时无人接听，请稍后再拨”)、忙音(持续约20秒)、用户请求拆线的信令。通过信令检测方法，可以检测没有接通，但是有较大的延迟，约45秒(15+10+20)，并且无法获取对方不在服务区的呼叫状态；通过标准信息音检测方法，可以检测没有接通，但是有较大的延迟，将近25秒，并且无法获取对方不在服务区；通过真人声检测方法，会将录音通知误判为真人接通，并且无法获取对方不在服务区。如果是寻呼被叫成功，但被叫方久不应答的情况，在呼叫端收到的信号序列依次为回铃音或彩铃、录音通知(持续约10秒，内容为“对不起，您拨打的电话暂时无人接听，请稍后再拨”)、忙音(持续约20秒)、用户请求拆线的信令。通过信令检测方法可以检测没有接通，但是有较大的延迟，将近30秒(录音通知10秒，忙音20秒)，并且无法获取对方是久叫不应；通过标准信息音检测方法，可以检测没有接通，但是有较大的延迟，将近10 秒，并且无法获取对方是久叫不应；通过真人声检测方法，会将录音通知误判为真人接通，并且无法获取对方是久叫不应。从以上分析可以看出，即使将上述三种方法混合使用，仍然会产生检测错误、检测延迟太大和无法获知被叫方准确的状态等问题。

发明内容
本发明提供了用于电话外拨系统的呼叫进程分析方法和装置，可以提高被叫方状态的检测正确率，获取呼叫的准确状态，缩短检测延迟。本发明实施例提出一种用于电话外拨系统的呼叫进程分析方法，包括如下步骤A、电话外拨系统拨打状态已知的被叫方号码，从呼叫线路中提取来自被叫方的语音作为源语音样本，选取包含关键词的源语音样本进行特征提取形关键词语音帧特征序列模板；B、电话外拨系统拨打被叫方号码，从呼叫线路中提取来自被叫方的语音作为目标语音样本，对目标语音样本进行特征提取，形成目标语音帧特征序列；C、利用关键词语音帧特征序列模板，对目标语音帧特征序列进行识别。较佳地，步骤A和/或步骤B所述从呼叫线路中提取来自被叫方的语音包括语音板卡、ISDN到H. 323或SIP语音的网关、或IP交换机从呼叫线路中提取音频数据，并对所提取的音频数据进行线性化处理。较佳地，步骤A所述选取包含关键词的源语音样本进行特征提取形成帧特征序列，将所述帧特征序列存储为关键词语音帧特征序列模板包括Al、对每一份包含关键词的源语音样本进行分帧加窗处理，得到源语音帧；A2、使用帧过零率或短时能量特征对所述源语音帧进行静音判定，对于每一个源语音帧，生成用于指示该源语音帧是否为静音帧的静音标识；A3、对每一个源语音帧的静音标识进行识别，若静音标识指示源语音帧为非静音帧，根据该源语音帧的语音线性猜测模型计算语音特征的倒谱系数；A4、依次存储每一个源语音帧的静音标识以及倒谱系数形成分帧语音倒谱系数序列；将所述分帧语音倒谱系数序列作为关键词语音帧特征序列模板。较佳地，步骤B所述对目标语音样本进行特征提取，形成目标语音帧特征序列包括Bi、对每一份目标语音样本进行分帧加窗处理，得到目标语音帧；B2、使用帧过零率或短时能量特征对所述目标语音帧进行静音判定，对于每一个目标语音帧，生成用于指示该目标语音帧是否为静音帧的静音标识；B3、对每一个目标语音帧的静音标识进行识别，若静音标识指示目标语音帧为非静音帧，根据该目标语音帧的语音线性猜测模型计算语音特征的倒谱系数；B4、将目标语音帧的静音标识以及倒谱系数按照顺序排列，形成分帧语音倒谱系数序列；将所述分帧语音倒谱系数序列作为目标语音帧特征序列。较佳地，所述步骤Al进一步包括对源语音样本进行预加重处理。较佳地，所述关键词包括是空号、已关机、无法接通、正在通话中、无法接通、呼入限制、无需加零、网络暂时无法接通、暂时无人接听或以上关键词的任意组合。较佳地，所述步骤C包括Cl、将目标语音帧特征序列分别对每一个关键词语音帧特征序列模板进行匹配，计算出与每一个关键词语音帧特征序列模板对应的匹配误差；C2、将所有关键词语音帧特征序列模板对应的匹配误差进行比较，找出其中最小的匹配误差；C3、判断所述最小的匹配误差是否小于预先设定的误差门限，若是，认为目标语音包含该最小的匹配误差对应的关键词语音帧特征序列模板所对应的关键词，否则，认为语音不包含关键词。较佳地，步骤Cl中对一个关键词语音帧特征序列模板进行匹配，计算出与该关键词语音帧特征序列模板对应的匹配误差包括设目标语音帧特征序列中的一个帧Fl与关键词语音帧特征序列模板的一个帧F2 之间的欧拉距离的表达式为Df(F\, F2)=如、-βι)2+(α2-β2)2- + {ακ 一凡)2 ；其中，α” α2··· α κ 为所述帧
Fl的倒谱系数，β β 2. . . β κ为所述帧F2的倒谱系数；设目标语音帧特征序列共包括M个语音帧，分别为FDpFD1. . . FDsh，而关键词语音帧特征序列模板包括N个语音帧分别为FI；、FT1. . . FTim，其中M > N，目标语音帧特征序列中进行匹配的起始帧号为s ；计算关键词语音帧特征序列模板与目标语音中从帧s到帧s+Ν-Ι的平均欧拉距离平均欧拉距离DTs
DTs = [Df (FDs+0, FT0) +Df (FDS+1，FT1) +··· +Df (FDs^1, FV1) ] /N ；将所述起始帧号s从0遍历到M-N+1，计算所有的平均欧拉距离DI；、 DT1. · · · DTm—N+i ‘在所述平均欧拉距离DTr DT1. . . . DTm_n+1中找到一个最小值，作为该关键词语音帧特征序列模板的匹配误差。本发明实施例还提出一种用于电话外拨系统的呼叫进程分析装置，包括源语音帧特征序列提取模块，用于在电话外拨系统拨打状态已知的被叫方号码时，从呼叫线路中提取来自被叫方的语音作为源语音样本，选取包含关键词的源语音样本进行特征提取形成关键词语音帧特征序列模板；目标语音特征提取模块，用于在电话外拨系统拨打被叫方号码时，从呼叫线路中提取来自被叫方的语音作为目标语音样本，对目标语音样本进行特征提取，形成目标语音帧特征序列；特征识别模块，用于利用所述特征模块建立的关键词语音帧特征序列模板，对信号提取模块所提取的目标语音帧特征序列进行识别。较佳地，所述源语音帧特征序列提取模块包括第一音频数据提取单元，用于从语音板卡、ISDN到H. 323或SIP语音的网关、或IP 交换机中提取音频数据并输出所述音频数据；第一线性化处理单元，用于对第一音频数据提取单元所提取的音频数据进行线性化处理，并输出线性化处理后的音频数据；关键词选择单元，用于从第一线性化处理单元输出的音频数据中截取包含关键词的音频片段作为源语音样本；第一加窗处理单元，用于对每一份包含关键词的源语音样本进行分帧加窗处理，得到源语音帧并输出；第一静音判定单元，用于使用帧过零率与短时能量特征对所述源语音帧进行静音判定，对于加窗处理单元输出的每一个源语音帧，生成用于指示该源语音帧是否为静音帧的静音标识；第一计算单元，用于对每一个源语音帧的静音标识进行识别，若静音标识指示源语音帧为非静音帧，根据该源语音帧的语音线性猜测模型计算语音特征的倒谱系数；存储单元，用于依次存储每一个源语音帧的静音标识以及倒谱系数形成分帧语音倒谱系数序列；所述分帧语音倒谱系数序列即为关键词语音帧特征序列模板。较佳地，所述目标语音特征提取模块包括第二音频数据提取单元，用于从语音板卡、ISDN到H. 323或SIP语音的网关、或IP 交换机中提取音频数据并输出所述音频数据；第二线性化处理单元，用于对音频数据提取单元所提取的音频数据进行线性化处理，并输出线性化处理后的音频数据作为目标语音样本；第二加窗处理单元，用于对每一份目标语音样本进行分帧加窗处理，得到并输出目标语音帧；第二静音判定单元，用于使用帧过零率与短时能量特征对所述目标语音帧进行静音判定，对于每一个目标语音帧，生成用于指示该目标语音帧是否为静音帧的静音标识；
第二计算单元，用于对每一个目标语音帧的静音标识进行识别，若静音标识指示目标语音帧为非静音帧，根据该目标语音帧的语音线性猜测模型计算语音特征的倒谱系数；特征序列单元，用于将目标语音帧的静音标识以及倒谱系数按照顺序排列，形成分帧语音倒谱系数序列；所述分帧语音倒谱系数序列作为目标语音帧特征序列。较佳地，所述特征识别模块包括匹配单元，用于将目标语音帧特征序列分别对每一个关键词语音帧特征序列模板进行匹配，计算出与该关键词语音帧特征序列模板对应的匹配误差；比较单元，用于将所有匹配误差进行比较，找出其中最小的匹配误差并输出至判断单元；以及判断单元，用于判断来自所述比较单元的匹配误差是否小于预先设定的误差门限，若是，判断结果为目标语音包含该关键词语音帧特征序列模板对应的关键词，否则，判断结果为语音不包含关键词，并输出该判断结果。从以上技术方案可以看出，在电话外拨系统拨打被叫号码时，提取来自被叫方的信号，根据预先建立录音通知包含的关键词的特征模板对该信号进行识别。该技术方案具有如下有益效果1、检测时间短，在接收到关键词30毫秒内，即可检测完成；2、检测信息全面，不但通过信令可以检测对方接通，还可以检测出空号、被叫用户关机、被叫不在服务区、被叫停机、有呼叫等待功能被叫忙、无呼叫等待功能被叫忙、中继忙 /网络忙、被叫用户设置了呼入限制、GSM手机拨GSM手机加〃 0〃、固定网拨本地GSM手机加"0"、拨号未加长途区号、其它运营商方向线路故障、被叫久叫不应等信息；3、误判率低不会将彩铃或录音通知误判为对方应答，不会因为彩铃误判为没有回铃。

图1为回铃音的波形示意图；图2为忙音的波形示意图；图3为本发明实施例提出的呼叫进程分析的流程示意图；图4为本发明实施例提出的用于电话外拨系统的呼叫进程分析装置的结构框图；图5为图4中的源语音帧特征序列提取模块401的内部结构图；图6为图4中的目标语音特征提取模块402的内部结构图；图7为图4中的特征识别模块的内部结构图。
具体实施例方式本发明实施例提出的用于电话外拨系统的呼叫进程分析方法，其关键技术特征为对被叫方的信号进行关键词语音识别，以解决检测错误、检测延迟太大和无法获知被叫方准确的状态等问题。图3所示为本发明实施例提出的呼叫进程分析的流程示意图，包括如下步骤步骤301 建立关键词语音帧特征序列模板。
建立关键词语音帧特征序列模板的流程包括如下步骤步骤301a 建立关键词字典，所述关键词包含但不限于“是空号”、“已关机”、“无法接通”、“正在通话中”、“无法接通”、“呼入限制”、“无需加零”、“网络暂时无法接通”、“暂时无人接听”等；步骤301b 电话外拨系统拨打状态已知的被叫方号码，从呼叫线路中提取来自被叫方的语音作为源语音样本。目前有大量的设备可以提取音频数据和信令，形成音频数据流，包括语音板卡、 ISDN到H. 323或SIP语音的网关、IP交换机等。通过这些设备可以直接从呼叫线路中提取音频数据，数据编码格式常用的是G. 711 A Law，将其线性化处理后即可进行语音识别处理。步骤301c 选取包含关键词的源语音样本进行特征提取形成关键词语音帧特征序列模板。步骤如下步骤301C-1 对源语音样本进行预加重处理，该步骤为可选步骤，其目的是提升高频部分，使信号的频谱变得平坦，保证语音特征明显，减少噪声对频谱分析的影响。步骤301c-2 对每一份目标语音样本进行分帧加窗处理，得到目标语音帧，该步骤的目的是保证分帧语音的短时平稳性；步骤301C-3 使用帧过零率或短时能量特征对所述源语音帧进行静音判定，对于每一个源语音帧，生成用于指示该源语音帧是否为静音帧的静音标识。使用帧过零率的判定方法如下设置采样值门限G和过零率门限为R，过零率=帧中采样值超过G的数量/N。当过零率< R时，则判定这一帧为静音帧，否则判定这一帧为非静音帧。步骤301C-4、对每一个目标语音帧的静音标识进行识别，若静音标识指示目标语音帧为非静音帧，根据该目标语音帧的语音线性猜测模型计算语音特征的倒谱系数。步骤 301c-5、依次存储每一个源语音帧的静音标识以及倒谱系数形成分帧语音倒谱系数序列；将所述分帧语音倒谱系数序列作为关键词语音帧特征序列模板。由于每一个关键词的倒谱系数序列都具有其独特的特征，并且易于识别，可以将其作为关键词的特征模板。步骤302 电话外拨系统拨打被叫方号码。步骤303 从呼叫线路中提取来自被叫方的带内语音。提取方式与提取源语音样本的方式相同。步骤304 对目标语音样本进行特征提取，形成目标语音帧特征序列。步骤304具体包括如下子步骤步骤304-1、对每一份目标语音样本进行分帧加窗处理，得到目标语音帧。步骤304-2、使用帧过零率与短时能量特征对所述目标语音帧进行静音判定，对于每一个目标语音帧，生成用于指示该目标语音帧是否为静音帧的静音标识；步骤304-3、对每一个目标语音帧的静音标识进行识别，若静音标识指示目标语音帧为非静音帧，根据该目标语音帧的语音线性猜测模型计算语音特征的倒谱系数；步骤304-4、将目标语音帧的静音标识以及倒谱系数按照顺序排列，形成分帧语音倒谱系数序列；将所述分帧语音倒谱系数序列作为目标语音帧特征序列。较佳地，在步骤304-1之前，也可以对目标语音样本进行预加重处理。步骤305 利用关键词语音帧特征序列模板，对目标语音帧特征序列进行识别。具体包括如下子步骤步骤305-1 将目标语音帧特征序列分别对每一个关键词语音帧特征序列模板进行匹配，计算出与该关键词语音帧特征序列模板对应的匹配误差；具体方法分解为三个部分1、计算帧误差，定义为函数Df (F1，F2)例如，设目标语音帧特征序列中一个帧F 1的倒谱系数为α2... α κ,关键词语音帧特征序列模板中一个帧F2的倒谱系数为β β 2. . . β κ，计算所述两个帧的欧拉距离为Df (Fl, F2) = sqrt (( α 1-β 1) "2+(α 2-β 2) "2. . . (αΚ_βΚ)~2)。该欧拉距离是帧Fl与帧F2之间的帧误差。2、计算平均欧拉距离DT设目标语音共包括M个语音帧，分别为FDpFD1. . . FDsh，而关键词语音帧特征序列模板包括N个语音帧分别为F!；、FT1. . . FTim，其中M > N，起始帧为S。计算关键词语音帧特征序列模板与目标语音中从帧s到帧s+Ν-Ι的平均欧拉距离 DTs:DTs = [Df(FDs+0, FT0)+Df (FDS+1, FT1)+···+Df (FDs^1, FV1) ]/N3、将所述起始帧号 s 从0遍历到M-N+1，计算所有的平均欧拉距离DTpDT1. . . . DTM_N+14、在所述平均欧拉距离DT。、 DT1. . . . DTm_n+1中找到一个最小值，作为该关键词语音帧特征序列模板的匹配误差步骤305-2 将所有匹配误差进行比较，找出其中最小的匹配误差，作为关键词语音帧特征序列模板的匹配误差；步骤305-3 判断所述最小的匹配误差是否小于预先设定的误差门限，若是，认为目标语音包含该关键词语音帧特征序列模板对应的关键词，否则，认为语音不包含关键词。本发明实施例还提出一种用于电话外拨系统的呼叫进程分析装置，其结构框图如图4所示，该呼叫进程分析装置400包括源语音帧特征序列提取模块401，用于在电话外拨系统拨打状态已知的被叫方号码时，从呼叫线路中提取来自被叫方的语音作为源语音样本，选取包含关键词的源语音样本进行特征提取形成关键词语音帧特征序列模板；目标语音特征提取模块402，用于在电话外拨系统拨打被叫方号码时，从呼叫线路中提取来自被叫方的语音作为目标语音样本，对目标语音样本进行特征提取，形成目标语音帧特征序列；特征识别模块403，用于利用所述特征模块建立的关键词语音帧特征序列模板，对信号提取模块所提取的目标语音帧特征序列进行识别。较佳地，所述源语音帧特征序列提取模块401的内部结构如图5所示，包括第一音频数据提取单元501，用于从语音板卡、ISDN到H. 323或SIP语音的网关、或IP交换机中提取音频数据并输出所述音频数据；第一线性化处理单元502，用于对第一音频数据提取单元所提取的音频数据进行线性化处理，并输出线性化处理后的音频数据；关键词选择单元503，用于从第一线性化处理单元502输出的音频数据中截取包含关键词的音频片段作为源语音样本；第一加窗处理单元504，用于对每一份包含关键词的源语音样本进行分帧加窗处理，得到源语音帧并输出；第一静音判定单元505，用于使用帧过零率与短时能量特征对所述源语音帧进行静音判定，对于加窗处理单元输出的每一个源语音帧，生成用于指示该源语音帧是否为静音帧的静音标识；第一计算单元506，用于对每一个源语音帧的静音标识进行识别，若静音标识指示源语音帧为非静音帧，根据该源语音帧的语音线性猜测模型计算语音特征的倒谱系数；存储单元507，用于依次存储每一个源语音帧的静音标识以及倒谱系数形成分帧语音倒谱系数序列；所述分帧语音倒谱系数序列即为关键词语音帧特征序列模板。较佳地，所述目标语音特征提取模块402的内部结构如图6所示，包括第二音频数据提取单元601，用于从语音板卡、ISDN到H. 323或SIP语音的网关、或IP交换机中提取音频数据并输出所述音频数据；第二线性化处理单元602，用于对音频数据提取单元601所提取的音频数据进行线性化处理，并输出线性化处理后的音频数据作为目标语音样本；第二加窗处理单元603，用于对每一份目标语音样本进行分帧加窗处理，得到并输出目标语音帧；第二静音判定单元604，用于使用帧过零率与短时能量特征对所述目标语音帧进行静音判定，对于每一个目标语音帧，生成用于指示该目标语音帧是否为静音帧的静音标识；第二计算单元605，用于对每一个目标语音帧的静音标识进行识别，若静音标识指示目标语音帧为非静音帧，根据该目标语音帧的语音线性猜测模型计算语音特征的倒谱系数；特征序列单元606，用于将目标语音帧的静音标识以及倒谱系数按照顺序排列，形成分帧语音倒谱系数序列；所述分帧语音倒谱系数序列作为目标语音帧特征序列输出。较佳地，所述特征识别模块的内部结构如图7所示，包括匹配单元701，用于将目标语音帧特征序列分别对每一个关键词语音帧特征序列模板进行匹配，计算出与该关键词语音帧特征序列模板对应的匹配误差；比较单元702，用于将所有匹配误差进行比较，找出其中最小的匹配误差并输出至判断单元；以及判断单元703，用于判断来自所述比较单元的匹配误差是否小于预先设定的误差门限，若是，判断结果为目标语音包含该关键词语音帧特征序列模板对应的关键词，否则，判断结果为语音不包含关键词，并输出该判断结果。本发明实施例的技术方案具有以下有益效果1、检测时间短，在接收到关键词30毫秒内，即可检测完成，例如，在听到“是空号” 的声音30毫秒后，即可判定对方是空号；2、检测信息全面，不但通过信令可以检测对方接通，还可以检测出空号、被叫用户关机、被叫不在服务区、被叫停机、有呼叫等待功能被叫忙、无呼叫等待功能被叫忙、中继忙 /网络忙、被叫用户设置了呼入限制、GSM手机拨GSM手机加〃 0〃、固定网拨本地GSM手机加"0"、拨号未加长途区号、其它运营商方向线路故障、被叫久叫不应等信息；3、误判率低不会将彩铃或录音通知误判为对方应答，不会因为彩铃误判为没有回铃。利用本发明实施例提出的呼叫进程分析方案，可以极大提高自动外拨的速度和效率。具体分析如下在实际使用中，电话外拨系统经常利用外拨资源同时发起上百个外拨任务，而且对于呼叫没有接通的电话需要重新呼叫。一方面，利用本发明实施例提出的呼叫进程分析方案快速检测呼叫状态，可以减少外拨资源占用，提高外拨效率；另一方面，通过制定策略，可以减少无效外拨对外拨资源的占用，并提高接通率，具体策略如下对于空号、被叫用户设置了呼入限制等状态的电话不再重复呼叫；对于被叫停机的状态，选择M小时后重复呼叫，避免资源占用；对于被叫用户关机的状态，选择延迟Ml小时后重复呼叫，例如，延迟5小时后呼叫；对于被叫不在服务区、被叫久叫不应的状态，选择延迟M2小时后重复呼叫；例如，所述M2 = 2。一般来说，M2应小于Ml。对于有呼叫等待功能被叫忙、无呼叫等待功能被叫忙、中继忙/网络忙、其它运营商方向线路故障的状态，选择M3小时后重复呼叫。例如，所述M3=l。一般来说，M3应小于M2。本发明实施例提出的准确的呼叫进程分析还可以用于提高预测式外拨的人员利用率。预测式外拨系统在自动外拨的基础上，增加接通后转接到人工的功能。首先，快速检测呼叫状态，可以减少人工等待，降低人力成本。其次，降低误判，降低人工接听没有接通的电话带来的人力浪费；最后，准确的呼叫进程分析提供的数据，可以大幅优化预测外拨的算法，提高坐席工作效率，降低騷扰率。以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明保护的范围之内。
权利要求
1.一种用于电话外拨系统的呼叫进程分析方法，其特征在于，包括如下步骤A、电话外拨系统拨打状态已知的被叫方号码，从呼叫线路中提取来自被叫方的语音作为源语音样本，选取包含关键词的源语音样本进行特征提取形关键词语音帧特征序列模板；B、电话外拨系统拨打被叫方号码，从呼叫线路中提取来自被叫方的语音作为目标语音样本，对目标语音样本进行特征提取，形成目标语音帧特征序列；C、利用关键词语音帧特征序列模板，对目标语音帧特征序列进行识别。
2.根据权利要求1所述的方法，其特征在于，步骤A和/或步骤B所述从呼叫线路中提取来自被叫方的语音包括语音板卡、ISDN到H. 323或SIP语音的网关、或IP交换机从呼叫线路中提取音频数据，并对所提取的音频数据进行线性化处理。
3.根据权利要求1所述的方法，其特征在于，步骤A所述选取包含关键词的源语音样本进行特征提取形成帧特征序列，将所述帧特征序列存储为关键词语音帧特征序列模板包括Al、对每一份包含关键词的源语音样本进行分帧加窗处理，得到源语音帧； A2、使用帧过零率或短时能量特征对所述源语音帧进行静音判定，对于每一个源语音帧，生成用于指示该源语音帧是否为静音帧的静音标识；A3、对每一个源语音帧的静音标识进行识别，若静音标识指示源语音帧为非静音帧，根据该源语音帧的语音线性猜测模型计算语音特征的倒谱系数；A4、依次存储每一个源语音帧的静音标识以及倒谱系数形成分帧语音倒谱系数序列；将所述分帧语音倒谱系数序列作为关键词语音帧特征序列模板。
4.根据权利要求1所述的方法，其特征在于，步骤B所述对目标语音样本进行特征提取，形成目标语音帧特征序列包括Bi、对每一份目标语音样本进行分帧加窗处理，得到目标语音帧； B2、使用帧过零率或短时能量特征对所述目标语音帧进行静音判定，对于每一个目标语音帧，生成用于指示该目标语音帧是否为静音帧的静音标识；B3、对每一个目标语音帧的静音标识进行识别，若静音标识指示目标语音帧为非静音帧，根据该目标语音帧的语音线性猜测模型计算语音特征的倒谱系数；B4、将目标语音帧的静音标识以及倒谱系数按照顺序排列，形成分帧语音倒谱系数序列；将所述分帧语音倒谱系数序列作为目标语音帧特征序列。
5.根据权利要求3所述的方法，其特征在于，所述步骤Al进一步包括对源语音样本进行预加重处理。
6.根据权利要求1所述的方法，其特征在于，所述关键词包括是空号、已关机、无法接通、正在通话中、无法接通、呼入限制、无需加零、网络暂时无法接通、暂时无人接听或以上关键词的任意组合。
7.根据权利要求1至6任一项所述的方法，其特征在于，所述步骤C包括Cl、将目标语音帧特征序列分别对每一个关键词语音帧特征序列模板进行匹配，计算出与每一个关键词语音帧特征序列模板对应的匹配误差；C2、将所有关键词语音帧特征序列模板对应的匹配误差进行比较，找出其中最小的匹配误差；C3、判断所述最小的匹配误差是否小于预先设定的误差门限，若是，认为目标语音包含该最小的匹配误差对应的关键词语音帧特征序列模板所对应的关键词，否则，认为语音不包含关键词。
8.根据权利要求7所述的方法，其特征在于，步骤Cl中对一个关键词语音帧特征序列模板进行匹配，计算出与该关键词语音帧特征序列模板对应的匹配误差包括设目标语音帧特征序列中的一个帧Fl与关键词语音帧特征序列模板的一个帧F2之间的欧拉距离的表达式为Df(F\, F2) = -β])2+(α2-β2)2·'· + (ακ-βκ)2α” α 2. . . α κ 为所述帧 Fl的倒谱系数，β β 2. . . β κ为所述帧F2的倒谱系数；设目标语音帧特征序列共包括M个语音帧，分别为FDciJD1. . . FDsh，而关键词语音帧特征序列模板包括N个语音帧分别为FI；、FT1. . . FTim，其中M > N，目标语音帧特征序列中进行匹配的起始帧号为s ；计算关键词语音帧特征序列模板与目标语音中从帧s到帧s+Ν-Ι的平均欧拉距离平均欧拉距离DTs DTs = [Df (FDs+0, FT0) +Df (FDS+1，FT1) +··· +Df (FDs^1, FTnJ ] /N ；将所述起始帧号s从0遍历到M-N+1，计算所有的平均欧拉距离DI；、DT1. . . . DTm_n+1 ；在所述平均欧拉距离DI；、DT1. . . . DTm_n+1中找到一个最小值，作为该关键词语音帧特征序列模板的匹配误差。
9.一种用于电话外拨系统的呼叫进程分析装置，其特征在于，包括源语音帧特征序列提取模块，用于在电话外拨系统拨打状态已知的被叫方号码时，从呼叫线路中提取来自被叫方的语音作为源语音样本，选取包含关键词的源语音样本进行特征提取形成关键词语音帧特征序列模板；目标语音特征提取模块，用于在电话外拨系统拨打被叫方号码时，从呼叫线路中提取来自被叫方的语音作为目标语音样本，对目标语音样本进行特征提取，形成目标语音帧特征序列；特征识别模块，用于利用所述特征模块建立的关键词语音帧特征序列模板，对信号提取模块所提取的目标语音帧特征序列进行识别。
10.根据权利要求9所述的装置，其特征在于，所述源语音帧特征序列提取模块包括第一音频数据提取单元，用于从语音板卡、ISDN到H. 323或SIP语音的网关、或IP交换机中提取音频数据并输出所述音频数据；第一线性化处理单元，用于对第一音频数据提取单元所提取的音频数据进行线性化处理，并输出线性化处理后的音频数据；关键词选择单元，用于从第一线性化处理单元输出的音频数据中截取包含关键词的音频片段作为源语音样本；第一加窗处理单元，用于对每一份包含关键词的源语音样本进行分帧加窗处理，得到源语音帧并输出；第一静音判定单元，用于使用帧过零率与短时能量特征对所述源语音帧进行静音判定，对于加窗处理单元输出的每一个源语音帧，生成用于指示该源语音帧是否为静音帧的静音标识；第一计算单元，用于对每一个源语音帧的静音标识进行识别，若静音标识指示源语音帧为非静音帧，根据该源语音帧的语音线性猜测模型计算语音特征的倒谱系数；存储单元，用于依次存储每一个源语音帧的静音标识以及倒谱系数形成分帧语音倒谱系数序列；所述分帧语音倒谱系数序列即为关键词语音帧特征序列模板。
11.根据权利要求9所述的装置，其特征在于，所述目标语音特征提取模块包括第二音频数据提取单元，用于从语音板卡、ISDN到H. 323或SIP语音的网关、或IP交换机中提取音频数据并输出所述音频数据；第二线性化处理单元，用于对音频数据提取单元所提取的音频数据进行线性化处理，并输出线性化处理后的音频数据作为目标语音样本；第二加窗处理单元，用于对每一份目标语音样本进行分帧加窗处理，得到并输出目标语音帧；第二静音判定单元，用于使用帧过零率与短时能量特征对所述目标语音帧进行静音判定，对于每一个目标语音帧，生成用于指示该目标语音帧是否为静音帧的静音标识；第二计算单元，用于对每一个目标语音帧的静音标识进行识别，若静音标识指示目标语音帧为非静音帧，根据该目标语音帧的语音线性猜测模型计算语音特征的倒谱系数；特征序列单元，用于将目标语音帧的静音标识以及倒谱系数按照顺序排列，形成分帧语音倒谱系数序列；所述分帧语音倒谱系数序列作为目标语音帧特征序列。
12.根据权利要求9至11任一项所述的方法，其特征在于，所述特征识别模块包括匹配单元，用于将目标语音帧特征序列分别对每一个关键词语音帧特征序列模板进行匹配，计算出与该关键词语音帧特征序列模板对应的匹配误差；比较单元，用于将所有匹配误差进行比较，找出其中最小的匹配误差并输出至判断单元；以及判断单元，用于判断来自所述比较单元的匹配误差是否小于预先设定的误差门限，若是，判断结果为目标语音包含该关键词语音帧特征序列模板对应的关键词，否则，判断结果为语音不包含关键词，并输出该判断结果。
全文摘要
本发明提供了一种用于电话外拨系统的呼叫进程分析方法，包括如下步骤A、电话外拨系统拨打状态已知的被叫方号码，从呼叫线路中提取来自被叫方的语音作为源语音样本，选取包含关键词的源语音样本进行特征提取形关键词语音帧特征序列模板；B、电话外拨系统拨打被叫方号码，从呼叫线路中提取来自被叫方的语音作为目标语音样本，对目标语音样本进行特征提取，形成目标语音帧特征序列；C、利用关键词语音帧特征序列模板，对目标语音帧特征序列进行识别。本发明还提供了一种用于电话外拨系统的呼叫进程分析装置。本发明方案可以提高被叫方状态的检测正确率，获取呼叫的准确状态，缩短检测延迟。
文档编号G10L15/06GK102404462SQ20101027700
公开日2012年4月4日申请日期2010年9月8日优先权日2010年9月8日
发明者黄河申请人:北京商路通信息技术有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：黄河
技术所有人：北京商路通信息技术有限公司
我是此专利的发明人

上一篇：基于语音输入激活多种功能的系统和方法
上一篇：一种用于语音情感识别的语音情感特征提取方法