图像清晰度检测方法、装置、设备及存储介质与流程

文档序号：25725469发布日期：2021-07-02 21:11阅读：来源：国知局

技术特征：

1.一种图像清晰度检测方法，其特征在于，包括：

获取待检测的图像；

采用预置场景文本检测模型对所述图像进行文字区域定位，输出所述图像中各文字所在区域对应的文字区域框；

从所述图像中裁取所述各文字区域框对应的文字区域；

基于无参考离散余弦变换域，对所述文字区域对应的空域进行变换，得到所述文字区域对应的频域图像；

根据所述频域图像，采用预置文本清晰度计算公式，计算所述各文字区域的清晰度；

根据所述各文字区域的清晰度，计算所述图像的综合清晰度。

2.根据权利要求1所述的图像清晰度检测方法，其特征在于，所述场景文本检测模型依次包括：pvanet网络、特征合并层、网络输出层，所述采用预置场景文本检测模型对所述图像进行文字区域定位，输出所述图像中各文字所在区域对应的文字区域框包括：

在所述pvanet网络中，将所述图像输入所述pvanet网络进行特征提取，得到不同尺寸的多个第一特征图；

在所述特征合并层的多个第一反卷积层中，使用多个第一反卷积核，对所述不同尺寸的各第一特征图进行上采样并向下合并，得到对应的多个第二特征图；

在所述网络输出层的第一池化层中，使用第一池化卷积核，对所述各第二特征图进行线性变换计算，得到对应的多个文字区域框。

3.根据权利要求2所述的图像清晰度检测方法，其特征在于，所述pvanet网络依次包括：激活层、inception网络、hypernet网络，所述将所述图像输入所述pvanet网络进行特征提取，得到不同尺寸的多个第一特征图包括：

在所述激活层的第一卷积层中，使用c.relu激活函数及第一卷积核，对所述图像进行非线性映射计算及卷积操作，得到对应的多个第一卷积特征图；

在所述inception网络的多个第二卷积层中，使用大小不同的多个第二卷积核，对所述各第一卷积特征图进行不同的卷积操作，得到对应不同尺寸的多个第二卷积特征图；

在所述hypernet网络的多个第三卷积层中，使用第三卷积核，对所述不同尺寸的各第二卷积特征图进行线性插值上采样及特征图融合，得到不同尺寸的多个第一特征图。

4.根据权利要求3所述的图像清晰度检测方法，其特征在于，在所述获取待检测的图像之前，还包括：

获取具有不同清晰度的多张图像样本；

将所述各图像样本输入预置全卷积网络模型，在所述全卷积网络模型的激活层的第四卷积层中，使用c.relu激活函数及第四卷积核，对所述各图像样本进行非线性映射计算及卷积操作，得到对应的多个第三卷积特征图；

在所述全卷积网络模型的inception网络的多个第五卷积层中，使用大小不同的多个第五卷积核，对所述各第三卷积特征图进行不同的卷积操作，得到对应不同尺寸的多个第四卷积特征图；

在所述全卷积网络模型的hypernet网络的多个第六卷积层中，使用多个第六卷积核，对所述不同尺寸的各第四卷积特征图进行线性插值上采样及特征图融合，得到不同尺寸的多个预测特征图；

在所述全卷积网络模型的特征合并层的多个第二反卷积层中，使用多个第二反卷积核，对所述各预测特征图进行上采样并向下合并，得到对应的多个第三特征图；

在所述全卷积网络模型的网络输出层的多个第二池化层中，使用多个第二池化卷积核，对所述各第三特征图进行线性变换计算，得到对应的多个预测文字区域框；

根据所述各预测文字框区域，调用预置损失函数采用梯度更新方法对所述全卷积网络模型进行参数优化，直至所述全卷积网络模型收敛，得到场景文本检测模型。

5.根据权利要求1-4中任一项所述的图像清晰度检测方法，其特征在于，基于无参考离散余弦变换域，对所述文字区域对应的空域进行变换，得到所述文字区域对应的频域图像包括：

基于无参考离散余弦变换域，采用离散余弦函数，对所述文字区域对应的像素数据进行计算，得到离散余弦变换系数；

基于所述离散余弦变换系数，对所述文字区域对应的空域进行正交变换，得到所述文字区域对应的频域图像。

6.根据权利要求1所述的图像清晰度检测方法，其特征在于，所述文本清晰度计算公式如下：

其中，q表示文本清晰度值，tn表示log(|c(x,y)|)大于阈值t的个数，log(|c(x,y)|)表示频域图像上每个像素值的绝对值的对数，m为所述频域图像的高，n为所述频域图像的宽。

7.根据权利要求6所述的图像清晰度检测方法，其特征在于，所述根据所述根据各文字区域的清晰度，计算所述图像的综合清晰度包括：

根据所述各文字区域的清晰度，采用预置综合清晰度计算公式，计算所述图像的综合清晰度；

其中，所述综合清晰度计算公式如下：

其中，s表示图像的综合清晰度，u表示所述文字区域的数量总和，qi表示第i个文字区域对应的文本清晰度值。

8.一种图像清晰度检测装置，所述图像清晰度检测装置包括：

获取模块，用于获取待检测的图像；

定位模块，用于采用预置场景文本检测模型对所述图像进行文字区域定位，输出所述图像中各文字所在区域对应的文字区域框；

裁剪模块，用于从所述图像中采取所述各文字区域框对应的文字区域；

变换模块，用于基于无参考离散余弦变换域，对所述文字区域对应的空域进行变换，得到所述文字区域对应的频域图像；

清晰度计算模块，用于根据所述频域图像，采用预置文本清晰度计算公式，计算所述各文字区域的清晰度；

综合清晰度计算模块，用于根据所述各文字区域的清晰度，计算所述图像的综合清晰度。

9.一种图像清晰度检测设备，其特征在于，所述图像清晰度检测设备包括：存储器和至少一个处理器，所述存储器中存储有指令，所述存储器和所述至少一个处理器通过线路互连；

所述至少一个处理器调用所述存储器中的所述指令，以使得所述图像清晰度检测设备执行如权利要求1-7中任一项所述的图像清晰度检测方法。

10.一种计算机可读存储介质，所述计算机可读存储介质上存储有指令，其特征在于，所述指令被处理器执行时实现如权利要求1-7中任一项所述的图像清晰度检测方法。

技术总结
本发明涉及人工智能领域，公开了一种图像清晰度检测方法、装置、设备及存储介质。图像清晰度检测方法包括：获取待检测的图像；采用预置场景文本检测模型对所述图像进行文字区域定位，输出所述图像中各文字所在区域对应的文字区域框；从所述图像中裁取所述各文字区域框对应的文字区域；基于无参考离散余弦变换域，对所述文字区域对应的空域进行变换，得到所述文字区域对应的频域图像；根据所述频域图像，采用预置文本清晰度计算公式，计算所述各文字区域的清晰度；根据所述各文字区域的清晰度，计算所述图像的综合清晰度。本发明可以高效且精准的检测图像的清晰度。

技术研发人员：洪叁亮;梁俊杰;赖众程
受保护的技术使用者：平安银行股份有限公司
技术研发日：2021.03.22
技术公布日：2021.07.02

完整全部详细技术资料下载

当前第2页1 2