用于物体图像的分类方法及设备、人工智能媒体平台与流程

文档序号：34042892发布日期：2023-05-05 14:22阅读：67来源：国知局

本发明属于物体图像分类的人工智能，具体涉及一种用于物体图像的分类方法一种用于物体图像的分类设备和一种人工智能媒体平台。

背景技术：

1、图像处理通常涉及数字处理图像，例如来自数字静态图像或数字视频，以确定、检测、分类特定内容图像中的特征或对象。带图案的数字图像处理识别已被用于各种各样的应用中，例如人脸识别、航拍片检测地面特征、车辆牌照确定等，不同类型的常规机器学习功能可能用于不同的模式识别，但是，传统的机器学习有许多缺点，其功能无法适应或可能难以适应数字图像处理中复杂的模式识别。

2、卷积神经网络(cnn)包含许多功能组件，这使得人们很难确定必要的网络体系结构，该体系结构必须准确执行以检测和分类与手头问题相关的图像的特定特征。此外，cnn的每个组件通常都具有与其关联的多个参数。在没有任何稳健的图像处理系统的情况下，先检验未知的参数对于成功和准确的图像分类是必需的。

3、并且目前的市场上，内容拥有者可以通过电视台、电影院等渠道将内容数据提供给消费者，内容拥有者也可以通过互联网将内容数据提供给消费者，但需要经过第三方公司，内容拥有者很难直接与消费者或商业客户沟通并提供服务，从而具有内容拥有者和消费者之间缺乏有效互动和连接时间长等优点。

4、因此，针对上述问题，予以进一步改进。

技术实现思路

1、本发明的主要目的在于提供用于物体图像的分类方法及设备、人工智能媒体平台，其通过迭代过程选择候选架构和候选参数来构建、训练和优化卷积神经网络，实现图像中的物体分类，同时提供了基于上述方法和设备的人工智能媒体平台，帮助内容拥有者通过互联网上传内容数据，通过平台对内容数据进行特征提取和多维度标注分类，并供使用者搜索、使用，实现内容拥有者直接向使用者提供内容数据，实现内容拥有者与使用者的有效互动，减少了中间环节，缩短了内容拥有者与使用者之间的连接时间。

2、为达到以上目的，本发明提供用于物体图像的分类方法，包括以下步骤：

3、步骤1：获取物体的若干预选图像并且根据预选图像创建训练图像集；

4、步骤2：选择卷积神经网络的候选架构和候选参数，通过迭代对训练图像集中的对象进行训练分类，从而获得最终的中间卷积神经网络集合：

5、步骤3：在中间卷积神经网络集合中构建标准特征池并且对后期输入的每个图像进行分类。作为上述技术方案的进一步优选的技术方案，步骤s2中的迭代具体实施为以下步骤：

6、步骤2.1：从多个卷积神经网络的候选架构中选择确定的候选架构；

7、步骤2.2：为所选的候选架构选择候选参数，所述候选参数包括学习速率、批处理大小、最大训练时期数和输入图像大小；

8、步骤2.3：针对所选确定的候选架构和候选参数选择预处理协议，以增强对象在训练图像集中的信息内容；

9、步骤2.4：使用训练图像集构建中间卷积神经网络；

10、步骤2.5：在图像验证集上评估中间卷积神经网络的性能(所述图像验证集与训练图像集不同，图像验证集在对训练中的中间卷积神经网络进行验证，以确保训练时的分类精度)，以判断中间卷积神经网络是否符合验证阈值，如不符则转至步骤2.1重复迭代过程，若符合则标记中间卷积神经网络；并且判断标记的中间卷积神经网络是否达到预定数量，若未达到则转至步骤2.1重复迭代过程，若达到则创建中间卷积神经网络集合。

11、作为上述技术方案的进一步优选的技术方案，步骤2.2中，学习速率为0.03-0.06，批处理大小为1-128个图像，最大训练时期数为50-100。

12、作为上述技术方案的进一步优选的技术方案，在步骤2.5中，判断中间卷积神经网络是否符合验证阈值包括确定所述中间卷积神经网络在图像验证集上的错误率是否小于20％。

13、作为上述技术方案的进一步优选的技术方案，在步骤2.5中，中间卷积神经网络的预定数量为25。

14、作为上述技术方案的进一步优选的技术方案，在步骤2.3中，预处理协议包括局部对比度归一化和独立分量分析。

15、作为上述技术方案的进一步优选的技术方案，在步骤s3中，由于通过对训练图像集的迭代处理，从而获得满足物体图像分类的中间卷积神经网络集合，一般而言，最终获得的中间卷积神经网络集合的分类精度较高，但是随着后期输入图像的种类和数量越来越多，代表图像中的特征的种类和数量越来越多，或者在刚开始构建训练图像集时，输入的预选图像比较片面，没有涵盖大所述的图像对应的特征，所以中间卷积神经网络集合对于物体图像的分类的精确度会越来越低，因此需要动态调整，从而满足对输入的图像的分类保持在一定的精度范围，其具体实施为：

16、中间卷积神经网络集合设有根据预选图片训练完成的标准特征池并且在标准特征池中包括若干图像对应的标准特征，每个标准特征对应一个类别(每个图像至少包括一个类别)，在中间卷积神经网络集合对后期输入的每个图像进行分类时，提取图像的所有实际特征并且将所有实际特征与实时更新的标准特征池中对应的标准特征进行比对，并且根据比对结果将对应的图像标记符合的类别，从而对当前图像进行分类，其中：

17、如果图像的任一实际特征与对应的标准特征(对应的标准特征为在标准特征池中与当前实际特征匹配度最高的标准特征)的匹配度在第一范围时(优选为80％以上)，则将图像的该实际特征标记为该标准特征对应的类别；

18、如果图像的任一实际特征与对应的标准特征的匹配度在第二范围时(优选为50-80％以上)，则将图像的该实际特征设为存疑状态，并且通过图像验证集对存疑状态的该实际特征进行验证(可通过人工进行验证)，如果该实际特征验证为匹配对应的标准特征(即该实际特征正确对应该标准特征)，则对该标准特征进行动态调整(以将之前有误差的标准特征进行修改，以更加精确对应类别)，以使得该实际特征与动态调整后的标准特征的匹配度在第一范围并且将图像的该实际特征标记为该标准特征对应的类别；如果该实际特征验证为不匹配对应的标准特征(即该实际特征错误对应该标准特征)，则将该实际特征作为新的标准特征补入到标准特征池中并且将新的标准特征设立新的类别，最后将图像的该实际特征标记为新补入的标准特征对应的类别；

19、如果图像的任一实际特征与对应的标准特征的匹配度在第三范围时(优选为50％以下)，则直接将该实际特征作为新的标准特征补入到标准特征池中并且将新的标准特征设立新的类别，最后将图像的该实际特征标记为新补入的标准特征对应的类别。

20、值得一提的是，通过不断实时动态调整和补入新标准特征的标准特征池，以使得本发明构建的中间卷积神经网络集合具有一个学习成长的功能，从而对于图像分类更加准确。

21、为达到以上目的，本发明还提供用于物体图像的分类设备，应用于物体图像的分类方法，包括设置在单个或多个计算机上的数据存储器、处理器和图像处理平台，其中：

22、数据存储器包括物理存储器、硬盘驱动器、光盘驱动器、闪存驱动器和驱动器阵列(的一种或多种)；

23、处理器包括微处理器、微控制器、专用集成电路和图形处理单元，用于执行图像处理功能；

24、图像处理平台包括训练电路、模型构建器、验证电路和分类器，训练电路用于根据物体的图像构建训练图像集，所述训练集数据包括新的对象和/或原有的对象的图像，模型构建器用于选定候选架构和候选参数，并且选择预处理协议来增强图像中的信息内容，以在训练图像集上构建卷积神经网络模型的中间卷积神经网络，验证电路用于在图像验证集上验证中间卷积神经网络是否满足验证阈值，分类器用于根据满足阈值的中间卷积神经网络对图像验证集中每个图像中的物体进行分类。

25、作为上述技术方案的进一步优选的技术方案，所述数据存储器包括易失性和/或非易失性数据存储器。

26、为达到以上目的，本发明还提供人工智能媒体平台，包括服务器、注解引擎模块、搜索引擎模块和推送引擎模块，其中：

27、所述注解引擎模块、搜索引擎模块和推送引擎模块均内置于服务器上；服务器设有与内容拥有者对接的接口，用于获取并存储内容拥有者上传的内容数据，所述内容数据包括图片、视频；

28、所述搜索引擎模块用于根据使用者输入的特征搜索寻找服务器中对应的内容或内容片段；

29、所述推送引擎模块用于根据使用者历史输入的特征推送相关的内容或内容片段；

30、所述注解引擎模块用于对服务器上存储的内容数据进行多维度标注，每一项内容数据均标注有若干个特征，所述特征包括文字标注特征、语音标注特征和图像标注特征，所述注解引擎模块包括上述物体图像的分类设备，用于完成图像标注特征，从而对包括对图像或视频每一帧中的人物、物体、背景等物体进行分类提取。

31、作为上述技术方案的进一步优选的技术方案，推送引擎模块通过隐私通道或者公开通道进行推送，其中：

32、隐私通道为只有当前使用者获知推送给自身的相关内容或内容片断(适合私人号使用)，而公开通道为除了当前使用者之外，服务器上其余所有的使用者都可以获知当前使用者推送给自身的相关内容或内容片断(适合公众号使用)；

33、对于隐私通道，在使用者和服务器之间建立隐私通道时，服务器设立一个唯一的隐私密钥并且将隐私密钥传发送到当前使用者，以使得使用者通过隐私密钥获取推送的相关内容或内容片段；

34、在一个人工智能媒体平台中设有若干服务器并且通过区块链将各个服务器进行连接，每个服务器为一个子区块链，当一个服务器将隐私密钥发送到使用者时，必须通过周围至少一个服务器的验证，以确保当前服务器没有被入侵篡改，从而确保发送的隐私密钥只为当前使用者可知。

35、本发明采用以上技术方案与现有技术相比，具有以下技术效果：

36、本发明能够帮助内容拥有者建立直接面向消费者(使用者)的交付模型，通过绕过运营商交付内容的方式，可以节约大量的发行成本和发行时间，同时本发明的平台能够让内容拥有者和消费者直接参与以及高度互动，通过人工智能算法的分析和判断，推荐相关的内容，满足消费者及商业客户可进行多维度查找的需求。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：陈怡泽刘凯金俊阳
技术所有人：南京智眸科技有限公司
我是此专利的发明人

上一篇：一种落料堆垛装置的制作方法
上一篇：储电模组、储能装置及电动工具的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。