本发明涉及数据库技术领域,具体为基于数据库的人工智能样本图管理方法。
背景技术:
分布式数据库系统是在集中式数据库系统的基础上发展起来的,它是计算机信息技术和网络技术相结合的产物。分布式数据库系统有两种模式:一种是物理分布式,但是它在逻辑上却还是集中的;另一种则是在物理上和逻辑上都是分布的,即联邦式分布数据库系统。分布式数据库具有以下几个明显的特点:1.数据的独立性与位置的透明性;2.数据的集中和节点自治相结合;3.各个局部的数据库能够满足集中数据库的一致性、可恢复性以及可串行性的要求;4.保证复制数据的透明性和及时更新;5.在一定条件下,可以通过增加服务器来实现进一步的分布数据和分担处理任务的要求。分布式数据除了上述的一些特点外,还具有很多独特的优点,例如,分布式数据库系统具有灵活的体系结构,其系统的可靠性高,可用性好;它能使用分布式的管理和控制,可拓展性好,易于集成现有系统,局部应用的响应速度快等。
在做基于人工智能深度学习的图片标记、训练和测试时需要不同种类的图片,同时这些图片需要一些附带信息。用数据库可以很方便地进行管理,但是又面临着数据量过大的问题,并且数据在不同地方能共享,用户能并发地增删改查。基于此,发明了这个用于人工智能样本图管理的分布式数据库系统管理方法。
技术实现要素:
(一)解决的技术问题
针对现有技术的不足,本发明主要应用于人工智能样本图的管理,本发明提供了基于数据库的人工智能样本图管理方法,具备可以通过公司产品、相机位、接受时间、标记时间、训练时间来查找图片、相应的标记信息和各种训练信息。同时给每个图片编了号,图片和标记信息只存一次,以前标记信息用json配置文件存,现在也加入数据库,大大减少硬盘存储空间。另外界面集成标记和一键训练,训练操作更加简单了等优点,解决了因为图片有来自不同公司产品,同时有各种混合训练集,用文件夹管理,查找不方便、占过多硬盘而且标记训练不方便。如果不同地方的用户要使用数据库,就要创建分布式数据库系统,多地方的用户共享数据库的问题。
(二)技术方案
为实现上述可以通过公司产品、相机位、接受时间、标记时间、训练时间来查找图片、相应的标记信息和各种训练信息。同时给每个图片编了号,图片和标记信息只存一次,以前标记信息用json配置文件存,现在也加入数据库,大大减少硬盘存储空间。另外界面集成标记和一键训练,训练操作更加简单的目的,本发明提供如下技术方案:基于数据库的人工智能样本图管理方法,包括以下的步骤:
第一步、数据表实现:给每个导入的图片一个id,有相应图片地址,有多个训练集时间,可存储混合训练;
第二步、导入图片:将图片信息存入数据库,先选择路径,将路径下所有图片绝对路径、产品、公司、相机、负责人、备注存入数据库,同一文件夹下图片是同一产品、公司、相机、负责人,并且路径不改变;
第二步、添加标记集:可选择多项产品相机,将标记集信息存入数据库,默认标记集可多次添加,最后标记会覆盖以前标记;
第三步、标记:图片标记信息存入数据库,标记信息可覆盖;
第四步、训练:将标记的图片通过标记信息剪切成正负样本,最后训练,训练是不可覆盖的,每训练一次数据表加一行信息,最终相应路径生成模型文件。
优选的,本发明采用的编程语言为c#。
优选的,本发明连接数据库,创建工具类dbutils,包括方法增加表行、查询、修改,将操作集成到界面上,包括导入图片,查询图片选为标记集,标记图片,训练。
优选的,本发明对于多个关键词,将所有关键词做出树状结构,符合图片本来的存储结构,关键词包括产品、公司、相机、时间,由先到后的。
优选的,本发明用自制的控件库来完成标记和图片的查看。
优选的,本发明用自制的训练库进行训练。
优选的,本发明采用的数据库是sqlserver2008r2。
优选的,本发明为了能实现远程访问,启用用户名,并且设置sqlserver网络配置,然后新建数据库。
(三)有益效果
与现有技术相比,本发明提供了基于数据库的人工智能样本图管理方法,具备以下有益效果:
该基于数据库的人工智能样本图管理方法,提供了基于数据库的人工智能样本图管理方法,具备可以通过公司产品、相机位、接受时间、标记时间、训练时间来查找图片、相应的标记信息和各种训练信息。同时给每个图片编了号,图片和标记信息只存一次,以前标记信息用json配置文件存,现在也加入数据库,大大减少硬盘存储空间。另外界面集成标记和一键训练,训练操作更加简单了等优点,解决了因为图片有来自不同公司产品,同时有各种混合训练集,用文件夹管理,查找不方便、占过多硬盘而且标记训练不方便。如果不同地方的用户要使用数据库,就要创建分布式数据库系统,多地方的用户共享数据库的问题。
附图说明
图1为本发明提出的基于数据库的人工智能样本图管理方法的用户操作流程图;
图2为本发明提出的基于数据库的人工智能样本图管理方法的数据表结构;
图3为本发明提出的基于数据库的人工智能样本图管理方法的导入图片流程图;
图4为本发明提出的基于数据库的人工智能样本图管理方法的竖状查询结构;
图5为本发明提出的基于数据库的人工智能样本图管理方法的标记步骤操作结果。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1-5,基于数据库的人工智能样本图管理方法,包括以下的步骤:
第一步、数据表实现:给每个导入的图片一个id,有相应图片地址,有多个训练集时间,可存储混合训练;
第二步、导入图片:将图片信息存入数据库,先选择路径,将路径下所有图片绝对路径、产品、公司、相机、负责人、备注存入数据库,同一文件夹下图片是同一产品、公司、相机、负责人,并且路径不改变;
第二步、添加标记集:可选择多项产品相机,将标记集信息存入数据库,默认标记集可多次添加,最后标记会覆盖以前标记;
第三步、标记:图片标记信息存入数据库,标记信息可覆盖;
第四步、训练:将标记的图片通过标记信息剪切成正负样本,最后训练,训练是不可覆盖的,每训练一次数据表加一行信息,最终相应路径生成模型文件。
本发明采用的编程语言为c#。
本发明连接数据库,创建工具类dbutils,包括方法增加表行、查询、修改,将操作集成到界面上,包括导入图片,查询图片选为标记集,标记图片,训练。
本发明对于多个关键词,将所有关键词做出树状结构,符合图片本来的存储结构,关键词包括产品、公司、相机、时间,由先到后的。
本发明用自制的控件库来完成标记和图片的查看。
本发明用自制的训练库进行训练。
本发明采用的数据库是sqlserver2008r2。
本发明为了能实现远程访问,启用用户名,并且设置sqlserver网络配置,然后新建数据库。
综上所述,该基于数据库的人工智能样本图管理方法,将sqlserver2008r2开启数据库的远程连接:打开sqlserver,登录,改服务器属性为混合登录模式;勾选连接选项的“允许远程连接此服务器”;在安全性,登录名:“sa”的属性中,选择“sqlserver身份验证”,并设置密码;右键服务器选择“方面”,在“服务器配置”中,将“remoteaccessenabled”属性设为“true”,至此,ssms设置完毕,成功启用sa账户登录;设置sscm,打开sqlserver配置管理器,启动“sqlserver”和“sqlserverbrowser”,在sqlserver网络配置节点下的sqlexpress的协议右侧的tcp/ip点击启用,选择“ip地址”选项卡,设置tcp的端口为“1433”。将客户端协议的“tcp/ip”修改为“enabled”。这样,sqlserver远程连接设置完成;此数据库的逻辑是一个整体,表列为图片路径、公司、产品、相机、负责人、标记信息、接受时间、标记集时间、训练集时间;通过时间的不同来分标记集、训练集。这样的单表查询的查询效率会更高,可重用性更高。从逻辑架构分层原则来看,相对于关联查询,单表查询的数据库消耗cpu、内存、io等资源会大大减少;导入图片:导入图片对物理图片和路径不做变化,只把相关信息存入数据库,导入图片步骤见图3;查询图片生成标记集:将所以图片分成公司、产品、相机、时间这样依次从高到低的树状结构,查询后显示到界面的树状控件,可任意多选这些条件进行查询;关于查询,只是一条语句连接查询,这样打开关闭数据库的操作越少,经检验,大于200条数据后,只用一条数据查询的效率更高一些,花的时间更少一些界面的树状结构和查询结果见图4;标记:标记控件为自开发的c#控件,功能有鼠标画四边形、矩形;鼠标对绘制图形的拉伸、平移、旋转,图片的缩放、平移,将绘制信息实时存入数据库,操作结果见图5;剪切训练:查询所以标记了的图片,根据所需作为训练集。先把这些图片复制到一个文件夹,将标记信息存到一个txt文件,然后通过开发的库剪切和训练。
需要说明的是,术语“包括”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。