基于深度学习的户型图识别方法与流程

文档序号:14390273阅读:810来源:国知局

本发明涉及一种基于深度学习的户型图识别方法。



背景技术:

在房产领域的户型图分类还在采用人工方式或者简单的机器辅助方式,工作效率极低,效果也是良莠不齐。

现有方式的工作效率极低,成本极高,基于人工的分类不仅费时费力,而且很难保证质量,也很难对质量进行评测和监控,不能适应海量数据的处理,很难面对大数据时代的挑战。



技术实现要素:

为克服现有技术的缺陷,本发明提供一种基于深度学习的户型图识别方法,本发明的技术方案是:

基于深度学习的户型图识别方法,包括以下步骤:

(1)训练数据的采集及预处理;

(2)进行模型训练;

(3)模型的使用。

所述的步骤(1)具体为:

(1-1)利用网络爬虫采集了多个房产官网的房源图片信息,结合采集页面的规则以及发现数据源特点,根据房产官网的标记信息为图片标记标签,具体获取标签方法如下:

a、找到标记该图片标签的兄弟标签,发现是否有标识该图片属性的标签,如果有则进行获取;

b、解析图片的url,检测是否包含能标识图片类型的标签,如果有则进行获取;

(1-2)对采集的数据进行预处理:

a、将采集的图片缩放成短边100px的图片;

b、然后随机切割成100pxx100px的图片作为训练样本;

c、使用数据增强方法,对图片进行角度旋转,对每个图片,以图片中心点为中心分别逆时针旋转90度、180度和270度;

所述的步骤(2)具体为:

(2-1)使用pytorch深度学习框架训练,模型的方法使用的cnn卷积神经网络,网络共分8层,分别为第一层卷积层,第二层卷积层,第三层池化层,第四层卷积层,第五层卷积层,第六层池化层,第七层全联接层,第八层全联接层,第七层以及第八层的全联接层以及标签通过交叉熵损失函数计算损失进行反向传播,通过rmsprop优化方法调整学习率,调整参数,共训练30个epoch。

所述的步骤(3)具体为:基于flask框架提供api接口,提前预加载步骤(2)的模型,具体步骤如下:

(4-1)在flask文件入口处添加模型的加载函数,

(4-2)读取步骤(2)中训练好了模型参数,

(4-3)搭建同步骤(2)中训练好的模型参数的网络,并读取的模型参数初始化网,这样就复现了步骤(2)训练的模型,

(4-4)保存此模型在内存中让模型常驻内存。

所述的步骤(3)具体为:进行离线批量处理,具体步骤如下:

(5-1)提供了快速下载图片接口,批量下载大量图片,

(5-2)模型本身提供batch使用接口,每次读取batch个数据进入模型然后批量使用算法处理,速度为2~3张/秒。

本发明的优点是:未使用人工标注,节约人力;模型结构简单,训练和使用都比较省时;多种只用接口可以满足不同场景需求。

具体实施方式

下面结合具体实施例来进一步描述本发明,本发明的优点和特点将会随着描述而更为清楚。但这些实施例仅是范例性的,并不对本发明的范围构成任何限制。本领域技术人员应该理解的是,在不偏离本发明的精神和范围下可以对本发明技术方案的细节和形式进行修改或替换,但这些修改和替换均落入本发明的保护范围内。

本发明涉及一种基于深度学习的户型图识别方法,包括以下步骤:

(1)训练数据的采集及预处理;

(2)进行模型训练;

(3)模型的使用。

所述的步骤(1)具体为:

(1-1)利用网络爬虫采集了多个房产官网的房源图片信息,结合采集页面的规则以及发现数据源特点,根据房产官网的标记信息为图片标记标签,具体获取标签方法如下:

a、找到标记该图片标签的兄弟标签,发现是否有标识该图片属性的标签,如果有则进行获取;

b、解析图片的url,检测是否包含能标识图片类型的标签,如果有则进行获取;

(1-2)对采集的数据进行预处理:

a、将采集的图片缩放成短边100px的图片;

b、然后随机切割成100pxx100px的图片作为训练样本;

c、使用数据增强方法,对图片进行角度旋转,对每个图片,以图片中心点为中心分别逆时针旋转90度、180度和270度;

所述的步骤(2)具体为:

(2-1)使用pytorch深度学习框架训练,模型的方法使用的cnn卷积神经网络,网络共分8层,分别为第一层卷积层,第二层卷积层,第三层池化层,第四层卷积层,第五层卷积层,第六层池化层,第七层全联接层,第八层全联接层,第七层以及第八层的全联接层以及标签通过交叉熵损失函数计算损失进行反向传播,通过rmsprop优化方法调整学习率,调整参数,共训练30个epoch。

所述的步骤(3)具体为:基于flask框架提供api接口,提前预加载步骤(2)的模型,具体步骤如下:

(4-1)在flask文件入口处添加模型的加载函数,

(4-2)读取步骤(2)中训练好了模型参数,

(4-3)搭建同步骤(2)中训练好的模型参数的网络,并读取的模型参数初始化网,这样就复现了步骤(2)训练的模型,

(4-4)保存此模型在内存中让模型常驻内存。

所述的步骤(3)具体为:进行离线批量处理,具体步骤如下:

(5-1)提供了快速下载图片接口,批量下载大量图片,

(5-2)模型本身提供batch使用接口,每次读取batch个数据进入模型然后批量使用算法处理,速度为2~3张/秒。



技术特征:

技术总结
本发明涉及一种基于深度学习的户型图识别方法,包括以下步骤:(1)训练数据的采集及预处理;(2)进行模型训练;(3)模型的使用。本发明的优点是:未使用人工标注,节约人力;模型结构简单,训练和使用都比较省时;多种只用接口可以满足不同场景需求。

技术研发人员:白峻峰;张文战;刘子曜;苏伟杰
受保护的技术使用者:北京诸葛找房信息技术有限公司
技术研发日:2017.12.27
技术公布日:2018.05.08
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1