本技术属于数据处理,特别涉及一种基于图像识别的多宠物喂食的方法及装置。
背景技术:
1、为了满足宠物主人的需求和便捷性,宠物喂食器作为一种创新的设备应运而生。宠物喂食器旨在为主人提供一种自动喂食的解决方案,有助于减轻日常喂食的工作负担。然而,传统的宠物喂食器通常存在一些缺点,如缺乏定时、定量喂食功能,宠物主人的工作和生活节奏可能导致不规律的喂食时间表和食物量,这不利于宠物的健康;另一方面,当家中养多只宠物时,难以实现对不同宠物的定量喂食,可能导致饮食不平衡、过量喂食或宠物争夺食物等问题。这些缺点都限制了宠物喂食器在家庭中的普及和应用。
技术实现思路
1、为了解决上述技术问题,本技术提供一种基于图像识别的多宠物喂食方法及装置,解决多宠物家庭的喂食难题。
2、本技术的第一个方面,一种基于图像识别的多宠物喂食方法,主要包括:
3、步骤s1、持续获取宠物喂食区域的图像;
4、步骤s2、基于预先训练好的宠物检测模型对持续输入的多幅图像进行检测,获得包含宠物的宠物图像区域;
5、步骤s3、基于预先训练好的宠物身份识别模型对所述宠物图像区域进行宠物身份的识别,获取宠物的个体身份;
6、步骤s4、确定与所述宠物的个体身份匹配的喂食参数,按照所述喂食参数投递食物。
7、优选的是,步骤s1进一步包括:
8、步骤s11、确定待喂食的各宠物的最近投喂时间;
9、步骤s12、在距所述最近投喂时间前设定时间,启动图像采集模块,持续获取宠物喂食区域的图像。
10、优选的是,步骤s2进一步包括:
11、步骤s21、基于所述宠物检测模型输出包含宠物的检测框坐标、置信度及宠物预测类别;
12、步骤s22、过滤置信度低于预设值的检测框,保留包含宠物的宠物图像区域。
13、优选的是,步骤s21之前,进一步包括通过以下步骤训练所述宠物检测模型:
14、步骤s211、获取包含不同宠物类型、不同背景、不同姿势和不同光照条件下的图像作为训练数据,并对所述训练数据进行宠物目标框及类别的标注;
15、步骤s212、基于待训练的宠物检测模型处理所述训练数据,获得包含宠物的检测框坐标、置信度及宠物预测类别的输出;
16、步骤s213、基于以下公式确定宠物检测模型的总损失ldet:
17、ldet= λcoord* lcoord+ λconf* lconf+ λcls* lcls;
18、其中,lcoord、lconf、lcls分别为坐标回归损失、置信度损失和分类损失,λcoord、λconf、λcls分别为坐标回归损失、置信度损失和分类损失的权重;
19、步骤s214、基于总损失ldet更新宠物检测模型的待优化权重参数,直至所述待优化权重参数收敛,获得最终的宠物检测模型。
20、优选的是,步骤s3进一步包括:
21、步骤s31、基于宠物身份识别模型获取宠物的特征向量;
22、步骤s32、计算所述特征向量与数据库中各样本特征向量的距离,确定距离最小的样本特征向量,从而确定宠物的个体身份。
23、优选的是,步骤s31中,使用标注了个体身份id的宠物图像数据集进行模型训练,并使用交叉熵损失和三元组损失共同优化宠物身份识别模型,所述宠物身份识别模型的总损失lid为:
24、lid= λce* lce+ λtriplet* ltriplet;
25、其中,lce、ltriplet分别为交叉熵损失和三元组损失,λce、λtriplet分别为交叉熵损失和三元组损失的权重系数。
26、优选的是,步骤s4进一步包括:
27、按设定速率投递与所述宠物的个体身份匹配的食物,并在未检测到该个体身份的宠物时,停止投放食物。
28、本技术第二方面,一种基于图像识别的多宠物喂食装置,主要包括:
29、宠物喂食区域图像获取模块,用于持续获取宠物喂食区域的图像;
30、宠物图像区域获取模块,用于基于预先训练好的宠物检测模型对持续输入的多幅图像进行检测,获得包含宠物的宠物图像区域;
31、宠物识别模块,用于基于预先训练好的宠物身份识别模型对所述宠物图像区域进行宠物身份的识别,获取宠物的个体身份;
32、投食模块,用于确定与所述宠物的个体身份匹配的喂食参数,按照所述喂食参数投递食物。
33、优选的是,所述宠物喂食区域图像获取模块包括:
34、投喂时间计时单元,用于确定待喂食的各宠物的最近投喂时间;
35、图像采集启动单元,用于在距所述最近投喂时间前设定时间,启动图像采集模块,持续获取宠物喂食区域的图像。
36、优选的是,所述宠物图像区域获取模块进一步包括:
37、模型输出单元,用于基于所述宠物检测模型输出包含宠物的检测框坐标、置信度及宠物预测类别;
38、过滤单元,用于过滤置信度低于预设值的检测框,保留包含宠物的宠物图像区域。
39、优选的是,进一步包括通过以下单元训练所述宠物检测模型:
40、训练数据标注单元,用于获取包含不同宠物类型、不同背景、不同姿势和不同光照条件下的图像作为训练数据,并对所述训练数据进行宠物目标框及类别的标注;
41、模型实际输出单元,用于基于待训练的宠物检测模型处理所述训练数据,获得包含宠物的检测框坐标、置信度及宠物预测类别的输出;
42、损失确定单元,用于基于以下公式确定宠物检测模型的总损失ldet:
43、ldet= λcoord* lcoord+ λconf* lconf+ λcls* lcls;
44、其中,lcoord、lconf、lcls分别为坐标回归损失、置信度损失和分类损失,λcoord、λconf、λcls分别为坐标回归损失、置信度损失和分类损失的权重;
45、循环优化单元,用于基于总损失ldet更新宠物检测模型的待优化权重参数,直至所述待优化权重参数收敛,获得最终的宠物检测模型。
46、优选的是,所述宠物识别模块包括:
47、特征向量输出单元,用于基于宠物身份识别模型获取宠物的特征向量;
48、距离计算单元,用于计算所述特征向量与数据库中各样本特征向量的距离,确定距离最小的样本特征向量,从而确定宠物的个体身份。
49、优选的是,使用标注了个体身份id的宠物图像数据集进行模型训练,并使用交叉熵损失和三元组损失共同优化宠物身份识别模型,所述宠物身份识别模型的总损失lid为:
50、lid= λce* lce+ λtriplet* ltriplet;
51、其中,lce、ltriplet分别为交叉熵损失和三元组损失,λce、λtriplet分别为交叉熵损失和三元组损失的权重系数。
52、优选的是,所述投食模块包括:
53、投食控制单元,用于按设定速率投递与所述宠物的个体身份匹配的食物,并在未检测到该个体身份的宠物时,停止投放食物。
54、本技术的第三方面,一种计算机设备,包括处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序用于实现如上任一项所述的基于图像识别的多宠物喂食方法。
55、本技术的第四方面,一种可读存储介质,所述可读存储介质存储有计算机程序,所述计算机程序被处理器执行时用于实现如上所述的基于图像识别的多宠物喂食方法。
56、本技术实现家庭拥有多个宠物的定时、定量投喂,减轻了宠物主人的喂食负担。