基于模糊k近邻的三维模型半自动标注方法及系统的制作方法

文档序号：6559439阅读：232来源：国知局

专利名称：基于模糊k近邻的三维模型半自动标注方法及系统的制作方法
技术领域：
本发明涉及一种三维模型标注方法，特别是一种基于模糊K近邻的三维模型半自动标注方法。
背景技术：
随着计算机软、硬件性能的提高和计算机图形学的发展，以及许多优秀的三维模型建模软件的出现，三维模型的应用越来越广泛，并在许多领域扮演着越来越重要的角色，比如虚拟现实、建筑设计、机械制造、3D游戏、3D电影、计算机辅助设计、考古、生物、医学等领域，三维化正成为一种流行趋势。日益发达的互联网技术为人们对三维模型的共享和处理提供了便利条件，越来越多的三维模型库涌现了出来，比如Google 3D Warehouse,3D Cafe等。如何迅速查找到所需的模型已成为继图像、视频检索之后的又一个热门课题。基于关键词的文本检索是人们最熟悉的检索方式，Google、百度都已成为人们生活中常用工具，但这些三维模型的文件格式均是为逼真绘制设计的，文件中包含三维对象的几何、纹理、材质、光照等丰富的显示信息，但这些信息均不能直接供计算机理解三维模型的语义内容。如果采用人工标注，则工作量大，又极为繁琐。目前国内夕卜公开的文献中，Fan Yachun，Zhou Mingquan. "Semantic-oriented 3d Object Retrieval Using Visual Vocabulary Labeling.，，International Joint Conference on Artificial Intelligence, 2009.提出了一种根据三维模型的语义信息进行检索的方法，首先建立一个语义词汇库，并提取三维模型的顶点直方图特征和正交投影特征作为语义词汇的映射特征，然后根据语义词汇映射的特征进行三维模型检索或对模型进行分类° Corey Goldfeder, Peter Allen. "Auto-tagging To Improve Text Search For 3D Models” .ACM Conference on Digital Libraries, 2008.提出了采用 Zernike 矩特征进行相似性匹配，然后通过计算语义词汇和模型间的置信度来完成模型的标注的方法。周志华，张敏灵.“MIML 多示例多标记学习.”提出了一种对多义性模型的标注方法，将场景分割成多个示例，然后对多个示例分别标注学习，最后用一个标注集合来表示模型。上述文献的解决思路有以下几点不足1)处于聚类区域边缘附近的样本易出现误判，误判的原因有多种特征本身的区分度不够、类别本身的含义模糊等。在这种情况下，如果采用确定的分类结果，往往会得到错误的类别标签；幻模型标注的自动化体现不够，过多依赖人为的判断；幻三维模型训练库中为语义词汇映射特征信息，而这些通过平均方法得到特征不能够准确地描述语义词汇，也损失了很多模型的内容信息。

发明内容
本发明的目的在于提供了一种基于模糊K近邻的三维模型半自动标注方法，该方法根据模型特征自动地提取三维模型的语义信息，完善其文本标注，以便于根据文本标注来检索三维模型。该方法使基于文本关键词的三维模型检索更加准确便捷，满足了用户方便准确地检索三维模型的需求，具有广泛的应用前景。
本发明中的三维模型半自动标注方法采用一种复合特征向量DESIRE来描述三维模型，并考虑到处于聚类区域边缘附近的样本易出现误判的因素，采用模糊K近邻(FKNN) 分类器得到模糊化的分类结果，并通过计算分类结果的不确定度来决定哪些模型需要通过相关性反馈的方式来确认分类结果，并引入训练学习机制，重复地学习计算，做到自动化标注模型。本发明中的基于模糊K近邻的三维模型半自动标注方法，包括如下步骤三维模型训练库建立步骤，建立三维模型训练库，所述训练库中包含三维模型的名称、几何结构信息、语义类别信息和特征信息；相似性匹配步骤，对用户输入的待标注模型提取特征向量，并与三维模型训练库里的模型做相似性匹配，找到k个与待标注模型最相近的近邻模型，所述k的取值范围为大于0且小于三维模型训练库里的模型数；模糊化分类步骤，基于相似性匹配步骤得到的k个近邻模型及它们的语义类别信息，采用模糊K近邻分类方法进行分类，得到模糊化的分类结果；分类不确定度计算步骤，基于模糊化的分类结果计算各个待标注模型的分类不确定度；训练学习步骤，基于分类不确定度计算步骤得到的分类不确定度，低于不确定度阈值的直接完成分类标注，高于不确定度阈值的通过相关性反馈和重新进行模糊分类方法完成分类标注；训练库添加步骤，完成分类标注的模型，按照已建立的三维模型训练库的存储格式，添加进训练库。所述三维模型训练库建立步骤进一步包括训练库设计步骤，所述训练库包括 Modennfo、Label、fvData和Label_Model四个表；ModeUnfo表存储了三维模型的名称、顶点数、面片数和模型文件的存储路径，Label表存储了语义类别ID、语义类别名称和父类别 ID，Label_Model表存储了 ModelInfo表和Label表之间多对多的映射关系，fvData表存储了三维模型的特征向量的下标和向量值信息；数据的批量导入步骤，提取PSB模型库里的各个模型的几何信息及其所属语义类别信息，添加到建好的训练库中的Modellnfo、Label 和LabelModel表中；特征信息的提取和导入步骤，提取PSB模型库中的所有三维模型的特征向量，添加到fvData表里，至此，三维模型训练库建立完成。所述相似性匹配步骤进一步包括待标注模型格式转换，将待标注模型转换为 off格式；特征向量提取步骤，提取待标注模型的特征向量；近邻模型确定步骤，将待标注模型的特征向量与训练库中模型的特征向量进行相似性匹配，找到k个近邻模型，所述k的取值范围为1 N，其中N为训练库中的模型总数。所述近邻模型确定步骤进一步包括相似距离计算步骤，分别计算待标注模型特征向量χ与训练库中的各个模型特征向量Xi间的相似距离dist(x，Xi)；相似模型确定步骤，按相似性距离由小到大的排序，找到前k个与待标注模型最相似的模型。所述模糊化分类步骤进一步包括判断待标注模型X与k个近邻模型中最小的距离dist(X，Xi)是否等于O ；如果等于0，则认为待标注模型χ和近邻模型Xi是相同的，将待标注模型χ直接归为近邻模型Xi所属的语义类别；如果不等于0，则统计出k个近邻模型所属的语义类别，假设共有c个类别；依次计算出待标注模型Χ隶属于第j个语义类别Cj的
可能性大小计算公式如下
权利要求
1.一种基于模糊K近邻的三维模型半自动标注方法，其特征在于，包括如下步骤三维模型训练库建立步骤，建立三维模型训练库，所述训练库中包含三维模型的名称、几何结构信息、语义类别信息和特征信息；相似性匹配步骤，对用户输入的待标注模型提取特征向量，并与三维模型训练库里的模型做相似性匹配，找到k个与待标注模型最相近的近邻模型，所述k的取值范围为大于0 且小于三维模型训练库里的模型数；模糊化分类步骤，基于相似性匹配步骤得到的k个近邻模型及它们的语义类别信息，采用模糊K近邻分类方法进行分类，得到模糊化的分类结果；分类不确定度计算步骤，基于模糊化的分类结果计算各个待标注模型的分类不确定度；训练学习步骤，基于分类不确定度计算步骤得到的分类不确定度，低于不确定度阈值的直接完成分类标注，高于不确定度阈值的通过相关性反馈和重新进行模糊分类方法完成分类标注；训练库添加步骤，完成分类标注的模型，按照已建立的三维模型训练库的存储格式，添加进训练库。
2.根据权利要求1所述的一种基于模糊K近邻的三维模型半自动标注方法，其特征在于所述三维模型训练库建立步骤进一步包括训练库设计步骤，所述训练库包括Modellnfo、Label、fvData和Label Model四个表； ModelInfo表存储了三维模型的名称、顶点数、面片数和模型文件的存储路径，Label表存储了语义类别ID、语义类别名称和父类别ID ,Label Model表存储了 Mode IInfo表和Label 表之间多对多的映射关系，fvData表存储了三维模型的特征向量的下标和向量值信息；数据的批量导入步骤，提取PSB模型库里的各个模型的几何信息及其所属语义类别信息，添加到建好的训练库中的Modellnfo、Label和Label_Model表中；特征信息的提取和导入步骤，提取PSB模型库中的所有三维模型的特征向量，添加到 fvData表里，至此，三维模型训练库建立完成。
3.根据权利要求1所述的一种基于模糊K近邻的三维模型半自动标注方法，其特征在于所述相似性匹配步骤进一步包括待标注模型格式转换，将待标注模型转换为off格式；特征向量提取步骤，提取待标注模型的特征向量；近邻模型确定步骤，将待标注模型的特征向量与训练库中模型的特征向量进行相似性匹配，找到k个近邻模型，所述k的取值范围为1 N，其中N为训练库中的模型总数。
4.根据权利要求3所述的一种基于模糊K近邻的三维模型半自动标注方法，其特征在于所述近邻模型确定步骤进一步包括相似距离计算步骤，分别计算待标注模型特征向量χ与训练库中的各个模型特征向量 Xi间的相似距离di st (X，Xi)；相似模型确定步骤，按相似性距离由小到大的排序，找到前k个与待标注模型最相似的模型。
5.根据权利要求1所述的一种基于模糊K近邻的三维模型半自动标注方法，其特征在于所述模糊化分类步骤进一步包括判断待标注模型χ与k个近邻模型中最小的距离dist(x，Xi)是否等于0 ；如果等于0，则认为待标注模型χ和近邻模型Xi是相同的，将待标注模型χ直接归为近邻模型Xi所属的语义类别；如果不等于0，则统计出k个近邻模型所属的语义类别，假设共有c个类别；依次计算出待标注模型χ隶属于第j个语义类别 .的可能性大小/ 00，计算公式如下对各个类别的可能性 ω按由大到小的顺序进行排序，完成模糊化分类。
6.根据权利要求1所述的一种基于模糊K近邻的三维模型半自动标注方法，其特征在于所述分类不确定度计算步骤进一步包括计算模型的分类不确定度，采用计算分类结果的信息熵的方法来计算不确定度，信息熵越大，表示分类的不确定程度越大，计算公式如下其中U1为第i个模型的不确定度，c为模型可能所属的类别数； Hik = -PikIogPik-(I-Pik)Iog(I-Pik)Hik为第i个模型与第k个类别之间的个体熵，Pik为第i个模型属于第k个类别的可能性大小；将待标注模型按照分类不确定度值由大到小的顺序进行排序。
7.根据权利要求1所述的一种基于模糊K近邻的三维模型半自动标注方法，其特征在于所述训练学习步骤进一步包括不确定度阈值判断步骤，分别将待标注模型的分类不确定度与阈值进行比较，低于阈值的直接完成模型的分类标注，高于阈值的进入相关性反馈和重新分类步骤；相关性反馈步骤，将高于阈值的待标注模型中不确定度最大的模型，将其模糊分类结果提交给用户决策，确定其分类，完成标注后添加进数据库；重新分类步骤，将高于阈值的其余待标注模型，基于新的训练库，依次重复相似性匹配步骤、模糊化分类步骤和分类不确定度计算步骤，直到所有模型都完成分类标注，并添加进训练库。
8.一种基于模糊K近邻的三维模型半自动标注系统，其特征在于，包括三维模型训练库建立模块，用于建立三维模型训练库，所述训练库中包含三维模型的名称、几何结构信息、语义类别信息和特征信息；相似性匹配模块，用于对用户输入的待标注模型提取特征向量，并与三维模型训练库里的模型做相似性匹配，找到k个与待标注模型最相近的近邻模型，所述k的取值范围为大于O且小于三维模型训练库里的模型数；模糊化分类模块，用于基于相似性匹配步骤得到的k个近邻模型及它们的语义类别信息，采用模糊K近邻分类方法进行分类，得到模糊化的分类结果；分类不确定度计算模块，用于基于模糊化的分类结果计算各个待标注模型的分类不确定度；训练学习模块，用于基于分类不确定度计算步骤得到的分类不确定度，低于不确定度阈值的直接完成分类标注，高于不确定度阈值的通过相关性反馈和重新进行模糊分类方法完成分类标注；训练库添加模块，用于完成分类标注的模型，按照已建立的三维模型训练库的存储格式，添加进训练库。
9.根据权利要求8所述的一种基于模糊K近邻的三维模型半自动标注系统，其特征在于所述三维模型训练库建立模块进一步包括训练库设计单元，所述训练库包括Model Info、Label、fvData和Label_Model四个表； ModelInfo表存储了三维模型的名称、顶点数、面片数和模型文件的存储路径，Label表存储了语义类别ID、语义类别名称和父类别ID，Label_Model表存储了 ModelInfo表和Label 表之间多对多的映射关系，fvData表存储了三维模型的特征向量的下标和向量值信息；数据的批量导入单元，用于提取PSB模型库里的各个模型的几何信息及其所属语义类别信息，添加到建好的训练库中的Modellnfo、Label和Label_M0del表中；特征信息的提取和导入单元，用于提取PSB模型库中的所有三维模型的特征向量，添加到fvData表里，至此，三维模型训练库建立完成；所述相似性匹配模块进一步包括待标注模型格式转换单元，用于将待标注模型转换为off格式；特征向量提取单元，用于提取待标注模型的特征向量；近邻模型确定单元，用于将待标注模型的特征向量与训练库中模型的特征向量进行相似性匹配，找到k个近邻模型，所述k的取值范围为1 N，其中N为训练库中的模型总数；所述近邻模型确定模块进一步包括相似距离计算单元，用于分别计算待标注模型特征向量χ与训练库中的各个模型特征向量Xi间的相似距离dist(X,Xi)；相似模型确定单元，用于按相似性距离由小到大的排序，找到前k个与待标注模型最相似的模型；所述模糊化分类模块用于判断待标注模型χ与k个近邻模型中最小的距离dist(x，Xi)是否等于O ；如果等于0，则认为待标注模型χ和近邻模型Xi是相同的，将待标注模型χ直接归为近邻模型Xi所属的语义类别；如果不等于0，则统计出k个近邻模型所属的语义类别，假设共有c个类别；依次计算出待标注模型χ隶属于第j个语义类别 .的可能性大小/ 00，计算公式如下TjPcj (xdilldist(x, Xi))P C Sx) = 2^-K-，)= 1，2，…,^(1/ dist{x, Xi))i=l对各个类别的可能性 ω按由大到小的顺序进行排序，完成模糊化分类；所述分类不确定度计算模块进一步包括计算模型的分类不确定度单元，采用计算分类结果的信息熵的方法来计算不确定度，信息熵越大，表示分类的不确定程度越大，计算公式如下Ul=YjHlk ，k=l，2，…，ck=\其中U1为第i个模型的不确定度，c为模型可能所属的类别数；Hik = -PikIogPik-(I-Pik)Iog(I-Pik)Hik为第i个模型与第k个类别之间的个体熵，Pik为第i个模型属于第k个类别的可能性大小；将待标注模型按照分类不确定度值由大到小的顺序进行排序；所述训练学习模块进一步包括不确定度阈值判断单元，用于分别将待标注模型的分类不确定度与阈值进行比较，低于阈值的直接完成模型的分类标注，高于阈值的进入相关性反馈和重新分类步骤；相关性反馈单元，用于将高于阈值的待标注模型中不确定度最大的模型，将其模糊分类结果提交给用户决策，确定其分类，完成标注后添加进数据库；重新分类单元，用于将高于阈值的其余待标注模型，基于新的训练库，依次重复相似性匹配步骤、模糊化分类步骤和分类不确定度计算步骤，直到所有模型都完成分类标注，并添加进训练库。
全文摘要
本发明公开了一种基于模糊K近邻的三维模型半自动标注方法，该方法的实现过程为首先建立3D模型训练库，然后提取输入的待标注模型的特征向量，并与训练库里的模型做相似性匹配，找到k个近邻模型，然后通过模糊K近邻分类器进行分类，得到模糊化的分类结果，最后计算分类不确定度，对于分类不确定的模型通过反馈和重新训练学习的方法完成分类标注。标注完的模型被添加到3D模型训练库以进一步扩充模型库。本发明中的三维模型半自动标注方法，采用模糊化的分类结果，包含更多的信息，对于类别不确定的模型还可以借助反馈来确认类别标签，解决特征聚类边缘重叠的问题，并通过训练学习的机制，进一步做到自动化标注。
文档编号G06K9/66GK102254192SQ20111019637
公开日2011年11月23日申请日期2011年7月13日优先权日2011年7月13日
发明者万丽莉, 张俊青, 苗振江申请人:北京交通大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：万丽莉;张俊青;苗振江
技术所有人：北京交通大学
我是此专利的发明人

上一篇：一种基于文本边界的中文文档图像畸变校正方法
上一篇：一种多模态人类年龄自动估计方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。