一种预测航天产品装配工时的处理方法及装置与流程

文档序号：21730277发布日期：2020-08-05 01:24阅读：265来源：国知局

本发明涉及工时预测技术领域，特别涉及一种预测航天产品装配工时的处理方法及装置。

背景技术：

航天产品(如卫星、导弹、火箭等)具有系统复杂、多学科综合、小批量生产、研制周期长的特点，装配是航天产品生产的最后环节，直接影响产品的最终性能。工时信息是企业控制成本、编制生产计划、衡量工人劳动量的重要计量单位，也是企业进行生产调度、计划排产的前提条件和重要依据。随着航天型号任务的增加，传统的、依赖人工经验的装配工时预测方法已不能满足航天企业对工时估算的准确性和时效性要求，严重影响着航天企业管理水平和生产效率。因此，研究在航天产品在装配过程中如何实现工时的快速、准确预测具有十分重要的意义。

在工时预测方面，很多学者立足于分析工艺和产品的特征，研究其与工时的内在关系，从而根据这些特征进行未知工时的估算。例如，黄青云研究了车削加工中零件尺寸与切削工时之间的线性回归关系，并以此制定车削定额工时。重庆大学的陈友玲等，提出了大规模定制生产中零件复杂度计算模型，通过matlab拟合出零件拓扑结构复杂度和工艺属性复杂度对加工工时的影响函数，用于计算新型零件的加工工时。南京航空航天大学的李露建立了机电产品装配过程的工时定额模型，分类讨论了各类型装配操作的工时计算公式，实现工时的快速计算。晁海涛等将线缆进行分类，并建立各类线缆的工时计算模型，实现机柜线缆装配工时的智能计算。此外，也有学者分析企业生产技术、员工素质等因素对工时的影响，分别从员工工作态度、员工知识水平、产品定制的方面提出了工时计算模型。

从当前国内外研究成果和实践经验可知，影响工时的因素虽然很多，但最关键的还是生产操作本身的特征，如零件复杂度、工艺复杂度、精度要求等，其他因素如员工水平等只是造成小范围的工时波动。但是，当前的工时预测方法研究以机械加工领域为主，主要是通过零件的尺寸、拓扑结构等特征作为工时计算参数，涉及到的工艺特征多是易于提取的结构化数据，如零件加工精度等。航天产品的装配工艺同机加工艺或大规模批量装配工艺相比，更注重于对零部件装配关系的描述，如图2所示，图2为某卫星载荷舱装配工艺卡，在该工艺卡的右上角为档当前工序的装配对象及代号，左侧列出了当前工序所涉及的零部件信息，包括零部件的名称、代号、所需数量，右侧是该工序用到的工装、工具和辅料。工序的具体操作内容在中间部分，这些描述性文字说明了装配的操作顺序、零件的连接次序、工装工具的使用方法、操作过程的注意事项以及现场工序检验的合格标准等。数据组成特点如下：1)以文字信息为主：航天产品的装配工艺同机加工艺相比，需要对零部件之间的装配关系进行详尽的描述，因此主要内容都以文本形式呈现。在实际装配中，二维的图纸和三维的模型主要进行装配示意，起指导作用的是工艺卡中的文字描述信息。2)信息组成复杂：一张工艺卡中包含了装配对象、零部件、工装夹具、辅料等各种关联对象的信息，同时，包含了大段文字描述形式的工艺说明。装配工序的完工情况、检验结果、操作人员和检验者的签署信息等，也汇集到同一张工艺卡中。而对单个零件几何信息的描述较少，工序内容包含大量文本信息，因而难以提取零件特征或工艺特征等信息用于工时计算。

技术实现要素：

本发明实施例要达到的技术目的是提供一种预测航天产品装配工时的处理方法及装置，用以解决当前航天产品的装配工艺描述中对单个零件几何信息的描述较少，工序内容包含大量文本信息，因而难以提取零件特征或工艺特征等信息用于工时计算，使得航天产品在装配过程中难以实现工时的快速、准确预测。

为解决上述技术问题，本发明实施例提供了一种预测航天产品装配工时的处理方法，包括：

构建工序分类库以及分别与工序分类库中每种工序类型对应的多个文本语料库；

依次选择工艺卡数据库中的预设工序作为预选工序，并根据工序分类库和文本语料库对预选工序进行预处理操作，得到预选工序的预选工序文本，以及与预选工序的工序类型所对应的预选文本语料库；

根据预选文本语料库对预选工序文本进行文本挖掘，得到预选工序文本的预选文本特征向量，并存储预选文本特征向量以及测试执行预选工序时的工时数值；

当确定工艺卡数据库中的所有工序均已遍历时，根据已存储的每种工序类型所对应的预选文本特征向量以及工时数值，得到每种工序类型对应的工时计算模型，并存储至工时计算模型库中；

根据待执行工序的描述文本以及工时计算模型库，得到待执行工序的工时预测值。

优选地，如上所述的处理方法，构建工序分类库以及分别与工序分类库中每种工序类型对应的多个文本语料库的步骤包括：

对工艺卡数据库中的每个预设工序进行工序特征提取，得到每个预设工序的文本内容以及工序基本属性；

根据工序基本属性以及预设工序分类规则，对每个预设工序进行分类，得到工序分类库；

对工序分类库中每种工序类型所包括的每一预设工序的文本内容进行文本预处理，得到每种工序类型所对应的文本语料库。

优选地，如上所述的处理方法，在得到每种工序类型所对应的文本语料库的步骤之后，处理方法还包括：

将每一工序类型所对应的文本语料库中的词组成一过渡文本；

获取过渡文本中每个词的词频-逆向文档频率(termfrequency–inversedocumentfrequency，简称：tf-idf)数值；

根据关于tf-idf数值的预设阈值或预设保留比例更新文本语料库。

具体地，如上所述的处理方法，根据工序分类库和文本语料库对预选工序进行预处理操作，得到预选工序的预选工序文本，以及与预选工序的工序类型所对应的预选工序语料库的步骤包括：

对预选工序进行工序特征提取，得到预选工序的预选文本内容以及预选工序基本属性；

对预选文本内容进行文本预处理得到预选工序文本；并根据预选工序基本属性在工序分类库中进行属性匹配，确定预选工序所属的预选工序类型以及与预选工序类型对应的预选工序文本语料库。

优选地，如上所述的处理方法，根据已存储的每种工序类型所对应的预选文本特征向量以及工时数值，得到每种工序类型对应的工时计算模型的步骤包括：

构建预设回归模型，其中，文本特征向量为自变量，工时数值为因变量；

将工艺卡数据库中每种工序类型所包括的工序根据预设比例划分为训练集和测试集；

根据训练集中的预选文本特征向量以及工时数值，得到预设回归模型的目标回归系数；

根据测试集中的预选工序对应的预选文本特征向量以及工时数值，对目标回归系数进行验证；

当验证通过时，将目标回归系数带入预设回归模型中，得到与预选工序的工序类型相对应的工时计算模型。

具体地，如上所述的处理方法，预设回归模型为：

其中，t由预选工序类型中每道工序的工时组成；

a为由预选工序类型中每道工序的预选文本特征向量构成的文本特征矩阵；

δ为回归系数；

ε为误差值；

α为岭回归系数；

i为单位矩阵。

优选地，如上所述的处理方法，根据待执行工序的描述文本以及工时计算模型库，得到待执行工序的工时预测值的步骤包括：

对待执行工序进行工序特征提取，得到待执行工序中的待执行工序文本内容和待执行工序基本属性；

对待执行工序文本内容进行文本预处理得到目标工序文本；并根据待执行工序基本属性在工序分类库中进行属性匹配，确定待执行工序所属的目标工序类型以及与目标工序类型对应的目标工序文本语料库；

根据目标工序文本语料库对目标工序文本进行文本挖掘，得到目标工序文本的目标文本特征向量；

从工时计算模型库中获取与目标工序类型对应的目标工时计算模型，并根据目标工时计算模型和目标文本特征向量，得到待执行工序的工时预测值。

具体地，如上所述的处理方法，文本预处理的步骤包括：

通过自然语言分词并结合预设的词典将工序文本内容分解为单独的词，并根据预设的停词库剔除工序文本内容中的停用词。

进一步的，如上所述的处理方法，根据文本语料库对工序文本进行文本挖掘，得到文本特征向量的步骤包括：

获取工序文本中每个目标词的tf-idf数值，其中，目标词为工序文本中的任意一个词；

根据每个目标词的tf-idf数值以及文本语料库对应的文本特征向量的维度，得到工序文本的文本特征向量。

具体地，如上所述的处理方法，工序分类库中的基本属性包括：产品尺寸、工序所属专业以及操作过程中的至少一个。

本发明的另一优选实施例还提供了一种预测航天产品装配工时的处理装置，包括：

第一处理模块，用于构建工序分类库以及分别与工序分类库中每种工序类型对应的多个文本语料库；

第二处理模块，用于依次选择工艺卡数据库中的预设工序作为预选工序，并根据工序分类库和文本语料库对预选工序进行预处理操作，得到预选工序的预选工序文本，以及与预选工序的工序类型所对应的预选文本语料库；

第三处理模块，用于根据预选文本语料库对预选工序文本进行文本挖掘，得到预选工序文本的预选文本特征向量，并存储预选文本特征向量以及测试执行预选工序时的工时数值；

第四处理模块，用于当确定工艺卡数据库中的所有工序均已遍历时，根据已存储的每种工序类型所对应的预选文本特征向量以及工时数值，得到每种工序类型对应的工时计算模型，并存储至工时计算模型库中；

第五处理模块，用于根据待执行工序的描述文本以及工时计算模型库，得到待执行工序的工时预测值。

优选地，如上所述的处理装置，第一处理模块包括：

第一处理单元，用于对工艺卡数据库中的每个预设工序进行工序特征提取，得到每个预设工序的文本内容以及工序基本属性；

第二处理单元，用于根据工序基本属性以及预设工序分类规则，对每个预设工序进行分类，得到工序分类库；

第三处理单元，用于对工序分类库中每种工序类型所包括的每一预设工序的文本内容进行文本预处理，得到每种工序类型所对应的文本语料库。

优选地，如上所述的处理装置，其特征在于，第一处理模块还包括：

第四处理单元，用于将每一工序类型所对应的文本语料库中的词组成一过渡文本；

第五处理单元，用于获取过渡文本中每个词的词频-逆向文档频率tf-idf数值；

第六处理单元，用于根据关于tf-idf数值的预设阈值或预设保留比例更新文本语料库。

具体地，如上所述的处理装置，第二处理模块，包括：

第七处理单元，用于对预选工序进行工序特征提取，得到预选工序的预选文本内容以及预选工序基本属性；

第八处理单元，用于对预选文本内容进行文本预处理得到预选工序文本；并根据预选工序基本属性在工序分类库中进行属性匹配，确定预选工序所属的预选工序类型以及与预选工序类型对应的预选工序文本语料库。

优选地，如上所述的处理装置，第四处理模块，包括：

第九处理单元，用于构建预设回归模型，其中，文本特征向量为自变量，工时数值为因变量；

第十处理单元，用于将工艺卡数据库中每种工序类型所包括的工序根据预设比例划分为训练集和测试集；

第十一处理单元，用于根据训练集中的预选文本特征向量以及工时数值，得到预设回归模型的目标回归系数；

第十二处理单元，用于根据测试集中的预选工序对应的预选文本特征向量以及工时数值，对目标回归系数进行验证；

第十三处理单元，用于当验证通过时，将目标回归系数带入预设回归模型中，得到与预选工序的工序类型相对应的工时计算模型。

具体地，如上所述的处理装置，预设回归模型为：

其中，t由预选工序类型中每道工序的工时组成；

a为由预选工序类型中每道工序的预选文本特征向量构成的文本特征矩阵；

δ为回归系数；

ε为误差值；

α为岭回归系数；

i为单位矩阵。

优选地，如上所述的处理装置，第五处理模块，包括：

第十四处理单元，用于对待执行工序进行工序特征提取，得到待执行工序中的待执行工序文本内容和待执行工序基本属性；

第十五处理单元，用于对待执行工序文本内容进行文本预处理得到目标工序文本；并根据待执行工序基本属性在工序分类库中进行属性匹配，确定待执行工序所属的目标工序类型以及与目标工序类型对应的目标工序文本语料库；

第十六处理单元，用于根据目标工序文本语料库对目标工序文本进行文本挖掘，得到目标工序文本的目标文本特征向量；

第十七处理单元，用于从工时计算模型库中获取与目标工序类型对应的目标工时计算模型，并根据目标工时计算模型和目标文本特征向量，得到待执行工序的工时预测值。

具体地，如上所述的处理装置，第三处理单元、第八处理单元或第十五处理单元还用于：

通过自然语言分词并结合预设的词典将工序文本内容分解为单独的词，并根据预设的停词库剔除工序文本内容中的停用词。

进一步的，如上所述的处理装置，第三处理模块或第十六处理单元还用于：

获取工序文本中每个目标词的tf-idf数值，其中，目标词为工序文本中的任意一个词；

根据每个目标词的tf-idf数值以及文本语料库对应的文本特征向量的维度，得到工序文本的文本特征向量。

具体地，如上所述的处理装置，工序分类库中的基本属性包括：产品尺寸、工序所属专业以及操作过程中的至少一个。

本发明的又一优选实施例还提供一种计算机可读存储介质，计算机可读存储介质上存储计算机程序，计算机程序被处理器执行时实现如上所述的预测航天产品装配工时的处理方法的步骤。

与现有技术相比，本发明实施例提供的一种预测航天产品装配工时的处理方法及装置，至少具有以下有益效果：

本发明的实施例通过历史数据构建工时基于工序文本特征的工时计算模型，用于对待执行工序的工时预测，解决了由于航天产品装配工序信息以文字信息为主，且信息组成复杂，导致当前基于生产操作本身的特征进行工时预测不适用于航天产品装配工时预测的问题，且有利于保证航天产品装配工时预测的准确性和实效性，进而提高生产效率。

附图说明

图1为本发明的预测航天产品装配工时的处理方法的流程示意图之一；

图2为某卫星载荷舱结构装配工艺卡；

图3为本发明的预测航天产品装配工时的处理方法的流程示意图之二；

图4为本发明的预测航天产品装配工时的处理方法的流程示意图之三；

图5为本发明的预测航天产品装配工时的处理方法的流程示意图之四；

图6为本发明的预测航天产品装配工时的处理方法的流程示意图之五；

图7为本发明的预测航天产品装配工时的处理方法的流程示意图之六；

图8为本发明的预测航天产品装配工时的处理方法的流程示意图之七；

图9为本发明的一具体实施例所提供的工序基本属性的构成示意图；

图10为本发明的一具体实施例所提供的分词效果对比示意图；

图11为本发明的一具体实施例所提供的文本预处理结果示意图；

图12为本发明的一具体实施例所提供的泛化精度变化曲线示意图；

图13为本发明的一具体实施例所提供的工时预测与实际工时的比较结果示意图；

图14为本发明的预测航天产品装配工时的处理装置的结构示意图。

具体实施方式

为使本发明要解决的技术问题、技术方案和优点更加清楚，下面将结合附图及具体实施例进行详细描述。在下面的描述中，提供诸如具体的配置和组件的特定细节仅仅是为了帮助全面理解本发明的实施例。因此，本领域技术人员应该清楚，可以对这里描述的实施例进行各种改变和修改而不脱离本发明的范围和精神。另外，为了清楚和简洁，省略了对已知功能和构造的描述。

应理解，说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本发明的至少一个实施例中。因此，在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外，这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。

在本发明的各种实施例中，应理解，下述各过程的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本发明实施例的实施过程构成任何限定。

应理解，本文中术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，a和/或b，可以表示：单独存在a，同时存在a和b，单独存在b这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。

在本申请所提供的实施例中，应理解，“与a相应的b”表示b与a相关联，根据a可以确定b。但还应理解，根据a确定b并不意味着仅仅根据a确定b，还可以根据a和/或其它信息确定b。

参见图1，本发明的一优选实施例提供了一种预测航天产品装配工时的处理方法，包括：

步骤s101，构建工序分类库以及分别与工序分类库中每种工序类型对应的多个文本语料库；

步骤s102，依次选择工艺卡数据库中的预设工序作为预选工序，并根据工序分类库和文本语料库对预选工序进行预处理操作，得到预选工序的预选工序文本，以及与预选工序的工序类型所对应的预选文本语料库；

步骤s103，根据预选文本语料库对预选工序文本进行文本挖掘，得到预选工序文本的预选文本特征向量，并存储预选文本特征向量以及测试执行预选工序时的工时数值；

步骤s104，当确定工艺卡数据库中的所有工序均已遍历时，根据已存储的每种工序类型所对应的预选文本特征向量以及工时数值，得到每种工序类型对应的工时计算模型，并存储至工时计算模型库中；

步骤s105，根据待执行工序的描述文本以及工时计算模型库，得到待执行工序的工时预测值。

在本发明的一具体实施例中，针对航天产品装配工艺中采用大量文本进行描述的特点，为便于对每一工序进行解析，通过历史数据构成一工艺卡数据库，进而根据工艺卡数据库中所有预设工序的描述文本，分别构建工序分类库以及与每种工序类型的一一对应的文本语料库，其中，构建工序分类库的使得将同类型的装配工艺进行整合，作为一个整体进行分析，有利于避免针对每一工序分别建立工时计算模型的繁杂操作，同时，可类比得到未收录的同类型的工序所对应的工时，减少计算量并拓宽工时计算模型的应用范围。语料库的构建为后续对每一工序的工序文本进行文本挖掘提供参考基础，其中，所述描述文本至少包括图2中所述的文字信息中的一部分。可选地，构建工序分类库和文本语料库时，可根据通过其他手段获得的工序分类库和文本语料库的数据进行构建。

为构建工时计算模型库，并保证每一工时计算模型的准确性，本发明的具体实施例中还公开了，依次选择工艺卡数据库中的预设工序作为预选工序，并根据上述构建的工序分类库和文本语料库对预选工序进行预处理操作，得到用于进行文本挖掘的预选工序文本，以及作为挖掘参考的预选文本语料库，进而根据该预选文本语料库对预选工序文本进行文本挖掘，得到预选工序文本的预选文本特征向量并存储，同时，将在专门用于测试或根据之前实际执行预设工序时的工时数值一并存储，为得到工时计算模型提供数据支持，并将下一预设工序作为预选工序重复上述内容。

当工艺卡数据库中的所有工序均已遍历时，根据每种工序类型所包括的预选工序的预选文本特征向量和工时数值，通过训练，得到对应每种工序类型的工时计算模型，并存储至工时计算模型库中，使得当预测待执行工序时，可根据待执行工序的所属工序类型直接从工时计算模型库中获取对应的工时计算模型，进而根据待执行工序的描述文本以及获取到的对应的工时计算模型进行计算即可得到待执行工序的工时预测值。

综上所述，本发明的实施例通过历史数据构建工时基于工序文本的工时计算模型，用于对待执行工序的工时预测，解决了由于航天产品装配工序信息以文字信息为主，且信息组成复杂，导致当前基于生产操作本身的特征进行工时预测不适用于航天产品装配工时预测的问题，且有利于保证航天产品装配工时预测的准确性和实效性，进而提高生产效率。

参见图3，优选地，如上所述的处理方法，构建工序分类库以及分别与工序分类库中每种工序类型对应的多个文本语料库的步骤s101包括：

步骤s301，对工艺卡数据库中的每个预设工序进行工序特征提取，得到每个预设工序的文本内容以及工序基本属性；

步骤s302，根据工序基本属性以及预设工序分类规则，对每个预设工序进行分类，得到工序分类库；

步骤s303，对工序分类库中每种工序类型所包括的每一预设工序的文本内容进行文本预处理，得到每种工序类型所对应的文本语料库。

在本发明的具体实施例中，在上述的处理方法中，在构建工序分类库以及文本语料库时，会对工艺卡数据库中的每个预设工序进行工序特征提取，从将工艺卡中对工序的描述文本中提取出表征工序特性的工序基本属性以及用于描述执行该预设工序时的具体操作的文本内容。其中，基于工序基本属性可由企业根据实际情况进行定义，但对于工序基本属性的定义，应使得被定义的工序基本属性涵盖所有的工序，例如生产阶段、工种等，同时被定义的工序基本属性应能被结构化存储，进而便于进行直接提取和属性匹配。其中，预设工序分类规则可由企业基于定义的工序基本属性，将其中一个或多个的组合确定为一种工序类型。当确定工序类型之后，对预设工序中的文本内容进行文本预处理，使在保证主要文本的基础上对文本内容进行简化，得到对应工序类型的文本语料库，其中，进行文本预处理，有利于避免因文本内容为句、段或存在与主要文本无关的字或词，对文本挖掘的影响。

可选的，进行文本预处理的步骤可在确定某一预设工序的工序类型后即进行文本预处理，将预处理后的结果存储至对应的文本语料库中，对该文本语料库进行更新；或者，当所有预设工序均确定工序类型后，以工序类型为基本单位，一次性对该工序类型所包括的预设工序的文本内容进行文本预处理，得到该工序类型对应的文本语料库。

参见图4，优选地，如上所述的处理方法，在得到每种工序类型所对应的文本语料库的步骤之后，处理方法还包括：

步骤s401，将每一工序类型所对应的文本语料库中的词组成一过渡文本；

步骤s402，获取过渡文本中每个词的词频-逆向文档频率tf-idf数值；

步骤s403，根据关于tf-idf数值的预设阈值或预设保留比例更新文本语料库。

在本发明的另一优选实施例中，在得到每种工序类型所对应的文本语料库之后，将每一工序类型所对应的文本语料库中的词组成一过渡文本，获取过渡文本中每个词的tf-idf数值，其中，此处的词频tf为某一个词在该过渡文本中的出现次数与过渡文本中总词数的比值；逆文档频率idf为所述语料库所包括的文档总数除以包含该词的参考文档数，得到的比值的对数，其中，在计算时，过渡文本包含在所述文档总数中，参考文档数为实际包含该词的文档数加一；tf-idf数值为词频tf和逆文档频率idf的乘积，其具体表达式为：

其中，n为当前语料库中工序的总数；

ωdt为工序文本d中的词t的tf-idf数值；

tfdt为词t在工序文本d中出现的频率；

nt为语料库中包含词t的工序文本总数。

从文本语料库中根据关于tf-idf数值的预设阈值或预设保留比例，将tf-idf数值小于预设阈值或处于预设保留比例之外的的词剔除，并对文本语料库进行更新，有利于减少文本语料库中的文本特征向量的维度，进而便于简化基于文本特征向量的计算。其中，预设保留比例为将每个词的tf-idf数值进行排序，tf-idf数值超出阈值的词的占比为所述预设保留比例。

需要说明的是，tf-idf数值仅为本发明中所优选采用的文本挖掘方法，当本领域的技术人员采用其他文本挖掘方法时，并进行减少文本特征向量的维度的步骤也属于本发明的保护范围。

参见图5，具体地，如上所述的处理方法，根据工序分类库和文本语料库对预选工序进行预处理操作，得到预选工序的预选工序文本，以及与预选工序的工序类型所对应的预选工序语料库的步骤包括：

步骤s501，对预选工序进行工序特征提取，得到预选工序的预选文本内容以及预选工序基本属性；

步骤s502，对预选文本内容进行文本预处理得到预选工序文本；并根据预选工序基本属性在工序分类库中进行属性匹配，确定预选工序所属的预选工序类型以及与预选工序类型对应的预选工序文本语料库。

在本发明的一具体实施例中，根据工序分类库和文本语料库对预选工序进行预处理操作具体为：对预选工序再次进行工序特征提取，得到预选工序的预选文本内容以及预选工序基本属性；其中还对预选文本内容进行文本预处理得到简化后的预选工序文本；并根据预选工序基本属性在工序分类库中进行属性匹配，当确定预选工序基本属性与工序分类库中的一种工序类型的工序基本属性相匹配时，确定该工序类型为预选工序所属的预选工序类型，进而通过该预选工序类型即可确定并获取相对应的预选工序文本语料库。其中，对预选工序再次进行工序特征提取以及工序基本属性匹配等操作，有利于进一步保证预选工序与更新后的文本语料库之间的对应关系。

可选的，不对预选工序再次进行工序特征提取以及工序基本属性匹配等操作，直接根据之前构件工序分类库和文本语料库时的工序与工序类型以及文本语料库的对应关系，直接确定预选工序所属的预选工序类型以及与预选工序类型对应的预选工序文本语料库，也属于本发明的保护范围。

参见图6，优选地，如上所述的处理方法，根据已存储的每种工序类型所对应的预选文本特征向量以及工时数值，得到每种工序类型对应的工时计算模型的步骤包括：

步骤s601，构建预设回归模型，其中，文本特征向量为自变量，工时数值为因变量；

步骤s602，将工艺卡数据库中每种工序类型所包括的工序根据预设比例划分为训练集和测试集；

步骤s603，根据训练集中的预选文本特征向量以及工时数值，得到预设回归模型的目标回归系数；

步骤s604，根据测试集中的预选工序对应的预选文本特征向量以及工时数值，对目标回归系数进行验证；

步骤s605，当验证通过时，将目标回归系数带入预设回归模型中，得到与预选工序的工序类型相对应的工时计算模型。

在本发明的一具体实施例中，在根据已存储的每种工序类型所对应的预选文本特征向量以及工时数值，得到每种工序类型对应的工时计算模型时，首先构建一预设回归模型，其中，由于本发明的方案主要目的为对航天产品装配工时进行预测，因此，将工时数值作为因变量，将工序的文本特征向量作为自变量。

在构建完成预设回归模型后，将每种工序类型中的工序根据预设比例划分为训练集和测试集，其中，预设比例可根据技术人员基于不同的实际问题考虑进行灵活设定。将训练集中的预选文本特征向量以及工时数值，带入预设回归模型中进行模型训练和泛化能力测试，进而确定最适合当前工序类型的目标回归系数；并根据测试集中的预选文本特征向量以及工时数值，对目标回归系数进行验证，用于判断当前得到的目标回归系数是否满足当前工序类型中任一工序的计算需求。当确定验证通过时，将目标回归系数带入预设回归模型即可得到与预选工序的工序类型相对应的工时计算模型。当验证不通过时，可通过重新划分训练集和测试集的方式再次进行目标回归系数的确定。其中，训练集和测试集的设置提高了得到的工时计算模型的准确性。

具体地，如上所述的处理方法，预设回归模型为：

其中，t由预选工序类型中每道工序的工时组成；

a为由预选工序类型中每道工序的预选文本特征向量构成的文本特征矩阵；

δ为回归系数；

ε为误差值；

α为岭回归系数；

i为单位矩阵。

在本发明的一优选实施例中，预选回归模型采用线性回归中的岭回归的方法进行数据拟合，其中，α为岭回归系数，当自变量文本特征矩阵a存在多重共线时，则矩阵a^ta为奇异矩阵，矩阵(a^ta)^-1对角线上的元素很大，造成参数估计极不稳定，数据发生微小变化就可能导致参数估计结构发生很大的变化，此时通过设置岭回归系数α为a^ta增加一个对角阵，使矩阵的特征值变大，将奇异矩阵尽可能的转化为非奇异矩阵，提高参数估计的稳定性。其中，当岭回归系数α越大，共线性对预测结构的影响越小。若α为零，则变成为最小而乘法估计，此时为无偏差估计；若α不为零，则为有偏估计。

参见图7，优选地，如上所述的处理方法，根据待执行工序的描述文本以及工时计算模型库，得到待执行工序的工时预测值的步骤包括：

步骤s701，对待执行工序进行工序特征提取，得到待执行工序中的待执行工序文本内容和待执行工序基本属性；

步骤s702，对待执行工序文本内容进行文本预处理得到目标工序文本；并根据待执行工序基本属性在工序分类库中进行属性匹配，确定待执行工序所属的目标工序类型以及与目标工序类型对应的目标工序文本语料库；

步骤s703，根据目标工序文本语料库对目标工序文本进行文本挖掘，得到目标工序文本的目标文本特征向量；

步骤s704，从工时计算模型库中获取与目标工序类型对应的目标工时计算模型，并根据目标工时计算模型和目标文本特征向量，得到待执行工序的工时预测值。

在本发明的一具体实施例中，当得到工时计算模型库之后，在对当前待执行工序进行工时预测时，会首先对待执行工序进行工序特征提取，得到待执行工序中待执行工序文本内容以及待执行工序基本属性；其中，对待执行工序文本内容进行文本预处理即可得到简化后的目标工序文本；将待执行工序基本属性在工序分类库中进行属性匹配，即可确定待执行工序所属的目标工序类型，进而可得到对应的目标工序文本语料库。根据目标工序文本语料库对目标工序文本进行文本挖掘即可确定目标工序文本的目标文本特征向量。通过在工时计算模型库中获取与目标工序类型对应的目标工时计算模型，并将目标文本特征向量带入目标工时计算模型中，即可得到待执行工序的工时预测值。即本发明通过获取待执行工序的描述文本中的文本特征，结合基于历史数据确定的工时计算模型确定待执行工序的工时预测值，解决了由于航天产品装配工序信息以文字信息为主，且信息组成复杂，导致当前基于生产操作本身的特征进行工时预测不适用于航天产品装配工时预测的问题，且有利于保证航天产品装配工时预测的准确性和实效性，进而提高生产效率。

具体地，如上所述的处理方法，文本预处理的步骤包括：

通过自然语言分词并结合预设的词典将工序文本内容分解为单独的词，并根据预设的停词库剔除工序文本内容中的停用词。

在本发明的一具体实施例中，上述的文本预处理的步骤包括：通过自然语言分词并结合预设的词典进行分词，将工序文本内容分解为单独的词，有利于避免句、段等因无明显的分界符进行划分影响后续文本挖掘的准确性，其中，词典可为所使用的软件开发环境中的预设词典和用户自己构建的词典中的至少一个。进而，还会剔除停用词包括：功能词例如：“这”、“那”、“的”、“在”等，以及普遍词例如“获取”、“应该”、“其实”等，避免这些出现频率较高，却和文档的主体或核心思想没有实际关联的冗余词汇，对具体装配相关词汇的重要性的影响。可选地，停用词的设置可根据现有的停词库和用户自己构建的停词库中的至少一个。其中，此处所述的工序文本可以为预设工序文本、预选工序文本或待执行工序文本中。

参见图8，进一步的，如上所述的处理方法，根据文本语料库对工序文本进行文本挖掘，得到文本特征向量的步骤包括：

步骤s801，获取工序文本中每个目标词的tf-idf数值，其中，目标词为工序文本中的任意一个词；

步骤s802，根据每个目标词的tf-idf数值以及文本语料库对应的文本特征向量的维度，得到工序文本的文本特征向量。

在本发明的实施例中，在得到文本特征向量时，会获取每个目标词的tf-idf数值，将每个目标词的tf-idf数值组合为一向量，并根据文本语料库中的维度对向量进行补充即可得到工序文本的文本特征向量，其中，此处所述的工序文本可以为预选工序文本或待执行工序文本中。

具体地，如上所述的处理方法，工序分类库中的工序基本属性包括：产品尺寸、工序所属专业以及操作过程中的至少一个。

在本发明的实施例中，工序基本属性可以包括：工序所属专业、工种、过程、风险类型等，为适应本发明所针对的航天产品，在本发明的一优选实施例中将工序基本属性确定为产品尺寸、工序所属专业以及操作过程中的组合，结合图9可知，产品尺寸包括：大型、中型、小型等；工序所属专业包括：装配、测试等；操作过程包括：结构装配、单机装配、热控实施、线缆敷设、电测试、磁测试、质量特性测试等。

在本发明的一具体实施例中，以某大型卫星的单机安装工序为例进行说明，其中，选取150道人为确定的工序作为历史数据，并获取其对应的描述文本构成工艺卡数据库；在此省略对构建工序分类库以及确定工序类型的步骤，且由于存储时已根据工序名称、工种、工序内容等分字段存储，使得特征提取的步骤较为简单，在此不再过多描述。

通过在python开发环境中导入文本内容进行文本预处理，通过python开发环境中的分词工具包(优选jieba分词工具包)进行分词处理，其中，分词时可根据自然语言进行分词也可根据自然语言与用户自建词库相结合进行分词，其中，自建词库中包括企业特定声场环境和过程中的专业术语，例如：“安装单机”、“脱落插头”、“分离插头”、“接地线”、“搭接电阻”等，使用自建词库可以提升分词的精确度。其效果对比可参见图10；在分词完成后，通过下载通用的停用词库并导入python开发环境的中分词工具包即可，经过剔除停用词后的文本预处理后结果如图11所示；

进而通过“corpora”工具包对图11中的150到工序内容组成的语料库构建词典即上述的过渡文本，其中词典中的次数决定了工序文本特征向量的元素数量即文本特征向量中的列数。由于现行回归对多变量数据的拟合效果较差，因此通过获取词典中每个词的tf-idf数值，通过设置阈值或按比例保留tf-idf数值较高的词，减少文本特征向量中的列数即维度；例如最终生成的词典为['侧装'：1，'大单机'：2，'拆保险'：3，'点装等待'：4，'硅脂'：5，'装星车'：6，'锁紧工具'：7，'多紧固件'：8，'接地线'：9，'数量'：10，'硅胶'：11，'紧固件'：12，'绝缘膜'：13，'10mm'：14，'与侧板间隙'：15，'小于'：16，'搭接电阻'：17，'测'：18，'涂胶'：19，'3台单机'：20，'侧板'：21，'分离插头'：22，'弹平垫'：23，'点封'：24，'倒装'：25，'力矩'：26，'铟箔'：27，'除胶'：28，'安装单机'：29，'胶垫'：30]。

根据词典对各工序的工序文本进行文本挖掘，并获取各工序中每个目标词tf-idf数值，将其构成一个150×30的文本特征矩阵，其中150小时工序数量，30表示词典的总词数；当词典中的某一个词存在于目标工序中时，则目标工序中的对应位置的值为该词tf-idf数值，当词典中的某一个词不存在于目标工序中时，则目标工序中的对应位置的值为零。

使用“ridge”模型对工序文本特征和工时进行回归，为了验证回归模型的训练结果的精确度，按照75％和25％的比例从150到工序中随机划分训练集和测试集。在[0，1]区间设置步长0.001取岭回归系数的值，分别进行“ridge”模型训练和泛化能力测试，得到泛化精度变化曲线，如图12所示。得到最适用于当前语料库的岭回归系数的值为0.242，用此岭回归系数的值进行回归模型训练，并对测试集的每道工序进行工时预测，预测结果如图13所示，可以看出，整体符合情况较好，工时预测偏差较小，因此将此岭回归系数带入回归模型中得到工时计算模型。

参见图14，本发明的另一优选实施例还提供了一种预测航天产品装配工时的处理装置，包括：

第一处理模块1401，用于构建工序分类库以及分别与工序分类库中每种工序类型对应的多个文本语料库；

第二处理模块1402，用于依次选择工艺卡数据库中的预设工序作为预选工序，并根据工序分类库和文本语料库对预选工序进行预处理操作，得到预选工序的预选工序文本，以及与预选工序的工序类型所对应的预选文本语料库；

第三处理模块1403，用于根据预选文本语料库对预选工序文本进行文本挖掘，得到预选工序文本的预选文本特征向量，并存储预选文本特征向量以及测试执行预选工序时的工时数值；

第四处理模块1404，用于当确定工艺卡数据库中的所有工序均已遍历时，根据已存储的每种工序类型所对应的预选文本特征向量以及工时数值，得到每种工序类型对应的工时计算模型，并存储至工时计算模型库中；

第五处理模块1405，用于根据待执行工序的描述文本以及工时计算模型库，得到待执行工序的工时预测值。

优选地，如上所述的处理装置，第一处理模块包括：

第一处理单元，用于对工艺卡数据库中的每个预设工序进行工序特征提取，得到每个预设工序的文本内容以及工序基本属性；

第二处理单元，用于根据工序基本属性以及预设工序分类规则，对每个预设工序进行分类，得到工序分类库；

第三处理单元，用于对工序分类库中每种工序类型所包括的每一预设工序的文本内容进行文本预处理，得到每种工序类型所对应的文本语料库。

优选地，如上所述的处理装置，其特征在于，第一处理模块还包括：

第四处理单元，用于将每一工序类型所对应的文本语料库中的词组成一过渡文本；

第五处理单元，用于获取过渡文本中每个词的词频-逆向文档频率tf-idf数值；

第六处理单元，用于根据关于tf-idf数值的预设阈值或预设保留比例更新文本语料库。

具体地，如上所述的处理装置，第二处理模块，包括：

第七处理单元，用于对预选工序进行工序特征提取，得到预选工序的预选文本内容以及预选工序基本属性；

优选地，如上所述的处理装置，第四处理模块，包括：

第九处理单元，用于构建预设回归模型，其中，文本特征向量为自变量，工时数值为因变量；

第十处理单元，用于将工艺卡数据库中每种工序类型所包括的工序根据预设比例划分为训练集和测试集；

第十一处理单元，用于根据训练集中的预选文本特征向量以及工时数值，得到预设回归模型的目标回归系数；

第十二处理单元，用于根据测试集中的预选工序对应的预选文本特征向量以及工时数值，对目标回归系数进行验证；

第十三处理单元，用于当验证通过时，将目标回归系数带入预设回归模型中，得到与预选工序的工序类型相对应的工时计算模型。

具体地，如上所述的处理装置，预设回归模型为：

其中，t由预选工序类型中每道工序的工时组成；

a为由预选工序类型中每道工序的预选文本特征向量构成的文本特征矩阵；

δ为回归系数；

ε为误差值；

α为岭回归系数；

i为单位矩阵。

优选地，如上所述的处理装置，第五处理模块，包括：

第十四处理单元，用于对待执行工序进行工序特征提取，得到待执行工序中的待执行工序文本内容和待执行工序基本属性；

第十六处理单元，用于根据目标工序文本语料库对目标工序文本进行文本挖掘，得到目标工序文本的目标文本特征向量；

具体地，如上所述的处理装置，第三处理单元、第八处理单元或第十五处理单元还用于：

通过自然语言分词并结合预设的词典将工序文本内容分解为单独的词，并根据预设的停词库剔除工序文本内容中的停用词。

进一步的，如上所述的处理装置，第三处理模块或第十六处理单元还用于：

获取工序文本中每个目标词的tf-idf数值，其中，目标词为工序文本中的任意一个词；

根据每个目标词的tf-idf数值以及文本语料库对应的文本特征向量的维度，得到工序文本的文本特征向量。

具体地，如上所述的处理装置，工序分类库中的基本属性包括：产品尺寸、工序所属专业以及操作过程中的至少一个。

本发明的处理装置实施例是与上述处理方法的实施例对应的处理装置，上述处理方法实施例中的所有实现手段均适用于该处理装置的实施例中，也能达到相同的技术效果。

需要说明的是，本文中所述的预设工序、预选工序以及待执行工序等仅为便于区分，其实质可以为同一工序。

此外，本发明可以在不同例子中重复参考数字和/或字母。这种重复是为了简化和清楚的目的，其本身不指示所讨论各种实施例和/或设置之间的关系。

还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含。

以上所述是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明所述原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘检华;刘子文;赵文浩;王治;邢香园;万峰;熊辉;陈小弟;陈伟男;吴剑锋
技术所有人：北京理工大学;上海卫星装备研究所
我是此专利的发明人

上一篇：一种水下管汇连接件制造工艺及水下管汇连接件的制作方法
上一篇：一种电子产品的供电插头的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。