专利名称:管理工程图的计算机自动系统的制作方法
技术领域:
本发明涉及计算机自动数据处理系统中按照预定义的算法自动地识别数字格式的工程图用的方法,所述方法使得可以编制所述工程图的数据库,使用户可以按照诸如创建日期、修订日期、图号的定义参数直接从所述数据库确定工程图的位置并对其进行检索。
在任何建筑项目的开发中,如果不是数千张工程图的话,通常也会有数百张工程图,这些图包括建筑项目的每一个方面。在开发过程中,这些图会一次又一次地被修改。不管改动是小是大,都需要制作另外的图,加到已经很多的图上。
适当并有效管理任何项目中这样的图对有效和及时地完成所述项目是绝对重要的。因此从这点可以看出,在建筑业,适当的图管理是极为重要的工具。
管理这样的工程图的传统方法是手工进行的或是通过将识别特定图所需的关键字输入到计算机化的数据库中来进行的。这两种方法都极为耗时、十分低效、昂贵并极易出错。传统的图管理系统的又一个缺点是如果工程图未被适当地分类,则工程技术人员可能不知道图已被修改并可能完全找不到所需的图。
本发明设法消除传统的检索和存储图的方法的缺点。
本发明的目的是提供更加有效、合算和快速管理诸如利用计算机辅助设计软件创建的图或者已经利用扫描仪扫描成数字格式的图纸的数字格式的工程图的方法,由此这样的图纸可以自动地被识别、加索引和存储,以便简单和快速地检索,而不需要利用手工将每一单张图输入到数据库中。
本发明涉及计算机自动数据处理系统中的方法,其中计算机的中央处理单元分析数字格式的工程图,诸如利用计算机辅助设计软件创建的图或者已经利用扫描仪扫描成数字格式的图纸,利用一组预定义的算法来识别图中包含的指定信息。然后在数据库中整理这种信息,使得用户可以参考诸如“图号”、“绘图者名”、“项目名称”等指定的准则来搜索和检索图。这样的处理是完全自动的并需要用户最少的输入操作。
工程图通常包括两个部分。一个部分具有实际的工程图本身,而另一个部分包括图框(drawing frame),图框包括与图有关的所有必要信息。虽然实际工程图本身可能复杂,然而不管图的类型如何,图框的格式趋向于标准。
一般说来,执行如下的用以分析工程图的处理。中央处理单元通过一系列预定算法来分析数字格式的数据,以便初步识别每一张工程图。一旦识别了图,计算机的中央处理单元按照一系列预定算法来处理每一个图框中的文本框中的信息,以便识别所述文本框中的信息并将其分类。然后按照指定的准则和其类别在数据库中整理这种信息,使得用户可以确定任何特定图的位置并对其进行检索。这样,能够与文件名一道标识和整理例如有关分类图号或分类版本、分类图名的信息、或诸如建筑要素名的一般信息。然后,用户可以参考这些参数来检索图。
除此之外,中央处理单元还识别位于每一张工程图本身中的任何文本。这种文本也存储在数据库中,以便所述文本与所述工程图相关联,并使得用户可以参考所述文本确定工程图的位置。
首先识别每一张工程图的边界。然后,在所述边界中,中央处理单元试图确定一系列有序排列的文本框位置,以便确定图框的位置并对其进行识别。然后分析图框中每一个文本框的内容,以便识别属于诸如“图名”、“图号”的等某个预定类别的关键字。如果关键字在所述文本框中,则再分析所述文本框中的内容,以便看看所述文本框是否包含两种不同类型的内容,诸如框名和内容描述。一旦确定这样的框的位置并确定这是相关的图框,则对所述框的内容进行分类并将其存储在结构化数据库中,以便可以检索所述图。
通过将来自工程图的值与存储在数据库中已知的预定值进行比较来分析来自工程图的数据。如果所述工程图中的值与存储在数据库中的预定值相同,则执行更进一步的数据分析,或者可以将所述信息识别为所需的信息并将其存储在数据库中。
工程图和工程图中有关文本框的识别是能够管理工程图的系统的关键步骤。下面将描述执行这种处理的最佳方法。
最初从图文件收集所有图形数据。然后按照其诸如线、文本、符号、虚线等特性而将这样的图形元素分成不同的类别,并且将其存储在不同的阵列中。然后,中央处理单元分析图形元素来识别工程图并确定图框的准确的数量和方向,如下所述1.中央处理单元从线阵列或多线阵列识别其长度长于预定图形的任何水平的两点直线。
2.然后中央处理单元搜索所有连接所述水平的两点直线的端点的线,以便确定这些连线是否形成闭合的矩形区。
3.一旦形成闭合矩形区的所有水平的两点直线被识别,则这些直线被分组在一起,为方便起见把它们标识为组A。
4.然后,对于组A中的每一个闭合的矩形区,中央处理单元分析闭合矩形区本身是否被更大的矩形闭合区包围。如果任何闭合矩形区被更大的闭合矩形区包围,则将较小的闭合矩形区从组A中删除。
5.对所有闭合矩形区重复所述步骤,结果在组A中只剩下那些未被另一个闭合矩形区包围的闭合矩形区。这样,闭合矩形区现在应该表示潜在的工程图的边界。
6.然后,中央处理单元分析上一步的每一个闭合矩形区,以便确定在所述矩形区中是否存在任何文本和/或线。如果在所述矩形区中不包含文本和线要素,则确定所述矩形区不包含任何工程图并将其从组A中删除。
7.然后进一步分析组A中的每一个闭合矩形区,以便确定所述每一个闭合矩形区是否被水平或垂直线分割而形成两个相邻矩形区,为方便起见,两个相邻的矩形区可标注为(a)和(b)。两个矩形区(a)和(b)表示图的内容和图框。标注为(a)和(b)的矩形区必须共享共同的边界。如果没有标注为(b)的闭合矩形区、即没有图框附到组A中的闭合矩形框上,则标注为(b)的闭合矩形区在进一步的分析中被排除。
8.然后进一步分析组A中的矩形区,以便确定每一个标注为(a)和(b)的区是否包含任何文本。如果未发现文本,则所述闭合矩形区从组A中被排除。
9.由中央处理单元这样识别的闭合矩形区表示包含图内容和图框的工程图。
通过这种处理,可以识别包含在闭合矩形区中并且包含图框和图内容这两个不同区的每一幅工程图。
一旦识别了图框,则中央处理单元分析所述图框中的所有闭合区、即文本框,以便识别每一个文本框的文本内容。然后,在数据库中整理所述文本信息,以便可以参考所述文本信息来识别和检索图。
中央处理单元一个一个单独地分析图框中每一个文本框的内容,以便按照诸如“图号”、“图名”、“版本”等的关键字来确定预定类别的存在。还参考文本框中关键字位置来分析所述关键字。确定并识别关键字的算法被预先定义并作为中央处理单元执行的命令码被存储。
如果关键字位于文本框中并且假设所述关键字的位置在文本框中,则中央处理单元分析所述文本框来进一步确定所述文本框中是否存在任何其它的文本内容。如果在所述文本框中存在任何其它的文本,则将所述信息存储在结构化数据库中,以便所述信息与所述特定的图和类别相关联,然后可以参考所述信息来检索图。
另外,中央处理单元还识别工程图的实际图内容部分中的任何文本。该文本也存储在数据库中,以便所述文本与所述工程图相关联,并使得用户可以参考所述文本来确定工程图的位置。
所述处理的基本特征是一旦开始所述处理,则是完全自动的,其中,需要识别的所有图被自动地分析,而不需要用户的任何其它输入。
现将参考附图来描述所述处理。
图1是识别工程图和图框的处理流程图。
图2示出包含图内容框和图框的典型工程图。
图3示出典型的图框。
图4示出将被分析的图框的详细版本。
图5示出将被分析和将被解释的图框中的单独的文本框。
图6示出用于建立数据库的单独的文本框。
图1图示了涉及上文中1点到9点的处理,用以识别单独的工程图和图框。
图2示出了具有各自包含在不同矩形区中的图内容(1)和图框(2)的典型工程图。包含图的矩形区(3)没有被任何其它的矩形区包围。实际工程图包含在图内容区(1)中,而图框(2)包含有关工程图的信息。
图3示出了典型的图框(2),后者包含以有序方式排列的不同文本框(4)中有关工程图的各种信息。图框中的每一个文本框包含有关工程图的不同信息块。示于图2的图框具有水平方向,但它在实际中可以具有垂直方向。
图4示出了包含几个不同文本框(4)的图框的详细版本。每一个文本框都包含诸如合同名(5)、图名(6)、图号(7)、制图者(8)、版本(9)的不同信息块。
图5示出了图框中的单独的文本框,后者单独地被分析并且其内容被编辑在数据库中,根据所述内容可以识别并提取所述图。
图6示出了可从图框中提取然后在数据库中编辑的信息。
数字形式的图必须首先被识别为单独的图。其目的是为了识别哪一个信息涉及哪一个图。这可以由中央处理单元通过分析图形要素来找到不被另外的闭合矩形区包含的闭合矩形区(3)而进行。该处理步骤识别每一个潜在的工程图的边界。然后,中央处理单元分析每一个这样的闭合矩形区的内容来确定这样的闭合矩形区是否具有位于其中的任何文本和线。不再对那些不具有文本和/或线的矩形区进行分析,因为它们不包含工程图。
然后,进一步对那些具有文本和/或线的闭合矩形区进行分析,以便确定它们是否被水平或垂直线分割而产生两个邻近闭合矩形区。这两个邻近矩形区是图内容区(1)和图框区(2)。通过一系列包含有关工程图的信息的不同矩形框来识别图框(2)。对每一个不同矩形框进行分析来识别包含在所述矩形框中的文本。如果该处理步骤识别的文本与存储在数据库中的预定值相同或相似,则按照预定的参数在数据库中整理来自所述文本框中的信息,后者可被用来识别特定的图。
因此,可以给那些类别加上关键字来编辑数据库,所述关键字用于识别相关的文本框,诸如“合同名”(5)、“图名”(6)、“图号”(7)、“制图者”(8)、和“修订版”(9)。引用这样的类别来搜索数据库将可以识别图框的文本框中具有所述信息的所有图。
另外,中央处理单元还对包含在实际图内容(1)中的任何文本进行识别。该文本也存储在数据库中,以便所述文本与特定的工程图相关联,然后用户可以借助查阅所述文本通过搜索数据库来确定所述特定工程图的位置。
权利要求
1.一种在计算机自动数据处理系统中用于识别、管理和检索数字格式的工程图的方法,所述方法包括如下步骤为了识别单个工程图和包含在每一个所述图中的特定信息,中央处理单元按照预定算法来分析所有所述数字数据;可以按照预定准则将所述特定信息存储在合适的存储装置中;可以利用适当的搜索引擎对照所述预定准则来搜索所述存储装置而识别每一个所述图并确定其位置。
2.权利要求1的方法,其特征在于所述中央处理单元按照预定算法来分析所述数字数据以便识别每一个工程图的边界。
3.权利要求1的方法,其特征在于所述中央处理单元按照预定算法来分析所述数字数据以便识别每一个工程图中包含的文本信息。
4.权利要求1的方法,其特征在于所述中央处理单元按照预定算法来分析所述数字数据以便识别包含文本内容的按序布置的一系列分立的框。
5.权利要求3的方法,其特征在于可以按照预定准则将包含在每一个工程图中的所述文本信息存储在合适的存储装置中,以便可以通过查阅所述文本信息来识别所述工程图。
6.权利要求4的方法,其特征在于所述中央处理单元按照预定算法来分析包含在每一个文本框中的所述文本信息,以便识别所述文本框中的预定关键字;如果识别了所述文本框中的所述关键字,则所述中央处理单元进一步分析包含在所述文本框中的数据,以便确定所述文本框中是否包含另外的文本信息;以及如果在所述文本框中找到另外的文本信息,则可按照预定准则将每一个文本框中包含的所述另外的文本信息存储在合适的存储装置中,以便可以通过查阅所述文本信息来识别所述工程图。
7.上文描述的方法,其特征在于可以通过查阅寻找的所述准确的文本信息来确定所述存储装置中存储的所述工程图的位置、检索所述工程图、并且将所述工程图显示在合适的显示装置上;以及可以通过诸如加亮的合适装置容易地识别所述文本信息。
全文摘要
一种用于识别、管理和检索数字格式的工程图的计算机自动方法,其中,中央处理单元按照预定算法来确定与所述工程图有关的特定文本和图形信息的位置并对其进行识别。按照预定准则将这样识别的文本信息存储在合适的存储装置中,以便可以通过查阅所述文本信息来识别并检索所述工程图。
文档编号G06F17/30GK1309371SQ0110459
公开日2001年8月22日 申请日期2001年2月14日 优先权日2000年2月15日
发明者黄天祥 申请人:纬衡科技有限公司