搜寻正文以检索符合某一关键词的字符流的信息搜寻装置的制作方法

文档序号:6411798阅读:395来源:国知局
专利名称:搜寻正文以检索符合某一关键词的字符流的信息搜寻装置的制作方法
技术领域
本发明总的说来涉及信息搜寻装置,这种装置为分别与指定的字符流(关键词)一致的一个或多个字符串而搜寻一数据库,从而检索字符流。本发明尤其涉及通过搜索数据库而以高速检索、加入、更新或删除与指定的字符流一致的一段字符流的信息搜索装置。
在近代的信息搜寻系统中,当用户指定某一字符流,并且将该字符流输入到普通的信息搜寻装置作为关键词时,对与指定的字符流一致的一段或多段字符数据搜寻为普通的信息搜寻装置而配置的数据库,并自动检索字符数据。更具体地说,已制造和广泛使用了一种相关数据库管理系统。
例如,第一种普通的信息搜寻装置见经公布但未经审查的日本专利申请S63-155324(1988)、H1-282635(1989)、H2-30869(1990)和H3-113626(1991)中揭示的内容。在专利申请S63-155324(信息检索装置)中,在每一循环中,当寄存的关键词逐词移动时,将寄存的关键词与由操作者指定的检索关键词比较,并进行信息检索操作。在专利申请H1-282635(索引维持系统)中,保留主索引和一较小的子索引,作为用来检索寄存的数据段的索引,将增加的寄存数据的索引记录加到子索引上,并以高速进行寄存数据的更新、增加和删除。在专利申请H2-302869(文件编辑系统)中,为了去掉存储器中无用的区域,以及快速地指定要处理的存储器中存储的数据,形成一个用来保留存储器空闲区指针(pointer)的表,而当涉及到该表时,就指定要处理的存储器中所存储的字符流数据。在专利申请H3-113626(控制缓冲器的系统和装置)中,为了提高某一任务的吞吐量,并行地执行缓冲器中数据的检索和来自辅助存储装置的数据传输。
在上述四个第一种普通的信息搜寻装置中,数据区和数据更新区排列在记录号单元中的存储区内,数据更新操作时一些数据段存储在数据更新区中,而数据区和数据更新区相互替换(专利申请S63-155324、H1-282635和H3-113626)。同时,数据的增加、更新和删除是用检索文件和字符流数据的记录中所存储的字符串数据对应表来进行的(专利申请H2-302869)。
下面描述第一种普通信息搜寻装置中进行的数据寄存操作、数据变更操作和数据删除操作。


图1是根据专利申请H2-302869的第一种普通信息搜寻装置中进行的过程流程图。图2示出用作第一种普通的信息搜寻装置的原始数据表T1和更改的数据表T2,描述了表T1中记录的数据流。表T1中,将三个记录设置为一个要处理的文件。在A型记录中,记录由两个字符“12”或“AI”组成的字符流和由两个字符“34”或“UE”组成的另一个字符流,形成A型记录的数据结构。在B型记录中,记录由两个字符组成的字符流和由五个字符组成的另一个字符流,形成B型记录的数据结构。本例中,A型记录字符流“12”的区域对应于A型记录字符流“AI”的区域,并且字符流“12”和“AI”是相同的项。同样, A型记录字符流“34”的区域对应于A型记录字符流“UE”的区域,并且字符流“34”和“UE”是相同的项。
如图1所示,从表T1中所示的检索文件中逐个读取要处理的多个字符流,作为要处理的记录(步骤S101)。接着,设置每一字符流的位置、每一字符流的大小和每一字符流的指针。字符流的位置表示与该字符流对应的某一记录的首地址。字符流的大小表示字符流中的字符数。用于多个字符流的指针表示这些字符流是相同的项。随后,将表T1中的字符流结构变更为存储器中表T2内的结构(步骤S102)。例如,因为第一记录A的字符流“12”的项与第三记录A的字符流“AI”的项相同,所以,设置用于字符流“12”和“AI”的指针p1。同样,由于第一记录A的字符流“34”的项与第三记录A的字符流“UE”的项相同,所以设置用于字符流“34”和“UE”的指针p2。随后,重复步骤S101和S102,直到读取了表1的所有字符流,并且这些字符流均以表T2的结构存储在存储器内为止(步骤S103)。接着,在存储器的空白区(space area)内设置表T2,从而制得表T2(步骤S104)。
接着,考虑计划对表T1的字符流进行更新的情况(步骤S105中的更新操作)。例如,当计划将表1中第一记录A的字符流“34”更新为“56”时,检查表T2中的多个记录A,检测表T2中第三行中寄存的字符流“34”,并将字符流“34”变更为字符流“56”。这时,由于字符数不变,所以无需变更指针p2。
同样,在步骤S105进行删除操作时,当计划检测例如表T1的第三记录A的字符流“UE”时,检查表T2的多个记录A,在跟踪第三行中寄存的指针p2时检测表T2第七行中寄存的字符流“UE”,并删除与字符流“UE”对应的记录的某一行。另外还删除第三行的指针p2。
如上所述,在第一种普通的信息搜寻装置中,用表2进行寄存操作、更新操作和删除操作,同时跟踪每一行中字符流的首地址、大小和指针。
然而,当数据库中寄存了大量的字符流(或大量的数据)时,就存在这样的缺陷,即需要花费很长的时间从数据库的所有数据段中搜寻出分别与某一指定的字符流(或某一关键词)一致的一个或多个数据段。所以,需要以高速搜寻一个数据库。
同时,当在第一种普通的信息搜寻装置中进行数据的更新或删除操作时,需要获得某一扩充区,使之等于存储器中更新记录或删除记录的某一区域,所以,另一个缺陷是需要一个具有大容量的存储器。
同样,还需要在进行了数据的更新或删除以后重新排列记录顺序的排序(sorting)操作。所以,另一个缺陷是需要花费长时间来更新或删除数据。
同时,将一条更新信息的记录插入到表T2的插入行内,该表中,多条数据记录密集排列而无空隙,并且从表T2中去掉放置在表T2的删除行中的一条删除信息记录。所以,在更新或删除操作中需要使置于插入行或删除行某一位置以后的多条数据记录移位,从而另一个缺陷是需要长时间进行更新或删除操作。
再有,即使不从表T2中删除该删除信息,而将该删除信息的删除标志设置为“on(打开)”状况,其再一个缺陷是在表T2中使记录的条数(或数据数)增加。
图3是第二种普通的信息搜寻装置的方框图。
如图3所示,第二种普通的信息搜寻装置11包括,输入装置12,用来接收文件寄存(或更新)操作中用户所准备的文件以及接收检索操作中某一指定的检索字符流;处理请求接收装置13,用来从输入装置12接收寄存(或更新)文件的请求,以及从输入装置12接收对指定检索字符流的检索请求;一实时处理单元14,按照从处理请求接收单元13发送的处理请求,实时处理该文件,以便准备用于检索操作的索引文件;用来存储索引文件的索引文件存储单元15;输出一段信息的输出单元16,该信息指出由处理请求接收单元13通知的索引文件准备结束时索引文件准备的结束;以及一检索操作执行单元17,用来执行检索操作,从而当从处理请求接收单元13接收检索指令时,从索引文件存储单元15中存储的索引文件中检索分别与指定的检索字符流一致的一段或多段字符数据。
在上述结构中,当用户准备一个文件以及将该文件输入到输入装置12以实时寄存或更新该文件,在装置11中启动文件寄存(或更新)操作。即,由处理请求接收装置13接收从输入单元12发送的文件和文件的寄存(或更新)请求,并且该文件和该文件的处理请求从处理请求接收单元13发送到实时处理单元14。在处理单元14中,实时处理文件,并准备该文件的索引文件,而且将索引文件存储在索引文件存储装置15中。同时,当索引文件的准备结束的了以后,处理单元14将索引文件准备的结束通知处理请求接收单元13。以后,将表示实时结束了索引文件准备的一条实时操作结束信息传送到输出单元16,并将该实时操作结束信息从输出装置16输出。所以,文件寄存(或更新)操作结束,并将第二种普通的信息搜寻装置11设置为请求等待状态。
随后,当将某一指定的检索字符流输入到输入装置12请求检索操作时,由处理请求接收单元13接收检索请求,检索指令从接收单元13发送到检索操作执行单元17,并在执行单元17中执行检索操作。即,从索引文件存储单元15中存储的索引文件中分别检索与指定的检索字符流一致的一段或多段字符数据。当字符数据的检索结束时,执行单元17将字符数据检索结束的情况通知接收单元13,并将该字符数据从输出装置16输出,作为检索结果。即,检索操作结束。
然而在结束数据文件的准备之前不能执行检索操作,并且需要花费长时间来准备索引文件。即,操作者必须在实时寄存或更新文件并将数据文件存储到存储装置15内之前,等待将指定的检索字符流输入到输入单元12。所以,其缺陷是需要花费长时间,直到把第二种普通的信息搜寻装置11设定为请求等待状态。
考虑到上述普通信息搜寻装置的缺陷,本发明的第一个目的是提供一种信息搜寻装置,在这种装置中对于分别与指定的字符流(或关键词)一致的一条或多条字符流搜寻数据库,以高的速率检索出字符流,并且以高的速率更新或删除与指定的字符流一致的字符流。
本发明的第二个目的是提供一种信息搜寻装置,这种装置只要在正确检索出字符流而不等到为索引文件而执行的记录、增加、更新或删除操作结束以后,即使在索引文件的记录、增加、更新或删除操作的中期请求检索操作,也能对分别与一指定的字符流(或一关键词)一致的一个或多个字符流立即执行等效于数据库的某一索引文件的搜寻操作。
第一个目的是通过提供一种信息搜寻装置来实现的,该装置包含
发生号表准备装置,用来准备一个发生号表,该表中,对于每一字符列举了一个或多个发生号,发生号是在检索正文中对于属于一个字符类型的一个或多个字符按出现的次序编号而得到的;索引文件准备装置,用来将由发生号表准备装置准备的发生号表中排列的发生号重新构筑成多个发生号型式(pattern),每一型式指出检索正文中一组两个相邻字符的两个发生号;将发生号型式划分成多个发生号型式组,每一组对应于指出两个字符类型为一组的字符型式;并准备一索引文件,其中排列有分别与一个字符型式对应的几组发生号型式,由每个发生号型式表示的两个相邻字符的特定类型与用相应字符型式表示的两个字符类型一致;以及索引文件搜寻装置,用来搜寻索引文件,以及从由关键词指出的规定字符流中通过产生一系列规定的字符型式,检索与关键词一致的某一特定的字符流,并且在由系列发生号指出的特定字符系列与特定的字符流一致的情况下,选择一与规定字符型式系列对应的特定发生号型式系列。
在上述结构中,把在检索正文中按发生的先后顺序排列的属于一个字符类型的一个或多个字符编号所得到的一个或多个数字称作为一个或多个发生号。还将一组两个字符类型定义为一字符型式,将检索正文中两个相邻字符的两个发生号为一组定义为发生号型式。由发生号表准备装置为每一字符类型列出在检索正文中排列的一个或多个字符的一个或多个发生号准备一张发生号表。随后,将发生号表中列出的发生号重新构筑成多个发生号型式,将发生号型式划分成多组发生号型式,每一个发生号型式对应于一个字符型式,并用索引文件准备装置准备一索引文件,该索引文件中列出与一个字符型式对应的每一组发生号型式。随后,由索引文件搜寻装置搜寻索引文件,并检索与某一关键词对应的特定字符流。即,从用关键词表示的规定字符流产生一系列规定的字符型式,并且当用一系列特定发生号型式表示的一系列特定字符与特定的字符流一致时,选择与该系列的规定字符型式相应的一系列特定发生号型式。所以,把特定字符的系列作为与关键词一致的特定字符流来检索。
因此,在跟踪每一行中字符流的首地址、大小和指针时,因为第一普通信息搜寻装置中执行的寄存操作是不被采用的,但检索索引中的所有字符都用发生号型式组来替换,所以使索引文件的大小减小。因而用来记录索引文件的存储器的容量可以作得较小。
而且,不搜寻与所有的字符型式对应的所有的发生号型式组,以检索与关键词一致的特定字符流,但是,选择与根据关键词获得的规定字符型式系列对应的特定发生号型式组,并且在用特定发生号型式表示的一系列特定字符与特定的字符流一致的情况下,检索从特定的发生号型式组中选出的一系列特定发生号型式。所以,可以减小被搜寻的发生号型式的数量(volume),并且在高速下进行与关键词一致的特定字符流的检索。
第二个目的是通过提供一种信息搜寻装置而实现的,该装置包含存储一个或多个检索目标的检索目标存储装置;实时处理数据接收装置,用来接收分别与检索目标存储装置中存储的检索目标中的一个目标对应的一段或多段实时处理数据;用来接收一段检索信息和某一搜寻请求的检索信息接收装置;实时处理数据存储装置,用来存储由实时处理数据接收装置接收的实时处理数据段;实时处理装置,用来对实时处理数据存储装置中存储的实时处理数据段中的每一段数据进行实时处理,以更新检索目标存储装置中存储的检索目标;检索目标搜寻装置,用来搜寻检索目标存储装置中存储的每一个检索目标,从而从每一个检索目标中检索出与检索信息接收装置所接收的检索信息一致的一段或多段第一信息;并输出指出第一信息的检索结果;实时处理数据搜寻装置,用来搜寻一段或多段特定实时处理数据中的每一段,这些数据段不由实时处理装置处理但存储在实时处理数据存储装置中,从而从特定的实时处理数据段中的每一段中检索与由检索信息接收装置接收的检索信息一致的一个或多个第二信息段;检索结果修改装置,用来按照由实时处理数据搜寻装置检索的第二信息,修改从检索目标搜寻装置输出的检索结果,以反映检索结果中特定的实时处理数据段;以及检索结果输出装置,用来输出由检索结果修改装置修改的检索结果。
在上述结构中,当由实时处理数据接收装置接收一段或多段实时处理数据时,实时处理数据段是存储在实时处理数据存储装置内的。接着,由实时处理装置进行对每一段实时处理数据的实时处理,并逐个更新检索目标存储装置中存储的检索目标。在这种情况下,当由检索信息接收装置在实时处理的中间阶段接收搜寻请求和一段检索信息时,不由实时处理装置处理的一段或多段特定的实时处理数据保留在实时处理数据存储装置内。在这种情况下,在对特定的实时处理数据段进行搜寻操作期间,是不对一特定的实时处理数据段进行实时处理的。
随后,由检索目标搜寻装置检索存储在检索目标存储装置中的每一个检索目标,以检索与检索信息一致的一段或多段第一信息,并得到一检索结果。而且,由实时处理数据搜寻装置来搜寻特定的实时处理数据段中的每一段,从而从特定的实时处理数据段的每一段检索出与检索信息一致的一段或多段第二信息。随后,按照第二信息由检索结果修改装置修改检索结果,并且由检索结果输出装置输出该结果。所以,即使不由实时处理装置来更新与特定的实时处理数据段对应的每一特定的检索目标,在检索结果中也能反映特定的实时处理数据段。
因此,因为搜寻操作是在接收到搜寻请求而不管每一实时数据的实时处理是否结束时进行的,所以可以立即进行搜寻操作,而不必等待实时处理(比如记录、增加、更新或删除操作)的结束。
再有,因为搜寻操作是在实时处理的中间阶段开始的,因为特定的实时处理数据的每一段是由实时处理数据搜寻装置搜寻并且检索结果由检索结果修改装置按照从特定的实时处理数据段中检索的第二信息来修改,因而即使不由实时处理装置分别处理的一段或多段特定的实时处理数据保留在实时处理数据存储装置中,也可以正确地进行搜寻操作。
信息搜寻装置最好还包含重复实时处理避免装置,用来在由实时处理数据接收装置接收与同一特定检索目标对应的一段重复的实时处理数据时,将与某一特定检索目标对应并存储在实时处理数据存储装置中的一段实时处理数据按照同一特定的检索目标,改变成一段修改过的实时处理数据;并废弃该重复的实时处理数据。
在上述结构中,因为避免了重复处理数据的重复实时处理,可以在高速下有效地进行实时处理。
信息搜寻装置最好还包含存在判断表准备装置,用来准备一存在判断表,该表中存在存储在实时处理装置中和一段指定的实时处理数据的所有成分;以及检索操作控制装置,用来判断存在判断表准备装置所准备的存在判断表中是否存在检索信息的所有成分,并控制实时处理数据搜寻装置使之在存在判断表中不存在检索表的所有成分时停止搜寻指定的实时处理数据。
在上述结构中,因为准备了存在判断表,所以,当搜寻指定的实时处理数据以检索与检索信息一致的一段或多段第二信息时,可以判断存在判断表中是否存在检索信息的所有成分,并且当判断结果是存在判断表中不存在检索信息的所有成分时,可以停止由实时处理数据搜寻装置进行的搜寻操作。因而可以高速进行搜寻操作。
信息搜寻装置最好还包含重复检索操作避免装置,用来从与从实时处理数据存储装置中存储的同一特定检索目标相应的多个实时处理数据段中选出一段与特定的检索目标对应的最新实时处理数据,控制实时处理数据搜寻装置从而从最新的实时处理数据中检索与检索信息一致的第二信息,以及控制实时处理搜寻装置不进行针对与同一特定检索信息对应的其他实时处理数据的搜寻操作。
在上述结构中,因为在与同一特定的检索目标对应的多个实时处理数据存储在实时处理数据存储装置中的情况下对最新实时处理数据进行搜寻操作,并且因为是不对与同一特定检索目标对应的其他实时处理数据段进行任何搜寻操作,所以可以高速进行搜寻操作。
信息搜寻装置最好还包含用来接收结束请求的结束请求接收装置;强迫结束操作请求装置,用来在结束请求接收装置接收到结束请求的情况下,请求实时处理装置强迫停止一实时处理,使得实时处理装置不处理的一段或多段指定的实时处理数据保持在实时处理数据存储装置中;以及结束情况存储装置,用来存储由强迫结束操作请求装置保持的指定的实时处理数据段。
在上述结构中,即使在实时处理数据装置中存储大量的实时处理数据,因为接收到结束请求时针对一段当前实时处理数据的实时处理是强迫结束的,所以不存在使用者等待很长的时间来结束针对所有实时处理数据的实时处理的情况。因而使用者可以用该信息搜寻装置立即进行另一种类型的操作。
信息搜寻装置最好还包含接收启动请求的启动请求接收装置;以及启动操作请求装置,用来在启动请求接收装置接收到启动请求时请求实时处理装置重新启动由强迫结束操作请求装置所强迫结束的实时处理。
在上述结构中,即使针对所有实时处理数据的实时处理还未结束,由于未处理的指定的实时处理数据中的一段或多段是存储在结束情况存储装置中的,所以当接收到启动请求时,可以处理未处理的指定的实时处理数据段。因而,不管实时处理数据的数量如何,都可以正确地进行针对所有实时处理数据的实时处理。
信息搜寻装置最好还包含检索时间测量装置,用来测量由检索目标搜寻装置搜寻检索目标存储装置中所存储的特定检索目标或者由实时处理数据搜寻装置搜寻实时处理数据存储装置中所存储的特定的检索目标的一段特定实时处理数据所需的检索时间;更新时间测量装置,用来测量由实时处理装置更新检索目标存储装置中存储的特定检索目标的更新时间;更新操作通知装置,用来判断检索时间测量装置所测量的检索时间是否迟于更新时间测量装置所测量的更新时间,并且在更新时间迟于检索时间时,准备一段更新信息,该段信息指出对特定检索目标的更新操作是在由检索目标搜寻装置或实时处理数据搜寻装置搜寻了特定检索目标以后进行的;以及更新信息输出装置,用来在更新时间迟于检索时间的情况下,输出由更新操作信息装置获得的特定检索目标的一个识别号和更新信息。
在上述结构中,因为判断了检索时间是否迟于更新时间,所以即使特定的检索目标是在对特定检索目标进行的搜寻操作以后更新的,也可以将一段更新信息通知用户。
在结合附图对本发明进行了下述描述以后,读者将清楚地了解本发明的目的、特性和优点。
图1是第一种普通信息搜寻装置中进行的过程的流程图;图2是用来示出原始数据表中记录的数据流的、第一种普通信息搜寻装置的原始数据表和变更数据表;图3是第二种普通信息搜寻装置的方框图;图4示出列出用于每一种类型的字符的多个发生号的发生号表;图5示出列出用于每一字符型式的一个或多个发生号型式的索引文件;图6是按照本发明第一、第二和第三实施例的信息搜寻装置方框图;图7是按照搜寻方法执行的索引文件寄存操作流程图8示出针对每一字符型式而列出的一个或多个发生号型式的索引文件;图9是按照一种搜寻方法执行的搜寻操作流程图;图10描述的是关键词中相互靠近的一对指定字符型式和与每一指定字符型式对应的多个发生号型式;图11是示出按照第二实施例对于存储装置中寄存的原始索引文件作更新操作的流程图;图12示出按照第二实施例从修改的检索正文准备的发生号表;图13示出按照第二实施例与每一种字符型式对应的一种或多种发生号型式的发生号型式表;图14示出按照第二实施例针对每一字符型式列出的一种或多种发生号型式的索引文件;图15是示出按照第三实施例的对于存储单元28中存储的索引文件作部分删除操作的流程图;图16示出按照第三实施例从修改的检索正文准备的发生号表;图17示出按照第三种实施例的一个或多个发生号型式与每一字符型式对应的发生号型式表;图18示出按照第三实施例针对每一字符型式而列出一个或多个发生号的索引文件;图19是按照本发明第四和第五实施例的信息搜寻装置的方框图;图20是示出记录一段实时处理数据的处理数据组和一实时处理请求的流程图;图21示出一例处理数据组;图22示出具有一对标志的处理数据组;图23示出实时处理数据存储单元中存储的多个未处理的处理数据组和多个已处理的处理数据组的列表;图24示出一段显示数据结构;图25示出显示数据段的一例;图26是示出索引文件存储单元中存储的索引文件的修改操作流程图;图27示出索引存储单元中存储的索引文件结构;图28A示出与多个字符型式(C1,C2)中的每一个字符型式对应的一个或多个字符信息型式(PC1,DN)的原始索引文件;图28B示出与多个字符型式(C1,C2)中的每一个字符型式对应的一个或多个字符信息型式(PC1,DN)的修改的索引文件;图29是示出在不对所有的处理数据组进行实时处理的情况下进行检索操作的流程图;图30示出由图19所示检索结果修改单元进行的修改操作的一例;图31是示出按照本发明的第五实施例的对与同一特定检索正文相应的两个处理数据组进行实时处理的流程图;图32A是按照第五实施例的实时更新操作的例子;图32B是按照第五实施例的实时删除操作的例子;图32C是按照第五实施例的实时增加操作的例子;图33是按照本发明的第六实施例的信息搜寻装置的方框图;图34是按照第六实施例处理数据组寄存操作的流程图;图35是字符存在判断表的结构;图36是字符存在判断表的一个例子;图37是采用字符存在判断表时进行字符流检索操作的流程图;图38是按照本发明第七实施例的信息搜寻装置的方框图;图39是示出按照第七实施例在避免重复检索操作时重复检索操作避免单元进行的字符流检索操作的流程图;图40示出按照第七实施例的重复检索操作避免单元和检索结果修改单元进行检索和修改操作的例子;图41是按照本发明的第八实施例的信息搜寻装置的方框图;图42是按照本发明的第八实施例的强迫结束操作的流程图;图43示出一段结束条件数据的结构;图44示出三段结束条件数据的例子;图45是示出按照本发明第八实施例的启动操作的流程图;图46是按照本发明第九实施例的信息搜寻装置的方框图;图47是示出检索时间的记录的流程图;图48示出一数据数和检索时间组的结构;图49描述的是一数据数和检索时间组的例子;
图50是示出更新时间的记录的流程图;图51示出一数据数和更新时间组的结构;图52示出一数据数和更新时间组的例子;图53是示出按照第九种实施例的更新或不更新信息输出操作的流程图;以及图54是从更新信息输出单元输出的更新和不更新信息的例子。
下面参照附图描述按照本发明的信息搜寻装置的较佳实施例。
首先描述按照本发明第一种实施例搜寻与某一关键词(或指定字符流)一致的一个或多个字符流的索引文件的搜寻方法。
图4描述的是一个发生号表,表中列出了每一种类型的字符的多个发生号,而图5是一个索引文件,文件中列出了每一字符型式的一个或多个发生号型式。
如图4所示,把在检索正文排列的多个字符按照多个不同的类型加以划分,按发生的顺序将属于同一字符类型的一个或多个字符从1起编上号,从而制得一个发生号表,表中,以递增的顺序列出每一种字符类型的发生号。例如,如果检索正文中记录的是由三种字符类型“A”、“I”和“N”组成的字符流“AAIAAIANNAANAI”,发生号表的结构如下所述。字符流的字符“A”按发生的顺序从1到8编号,字符流的字符“I”按发生的顺序从1到3编号,字符流的字符“N”按发生的顺序从1到3编号,以1编号的字符“I”位于以2和3编号的字符“A”之间,以2编号的字符“I”位于以4和5编号的字符“A”之间,以1和2编号的字符“N”位于以5和6编号的字符“A”之间,以3编号的字符“N”位于以7和8编号的字符“A”之间,而以3编号的字符“I”跟在以8编号的字符“A”后面。
同时,将一组两字符类型的型式定义为字符型式,而将类型与一种字符型式对应的两个相邻字符的两个发生号的型式定义为发生号型式。例如,从部分字符流“AAIA”得到三种字符型式(A,A)、(A,I)和(I,A),而从部分字符流“AAIA”得到三种发生号型式(1,2)、(2,1)和(1,3)。
接着,如图5所示,对每一字符型式按发生号递增的顺序将与一种字符型式分别对应的一个或多个发生号型式集合起来,并准备发生号型式表,作为每一个检索正文的索引文件。
随后,当把指定字符流“AIA”,例如作为一关键词准备时,就从该关键词得到第一指定字符型式(A,I)和第二指定字符型式(I,A)。为了通过使关键词的指定字符型式与检索正文的一系列字符型式关联起来而从检索正文中检索与该关键词一致的一个或多个字符流,从如图5所示的发生号型式表中拾取对应于与关键词的指定字符型式(A,I)和(I,A)一致的每一字符型式的一个或多个发生号型式。因此,发生号型式(2,1)、(4,2)和(8,3)对应于第一字符型式(A,I),而发生号型式(1,3)和(2,5)对应于第二字符型式(I,A)。这样,与第一字符型式(A,I)对应一个特定发生号型式的第二元素与对应于第二字符型式(I,A)的另一特定发生号型式的第一元素一致的时候,对应于特定发生号型式的检索正文的字符流与关键词一致。本例中,发生号型式(2,1)的第二元素与发生号型式(1,3)的第一元素(1)一致,而发生号型式(4,2)的第二元素(2)与发生号型式(2,5)的第一元素(2)一致。因此,检索正文中存在与关键词一致的两个字符流。随后,参见如图4中所示的发生号表,从检索正文中检索出对应于特定发生号型式的两个字符流。
图6是按照本发明第一、第二和第三实施例的信息搜寻装置方框图。
如图6中所示,信息搜寻装置21包含一正文数据库22,用来存储由操作者作为数据库准备的多个检索正文;正文记录产生单元23,用来逐个读取正文数据库22中存储的检索正文,并产生对应于每一个检索正文的正文记录;用来读取操作者准备的关键词的关键词读取装置;用来读取操作者准备的修改正文并产生修改正文记录的修改正文读取单元25;准备发生号表的发生号表准备单元26,表中对于正文记录产生单元23产生的正文记录或修改正文读取单元25产生的修改正文记录列出了多个用于每一种类型的字符的发生号;索引文件准备单元27,用来准备发生号型式表,表中对于每一字符型式列出一个或多个发生号,作为从准备单元26中产生的发生号表索引文件;索引文件存储单元28,用来存储准备单元26中产生的发生号表和索引文件准备单元27中准备的索引文件(或发生号型式表);扩展区设定单元29,用来另外设置与索引文件中每一种字符型式对应的一个或多个发生号型式的记录区域后的一个或多个扩展区Re1;字符型式产生单元30,用来根据关键词读取单元24读取的关键词产生多个指定字符型式;索引文件搜寻单元31,通过使索引文件的一系列三字符与一对关键词的指定字符型式一致,针对分别与关键词一致的一个或多个检索字符流,搜寻索引文件存储装置28中存储的索引文件;搜寻操作判断单元32,用来判断索引文件搜寻单元是否针对与对应于字符型式产生单元30中产生的一个字符型式的所有发生号型式搜寻了正文记录;检索结果输出单元33,用来暂时存储与搜寻单元31中被选择的字符型式对相对应的一系列三字符,并输出索引文件搜寻单元31中获得的检索字符流作为检索结果;以及发生号型式更新单元34,用来按照修改正文读取单元25读取的修改正文更新正文修改操作中索引文件的发生号型式。
在上述结构中,描述了将一个或多个检索正文作为一个或多个索引文件寄存的索引文件寄存操作和按照搜寻方法搜寻分别与某一关键词一致的一个或多个检索字符流的一个索引文件的搜寻操作。所以,修改正文读取单元25或发生号型式更新单元34不用在第一实施例中,但用在第二和第三实施例中。
图7是按照搜寻方法执行的索引文件寄存操作流程图。
如图7所示,逐个将多个检索正文从正文数据库22读取到正文记录产生单元23中,并将记录号Ni附加到每一个检索正文上,产生与每一个检索正文对应的正文记录(步骤S201)。随后,将例如当前正文记录“AAIAAIANNAANAI”传送到准备单元26。在准备单元26中,将每一种类型字符的发生号N(C)初始置零。这里,N(C)中的符号C表示字符的类型(C=A表示字符A的类型,C=I表示字符I的类型,而C=N表示字符N的类型)。随后,将字符指针P1初始设置成当前正文记录的开头字符(步骤S202)。接着,在逐个字符使字符指针P1移位时,按每一字符类型发生的顺序,从1开始将属于相同字符类型的一个或多个字符编号(步骤S203)。所以,对每一字符类型列出了多个发生号N(C)。随后,判断字符指针P1是否设置到当前正文记录的末尾字符(步骤S204),如果字符指针不是设置在当前正文记录的末尾字符,就继续步骤S203。相反,如果已经计数到当前正文记录末尾字符的发生号N(C),就如图4所示准备当前正文记录的部分发生号表,并将该表存储在存储单元28内。接着,判断正文记录产生单元23中是否保留有步骤S202和S203中未处理的正文记录(步骤S205)。如果保留有未经处理的后面的正文记录,就以相同的方式处理步骤S202和S203中未处理的后面的正文记录,并准备后面的正文记录的另一部分发生号表,并将该表存储在存储单元28内。当在步骤S202和S203中处理了所有的正文记录以后,在发生号准备单元26中完成所有正文记录的发生号表准备,并且将所有正文记录的发生号表存储在存储单元28中。
接着,由索引文件准备单元27准备发生号型式表。详而言之,将发生号型式指针P2初始设定至存储单元28中存储的发生号表的当前正文记录N1的顶部发生号型式(步骤S207),在逐个型式地使型式指针P2移位时,在用于每一字符型式的索引文件中逐个列出由型式指针P2指出的一个或多个发生号型式(步骤S208)。接着,判断型式指针P2是否设置至发生号表当前正文记录N1的末尾发生号型式(步骤S209)。如果型式指针P2没有设置至当前正文记录N1的末尾发生号型式,则继续步骤S208。相反,如果已经列出了当前正文记录N1的末尾发生号型式,那么就为当前正文记录N1的每一字符型式,在一个或多个发生号型式的记录区域后面另外设置两个扩展区Re1(步骤S210)。扩展区Re1的增加是由扩展区设置单元29进行的,与每一字符型式对应的末尾发生号型式再次记录在第一扩展区Re1内,而在第一扩展区后面的第二扩展区中却什么也不记录。把第二扩展区Re1安排来记录索引文件修改操作中得到的附加发生号。所以,用于当前正文记录N1的发生号型式表如图8所示由索引文件准备单元27准备,并在存储单元28中作为的索引文件N1寄存。接着,判断步骤S207和S208中未处理的正文记录是否保留在正文记录产生单元23内(步骤S211)。如果保留有后面的未经处理的正文记录,就以同样的方式在步骤S207到S210处理后面的正文记录,并准备后面的正文记录的另一个发生号型式表,以及将其存储在存储单元28中,作为另一个索引文件。当在步骤S207和S208中处理了所有的正文记录以后,就在索引文件准备单元27中完成所有的正文记录的一个或多个索引文件的准备(步骤S212),并将该索引文件存储在存储单元28中。即,完成对所有的正文记录的索引文件寄存操作。
这样,与每一字符型式对应的发生号型式(Ai,Bi)的第一和第二元素(或发生号)Ai和Bi就按增加发生号的顺序排列了起来。即,满足关系A1<A2<…<Am和B1<B2…<Bm。
接着描述按照搜寻方法的搜寻分别与某一关键词一致的一个或多个字符流的索引文件的搜寻方法。
图9是按照该搜寻方法进行的搜寻操作的流程图。
如图9中所示,读取由操作者准备的某一关键词(步骤S221),并由产生装置30从该关键词产生一系列指定的字符型式{C1(p),C2(p)},{C1(p+1),C2(p+1)}(步骤S222)。这里,符号C1(p)表示该关键词的第p个指定字符型式中的第一个字符,而符号C2(p)表示该关键词的第p个指定字符型式中的第二个字符。例如,从关键词“AIA”中取得第一个指定字符型式“AI”和第二个指定字符型式“IA”。随后,由搜寻单元31,对当前检索正文记录设置一个记录号N1,并用一关键词指针P3表示该关键词的第p个指定的字符型式(步骤S224)。用指针P3一开始表示该关键词的第一字符(p=1)。随后,选择该关键词的第p个指定字符型式{C1(p),C2(p)}和第p+1个指定的字符型式{C1(p+1),C2(p+1)},作为与检索操作相关的两个指定的字符型式(步骤S225)。例如,首先设置该关键词的两个最上面的字符型式{C1(1),C2(1)}=(A,I)和{C1(2),C2(2)}=(I,A)。由关键词读取单元24执行步骤S221至S225。
接着,如图10所示,从存储在存储单元28中的索引文件中将与第p个指定字符型式{C1(p),C2(p)}对应的发生号型式{N1(p,j),N2(p,j)}读取到索引文件搜寻单元31(步骤S226)。这里,符号N1(p,j)表示与第p个指定的字符型式{C1(p),C2(p)}对应的多个发生号型式中第j个发生号型式的第一个元素的发生号N1,而符号N2(p,j)表示第j个发生号型式第二个元素的发生号N2。从索引文件中一开始读取发生号型式{N1(p,1),N2(p,1)}=(2,1)。同样,如图10所示,将与第(p+1)个指定的发生号{C1(p+1),C2(p+1)对应的发生号型式{N3(p+1,k),N4(p+1,k)}读取到索引文件搜寻单元31中(步骤S227)。这里,符号N3(p+1,k)表示与第p+1个指定字符型式{C1(p+1),C2(p+1)}对应的多个发生号型式中第k个发生号型式的第一个元素的发生号N3,而符号N4(p,k)表示第k个发生号型式的第二个元素的发生号N4。一开始从索引文件中读取发生号型式{N3(p,1),N4(p,1)}=(1,3)。
接着,由索引文件搜寻单元31判断发生号型式{N1(p,j),N2(p,j)}的第二个元素的发生号N2是否与发生号型式{N3(p+1,k),N4(p+1,k)}的第一个元素的发生号N3一致(步骤S228)。如果发生号N2与发生号N3一致,则与发生号型式{N1(p,j),N2(p,j)}和{N3(p+1,k),N4(p+1,k}对应的由三个字符组成的系列就在当前检索正文记录N1中排列起来,并暂时与当前检索正文的记录数N1一起存储在检索结果输出单元33中(步骤S229),并且程序进行到步骤S230,检索与来自当前检索正文N1的指定字符型式{C1(p),C2(p)}和{C1(p+1),C2(p+1)}对应的另一个三字符系列。相反,如果在步骤S228中发生号N2与发生号N3不同,则程序进行到步骤S230,不输出任何三字符系列。
在步骤S230中,在搜寻单元31中判断发生号型式{N1(p,j),N2(p,j)}的第二元素的发生号N2是否高于发生号型式{N3(p+1,k),N4(p+1,k)}第一个元素的发生号N3。如果该发生号N3高于发生号N2,则使j的值递增(j←j+1),以检查下一个发生号型式{N1(p,j),N2(p,j)}(步骤S231),并且判断发生号型式{N1(p,j),N2(p,j)}第一个元素的发生号N2(p,j)是否高于发生号N2(p,j-1)(步骤S232)。即,判断发生号型式{N1(p,j),N2(p,j)}是否记录在第一扩展区Re1内。如果发生号N2(p,j)高于发生号N2(p,j-1),则因为发生号型式{N1(p,j),N2(p,j)}是不记录在扩展区Re1中的,所以程序回到步骤S228。相反,如果发生号N2(p,j)等于或低于发生号N2(p,j-1),则因为发生号型式{N1(p,j),N2(p,j)}记录在第一扩展区Re1中,所以程序进行到步骤S237。同样,如果在步骤S230中发生号N3低于发生号N2,则使k的值递增(k←k+1)(步骤S233),并且判断发生号型式{N3(p+1,k),N4(p+1,k)}第一个元素的发生号型式N3(p+1,k)是否高于发生号N3(p+1,k-1)(步骤S234)。即,判断发生号型式{N3(p+1,k),N4(p+1,k)}是否记录在第一扩展区Re1中。如果发生号N3(p+1,k)高于发生号N3(p+1,k-1),则程序回到步骤S228。相反,如果发生号N3(p+1,k)等于或低于发生号N3(p+1,k-1),则程序进行到步骤S237。同样,如果在步骤S230中发生号N3等于发生号N2,则使j和k的值递增(k←k+1,j←j+1)(步骤S235),并且判断发生号型式{N1(p,j),N2(p,j)}第二个元素的发生号N2(p,j)是否高于发生号N2(p,j-1)以及判断发生号型式{N3(p+1,k),N4(p+1,k)}第一个元素的发生号N3(p+1,k)是否高于发生号N3(p+1,k-1)(步骤S236)。即,判断发生号型式{N1(p,j),N2(p,j)}是否记录在第一扩展区Re1中,以及判断发生号型式{N3(p+1,k),N4(p+1,k)}是否记录在扩展区Re1中。如果发生号N2(p,j)高于发生号N2(p,j-1),并且发生号N3(p+1,k)高于发生号N3(P+1,k-1),则程序回到步骤S228。相反,如果发生号N2(p,j)等于或低于发生号N2(p,j-1)或者发生号N3(p+1,k)等于或低于发生号N3(p+1,k-1),那么程序进行到步骤S237。
例如,如果关键词读取单元24读取关键词“AIA”,则第一扩展区Re1中记录的发生号型式(2,1),(4,2)和(8,3)和发生号型式(8,3)对应于第一(p=1)指定字符型式(A,I),而在扩展区中记录的发生号型式(1,3)和(2,5)和发生号型式(2,5)对应于第二(p=2)指定字符型式(I,A)。所以,在步骤S228中判断第一(j=1)发生号型式(2,1)第二个元素的发生号是否与第一(k=1)发生号型式(1,3)第一个元素的发生号一致。因为第一(j=1)发生号型式(2,1)第二个元素的发生号“1”与第一(k=1)发生号型式(1,3)第一个元素的发生号“1”一致,所以在步骤S229中与发生号(2,1)和(1,3)对应的三个字符“AIA”系列暂时存储在输出单元33中。随后,在步骤S235中使j和k的值递增,并且在步骤S228中判断出第二(j=2)发生号型式(4,2)第二个元素的发生号“2”与第二(k=2)发生号型式(2,5)第一个元素的发生号“2”一致。所以,在步骤S229中,将与发生号型式(4,2)和(2,5)一致的三字符“AIA”系列暂时存储在输出单元33中。接着,在步骤235中使j和k的值递增,并且在步骤S236判断出第二(k=20)发生号型式(2,5)第一个元素的发生号等于第三(k=3)发生号型式(2,5)第一个元素的发生号“2”。所以,程序进行到步骤S237。
在步骤S237中,因为搜寻了与对应于关键词第p个指定字符型式的所有发生号型式以及对应于第(p+1)个指定字符型式的所有发生号型式所相关的当前检索正文的所有字符,所以判断第(p+1)个指定字符型式是否为该关键词中的最后指定字符型式。换言之,由搜寻单元31判断是否检查了与从该关键词得到的所有指定字符型式对应的发生号型式。如果第(p+1)个指定字符型式不是该关键词中的最后指定字符型式,则在步骤S238中使p的值递增(p←p+1),并且程序回到步骤S225,检索与另一对指定字符型式一致的当前检索正文的一对或多对字符。相反,如果第(p+1)个指定字符型式是该关键词中的最后一个指定字符型式,那么因为检查了与从该关键词得到的所有指定字符型式对应的发生号型式,所以判断在步骤S229中对每一对指定字符型式的三字符系列的存储是否存在(步骤S239)。如果在步骤S229中存储了每一对指定字符型式的三字符系列,则通过连接每一对指定字符型式的三字符系列产生一个或多个检索字符流,并且输出表示检索字符流存在的一段信息和当前检索正文的记录号N1,作为来自检索结果输出单元33的检索结果(步骤S240)。相反,如果在步骤S229中没有存储每一对指定字符型式的三字符系列,则输出表示检索字符流不存在的一段信息和当前检索正文的记录号N1,作为来自检索结果输出单元33的检索结果(步骤S241)。
如上所述,在第一个实施例中,对每一检索正文记录Ni在发生号表准备单元26中准备发生号表,并存储在索引文件存储单元28中,在另外由扩展区设置单元29为每一指定字符型式设置两个扩展区Re1时,将索引文件准备单元27中按照存储单元28中存储的发生号表为每一个检索正文记录Ni准备一个发生号型式表,并将该表存储在存储单元28中作为每一个检索正文记录的索引文件,在索引文件搜寻单元3 1中找出由关键词读取单元24读取的关键词中与相互靠近的一对指定字符型式对应的一对发生号型式,在索引文件搜寻单元31中判断对关键词中相互靠近每一对指定字符型式是否存在发生号型式对,并输出表示检索字符流存在或不存在的一段信息,作为来自检索结果输出单元33的检索结果。所以,可以大体搜寻正文数据库22中存储的每一个检索正文,并且可以检索出与关键词分别一致的一个或多个检索字符流。
此外,因为发生号型式表中每一个字符型式的发生号型式是按发生号增加的顺序排列起来的,所以,可以按使发生号增加的顺序检查每一个发生号型式。因此,可以高速搜寻与关键词的一对指定字符型式对应的所有发生号型式。
在第一实施例中,如图5中所示,发生号型式表中每一个字符型式的发生号型式是以发生号增加的顺序排列的。然而也可以采用使发生号减小的顺序来排列发生号型式。
此外,在索引文件中还为每一个字符型式设置第二扩展区Re1。然而,可以在索引文件中为每一字符型式设置多个第二扩展区。
此外,通过在信息搜寻装置21中搜寻检索正文来检索与关键词一致的一个或多个字符流。但是,第一实施例并非仅局限于字符流的检索。即,可以检索与某一关键词一致的一个或多个具有一定型式的数据流。
下面描述按照本发明第二实施例的存储单元28中存储的索引文件的更新操作。
如图6所示,当读取由操作者准备的修改正文和在修改正文读取单元25中产生修改的正文记录时,经修改的发生号表是按照发生号表准备单元26中的修改正文记录产生,并存储在存储单元28内的。随后,为每一字符类型准备用于修改正文的经修改的发生号型式表,作为索引文件准备单元27中的经修改索引文件N1R,并用存储单元28中存储的原始索引文件N1替换修改的索引文件N1R。这样,当经修改的索引文件N1R特定字符型式的经修改的发生号型式的数量高于原始索引文件N1的发生号型式的数量时,就加入经修改的扩展区Re2,从而再次记录与经修改的索引文件N1R每一特定字符型式对应的最终经修改的发生号型式。
下面参照图11详细描述更新操作。
图11描述的是按照第二个实施例的存储单元28中存储的索引文件的更新操作流程图。
如图11所示,由修改作为原始索引文件N1存档的原始检索正文“AAIAAIANNAANAI”而获得的经修改的检索正文“AAIAIIANAAINAI”由修改正文读取单元25来读取,并且将记录号N1R附到经修改的检索正文上,产生一个经修改的正文记录(步骤S301)。随后,在准备单元26中,将每一种类型字符的发生号N(C)初始置零,而将字符指针P1初始设置为经修改的正文记录N1R的首字符(步骤S302)。随后,通过逐个字符地将字符指针P1移位,将属于相同字符类型的一个或多个字符按每一字符类型出现的次序从1起编号(步骤S303)。所以,针对每一字符类型列出了多个发生号N(C)。接着,判断是否将字符指针P1置于经修改的正文记录N1R的末字符(步骤S304)。如果字符指针P1没有被置于经修改的正文记录N1R的末字符,就继续步骤S303。相反,如果已经计数了经修改的正文记录N1R末字符的发生号N(C),那么就如图12所示准备经修改的正文记录N1R的经修改的发生号表,并将其存储在存储单元28内。
随后,由索引文件准备单元35从索引文件存储单元28找出与正文记录号N1对应的原始索引文件,将发生号型式指针P2初始置于原始索引文件N1中顶部字符型式的顶部发生号型式,并且将发生号型式指针P2移位,以逐个指出原始索引文件N1的发生号型式(步骤S305)。还将更新型式指针P4初始置于指出经修改的发生号表中顶部的经修改的发生号型式,并且将更新型式指针P4移位,以逐个指出经修改的发生号表的经修改的发生号型式(步骤S306)。接着,通过发生号型式更新单元34,用经修改的发生号表中逐个由更新型式指针P4指出的经修改的发生号型式来替换原始索引文件N1中逐个由发生号指针P2表示的发生号型式(步骤S307)。
随后,判断每一字符型式经修改的发生号型式的数量是否变得高于原始索引文件N1中的发生号型式的数量(步骤S308)。如果特定字符型式的经修改的发生号型式的数量变得高于原始索引文件N1中特定字符型式的发生号型式的数量(参见图13),则由扩展区设置单元29增加一个或多个记录区,以记录经修改的索引文件N1R中特定字符型式的所有经修改的发生号型式(步骤S309)。随后,判断型式指针P4是否设置成经修改的发生号表的最后一个经修改的发生号型式(步骤S310)。如果型式指针P2没有设置成经修改的发生号表的最后一个经修改的发生号型式,则继续步骤S307。相反,如果经修改的发生号表的最后一个经修改的发生号型式已经列在修改的索引文件N1R中了,则对修改的索引文件N1R中的每一字符型式另外设置跟在一个或多个经修改的发生号型式后面的修改扩展区Re2(步骤S311)。经修改扩展区Re2的添加是由扩展区设置单元29进行的,并且最后的经修改的发生号型式再次记录在经修改的扩展区Re2内。这样,可以另外为每一字符型式设置跟在一个或多个经修改的发生号型式后面的多个扩展区Re2。所以,如图14所示,经修改的正文记录N1R的经修改的发生号型式由发生号型式修改单元34准备,并存储在存储单元28中。
图14中,对每一字符型式两次列出最后的发生号型式,并对字符型式(A,I)设置经修改的扩展区Re2。并且,如果某一特定字符型式的经修改的发生号型式的数量变得低于原始索引文件N1中特定字符型式的发生号型式的数量,则将原始索引文件N1中的一个或多个记录区改变成一个或多个扩展区Re2。例如,将字符型式(A,A)和(A,N)中的每一个型式的一个记录区变更成一个经修改的扩展区Re2。并且,如果尽管在原始索引文件N1中存在特定字符型式的一个或多个发生号型式但不存在特定字符型式的经修改的发生号型式,则将原始索引文件N1中特定字符型式的一个或多个记录区变更成一个或多个扩展区Re2。例如,把字符型式(N,I)和(N,N)中每一个型式的一个记录区变更成一个经修改的扩展区Re2。
随后,以与第一实施例(图9)中同样的方式,执行对与某一关键词一致的一个或多个字符流搜索经修改的索引文件N1R搜寻操作。
因此,即使经修改的索引文件N1R中特定字符型式的经修改的发生号的数量变得高于原始索引文件中特定字符型式的发生号型式的数量,也可以在一个或多个记录区和一个扩展区Re1中立即列出经修改的发生号型式。所以,可以高速进行对索引文件的更新操作。
此外,即使某一特定字符型式的记录区和扩展区Re1的数量低于特定字符型式经修改的发生号型式的数量,但因为每次在经修改索引文件N1R中列出了一个经修改的发生号型式时还另外设置了一个经修改的扩展区Re2,所以可以方便地在经修改的索引文件N1R中列出特定字符型式的所有经修改的发生号型式。
下面接着描述按照本发明第三个实施例的在存储单元28中删除一部分作为原始索引文件而存储的正文记录的部分删除操作。
如图6所示,当读取通过部分删除某一原始正文N1而获得的经修改的正文并在经修改的正文读取单元25中产生经修改的正文记录时,经修改的发生号表是按照经修改的发生号表准备单元26中经修改的正文记录产生、并存储在存储单元28内的。随后,为每一字符型式准备经修改的正文经修改的发生号型式表,作为索引文件准备单元27中的经修改的索引文件N1D,并用存储单元28中存储的原始索引文件N1代替修改的索引文件N1D。这样,因为经修改的索引文件N1D的某一特定字符型式的经修改的发生号型式数量必须等于或低于原始索引文件N1的发生号型式的数量,所以不另外设置任何扩展区。
下面参考图15详细描述部分删除操作。
图15是示出按照第三实施例的对于存储在存储单元28中的索引文件进行部分删除操作的流程图。
如图15所示,由经修改的正文读取单元25读取经修改的检索正文“AAIAAIAN”,它是由在存储单元28中通过部分删除作为索引文件存档的原始检索正文“AAIAAIANNAANAI”而获得的,并将记录号N1D附到经修改的检索正文上,产生经修改的正文记录N1D(步骤S401)。随后,如图16所示,以与第二实施例的步骤S302到S304相同的方式,准备经修改的正文记录N1D的经修改的发生号表,并将该表存储在存储单元28中(步骤S402到S404)。
随后,以与第二实施例的步骤S305和S306中相同的方式,在使型式指针P2和P4移位(步骤S405和S406)时,通过发生号型式更新单元34,用经修改的发生号表中更新型式指针P4所指出的经修改的发生号型式逐个替换原始索引文件N1中发生号型式指针P2所表示的发生号型式(步骤S407)。这样,由于经修改的检索正文是通过部分删除原始检索正文获得的,所以不用经修改的发生号型式替换扩展区Re1中记录的任何发生号型式。
接着,判断型式指针P4是否设置为经修改的发生号表的最后一个经修改的发生号型式(步骤S408)。如果型式指针P2没有设置为经修改的发生号表的最后一个经修改的发生号型式,则继续步骤S407。相反,如果在经修改的索引文件N1D中已经列出了经修改的发生号表的最后一个的经修改的发生号型式,则得到了如图17所示的经修改的发生号型式表。接着,再次将与每一字符型式对应的记录区中记录的最后的经一个修改的发生号型式记录在跟在后面的一个记录区或扩展区Re1中(步骤S409)。接着,由索引文件搜寻单元31判断经修改的发生号型式表中是否存在不出现在经修改的检索正文中的、不使用的字符型式(步骤S410)。如果存在不出现在经修改检索正文中的、不使用的字符型式,则与不使用的字符型式对应的顶部记录区就变成一扩展区Re3,以删除在顶部记录区中记录的发生号型式,并且把一段无效型式表示信息存储在扩展区Re3中(步骤S411)。即,将扩展区Re3后面的一个或多个记录区和扩展区Re1作为无效区来对待。例如,如图18所示,因为经修改的检索正文中不存在字符型式(N,A),所以把字符型式(N,A)作为不使用的字符型式来对待,并且顶部记录区变成一扩展区Re3。并且将字符型式(N,N)作为一不使用的字符型式来对待,而与不使用的字符型式对应的顶部记录区变成一扩展区Re3。
接着,以与第一实施例(图9)中相同的方式,对与某一关键词一致的一个或多个字符流进行搜寻经修改的索引文件N1D的搜寻操作。这样,即使在记录相同最后一个发生号型式的一对记录区后面的记录区或扩展区内保持有索引文件产生操作中列出的特定发生号型式(图7),因为搜寻操作是在以使发生号增加的顺序来排列经修改的发生号型式表中每一字符型式的发生号型式的情况下进行的,所以不进行对特定发生号型式的搜寻操作。例如,尽管与字符型式(A,A)对应,在第二和第三记录区中记录了发生号型式(3,4)以后,在扩展区Re1中记录了发生号型式(6,7),但不进行对第三记录区和扩展区Re1中记录的发生号型式(3,4)和(6,7)的搜寻操作。同样的原因,不对无效区中记录的任何发生号型式进行搜寻操作。
因此,因为在部分删除操作中未删除所有不必要的发生号型式,所以可以高速进行部分删除操作。
接着描述按照第四实施例实现第二个目的的信息搜寻装置。
图19是按照本发明第四和第五实施例的信息搜寻装置的方框图。
如图19所示,信息搜寻装置41包含请求与数据接收单元42,用来接收一段实时处理数据的处理数据组和按照实时处理数据请求实时更新操作、实时增加操作或实时删除操作的实时处理请求,并接收检索字符流的检索组和请求检索操作的检索请求,实时处理数据寄存单元43,用来寄存实时处理数据的处理数据组以及按照实时处理请求的实时处理请求,实时处理数据存储单元44,用来在数据寄存位置(BtmNew)存储由寄存单元43逐个寄存的多个处理数据组;实时处理数据条件管理单元45,用来管理存储单元44中存储的处理数据组的使用条件,并控制存储单元44以存储在数据寄存位置(BtmNew)处由寄存单元43寄存的每一个处理数据组;显示数据产生单元46,用来按照相应的实时处理请求,根据由寄存单元43寄存的每一实时处理数据,产生一段显示数据;
存储显示数据的显示数据存储单元47;显示显示数据的显示器48;索引文件存储单元49,用来存储索引文件,索引文件中大体保存着分别由呈串行排列的字符组成的一个或多个原始检索正文,并且每一个原始检索正文由数据号识别,实时处理单元50,用来在管理单元45的控制下,逐个实时进行对存储单元44中存储的处理数据组中每一个数据组的实时处理,并对索引文件存储单元49中存储的索引文件中的处理数据组进行存档,以修改索引文件,索引文件搜寻单元51,用来搜寻索引文件存储单元50中存储的索引文件,从而当请求和数据接收单元42接收到检索请求和检索字符流的检索组时,不管在实时处理单元50中对存储单元44中存储的所有处理数据组的实时处理是否结束,检索与数据接收单元42接收的检索字符流一致的一个或多个字符流,并输出与检索字符流一致的字符流的检索结果,字符流检索单元52,用来搜寻所有的处理数据组,当由请求和数据接收单元42接收到检索请求和检索字符流的检索组时,搜寻存储在存储单元44中并且实时处理单元50不处理的所有处理数据组,从而从处理数据组中检索出分别与请求与数据接收单元42接收的检索字符流一致的一个或多个字符流;检索结果修改单元53,用来按照字符流检索单元52中获得的处理数据搜寻结果,修改在索引文件搜寻单元51中得到的检索结果,从而无论实时处理单元50对处理数据组进行的实时处理是否结束都在检索结果中反映请求与数据接收单元42所接收的所有处理数据组;以及检索结果输出单元54,用来输出检索结果修改单元53所获得的经修改的检索结果。
在上述结构中,参考图20描述了一段实时处理数据的处理数据组和实时处理请求的寄存。如图20所示,当某一用户通过输入由实时处理数据和实时处理请求组成的处理数据组来请求对一段实时处理数据作实时处理时,由实时处理数据组和实时处理请求组成的处理数据组由请求与数据接收单元42接收,并由实时处理数据寄存单元43寄存(步骤S501),并且由实时处理数据条件管理单元45将信息搜寻装置41设置为一处理条件(步骤S502)。例如,如图21所示,由实时处理数据和实时处理请求组成的处理数据组指出将数据号为D4的一段数据更新为字符流“EOK”的更新操作。接着,由实时处理数据寄存单元43检查实时处理数据条件管理单元45设置的实时处理数据存储单元44中的数据寄存位置(BtmNew)(步骤S503),并且把由实时处理数据和实时处理请求组成的处理数据组存储在实时处理数据存储单元44中的数据寄存位置(BtmNew)处(步骤S504)。这样,如图22所示,由管理单元45将一对标志F1和F2加到由实时处理数据和实时处理请求组成的处理数据组上。标志F1是一指出检索条件的检索标志,而另一标志F2是指出更新、增加或删除情况的实时处理标志。所以,如图23所示,逐个由接收单元42接收的实时处理数据和实时处理请求的多个处理数据组随标志一起存储在存储单元44内。接着,数据寄存位置移位至更低的位置(BtmNew←BtmNew+1)(步骤S505)。
接着,当实时处理请求指出更新或增加操作时,由显示数据产生单元46中的寄存单元43寄存的实时处理数据产生一段显示数据。随后,如果是更新操作,则用显示数据替换存储单元47中存储的一段老的显示数据,如果是增加操作,则在存储单元47中增加显示数据(步骤S506)。并且,如果实时处理请求指出删除操作,则在存储单元47中删除由实时处理数据表示数据号的一段数据。例如,用显示数据产生单元46产生如图24所示的一段显示数据,并且如图25所示,将数据号为D4的数据段改变成“EOK”。随后,将表示实时处理数据和实时处理请求的处理数据组的寄存已结束的一段数据寄存结束信息从寄存单元43传送到显示器48(步骤S507),从而通知用户寄存操作已经结束。随后,将信息搜寻装置41设置为等待处理请求的条件(步骤S508)。
因此,当用户请求另一实时处理(步骤S509)时,重复步骤S501到步骤S508。
下面,参照图26描述对存储在存储单元44中的由实时处理数据和实时处理请求组成的处理数据组进行处理而执行的索引文件的修改。
图26是示出对存储在存储单元49中索引文件进行修改操作的流程图。
如图26所示,由实时处理单元50通过管理单元45对由一段实时存储数据和实时处理请求组成的处理数据组是否存储在存储单元44中进行判断(步骤S511)。如果处理数据组没有存储在存储单元44中,则在等待时间后重复步骤S511。相反,如果一个或多个处理数据组已经存储在存储单元44内,则将处理数据组放置在存储单元44中从顶部处理位置(TopNew)到底部处理位置(BtmNew)之间的处理位置上,顶部处理位置用处理指针P5表示,并且把存储在顶部处理位置(TopNew)处的顶部处理数据组在管理单元45的控制下传送到处理单元50(步骤S512),而且将顶部处理数据组的实时处理标志F2设置成“on(开启)”条件(步骤S513)。例如,如图23所示,把一段实时处理数据“AIU”和一实时更新请求的顶部处理数据组传送至处理单元50。随后,按照顶部处理数据组,对顶部处理数据组进行实时处理,以修改存储单元49中存储的索引文件(步骤S514)。例如,用实时处理数据“AIU”替换索引文件中以数据号D5存储的一段数据。
索引文件的结构如图27所示。如图27所示,在索引文件中列出多个字符型式(C1,C2),每一个字符型式表示检索正文中相互靠近的第一字符C1和第二字符C2。对索引文件中的每一字符型式,还列出一个或多个字符信息型式(PC1,DN),它们分别表示检索正文中第一字符C1的位置PC1和识别检索正文的数据号DN。例如,如图28A所示,如果用字符流“AIAAIUAU”表示数据号DN=1的原始检索正文,则通过从1起按发生的顺序对原始检索正文的字符编号来确定每一字符的字符位置,并在原始索引文件中列出对应于字符型式(A,A)的字符信息型式(3,1)、对应于字符型式(A,I)的两个字符信息型式(1,1)和(4,1)、对应于字符型式(A,U)的字符信息型式(7,1)、对应于字符型式(I,A)的字符信息型式(2,1)、对应于字符型式(I,U)的字符信息型式(5,1)和对应于字符型式(U,A)的字符信息型式(6,1)。随后,如果在步骤S514中将数据号DN=5的字符流“AIU”加到原始检索正文上,那么因为字符流“AIU”分成两个字符型式(A,I)和(I,U),对应于字符型式(A,I)的字符信息型式(1,5)和对应于字符型式(I,U)的字符信息型式(2,5)就加至原始索引文件。因而,如图28B所示,修改了原始索引文件。
并且,如果对原始索引文件进行删除操作,那么就删除了与某一删除数据号相关的所有字符信息型式。并且,如果对原始索引文件进行更新操作,那么就删除了与某一更新数据号相关的所有字符信息型式,并且把一个或多个更新字符信息型式就加至原始索引文件。
接着,当对顶部处理数据组的实时处理结束以后,顶部处理数据组的实时处理标志F2被设置成“off(关断)”条件(步骤S515),并且由处理指针P5指出的存储单元44的位置就移位到某一更低的位置(TopNew←TopNew+1),以对下一个数据组进行实时处理(步骤S516)。所以,用处理指针P5指出从顶部的处理位置起第二个位置处放置的下一个处理数据组。同样,用删除指针P6指出放置了在步骤S514中已经处理的顶部处理数据组的前一个顶部处理位置,并且由管理单元45将前一个顶部处理位置设置为底部的实时处理结束位置(BtmOld)(步骤S517)。因而,已经处理的多个处理数据组(或多个经处理的数据组)就放置在从顶部实时处理结束位置(TopOld)到底部实时处理结束位置(BtmOld)之间的位置处。
接着,由管理单元45判断放置在顶部实时处理结束位置(TopOld)处的检索标志F1和实时处理标志F2是否一起设置成“off”条件(步骤S518)。如果经处理的数据组的检索标志F1和实时处理标志F2一起设置成“off”条件,那么因为经处理的数据组的实时处理已经结束并且经处理的数据组未设置成用字符流检索单元52搜寻处理数据组的搜寻条件,所以把顶部实时处理结束位置(TopOld)处放置的经处理的数据组从存储单元44中删除(步骤S519),并且由删除指针P6指出的存储单元44的位置就移位到更低的位置(TopOld←TopOld+1)(步骤S520)。相反,如果将顶部实时处理结束位置(TopOld)处放置的经处理的数据组的检索标志F1或实时处理标志F2设置成“on”条件,那么因为仍然需要经处理的数据组,处理过程跳到步骤S520。随后,重复步骤S518到S520,直到删除了所有经处理的数据组,并且顶部实时处理结束位置(TopOld)到达处理数据组顶部处理位置(TopNew)(步骤S521)。随后,重复步骤S511到S522,直到对所有的处理数据组进行的实时处理均结束并且处理数据组顶部位置(TopNew)到达数据寄存位置(BtmNew)为止(步骤S522)。
因此,由请求与数据接收单元42接收的多个处理数据组作为多个处理数据组逐个存储在数据寄存位置(BtmNew)处,同时使数据寄存位置(BtmNew)移位,将处理数据组放置在从顶部处理位置(TopNew)到数据寄存位置(BtmNew)的位置处,在使顶部处理位置(TopNew)移位时对放置在顶部处理位置(TopNew)处的一个处理数据组进行实时处理,将结束对处理数据组的实时处理而获得的多个经处理的数据组放置在从顶部实时处理结束位置(TopOld)到底部实时处理结束位置(BtmOld)之间的位置处,并且在处理所有的处理数据时逐个删除所有经处理的数据。所以,可以实时修改索引文件存储单元49中存储的索引文件。
下面描述按照第一实施例在不对实时处理数据存储单元44中存储的所有处理数据组进行实时处理的情况下进行的检索操作。
图29是在不对所有的处理数据组进行实时处理的情况下进行检索操作的流程图。
如图29所示,当不管实时处理单元50中对存储单元44中存储的所有处理数据组进行的实时处理是否结束而由请求与数据接收单元42接收到由用户准备的检索字符流和检索请求的检索组时(步骤S531),因为接收到检索请求,所以等效于某一关键词的检索字符流就被传送到索引文件搜寻单元51和字符流检索单元52(步骤S532)。在搜寻单元51中,搜寻索引文件存储单元50中存储的索引文件,以检索与该检索字符流一致的一个或多个字符流(步骤S533),并且将表示与该检索字符流一致的字符流检索的检索结果输出到检索结果修改单元53(步骤S534)。
详细说来,将检索字符流划分成一系列指定的字符型式{C1(i),C2(i)}(i=1,2,…,p,p+1,…),从索引文件中选择与每一个指定的字符型式对应的一个或多个字符信息型式,并且当每一对特定字符信息型式的数据号DN相互一致而与第一指定字符型式对应的一个特定字符信息型式的字符位置PC1比与第二指定字符型式对应的另一特定字符信息型式低1时,从字符信息型式中选择出与相互靠近的每一对第一指定字符型式{C1(p),C2(p)}和第二指定字符型式{C1(p+1),C2(p+1)}对应的一对或多对特定的字符信息型式。即,如果第一和第二指定字符型式的两个字符C1(p)和C1(p+1)在同一检索正文中按那个顺序相互邻接,那么就选择每一对特定的字符信息型式。所以,如果对于从所有指定字符型式产生的所有指定字符型式对中每一对型式存在一对或多对特定字符信息型式,那么就判断索引文件中是否存在与检索字符流一致的一个或多个字符流。例如,如果在步骤S531中接收到检索字符流“AIU”,并且图28B中所示的索引文件存储在存储单元49中,则检索字符流“AIU”被划分,在搜寻单元51中产生两个指定的字符型式(A,I)和(I,U),从索引文件中选择与指定的字符型式(A,I)对应的字符信息型式(1,1)、(4,1)和(1,5)以及与指定的字符型式(I,U)对应的字符信息型式(5,1)和(2,5),因为特定字符信息型式对的数据号DN相互一致并且一个特定字符信息型式(4,1)的字符位置PC1=4比另一个特定字符信息型式(5,1)的PC1=5低1而选择一对特定的字符信息型式(4,1)和(5,1),因为特定字符信息型式对的数据号DN相互一致并且一个特定字符信息型式(1,5)的字符位置PC1=1比另一个特定字符信息型式(2,5)的PC1=2低1而选择另一对特定的字符信息型式(1,5)和(2,5)。所以,在索引文件中存在两个与检索字符流“AIU”一致的字符流。
接着,在管理单元45的控制下,读取实时处理数据存储单元44中从顶部处理位置(TopNew)到数据寄存位置(BtmNew)之间的位置处放置的一个或多个处理数据组,并将该数据组传送到字符流检索单元52(步骤S535),并逐个由管理单元45将处理数据组的检索标志F1设置成“on”条件(步骤S536)。“on”条件的每一处理数据组是不由实时处理单元50来处理的。随后,搜寻处理数据组中的每一实时处理数据,以检索分别与检索字符流一致的一个或多个字符流(步骤S537),并且将处理数据搜寻结果输出到检索结果修改单元53。接着,按照处理数据搜寻结果修改索引文件搜寻单元51中得到的检索结果,以反映检索结果中由请求与数据接收单元42所接收的所有处理数据组(步骤S538),由管理单元45将存储单元44中存储的每一处理数据组的检索标志F1设置成“off”条件(步骤S539),并从检索结果输出单元54输出经修改的检索结果(步骤S540)。当用户对信息搜寻装置41发出指令显示经修改的检索结果时,还通过显示数据存储单元47由显示器48显示经修改的检索结果。在经修改的检索结果中,列出存在与指定的字符流一致的一个或多个字符流的一个或多个检索正文的一个或多个数据号,并且为每一数据号列出与指定的字符流一致的字符流的数量。
下面参考图30详细描述修改单元53中进行的修改操作。
如图30所示,由搜寻单元51搜寻存储单元49中存储的索引文件,以检索与检索字符流“AIU”一致并且列在数据号为D1、D5、D10和D15的多个检索正文中的多个字符流,以及存储单元44中存在的四个如图30中所示的处理数据组。在这种情况下,因为第一处理数据组而将检索正文D5的字符流“AIU”加到检索结果中,因为与检索字符流不同的字符流“UEO”按照第二处理数据组加到检索正文D12中而废弃第二处理数据组,因为受第三处理数据组的指令而用与检索字符流一致的字符流“AIU”替换检索正文D11的字符流而将检索正文D11的字符流“AIU”增加到检索结果,并且因为第四处理数据组而从检索结果中删除检索正文D5。
因此,尽管在执行单元50执行的实时处理的中间将检索请求输入到信息搜寻装置41,但是因为不由执行单元50处理的一个或多个处理数据组中的每一个数据组由字符流检索单元52搜寻,并且修改由索引文件搜寻单元51获得的检索结果,所以在经修改的检索结果中可以反映输入到信息搜寻装置41的所有处理数据组。即,尽管在索引文件的寄存、增加、更新或删除中间请求检索操作,但可以对于分别与检索字符流一致的一个或多个字符流立即执行索引文件搜寻操作,而不必等到对索引文件的寄存、增加、更新或删除操作的结束。
在第四实施例中,每一检索正文中字符的绝对位置是由管理单元45控制的。然而,每一检索正文中字符的相对位置也可以由管理单元45来管理。
在第四实施例中还使用两个标志F1和F2。但是,因为不存在将标志F1和F2都设置成“on”条件的情况,所以可以用一个标志来取代标志F1和F2。
下面描述第五实施例,在该实施例中,在实时处理数据存储单元44中存储另一个处理数据组时在请求与数据接收单元42中接收到处理数据组中的一个数据组的情况下,对相应于同一特定检索正文的两个处理数据组进行实时处理。
如图19所示,信息搜寻装置41还包含重复实时处理避免单元55,用来在请求与数据接收单元42接收到与同一特定检索正文相应的重复处理数据组时,将相应于特定检索正文并存储在实时处理存储单元44中的原始处理数据组变更成相应于同一特定检索正文的经修改的处理数据组;并舍弃重复处理数据组。
下面参照图31描述在上述结构的信息搜寻装置41中用于对相应于同一特定检索正文的两个处理数据组的实时处理。
图31是示出按照本发明第五实施例的对应于相同特定检索正文的两个处理数据组之实时处理的流程图。
如图31所示,在如图20所示的步骤S501到S503中接收并寄存对应于某一特定检索正文的特定处理数据组以后,因为相应于同一特定检索正文的原始处理数据组是存储在实时处理数据存储单元44内的,所以,由重复实时处理避免单元55来判断该特定处理数据是否等效于某一重复的处理数据组(步骤S601)。如果在实时处理数据存储单元44中存储有与相同特定检索正文相应的原始处理数据组,那么就判断该特定处理数据组等效于某一重复处理数据组,并通过将原始处理数据组变更成与相同特定检索正文对应的经修改的处理数据组和舍弃重复处理数据组,而由重复实时处理避免单元55执行重复处理避免操作(步骤S602)。
例如,如图32A所示,如果在存储单元44中存储与特定检索正文D1相应并请求增加字符流“AIU”的增加操作的原始处理数据组,并接收和寄存请求更新操作从而用某一字符流“IUE”来代替特定检索正文D1的一段数据的重复处理数据组,那么因为用字符流“IUE”替换加至特定检索正文的字符流“AIU”,所以原始处理数据组就改变成请求将字符流“IUE”加至该特定检索正文D1的增加操作的经修改的处理数据组,并舍弃重复处理数据组。
并且,如图32B所示,如果在存储单元44中存储对应于特定检索正文D1并请求将特定检索正文D2的一段数据替换为字符流“UEO”的更新操作之原始处理数据组,并且接收和寄存请求删除特定检索正文D2的删除操作的重复处理数据组,那么因为该特定检索正文D2最终被删除,所以原始处理数据组就改变成请求删除该特定检索正文D2的删除操作的经修改的处理数据组,而重复处理数据组被舍弃。
同时,如图32C所示,如果在存储单元44中存储对应于特定检索正文D3并请求删除特定检索正文D3的删除操作的原始处理数据组,以及接收并寄存请求将字符流“IUE”加至特定检索正文D3的增加操作的重复处理数据组,那么因为删除了特定检索正文D3的数据和加入了字符流“IUE”,所以原始处理数据组改变成请求用字符流“IUE”来替换特定检索正文D3的更新操作的经修改的处理数据组。
接着,由重复实时处理避免单元55来判断是否需要将经修改的处理数据组存储在存储单元44中(步骤S603)。如果需要存储经修改的处理数据组,那么就由重复实时处理避免单元55将经修改的处理数据组存储在存储单元44中,并且数据寄存位置移位至更低的位置(BtmNew←BtmNew+1)(步骤S605)。随后,执行如图20中所示的步骤S506到S509。
因此,因为可以避免对重复处理数据组的重复实时处理,所以可以在高速下有效地进行实时处理。
下面描述第六实施例。在该实施例中,在处理数据组寄存操作中准备一个字符存在判断表,该判断表用来判断在实时处理数据存储单元44中存储的所有处理数据组的实时处理数据中所使用的字符之存在,用该字符存在判断表在字符流检索单元52中进行检索操作。
图33是按照本发明第六实施例的信息搜寻装置方框图。
如图33所示,信息搜寻装置61包含请求与数据接收单元42;实时处理数据寄存单元43;实时处理数据存储单元44;实时处理数据条件管理单元45;索引文件存储单元49;实时处理单元50;索引文件搜寻单元51;字符流检索单元52;字符存在判断表准备单元62,用来准备一字符存在判断表,表中指出实时处理数据存储单元44中所存储的特定处理数据组的一段实时处理数据中所使用字符的存在,字符存在判断表存储单元63,用来存储字符存在判断表准备单元62所准备的字符存在判断表,判断表复位单元64,当对特定处理数据组的实时处理结束并且删除存储单元44中存储的特定处理数据组时,使存储单元44中存储的字符存在判断表复位;检索操作控制单元65,当请求与数据接收单元42接收到检索请求和检索字符流的检索组时,控制字符流检索单元52,以搜寻每一个都存储在存储单元44中并且不由实时处理单元50处理的所有处理数据组,并在参照字符存在判断表存储单元63中存储的字符存在判断表并输出处理数据搜寻结果的同时,控制字符流检索单元52,以检索与由请求与数据接收单元42从处理数据组接收的检索字符流分别一致的一个或多个字符流;检索结果修改单元53,和检索结果输出单元54。
下面参照图34描述上述结构中按照第六实施例的处理数据组寄存操作。
图34是按照第六实施例的处理数据组寄存操作的流程图。
如图34中所示,在以如图20所示的相同的方式执行了步骤S501至S503以后,如图35所示使字符存在判断表初始化,判断表中,所有类型字符中的每一个对应于一个字符存在判断标志(步骤S610)。即,将所有字符存在判断标志中的每一个设置成表示不存在相应字符类型的“off”条件。随后,由字符存在判断表准备单元62检查寄存单元43寄存的处理数据组的一段实时处理数据顶部字符的类型(步骤S611),在字符存在判断表中将与经检查的字符类型相应的字符存在判断标志设置成“on”条件(步骤S612)。例如,寄存示于图21中所设置的处理数据组,将与字符“E”的类型对应的字符标志F(E)设置成“on”条件。随后,判断与步骤S612中所设置的字符存在判断标志对应的字符是否排列在实时处理数据最后的位置处(步骤S613)。如果与步骤S612中所设置的字符存在判断标志对应的字符不是放置在最后位置上,那么就由准备单元63检查实时处理数据中下一个字符的类型(步骤S614),并重复步骤S612和S613。相反,如果与步骤S612中设置的字符存在判断标志对应的字符是放置在最后位置上,那么因为与实时处理数据中存在的所有字符的类型对应的字符存在判断标志被设置成表示存在相应字符的“on”条件,所以将字符存在判断表存储在字符存在判断表存储单元63中,将处理数据组存储在存储单元44中(步骤S504),并执行步骤S505至S509。本例中,因为如图36所示实时处理数据“EOK”是由寄存单元43寄存的,所以将对应于字符“E”、“O”和“K”的字符存在判断标志设置成“on”条件的字符存在判断表由字符存在判断表准备单元62准备。
随后,当由实时处理单元50结束对处理数据组的实时处理并且由管理单元45删除存储单元44中所存储的处理数据组时,与处理数据组的实时处理数据中所有字符类型对应的字符存在判断标志由判断表复位单元64复位成“off”条件。
下面参照图37描述按照第六实施例的字符流检索操作,字符流检索单元52在检索操作控制单元65的控制下使用字符存在判断表而进行该操作。
图37是使用字符存在判断表时进行的字符流检索操作流程图。
在由字符流检索单元52执行了步骤S531至S536以后,对表示存储单元44中存储的处理数据组的某一特定处理数据组进行字符流检索操作。即,如图37所示,提取由接收单元42所接收的检索字符流顶部的字符,作为检查字符(步骤S621),并判断与经检查的字符对应的字符存在判断标志是否在特定字符存在判断表中设置成“on”条件,该表指出了用于特定处理数据组中字符的存在(步骤S622)。
如果与经检查的字符对应的字符存在判断标志被设置成“on”条件,那么就判断经检查的字符是否设置为检索字符流最后位置(步骤S623)。如果经检查的字符不是设置为检索字符流的最后位置,那么就从检索字符流中提取经检查的字符后面的另一个字符作为检查字符(步骤S624),并重复步骤S622。
相反,如果与经检查的字符对应的字符存在判断标志不是设置为“on”条件,因为与检索字符流所有字符对应的一个或多个字符存在判断标志在特定字符存在判断表中不是设置为“on”条件,所以作出不存在与检索字符流一致的字符流的判断。所以,结束对特定处理数据组的字符流检索操作。
并且,如果在步骤S623中经检查的字符不是设置在检索字符流的最后位置上,因为与检索字符流所有字符对应的一个或多个字符存在判断标志被设置成特定字符存在判断表中的“on”条件,所以作出存在分别与检索字符流一致的一个或多个字符流的判断。所以,从特定处理数据组的一段实时处理数据中检索分别与检索字符流一致的一个或多个字符流(步骤S537),以同样的方式执行步骤S538到S540。
因此,因为准备了指出特定处理数据组中使用字符存在的字符存在判断表,所以当搜寻特定处理数据组以检索与检索字符流一致的一个或多个字符流时,可以高速执行对特定处理数据组中是否存在与检索字符流一致的一个或多个字符流的判断,并且当判断为不存在与检索字符流一致的字符流时,可以停止由字符流检索单元52执行的字符流检索操作。所以,可以在高速下进行字符流检索操作。
下面描述第七实施例,在该实施例中,在与同一特定检索正文对应的多个处理数据组存储在实时处理数据存储单元44中的情况下,对相应于某一特定检索正文的最近的处理数据组进行字符流检索操作。
图38是按照本发明第七实施例的信息搜寻装置的方框图。
如图38所示,信息搜寻装置71包含请求与数据接收单元42;实时处理数据寄存单元43;实时处理数据存储单元44;实时处理数据条件管理单元45;显示数据产生单元46;显示数据存储单元47;显示器48;索引文件存储单元49;实时处理单元50;索引文件搜寻单元51;字符流检索单元52;重复检索操作避免单元72,用来从与实时处理数据存储单元44中存储的相同特定检索正文对应的多个处理数据组中选择对应于某一特定检索正文的最近的处理数据组;控制字符流检索单元52,以从最近的处理数据组中检索分别和请求与数据接收单元42接收的检索字符流对应的一个或多个字符流,并控制字符流检索单元52,不对相应于相同特定检索正文的其他处理数据组进行字符流检索操作;检索结果修改单元53;和检索结果输出单元54。
下面参照图39描述在上述结构的信息搜寻装置71中,在避免重复检索操作时在重复检索操作避免单元72的控制下由字符流检索单元52执行的字符流检索操作。
在用如信息搜寻装置41中相同的方式执行的如图29所示的步骤S531至S536以获得存储在存储单元44中的多个处理数据组以后,如图39所示,因为在存储单元44中存储的多个处理数据组中,排列在存储单元44的数据寄存位置(BtmNew)处的指定处理数据组是最新的,所以取出该指定的处理数据组,作为一检索数据组(步骤S631),并且对检索数据组进行字符流检索操作,以从检索数据组中检索出与检索字符流一致的一个或多个字符流(步骤S632)。随后,按照字符流检索单元52的处理数据搜寻结果,由检索结果修改单元53修改索引文件搜寻单元51中获得的检索结果(步骤S538)。接着,判断该检索数据组是否处在顶部的处理位置(TopNew)(步骤S633)。
如果检索数据组排列在顶部的处理位置(TopNew),那么因为在步骤S632中已经进行了对存储单元44中存储的所有处理数据组中每一数据组的字符流检索操作,所以结束避免单元52的操作。相反,如果该检索数据组不排列在顶部的处理位置(TopNew),那么就取出放置在检索数据组上部位置处的处理数据组,作为对应于由数据号标识的特定检索正文的检索数据组(步骤S634),并判断是否先前在步骤S632中对与相同特定检索正文对应的特定处理数据组执行过字符流检索操作(步骤S635)。
如果从未对与相同特定检索正文对应的特定处理数据组进行过字符流检索操作,那么重复步骤S632、S538、S633和S634。即,按列出的反向顺序进行由字符流检索单元52执行的检索操作和由修改单元53执行的修改操作。相反,如果先前已对与相同特定检索正文对应的特定处理数据组进行过字符流检索操作,那么就不对检索处理数据组进行任何字符流检索操作,并且过程返回到步骤S633。即,避免了重复检索操作。
下面参照图40详细描述在避免单元72的控制下在字符流检索单元52和修改单元53中进行的检索和修改操作。
如图40所示,由搜寻单元51搜寻存储单元49中存储的索引文件,以检索与检索字符流“AIU”一致并且列在数据号为D1、D5、D10和D15的多个检索正文中的多个字符流以及存储单元44中存在如图40所示的四个处理数据组。这样,因为排列在存储单元44的数据寄存位置(BtmNew)处的第一处理数据组表示对检索正文D5的删除操作而从检索结果中删除检索正文D5,因为排列在第一处理数据组上部位置处的第二处理数据组表示用与检索字符流一致的字符流“AIU”来替换检索正文D11的字符流而将检索正文D11的字符流“AIU”加至检索结果,因为按照第三处理数据组而将与检索字符流不同的字符流“UEO”加到检索正文D12而舍弃排列在第二处理数据组上部位置处的第三处理数据组,并且因为已经由字符流检索单元52在避免单元72的控制下处理了第四处理数据组表示的检索正文D5而舍弃排列在第三处理数据组上部位置处的第四处理数据组。
因此,因为如果与相同特定检索正文对应的多个处理数据组存储在实时处理数据存储单元44中而对相应于特定检索正文的最近的处理数据组进行字符流检索操作,以及因为不对相应于相同特定检索正文的其他处理数据组进行字符流检索操作,所以可以高速进行字符流检索操作。
下面描述按照第八实施例在由实时处理单元50进行的实时处理期间执行的强迫结束操作和在强迫结束操作以后进行的启动操作。
图41是按照本发明第八实施例的信息搜寻装置的方框图。
如图41所示,信息搜寻装置81包含请求与数据接收单元42;实时处理数据寄存单元43;实时处理数据存储单元44;实时处理数据条件管理单元45;显示数据产生单元46;显示数据存储单元47;显示器48;索引文件存储单元49;实时处理单元50;强迫结束操作请求单元82,用来当请求与数据接收单元42接收到结束请求时,请求实时处理单元59强迫结束实时处理;结束条件存储单元83,用来存储由于强迫结束操作请求单元82请求的强迫结束操作而未由实时处理过程处理的一个或多个处理数据组;启动操作请求单元84,用来当请求与数据接收单元42接收到启动请求时,请求实时处理单元50启动由结束请求强迫结束的实时处理过程,索引文件搜寻单元51;字符流检索单元52;检索结果修改单元53和检索结果输出单元54。
下面参照图42描述在上述结构中在信息搜寻装置81中进行的强迫结束操作。
图42是示出按照本发明第八实施例的强迫结束操作的流程图。
如图42所示,当在实时处理单元50进行实时处理的中间由接收单元42接收到一结束请求(步骤S701),那么强迫结束操作请求单元82请求实时处理单元50在处理了当前处理数据组以后,强迫结束实时处理(步骤S702)。例如,如果在接收到结束请求时正在对如图23所示的四个处理数据组顶部的处理数据组进行了实时处理的情况下,在将检索正文D5更新为字符流“AIU”的操作结束以后强迫结束实时处理。
接着,通过请求单元82将每一个存储在存储单元44中并且实时处理单元50不处理的一个或多个处理数据组传送到结束条件存储单元83,作为一段结束条件数据(步骤S703)。如图43所示,结束条件数据中的每一个包含诸如更新操作、增加操作或删除操作等处理类型、标识相应的检索正文的数据号和一段数据。因为结束了对检索正文D5的更新操作,所以如图44所示,将三段结束条件数据存储在结束条件存储单元83中。随后,告诉用户实时处理的强迫结束(步骤S704)。
下面参照图45描述强迫结束操作以后进行的启动操作。
如图45所示,当请求与数据接收单元42接收到启动请求时(步骤S711),由启动操作请求单元84判断是否在存储单元83中存储了一段或多段结束条件数据(步骤S712)。如果一段或多段结束条件数据存储在存储单元83中,就将结束条件数据传送到实时处理单元50,作为一个或多个处理数据组,对处理数据组中的每一个进行实时处理(步骤S713),作为紧急启动操作。在执行了紧急启动操作以后,执行正常的启动操作(步骤S714)。
因此,即使在存储单元44中存储了大量的处理数据组,但因为当接收到结束请求时强迫结束了对处理数据组的实时处理,所以不存在用户需要很长时间来等待对所有处理数据组的实时处理的结束的情况。所以,用户可以用信息搜寻装置81立即进行另一种类型的操作。
并且,即使对所有处理数据组的实时处理没有结束,但因为未处理的一个或多个数据组是存储在结束条件存储单元83内的,所以,可以将未处理的处理数据组当作紧急启动操作来处理。所以,可以不管处理数据组的大小正确地对所有处理数据组进行实时处理。
下面描述按照第九实施例的检索结果输出操作,在该操作中,如果特定检索正文是在获得了经修改的检索结果以后更新的,则对特定检索正文的经修改的检索结果与一段表示该特定检索正文更新的更新信息一起输出。
图46是本发明第九个实施例的信息搜寻装置的方框图。
如图46所示,信息搜寻装置91包含请求与数据接收单元42;实时处理数据寄存单元43;实时处理数据存储单元44;实时处理数据条件管理单元45;显示数据产生单元46;显示数据存储单元47;显示器48;索引文件存储单元49;实时处理单元50;索引文件搜寻单元51;字符流检索单元52;检索结果修改单元53;检索结果输出单元54;检索时间测量和记录单元92,用来测量和记录检索时间,在该时间内,对检索正文中的每一个,由索引文件搜寻单元51或者由字符流检索单元52搜寻检索正文或检索正文的处理数据组,并由字符流检索单元从检索正文中检索出与检索字符流一致的一个或多个字符流;更新时间测量和记录单元93,用来测量和记录更新时间,在该时间内,对检索正文中的每一个,由实时处理单元50更新索引文件存储单元49中存储的检索正文,检索结果输出操作控制单元94,当请求与数据接收单元42接收到检索结果输出请求时,用来控制检索结果输出操作的进行;更新操作通知单元95,用来判断检索时间测量和记录单元92对检索正文中的每一个检索正文测量的一个检索时间是否比更新时间测量和记录单元93测得一个更新时间迟,并且如果更新时间比检索时间迟,则准备一段更新信息,它表示对某一检索正文的更新操作是在由索引文件搜寻单元51或字符流检索单元52对检索正文中的每一个进行检索正文或检索正文的处理数据组的搜寻以后进行的,以及更新信息输出单元96,用来输出由更新操作通知单元95对每个检索正文获得的数据号、检索正文的数据和更新或不更新信息。
下面描述在上述结构中由信息搜寻装置91进行的检索结果输出操作。
图47是示出记录检索时间的流程图。
当请求与数据接收单元41接收到请求检索操作的检索字符流和检索请求的检索组时,以如图29所示同样的方式执行步骤S531到S538。随后,执行如图47所示检索时间的记录。即,如图48所示,对检索正文中的每一个,将一组数据号和由索引文件搜寻单元51或字符流检索单元52对检索正文或检索正文的处理数据组进行搜寻的检索时间以及从检索正文由字符流检索单元52检索的与检索字符流一致的一个或多个字符流,记录在检索时间测量和记录单元92内(步骤S721)。随后,以与图29中相同的方式执行步骤S539和S540。例如,如果由索引文件搜寻单元51从某一检索正文D1中在10点钟检索到与检索字符流“AIU”一致的字符流,那么如图49所示,就得到了一组数据号D1和检索时间1000。
随后,进行更新时间的记录。详细说来,当请求与数据接收单元42接收到由一段实时处理数据和请求对特定检索正文进行实时处理的实时处理请求组成的处理数据组时,以与图20所示相同的方式执行步骤S501到S509,以存储并处理用于特定检索正文的处理数据组。随后,由实时处理单元50以与图26中所示相同的方式执行步骤S511到S522,以更新索引文件存储单元49中存储的特定检索正文。并且,如图50所示,测量由实时处理单元50更新索引文件存储单元49中存储的特定检索正文的更新时间(步骤S731),并且如图51中所示的那样,在更新时间测量和记录单元93中记录特定检索正文的一组数据号和更新时间(步骤S732)。例如,如果在10点过10分的时候,将某一检索正文D1更新为一字符流“IUE”,那么如图52所示,就得到一组数据号和一检索时间1010。
随后,输出一段更新信息,该信息表示在索引文件搜寻单元51搜寻该检索正文后对检索正文进行了更新操作。详细说来,如图53所示,当请求与数据接收单元42接收到请求输出一个或多个检索正文的经修改的检索结果的检索结果输出请求时(步骤S741),在检索结果输出操作控制单元94的控制下,每一检索正文的检索时间从检索时间测量和记录单元92传送到更新操作通知单元95(步骤S742),在检索结果输出操作控制单元94的控制下,每一检索正文的更新时间从更新时间测量和记录单元93传送到更新操作通知单元95(步骤S743)。接着,对每一检索正文进行检索时间是否迟于更新时间的判断(步骤S744)。如果检索时间等于或迟于更新时间,则由更新操作通知单元95准备一段更新信息,该信息表示在由索引文件搜寻单元51或字符流检索单元52搜寻检索正文或用于该检索正文的处理数据组以后,不对检索正文进行任何更新操作(步骤S745)。相反,如果更新时间迟于检索时间,则由更新操作通知单元95准备一段更新信息,该信息表示在由索引文件搜寻单元51或字符流检索单元52搜寻了检索正文或用于该检索正文的处理数据组以后,对检索正文进行更新操作(步骤S746)。随后,对每一检索正文,由更新信息输出单元96输出一张列出数据号表、检索正文的数据和更新或不更新信息的表(步骤S747)。
例如,如果由索引文件搜寻单元51或字符流检索单元52从检索正文D1、D2中的每一个接收与检索字符流一致的一个或多个字符流“IUE”,则在步骤S742将用于检索正文D1的检索时间传送到更新操作通知单元95,而在步骤S743将用于检索正文D2的更新时间900和用于检索正文D5的更新时间940传送到更新操作通知单元95。随后,因为用于检索正文D1的更新时间(图52)迟于用于检索正文D1的检索时间1000(图49),所以如图54所示,由更新操作通知单元95准备用于检索正文D1的一段更新信息(步骤S746)。
因此,因为对检索时间是否迟于更新时间作出了判断,所以即使在对检索正文进行搜寻操作以后更新检索正文,也可以通知用户一段更新信息。
在结合较佳实施例对本发明的原理进行了上述描述以后,本领域的技术人员应当了解,在不偏离上述原理的情况下可以对上述实施例的安排和细节进行修改。这些修改都将落在权利要求所包括的范围内。
权利要求
1.一种信息搜寻装置,其特征在于,它包含发生号表准备装置,用来准备一发生号表,表中为每一字符类型列出通过将属于一字符类型的一个或多个字符按出现次序编号而获得的一个或多个字符号;索引文件准备装置,用来将发生号表准备装置准备的发生号表中列出的发生号重新构筑成多个发生号型式,每一个发生号型式表示检索正文中两个相邻字符的一组两个发生号、将发生号型式划分成每一个均与表示一组两个字符类型的字符类型对应的多组发生号型式,并准备列出分别与一个字符型式对应的发生号型式组的索引文件,由每一发生号型式表示的两个相邻字符的特定类型与由相应字符型式表示的两个字符类型一致;以及索引文件搜寻装置,用来通过由关键词表示的指定字符流产生一系列指定字符型式来搜寻索引文件并检索与关键词一致的特定字符流,并且在由特定发生号型式序列表示的一系列特定字符与特定字符流一致时,选择与指定的字符型式序列对应的一系列特定发生号型式。
2.如权利要求1所述的信息搜寻装置,其特征在于,每一组发生号型式中的多个发生号型式是由索引文件搜寻装置使发生号型式的发生号增加或减小的顺序来排列的。
3.如权利要求1所述的信息搜寻装置,其特征在于,它还包含索引文件存储装置,用来存储索引文件准备装置作为索引文件获得的发生号型式组,所述索引文件存储装置包含多个记录区,用来将多个发生号型式从每一组发生号型式的最前的发生号型式存放到最后的发生号型式;以及跟在所述记录区后面的扩展区,用来对最后的记录区中存储的最后的发生号型式后面连接地再存储最后的发生号型式,以及在由索引文件搜寻装置再次检查扩展区中记录的最后的发生号型式时,停止由索引文件搜寻装置进行的对每一组发生号型式的搜寻操作。
4.如权利要求1所述的信息搜寻装置,其特征在于,它还包含索引文件存储装置,用来存储由索引文件准备装置作为索引文件获得的发生号型式组,所述索引文件存储装置包含多个记录区,用来对每一组发生号型式从最前的发生号型式到最后的发生号型式存储多个发生号型式;以及扩展区,它是为每一组发生号型式安排的,用来存储在正文修改操作中由索引文件准备装置获得的附加发生号型式。
5.如权利要求1所述的信息搜寻装置,其特征在于,它还包含索引文件存储装置,用来存储由索引文件准备装置作为索引文件获得的发生号型式组,所述索引文件存储装置包含多个记录区,用来对每一组发生号型式存储从最前的发生号型式到最后的发生号型式的多个发生号型式;跟在所述记录区后面的第一扩展区,用来接连地对存储在最后的记录区中的最后的发生号型式再存储最后的发生号型式;以及跟在所述第一扩展区后面的第二扩展区,用来存储在正文修改操作中由索引文件准备装置获得的附加发生号型式,并且在由索引文件搜寻装置再次检查第一扩展区中记录的最后的发生号型式时,停止由索引文件搜寻装置进行的对每一组发生号型式进行的搜寻操作。
6.一种信息搜寻装置,其特征在于,它包含检索目标存储装置,用来存储一个或多个检索目标;实时处理数据接收装置,用来接收一段或多段实时处理数据,所述数据分别与检索目标存储装置中存储的一个检索目标对应;检索信息接收装置,用来接收一段检索信息和一搜寻请求;实时处理数据存储装置,用来存储由实时处理数据接收装置接收到的实时处理数据段;实时处理装置,用来对实时处理数据存储装置中存储的实时处理数据段中的每一段进行实时处理,以更新检索目标存储装置中存储的检索目标;检索目标搜寻装置,用来搜寻检索目标存储装置中存储的每一个检索目标,从而检索与检索信息接收装置从每一检索目标中接收的检索信息一致的一段或多段第一信息,并输出表示第一信息的检索结果;实时处理数据搜寻装置,用来搜寻实时处理装置不处理并且存储在实时处理数据存储装置中的一段或多段特定实时处理数据中的每一段,以从特定实时处理数据段中的每一段中检索出分别与检索信息接收装置接收的检索信息一致的一段或多段第二信息;检索结果修改装置,用来按照实时处理数据搜寻装置检索的第二信息,修改从检索目标搜寻装置输出的检索结果,以反映检索结果中的特定实时处理数据段;以及检索结果输出装置,用来输出由检索结果修改装置修改的检索结果。
7.如权利要求6所述的信息搜寻装置,其特征在于,所述检索目标存储装置中存储的每一检索目标是一个字符流,所述字符流用分别由相互靠近的第一字符和第二字符表示的一个或多个字符型式以及每一个均与一个字符型式对应并用字符流中第一字符的位置和标识该字符流的数据号指出的字符信息型式来表示。
8.如权利要求6所述的信息搜寻装置,其特征在于,它还包含重复实时处理避免装置,用来在由实时处理数据接收装置接收到与相同特定检索目标对应的一段重复实时处理数据时,把与特定检索目标对应并存储在实时处理数据存储装置中的一段实时处理数据改变成与同一特定检索目标对应的一段经修改的实时处理数据,并舍弃重复实时处理数据。
9.如权利要求6所述的信息搜寻装置,其特征在于,它还包含存在判断表准备装置,用来准备一存在判断表,表中存在实时处理数据存储装置中存储的一段指定实时处理数据的所有组成部分;以及检索操作控制装置,用来判断存在判断表准备装置准备的存在判断表中是否存在检索信息的所有成分,并且当存在判断表中不存在检索信息的所有成分时,控制实时处理数据搜寻装置,以停止对指定实时处理数据的搜寻。
10.如权利要求6所述的信息搜寻装置,其特征在于,它还包含重复检索操作避免装置,用来从与存储在实时处理数据存储装置中存储的相同特定检索目标对应的多段实时处理数据中选择出一段与特定检索目标对应的最近的实时处理数据,控制实时处理数据搜寻装置以从所述最近的实时处理数据中检索出与所述检索信息一致的的第二信息,并控制实时处理数据搜寻装置,对与相同特定检索信息对应的其他实时处理数据段不进行搜寻操作。
11.如权利要求6所述的信息搜寻装置,其特征在于,它还包含结束请求接收装置,用来接收结束请求;强迫结束操作请求装置,用来在由结束请求接收装置接收到结束请求时,请求实时处理装置强迫结束实时处理,以在实时处理数据存储装置中保持实时处理装置不处理的一段或多段指定实时处理数据;以及结束条件存储装置,用来存储由强迫结束操作请求装置保持的指定的实时处理数据段。
12.如权利要求11所述的信息搜寻装置,其特征在于,它还包含启动请求接收装置,用来接收启动请求;以及启动操作请求装置,用来在由启动请求接收装置接收到启动请求时,请求实时处理装置重新启动由结束操作请求装置强迫结束的实时处理。
13.如权利要求6所述的信息搜寻装置,其特征在于,它还包含检索时间测量装置,用来测量检索目标搜寻装置搜寻的检索目标存储装置中存储的特定检索目标或者实时处理数据搜寻装置搜寻的实时处理数据存储装置中对于特定检索目标存储的一段特定实时处理数据的检索时间;更新时间测量装置,用来测量由实时处理装置更新检索目标存储装置中存储的特定检索目标的更新时间;更新操作通知装置,用来判断由检索时间测量装置测量的检索时间是否迟于更新时间测量装置测量的更新时间,并在更新时间迟于检索时间时,制备一段更新信息,表示在由检索目标搜寻装置或实时处理数据搜寻装置搜寻特定检索目标以后,对特定检索目标进行了更新操作;以及更新信息输出装置,用来在更新时间迟于检索时间的情况下,输出特定检索目标的标识号和由更新操作通知装置获得的更新信息。
全文摘要
一种信息搜寻装置,它包含发生号表准备装置、索引文件准备装置和索引文件搜寻装置。这种装置由于将正文的字符转换成发生号形式并且不搜寻所有的发生号,所以可以高速进行搜寻操作。
文档编号G06F17/30GK1166005SQ9710295
公开日1997年11月26日 申请日期1997年2月27日 优先权日1996年3月27日
发明者木下哲也, 小山隆正, 菊池忠一, 榎本典行, 篠木裕文 申请人:松下电器产业株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1