专利名称:一种计算机事务存储方法
技术领域:
本发明涉及一种计算机事务存储(transactional memory)方法,属于计算机系统 结构技术领域。
背景技术:
根据摩尔定律,计算机处理器的性能每18至24个月增加一倍,然而,内存的访问 速度仅以每年7% _10%的速度增长,远远落后于处理器的增长速度。相对于处理器来说, 内存访问延迟以每十年5倍的速度增长,处理器与存储器的差距不断增加,造成了系统结 构的失衡,形成了阻碍性能提升的"存储墙",从而使得内存访问成为整个计算机系统的性 能瓶颈。 为了缓解"存储墙"对计算机系统性能的影B向,需要对内存访问进行优化。降低内 存的访问次数是访存优化的一种方法。L印ak等人通过研究,观察到由于许多写指令写入 内存的值都与内存中原有的值相同,因此这些写指令都没有产生实际效果。基于这一观察, L印ak等人提出了沉默存储(silent store)结构。在这种结构中, 一个写操作被转换为三 个操作,即读操作、比较操作和实际的写操作(如果这个写操作不是沉默的),这样系统就 可能减少内存的写操作,但是这种结构同时可能会增加读操作的次数。
事务存储编程模型由布朗大学的Herlihy教授于1993年提出,它的提出受到了数 据库系统中事务处理的影响,使用事务的概念代替原来的临界区。事务是只能被一个线程 执行的一段内存读写指令序列,这个序列中的读写操作只有两种结果全部生效或者不起 作用。事务存储就是支持多个事务并行执行的一种编程模型。事务存储具有容易编程、安 全性好、可扩展性好及高性能的优点,从而得到了广泛的关注。在最近十几年里,许多大学 和科研单位参加到事务存储的研究之中,同时微软、英特尔等一批公司也在积极地进行相 关研究。 实现事务存储中的版本管理(version management)是指系统必须同时提供空间 用于存放数据的新值(当提交事务时会使用这些新值)和旧值(当放弃事务时会使用这些 旧值)。威斯康星大学麦迪逊分校的Moore等人提出的基于日志的事务存储(log-based transactionalmemory,简称LogTM)采用积极的版本管理方式,将数据的新值直接存放在 目标位置,而将数据的旧值存放于可缓存的日志中,在事务放弃时用来对数据进行恢复。当 事务提交或放弃后,事务的日志都被丢弃,但实际上被丢弃的日志还存在于缓存中而且在 缓存中的状态为"被修改过",在日志所在缓存行被其它行替换时,就可能造成不必要的写 回,从而增加了内存写操作的次数,造成了性能的下降。
发明内容
本发明的目的是提出一种计算机事务存储方法,以克服已有的事务存储实现方法 中对日志进行无意义的内存写操作的缺点。本发明提出的事务存储方法减少了对日志的写 内存操作的次数,缓解了处理器和内存之间的速度差距,提高了事务存储系统的性能。
本发明提出的计算机数据的事务存储方法,包括以下步骤 (1-1)定义从对计算机内存地址的写操作至对该内存地址的下一次写操作之前的对该地址的最后一次读指令为数据存活区间,从对计算机内存地址的最后一次读操作到对该内侧地址的下一次写操作为数据消亡区间; (1-2)计算机的一个缓存行中的数据被修改过,若在该缓存行被替换时,修改的数据所在的内存地址处于上述数据存活区间中,则将修改的数据写回内存中,若在缓存行被替换时,修改的数据所在的内存地址处于上述数据消亡区间中,则修改的数据保持在缓存中; (1-3)在数据存活区间结束和数据消亡区间开始的位置,插入一条最后一次读操作指令M,在数据消亡区间中读操作指令已经进行后插入一条该数据的存活区间结束消亡区间从此开始的标识指令N ; (1-4)当处理器执行读指令M或标识指令N时,对计算机缓存行的状态进行修改; (1-5)处理器在进行事务的提交操作时,丢弃内存中该事务所有的日志,对日志所
在的所有内存地址,执行数据的存活区间结束消亡区间从此开始的标识指令N ; (1-6)处理器在进行事务的放弃操作时,通过读取该事务的日志,恢复内存中被该
事务修改过的所有数据的原值,对日志所在的所有内存地址,执行数据的存活区间结束消
亡区间从此开始的标识指令N。 上述事务存储方法中,步骤(1-2)计算机的一个缓存行中的数据被修改过,若在该缓存行被替换时,修改的数据所在的内存地址处于上述数据存活区间中,则将修改的数据写回内存中,若在缓存行被替换时,修改的数据所在的内存地址处于上述数据消亡区间中,则修改的数据保持在缓存中,其过程如下 (2-1)计算机的缓存为一级,若缓存行被替换时被修改的数据所在的内存地址处
于所述的数据存活区间中,则将被修改的数据写回内存中,若在缓存行被替换时被修改的
数据所在的内存地址处于所述的数据消亡区间中,则被修改的数据保持在缓存中; (2-2)计算机的缓存为两级,其中一级为写直达方式,二级为写回方式,且二级缓
存的缓存行中的数据被修改过,若二级缓存行被替换时缓存行中被修改的数据所在的内存
地址处于所述的数据存活区间中,则将被修改的数据写回内存中,若二级缓存行被替换时
缓存行中被修改的数据所在的内存地址处于所述的消亡区间中,则被修改的数据保持在缓
存中; (2-3)计算机的缓存有两级,其中一级和二级同时为写回方式,若一级缓存的缓存行中的数据被修改过,则当该一级缓存行被替换时,若一级缓存行被替换时缓存行中被修改的数据所在的内存地址处于所述的数据存活区间中,则将被修改的数据写回内存中,若一级缓存行被替换时缓存行中被修改的数据所在的内存地址处于所述的消亡区间中,则被修改的数据保持在缓存中;若二级缓存行被替换时缓存行中被修改的数据所在的内存地址处于所述的数据存活区间中,则将被修改的数据写回内存中,若二级缓存行被替换时缓存行中被修改的数据所在的内存地址处于所述的消亡区间中,则被修改的数据保持在缓存中。 上述事务存储方法中,步骤(1-4)当处理器执行读指令M或标识指令N时,对计算机缓存行的状态进行修改的方法,包括以下步骤
(3-1)计算机的缓存为一级,计算机处理器执行最后一次读操作指令M或数据的 存活区间结束消亡区间从此开始的标识指令N时,若与指令的内存地址相对应的缓存行 的状态为"缓存行中的数据被修改过",则将该缓存行状态修改为"缓存行中的数据未修改 过",若与指令的内存地址相对应的缓存行的状态为"缓存行中的数据未被修改过",则不作 修改; (3-2)计算机的缓存未两级,其中一级为写直达方式,二级为写回方式,计算机处 理器执行最后一次读操作指令M或数据的存活区间结束消亡区间从此开始的标识指令N 时,若与指令的内存地址相对应的二级缓存行的状态为"缓存行中的数据被修改过",则将 该缓存行状态修改为"缓存行中的数据未修改过",若与指令的内存地址相对应的二级缓存 行的状态为"缓存行中的数据未被修改过",则不作修改; (3-3)计算机的缓存为两级,其中一级和二级同时为写回方式,计算机处理器执 行最后一次读操作指令M或数据的存活区间结束消亡区间从此开始的标识指令N时,若与 指令的内存地址相对应的一级缓存行的状态为"缓存行中的数据被修改过",则将该缓存行 状态修改为"缓存行中的数据未修改过",若与指令的内存地址相对应的一级缓存行的状态 为"缓存行中的数据未被修改过",则不作修改;若与指令的内存地址相对应的二级缓存行 的状态为"缓存行中的数据被修改过",则将该缓存行状态修改为"缓存行中的数据未修改 过",若与指令的内存地址相对应的二级缓存行的状态为"缓存行中的数据未被修改过",则 不作修改。 本发明提出的计算机事务存储方法,其优点是减少了对日志的写内存操作的次 数,缓解了处理器与内存之间的速度差距,提高了事务存储系统的性能。
图1本发明方法中定义的数据存活区间和消亡区间的定义示意图。
具体实施例方式本发明提出的计算机数据的事务存储方法,包括以下步骤 (1-1)定义从对计算机内存地址的写操作至对该内存地址的下一次写操作之前 的对该地址的最后一次读指令为数据存活区间,从对计算机内存地址的最后一次读操作到 对该内侧地址的下一次写操作为数据消亡区间,如图1所示; (1-2)计算机的一个缓存行中的数据被修改过,若在该缓存行被替换时,修改的数 据所在的内存地址处于上述数据存活区间中,则将修改的数据写回内存中,若在缓存行被 替换时,修改的数据所在的内存地址处于上述数据消亡区间中,则修改的数据保持在缓存 中; (1-3)在数据存活区间结束和数据消亡区间开始的位置,插入一条最后一次读操 作指令M,在数据消亡区间中读操作指令已经进行后插入一条该数据的存活区间结束消亡 区间从此开始的标识指令N ; (1-4)当处理器执行读指令M或标识指令N时,对计算机缓存行的状态进行修改;
(1-5)处理器在进行事务的提交操作时,丢弃内存中该事务所有的日志,对日志所 在的所有内存地址,执行数据的存活区间结束消亡区间从此开始的标识指令N ;
(1-6)处理器在进行事务的放弃操作时,通过读取该事务的日志,恢复内存中被该事务修改过的所有数据的原值,对日志所在的所有内存地址,执行数据的存活区间结束消亡区间从此开始的标识指令N。 上述事务存储方法中,步骤(1-2)计算机的一个缓存行中的数据被修改过,若在该缓存行被替换时,修改的数据所在的内存地址处于上述数据存活区间中,则将修改的数据写回内存中,若在缓存行被替换时,修改的数据所在的内存地址处于上述数据消亡区间中,则修改的数据保持在缓存中,其过程如下 (2-1)计算机的缓存为一级,若缓存行被替换时被修改的数据所在的内存地址处
于所述的数据存活区间中,则将被修改的数据写回内存中,若在缓存行被替换时被修改的
数据所在的内存地址处于所述的数据消亡区间中,则被修改的数据保持在缓存中; (2-2)计算机的缓存为两级,其中一级为写直达方式,二级为写回方式,且二级缓
存的缓存行中的数据被修改过,若二级缓存行被替换时缓存行中被修改的数据所在的内存
地址处于所述的数据存活区间中,则将被修改的数据写回内存中,若二级缓存行被替换时
缓存行中被修改的数据所在的内存地址处于所述的消亡区间中,则被修改的数据保持在缓
存中; (2-3)计算机的缓存有两级,其中一级和二级同时为写回方式,若一级缓存的缓存行中的数据被修改过,则当该一级缓存行被替换时,若一级缓存行被替换时缓存行中被修改的数据所在的内存地址处于所述的数据存活区间中,则将被修改的数据写回内存中,若一级缓存行被替换时缓存行中被修改的数据所在的内存地址处于所述的消亡区间中,则被修改的数据保持在缓存中;若二级缓存行被替换时缓存行中被修改的数据所在的内存地址处于所述的数据存活区间中,则将被修改的数据写回内存中,若二级缓存行被替换时缓存行中被修改的数据所在的内存地址处于所述的消亡区间中,则被修改的数据保持在缓存中。 上述事务存储方法中,步骤(1-4)当处理器执行读指令M或标识指令N时,对计算机缓存行的状态进行修改的方法,包括以下步骤 (3-1)计算机的缓存为一级,计算机处理器执行最后一次读操作指令M或数据的存活区间结束消亡区间从此开始的标识指令N时,若与指令的内存地址相对应的缓存行的状态为"缓存行中的数据被修改过",则将该缓存行状态修改为"缓存行中的数据未修改过",若与指令的内存地址相对应的缓存行的状态为"缓存行中的数据未被修改过",则不作修改; (3-2)计算机的缓存未两级,其中一级为写直达方式,二级为写回方式,计算机处理器执行最后一次读操作指令M或数据的存活区间结束消亡区间从此开始的标识指令N时,若与指令的内存地址相对应的二级缓存行的状态为"缓存行中的数据被修改过",则将该缓存行状态修改为"缓存行中的数据未修改过",若与指令的内存地址相对应的二级缓存行的状态为"缓存行中的数据未被修改过",则不作修改; (3-3)计算机的缓存为两级,其中一级和二级同时为写回方式,计算机处理器执行最后一次读操作指令M或数据的存活区间结束消亡区间从此开始的标识指令N时,若与指令的内存地址相对应的一级缓存行的状态为"缓存行中的数据被修改过",则将该缓存行状态修改为"缓存行中的数据未修改过",若与指令的内存地址相对应的一级缓存行的状态为"缓存行中的数据未被修改过",则不作修改;若与指令的内存地址相对应的二级缓存行 的状态为"缓存行中的数据被修改过",则将该缓存行状态修改为"缓存行中的数据未修改 过",若与指令的内存地址相对应的二级缓存行的状态为"缓存行中的数据未被修改过",则 不作修改。
权利要求
一种计算机事务存储方法,其特征在于该方法包括以下步骤(1-1)定义从对计算机内存地址的写操作至对该内存地址的下一次写操作之前的对该地址的最后一次读指令为数据存活区间,从对计算机内存地址的最后一次读操作到对该内侧地址的下一次写操作为数据消亡区间;(1-2)计算机的一个缓存行中的数据被修改过,若在该缓存行被替换时,修改的数据所在的内存地址处于上述数据存活区间中,则将修改的数据写回内存中,若在缓存行被替换时,修改的数据所在的内存地址处于上述数据消亡区间中,则修改的数据保持在缓存中;(1-3)在数据存活区间结束和数据消亡区间开始的位置,插入一条最后一次读操作指令M,在数据消亡区间中读操作指令已经进行后插入一条该数据的存活区间结束消亡区间从此开始的标识指令N;(1-4)当处理器执行读指令M或标识指令N时,对计算机缓存行的状态进行修改;(1-5)处理器在进行事务的提交操作时,丢弃内存中该事务所有的日志,对日志所在的所有内存地址,执行数据的存活区间结束消亡区间从此开始的标识指令N;(1-6)处理器在进行事务的放弃操作时,通过读取该事务的日志,恢复内存中被该事务修改过的所有数据的原值,对日志所在的所有内存地址,执行数据的存活区间结束消亡区间从此开始的标识指令N。
2. 如权利要求l所述的方法,其特征在于其中所述的步骤(1-2)计算机的一个缓存行 中的数据被修改过,若在该缓存行被替换时,修改的数据所在的内存地址处于上述数据存 活区间中,则将修改的数据写回内存中,若在缓存行被替换时,修改的数据所在的内存地址 处于上述数据消亡区间中,则修改的数据保持在缓存中,其过程如下(2-1)计算机的缓存为一级,若缓存行被替换时被修改的数据所在的内存地址处于所 述的数据存活区间中,则将被修改的数据写回内存中,若在缓存行被替换时被修改的数据 所在的内存地址处于所述的数据消亡区间中,则被修改的数据保持在缓存中;(2-2)计算机的缓存为两级,其中一级为写直达方式,二级为写回方式,且二级缓存的 缓存行中的数据被修改过,若二级缓存行被替换时缓存行中被修改的数据所在的内存地址 处于所述的数据存活区间中,则将被修改的数据写回内存中,若二级缓存行被替换时缓存 行中被修改的数据所在的内存地址处于所述的消亡区间中,则被修改的数据保持在缓存 中;(2-3)计算机的缓存有两级,其中一级和二级同时为写回方式,若一级缓存的缓存行中 的数据被修改过,则当该一级缓存行被替换时,若一级缓存行被替换时缓存行中被修改的 数据所在的内存地址处于所述的数据存活区间中,则将被修改的数据写回内存中,若一级 缓存行被替换时缓存行中被修改的数据所在的内存地址处于所述的消亡区间中,则被修改 的数据保持在缓存中;若二级缓存行被替换时缓存行中被修改的数据所在的内存地址处于 所述的数据存活区间中,则将被修改的数据写回内存中,若二级缓存行被替换时缓存行中 被修改的数据所在的内存地址处于所述的消亡区间中,则被修改的数据保持在缓存中。
3. 如权利要求l所述的方法,其特征在于其中所述的步骤(1-4)当处理器执行读指令 M或标识指令N时,对计算机缓存行的状态进行修改的方法,包括以下步骤(3-1)计算机的缓存为一级,计算机处理器执行最后一次读操作指令M或数据的存活 区间结束消亡区间从此开始的标识指令N时,若与指令的内存地址相对应的缓存行的状态为"缓存行中的数据被修改过",则将该缓存行状态修改为"缓存行中的数据未修改过",若与指令的内存地址相对应的缓存行的状态为"缓存行中的数据未被修改过",则不作修改;(3-2)计算机的缓存未两级,其中一级为写直达方式,二级为写回方式,计算机处理器执行最后一次读操作指令M或数据的存活区间结束消亡区间从此开始的标识指令N时,若与指令的内存地址相对应的二级缓存行的状态为"缓存行中的数据被修改过",则将该缓存行状态修改为"缓存行中的数据未修改过",若与指令的内存地址相对应的二级缓存行的状态为"缓存行中的数据未被修改过",则不作修改;(3-3)计算机的缓存为两级,其中一级和二级同时为写回方式,计算机处理器执行最后一次读操作指令M或数据的存活区间结束消亡区间从此开始的标识指令N时,若与指令的内存地址相对应的一级缓存行的状态为"缓存行中的数据被修改过",则将该缓存行状态修改为"缓存行中的数据未修改过",若与指令的内存地址相对应的一级缓存行的状态为"缓存行中的数据未被修改过",则不作修改;若与指令的内存地址相对应的二级缓存行的状态为"缓存行中的数据被修改过",则将该缓存行状态修改为"缓存行中的数据未修改过",若与指令的内存地址相对应的二级缓存行的状态为"缓存行中的数据未被修改过",则不作修改。
全文摘要
本发明涉及一种计算机事务存储方法,属于计算机系统结构技术领域。本发明方法中,首先定义数据存活区间和消亡区间。通过增加指令,标识出数据存活区间和数据消亡区间的位置。当数据从缓存中被替换出时,如果处于数据消亡区间,即使数据被修改过,也不再将其写回内存,从而有效降低了写内存的次数。本发明将如上所述的缓存方法应用于事务存储系统,对于事务存储系统存放在缓存中的日志,在事务被提交或放弃之后,不将其写入内存,从而减少内存写操作,缓解了处理器与内存之间的速度差距,提高了事务存储系统的性能。
文档编号G06F12/08GK101699412SQ20091023572
公开日2010年4月28日 申请日期2009年10月15日 优先权日2009年10月15日
发明者汪东升, 王海霞, 郭三川 申请人:清华大学