一种故障检测的方法和装置的制造方法

文档序号:9826170阅读:512来源:国知局
一种故障检测的方法和装置的制造方法
【技术领域】
[0001] 本发明涉及通信技术领域,尤其涉及一种故障检测的方法和装置。
【背景技术】
[0002] CPU(Central Processing Unit,中央处理器)与内存(即内存条或者内存颗粒) 之间通过线路(即数据线或者地址线)连接起来,而用于连接CPU与内存的线路可能存在 三种故障,这三种故障分别为:1、短路:两个线路的引脚短接在一起,使得这两个线路的电 平相同,如果最终电平被高电平主导,则称这种短路类型为1支配型短路,如果最终电平被 低电平主导,则称这种短路类型为0支配型短路。2、开路:有线路的部分引脚出现断路。3、 固定逻辑:有线路的部分引脚被固定地拉到固定电平,如与地短接等。
[0003] 目前,可以采用走步法检测线路是否存在短路、开路、固定逻辑等故障,如通过地 址线走步算法检测地址线是否存在短路、开路、固定逻辑等故障,并通过数据线走步算法检 测数据线是否存在短路、开路、固定逻辑等故障。
[0004] 在上述处理过程中,走步法需要检测的地址是CPU能够处理的物理地址,因此, CPU可以直接在该地址内写入数据,并从该地址中读取数据。
[0005] 针对需要检测的地址不是CPU能够处理的物理地址的应用场景,CPU无法采用走 步法检测线路是否存在短路、开路、固定逻辑等故障。

【发明内容】

[0006] 本发明提供一种故障检测的方法,所述方法包括以下步骤:
[0007] 获取待检测的线路所在的内存区块Rank对应的物理Rank地址;
[0008] 将所述物理Rank地址转换成中央处理器能够处理的系统物理地址;
[0009] 向所述系统物理地址中写入数据,并从所述系统物理地址中读取数据;
[0010] 利用向所述系统物理地址中写入的数据,以及从所述系统物理地址中读取的数 据,确定所述待检测的线路是否发生故障。
[0011] 所述待检测的线路具体包括:待检测的地址线;
[0012] 所述向所述系统物理地址中写入数据,并从所述系统物理地址中读取数据,具体 包括:基于地址线走步算法,向所述系统物理地址中写入数据,并从所述系统物理地址中读 取数据;
[0013] 所述利用向所述系统物理地址中写入的数据,以及从所述系统物理地址中读取的 数据,确定所述待检测的线路是否发生故障,具体包括:利用向所述系统物理地址中写入的 数据,以及从所述系统物理地址中读取的数据,确定所述待检测的地址线是否发生故障。
[0014] 所述待检测的线路具体包括:待检测的数据线;
[0015] 所述向所述系统物理地址中写入数据,并从所述系统物理地址中读取数据,具体 包括:基于数据线走步算法,向所述系统物理地址中写入数据,并从所述系统物理地址中读 取数据;
[0016] 所述利用向所述系统物理地址中写入的数据,以及从所述系统物理地址中读取的 数据,确定所述待检测的线路是否发生故障,具体包括:利用向所述系统物理地址中写入的 数据,以及从所述系统物理地址中读取的数据,确定所述待检测的数据线是否发生故障。
[0017] 向所述系统物理地址中写入数据,并从所述系统物理地址中读取数据之前,所述 方法进一步包括:获取内存映射表,所述内存映射表中包含不能访问的系统物理地址区间; 如果所述系统物理地址位于所述系统物理地址区间,则跳过向所述系统物理地址中写入数 据,并从所述系统物理地址中读取数据的过程;如果所述系统物理地址不位于所述系统物 理地址区间,则执行向所述系统物理地址中写入数据,并从所述系统物理地址中读取数据 的过程。
[0018] 将包含地址线走步算法、数据线走步算法、以及内存映射表的测试程序,存储在统 一可扩展固件接口 UEFI固件中,并在系统管理中断SMI中运行所述测试程序。
[0019] 在获取待检测的线路所在的Rank对应的物理Rank地址之前,所述方法进一步包 括:关闭内存的镜像功能和几余功能;
[0020] 在利用向所述系统物理地址中写入的数据,以及从所述系统物理地址中读取的数 据,确定所述待检测的线路是否发生故障之后,所述方法进一步包括:
[0021] 恢复内存的镜像功能和冗余功能。
[0022] 本发明提供一种故障检测的装置,所述装置具体包括:
[0023] 获取模块,用于获取待检测的线路所在的内存区块Rank对应的物理Rank地址; 转换模块,用于将所述物理Rank地址转换成中央处理器能够处理的系统物理地址;检测模 块,用于向所述系统物理地址中写入数据,并从所述系统物理地址中读取数据,并利用向所 述系统物理地址中写入的数据,以及从所述系统物理地址中读取的数据,确定所述待检测 的线路是否发生故障。
[0024] 所述待检测的线路具体包括:待检测的地址线;所述检测模块,具体用于基于地 址线走步算法,向所述系统物理地址中写入数据,并从所述系统物理地址中读取数据,并利 用向所述系统物理地址中写入的数据,以及从所述系统物理地址中读取的数据,确定所述 待检测的地址线是否发生故障。
[0025] 所述待检测的线路具体包括:待检测的数据线;所述检测模块,具体用于基于数 据线走步算法,向所述系统物理地址中写入数据,并从所述系统物理地址中读取数据,并利 用向所述系统物理地址中写入的数据,以及从所述系统物理地址中读取的数据,确定所述 待检测的数据线是否发生故障。
[0026] 所述获取模块,进一步用于在所述检测模块向所述系统物理地址中写入数据,并 从所述系统物理地址中读取数据之前,获取内存映射表,其中,所述内存映射表中包含不能 访问的系统物理地址区间;
[0027] 如果所述转换模块得到的所述系统物理地址位于所述系统物理地址区间,则由所 述检测模块跳过向所述系统物理地址中写入数据,并从所述系统物理地址中读取数据的过 程;如果所述转换模块得到的所述系统物理地址不位于所述系统物理地址区间,则由所述 检测模块执行向所述系统物理地址中写入数据,并从所述系统物理地址中读取数据的过 程。
[0028] 将包含地址线走步算法、数据线走步算法、以及内存映射表的测试程序,存储在统 一可扩展固件接口 UEFI固件中,并在系统管理中断SMI中运行所述测试程序。
[0029] 还包括:处理模块,用于在所述获取模块获取待检测的线路所在的Rank对应的物 理Rank地址之前,关闭内存的镜像功能和冗余功能;在所述检测模块利用向所述系统物理 地址中写入的数据,以及从所述系统物理地址中读取的数据,确定所述待检测的线路是否 发生故障之后,恢复内存的镜像功能和冗余功能。
[0030] 基于上述技术方案,本发明实施例中,在需要检测的地址不是中央处理器能够处 理的物理地址的应用场景(如Rank(内存区块)的应用场景)下,中央处理器通过将待检 测的线路对应的地址转换为本中央处理器能够处理的物理地址,从而使得中央处理器能够 采用走步法检测线路是否存在短路、开路、固定逻辑等故障,提供更高的故障定位精度,并 减少故障检测的时间。
【附图说明】
[0031] 图1是本发明一种实施方式中故障检测的方法的流程图;
[0032] 图2是本发明一种实施方式中包含故障检测的装置的设备的逻辑结构图;
[0033] 图3是本发明一种实施方式中故障检测的装置的逻辑结构图。
【具体实施方式】
[0034] 为了提升内存的访问带宽,通常会将连续的物理地址块交替地分配给不同的 Rank,这种分配过程即为交织。Rank是指一组连接在同一芯片的选通线上,能够同步操作 的DRAM (Dynamic Random Access Memory,动态随机存储器)芯片,一个Rank的数据位宽可 以为64比特。在将连续的物理地址块交替地分配给不同的Rank时,存在三种类型的地址。 1、系统物理地址,即中央处理器能够处理的物理地址;2、内存通道地址,即中央处理器内存 通道(Channel)内的地址;3、物理Rank地址,即内存的单个Rank上的地址。
[0035] 在上述应用场景下,走步法需要检测的地址是物理Rank地址,而中央处理器能够 执行写入和读取操作的地址是系统物理地址,因此,中央处理器无法直接在物理Rank地址 内写入数
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1