多中央处理单元侦错切换的方法

文档序号:6504908阅读:193来源:国知局
多中央处理单元侦错切换的方法
【专利摘要】本发明是关于一种多中央处理单元侦错切换的方法,多中央处理单元至少包含一第一及一第二处理器,而以第一处理器为预设处理器。侦错切换的方法包含:利用一微控制器模块,侦测第一处理器是否故障,包含无法侦测到或无法正常开机;当侦测到第一处理器故障时,微控制器模块发出一故障讯号,并将故障讯号传输至一切换器模块,以将预设处理器由第一处理器切换至第二处理器;以及侦测第二处理器是否故障,包含无法侦测到或无法正常开机,若第二处理器故障,则微控制器模块重新将第一处理器设定为预设处理器,并重新开机。
【专利说明】多中央处理单元侦错切换的方法 【【技术领域】】
[0001]本发明是关于一信息处理平台,尤其关于一种多中央处理单元侦错切换的方法。 【【背景技术】】
[0002]随着信息科技的进步,开发出了多中央处理单元的运算平台,以应付日趋复杂的 数据运算及处理需求。相较于一般单中央处理单元的运算平台,多中央处理单元的运算平 台不仅较为稳定,整体运算处理能力亦提升许多。因此,不论是企业的服务器或者家庭的个 人计算机,皆适合使用多中央处理单元。
[0003]然而,在多中央处理单元系统中,不免遭遇其中一中央处理单元故障的情形。以目 前技术水平而言,多中央处理单元系统可分为主从式架构及对等式架构。在对等式架构中, 操作系统可以在任何一个中央处理单元上执行,每一个中央处理单元亦可自行进行排程, 因此,若其中一中央处理单元故障,此运算平台仍可以其它中央处理单元继续执行程序。然 而,此种架构将使操作系统的安排更复杂,且在设计系统时,必须确定此多中央处理单元不 会执行相同的程序。
[0004]另一方面,相较于对等式架构,主从式架构的设计较简单,成本亦较低廉。只是在 主从式架构中,操作系统及主要核心功能皆在一主要的中央处理器上执行,此中央处理器 必须负责工作的排程。因此,若主要的中央处理器故障,其它中央处理器并无法单独运作, 因而造成系统当机,甚至无法开机。例如INTEL Romeley/Grantley等系列的双中央处理 器系统,在中央处理器与PCH(Platform Controller Hub)芯片组之间是利用DMI (Direct Media Interface)接口沟通,倘若连接DMI的中央处理器故障,即使另一中央处理器也无 法单独运作。如此,不仅无法发挥双中央处理单元平台的优点,亦可能对企业或个人带来极 大的损失。 【
【发明内容】

[0005] 本发明的一范畴在于提供一种多中央处理单元侦错切换的方法。
[0006] 根据本发明的一具体实施例,一种多中央处理单元侦错切换的方法包含下列步 骤。首先,利用一微控制器模块,侦测第一处理器是否故障,包含无法侦测到或无法正常开 机。接着,当侦测到第一处理器故障时,微控制器模块发出一故障讯号,并将此故障讯号传 输至一切换器模块,以将预设处理器由第一处理器切换至第二处理器。最后,微控制器模块 侦测第二处理器是否故障,若第二处理器故障,则微控制器模块再次将第一处理器设定为 预设处理器,并重新开机。
[0007] 在本发明的一具体实施例中,微控制器模块通过一通用型输入输出模块,判断第 一或第二处理器是否能够正常开机。通用型输入输出模块与一 PCH(Platform Controller Hub)芯片组电性连接,当开机成功时将发出一开机成功讯号。
[0008] 在本发明的另一具体实施例中,微控制器模块通过一定时器,判断第一或第二处 理器是否能够正常开机。第一或第二处理器以一预定时间间隔重置定时器,当定时器倒数 至零时,则判断第一或第二处理器故障。
[0009],本发明的功效在于:针对主从式架构多中央处理单元的信息处理平台,通过独立 或内含微控制器的芯片模块,自动侦测第一中央处理器是否故障,若是,则切换至第二中央 处理器,并以第二中央处理器继续程序执行,以期将损失降到最低。另外可以注意的是,此 种多中央处理单元的信息处理平台可包含两个以上的中央处理器,因此,通过独立或内含 微控制器的芯片模块,自动侦测第一中央处理器是否故障,若是,则切换至第二中央处理 器,若侦测到第二中央处理器故障,则切换至第三中央处理器,依此类推,直至侦测到有未 故障的处理器,则以处理器继续执行程序。 【【专利附图】

【附图说明】】
[0010]图1是根据本发明第一实施例的多中央处理单元侦错切换的方法流程图。
[0011]图2是根据本发明第二实施例的多中央处理单元侦错切换的方法流程图。
[0012] 图3是根据本发明第三实施例的多中央处理单元侦错切换的方法流程图。
[0013] 图4是根据本发明第四实施例的多中央处理单元侦错切换的方法流程图。
[0014] 主要组件符号说明:
[0015] 100 步骤:遍 _薩::微控1?機_鼴 W5.:錄傭_篤一IM翳 '过;^猶獬義翁切· 是喔_至_ 靡二处理臟拧开机' 110 .錄徽翻樓機_逮 135 雜觀_器模纖 过:r输入出模填·或 _模块,繡认第1? 时孤痛认篇一处 ailMg瓶成功 M0 麵:IE鑛机 115 步勸正雷瓶 145 雜::纖 120 步齡重觀親 2D0 纖机 125 步?锁麵第二处理器205 .骤::愤测第三处纏器是否连接至
[0016] 21Q 步骤?微控制器_^逋310 步藏重新并机 置,换器模块,切換_ 步驗开机 4〇s _侦测笫一魏_^_接至 215 步黴控_觀通賴 输纖块,或 410 纖:微控制器樓_1?^^ 讀时器· _认窠三处 出樣块,或;纖·議賴, 理器是^?成_ 机纖 220 步骤:正常开机 415 步骤:正常开机 22S 步囊:重新?m 420 步骤:由微控制_?5发出: 測 步廳侦测鎖》MU 号'令切换器模麵第二处理器改 是至輸*预设处理器 235: 纖驗制器模块通働飄重新开机 过一切換諸模块,切换 430 步骤:侦测第二划遽器是否连_ 至第四处理器执行开机 _ 240 宁爾:#控制器棋块遇.435 步骤:#控制器榫块€过 过T输入输出横块,戚 出機块,或二定时II,确胃二Λ: 一定时雅,确认第四处踽镰愚資开机成功 理ΙΙ^?Τ机成功 4? 步骤》正常开机 m 步藤:正常开视 :2'50 步藏:关机 300 步骤:Μ封开机次數是 否达:預定次數 S0S _.关机 【【具体实施方式】】
[0017] 图1是根据本发明一具体实施例的多中央处理单元侦错切换的方法流程图。此实 施例是以两个中央处理单元为说明。
[0018] 如图1所示,首先执行步骤100的开机程序,于此实施例中,开机程序泛指一般开 机程序,例如包括但不限于冷启动(cold boot)及热启动(warm boot)。
[0019] 接着,利用微控制器模块,侦测第一处理器是否连接至电源(步骤105),其中微控 制器模块与第一及第二处理器相连接。在此步骤中,微控制器模块由第一处理器读取是否 能成功连接至电源的讯号。假设此讯号的默认值为高准位,若可成功连接至电源,则此讯号 会被更改成低准位,因此,若微控制器模块接收到的讯号为低准位,表示第一处理器可成功 连接至电源,且由第一处理器执行开机程序;相反的,若讯息为高准位,则表示第一处理器 并未成功连接至电源。
[0020] 接着,在步骤110中,微控制器模块通过一通用型输入输出模块,以判断第一处理 器是否开机成功。通用型输入输出模块与微控制器模块及一 PCH(Platform Controller Hub)芯片组相连接,此PCH芯片组可于开机成功时发出一开机成功讯号。假设此讯号的默 认值为高准位,若开机成功,则此讯号会被更改成低准位,因此若微控制器模块接收到低准 位的讯号,表示开机成功;相反的,若微控制器模块接收到高准位的讯号,则表示开机失败, 此时确认第一处理器故障。
[0021] 或者,在步骤110中,微控制器模块亦可通过一定时器,以确认第一处理器是否开 机成功。此定时器可例如设置于微控制器模块内,且分别连接至第一处理器及第二处理器。 在此状况下,第一处理器以一预定时间间隔重置定时器,当定时器倒数至零时,则表示第一 处理器开机失败,可确认第一处理器故障。若否,则表示第一处理器开机成功。
[0022] 于步骤110中,若侦测到第一处理器并未故障,则由第一处理器完成开机程序(步 骤II5);若侦测到第一处理器故障,则启动关机,并且等待一预定时间,令主机板充分放电 之后,重新开机(步骤120)。
[0023] 在侦测到第一处理器并未连接至电源(步骤1〇5)或第一处理器故障且执行重新 开机(步骤110及120)的情况下,接着,微控制器模块侦测第二处理器是否连接至电源(步 骤125)。此时,微控制器模块由第二处理器读取是否成功连接至电源的讯号,假设此讯号的 默认值为高准位,若成功连接至电源,则此讯号会被更改成低准位。因此,若微控制器模块 接收到的讯号为低准位,表示第二处理器可成功连接至电源;相反的,若讯息为高准位,则 表示第二处理器并未成功连接至电源。
[0024]于步骤125中,若侦测到第二处理器已成功连接至电源,则微控制器模块通过一 切换器模块,将电路切换至第二处理器并执行开机(步骤130)。切换器模块连接至第一及第 二处理器,亦通过通用型输入输出模块连接至微控制器模块。因此,当微控制器模块侦测到 第二处理器已成功连接至电源时,将发出一讯号,此讯号通过通用型的输入输出模块而传 输至切换器模块,切换器模块在接收讯号后,便将电路切换至第二处理器,由第二处理器执 行开机。
[0025] 接着,在步骤I35中,微控制器模块通过一通用型输入输出模块,以判断第二处理 器是否开机成功。通用型输入输出模块与微控制器模块及一 PCH(Platform Controller Hub)芯片组相连接,此PCH芯片组用以于开机成功时发出一开机成功讯号。假设此讯号默 认值为尚准位,若开机成功,则此讯号会被更改成低准位,因此若微控制器模块接收到低准 位的讯号,表示开机成功;相反的,若接收到高准位的讯号,则表示开机失败,此时确认第二 处理器故障。
[0026] 或者,同步骤135,微控制器模块可通过一定时器,以确认第二处理器是否开机成 功。此定时器位于微控制器模块的内部,且分别连接至第一处理器及第二处理器,第二处理 器以一预定时间间隔重置定时器,当定时器倒数至零时,则表示第二处理器开机失败,可确 认第二处理器故障。若否,则表示第二处理器开机成功。
[0027]于步骤I35中,若侦测到第二处理器并未故障,则接着由第二处理器完成开机程 序(步骤140);若侦测到第二处理器故障,则启动关机(步骤145)。
[0028]图2是根据本发明第二具体实施例的多中央处理单元侦错切换的方法流程图。 [0029]如图2所示,第二实施例是以四个中央处理单元为实施例,可视为图!的第一实施 例的延伸,因此大致上与第一实施例相同,差别在于当第二处理器未能正常开机时(步骤 1:35),则启动关机,并且等待一预定时间,令主机板充分放电之后,重新开机(步骤 2〇〇)。 [0030]接着,微控制器模块侦测第三处理器是否连接至电源(步骤205)。此时,微控制器 模块由第三处理器读取是否成功连接至电源的讯号,假设此讯号的默认值为高准位,若成 功连接至电源,则此讯号会被更改成低准位。因此,若微控制器模块接收到的讯号为低准 位,表示第三处理器可成功连接至电源;相反的,若讯息为高准位,则表示第三处理器并未 成功连接至电源。
[0031]于步骤2〇5中,若侦测到第三处理器已成功连接至电源,则微控制器模块通过一 切换器模块,将电路切换至第三处理器并执行开机(步骤210)。切换器模块连接至第一、第 二、第三及第四处理器,亦通过通用型输入输出模块连接至微控制器模块。因此,当微控制 器模块侦测到第三处理器已成功连接至电源时,将发出一讯号,此讯号通过通用型的输入 输出模块而传输至切换器模块,切换器模块在接收讯号后,便将电路切换至第三处理器,由 第三处理器执行开机。
[0032] 接着,在步骤215中,微控制器模块通过一通用型输入输出模块,以判断第三处理 器是否开机成功。通用型输入输出模块与微控制器模块及一 PCH(Platform Controller Hub)芯片组相连接,此PCH芯片组用以于开机成功时发出一开机成功讯号。假设此讯号默 认值为高准位,若开机成功,则此讯号会被更改成低准位,因此若微控制器模块接收到低准 位的讯号,表示开机成功;相反的,若接收到高准位的讯号,则表示开机失败,此时确认第三 处理器故障。
[0033]或者,同步骤215,微控制器模块可通过一定时器,以确认第三处理器是否开机成 功。此定时器位于微控制器模块的内部,且分别连接至第一、第二、第三及第四处理器,第三 处理器以一预定时间间隔重置定时器,当定时器倒数至零时,则表示第三处理器开机失败, 可确认第三处理器故障。若否,则表示第三处理器开机成功。
[0034]于步骤215中,若侦测到第三处理器并未故障,则接着由第三处理器完成开机程 序(步骤220);若侦测到第三处理器故障,则启动关机,并且等待一预定时间,令主机板充分 放电之后,重新开机(步骤225 )。
[0035] 接着,微控制器模块侦测第四处理器是否连接至电源(步骤230)。此时,微控制器 模块由第四处理器读取是否成功连接至电源的讯号,假设此讯号的默认值为高准位,若成 功连接至电源,则此讯号会被更改成低准位。因此,若微控制器模块接收到的讯号为低准 位,表示第四处理器可成功连接至电源;相反的,若讯息为高准位,则表示第四处理器并未 成功连接至电源。
[0036] 于步骤23〇中,若侦测到第四处理器已成功连接至电源,则微控制器模块通过一 切换器模块,将电路切换至第四处理器并执行开机(步骤235)。切换器模块连接至第一、第 二、第三及第四处理器,亦通过通用型输入输出模块连接至微控制器模块。因此,当微控制 器模块侦测到第四处理器已成功连接至电源时,将发出一讯号,此讯号通过通用型的输入 输出検块而传输至切换器模块,切换器模块在接收讯号后,便将电路切换至第四处理器,由 第四处理器执行开机。
[0037]接着,在步骤240中,微控制器模块通过一通用型输入输出模块,以判断第四处理 器是否开机成功。通用型输入输出模块与微控制器模块及一 PCH(Platf〇rm c〇ntr〇ller Hub)芯2组相连接,此PCH芯片组用以于开机成功时发出一开机成功讯号。假设此讯号默 认值为高准位,若开机成功,则此讯号会被更改成低准位,因此若微控制器模块接收到低准 位的讯号,表示开机成功;相反的,若接收到高准位的讯号,则表示开机失败,此时确认第四 处理器故障。
[0038]或者,同步骤240,微控制器模块可通过一定时器,以确认第四处理器是否开机成 功。此定时器位于微控制器模块的内部,且分别连接至第一、第二、第三及第四处理器,第四 处理器以一预定时间间隔重置定时器,当定时器倒数至零时,则表示第四处理器开机失败, 可确认第四处理器故障。若否,则表示第四处理器开机成功。
[0039]于步骤240中,若侦测到第四处理器并未故障,则接着由第四处理器完成开机程 序(步骤245);若侦测到第四处理器故障,则启动关机(步骤250)。
[0040]图3是根据本发明第三具体实施例的多中央处理单元侦错切换的方法流程图。 [0041]如图3所示,第三实施例的方法大致上与第一实施例相同,差别仅在于当第二处 理器未能正常开机时(步骤135),再次重新开机,并增加判断重新开机的次数是否已达一 预定次数的步骤(步骤300)。倘若已达一预定次数,则进行关机(步骤305);倘若未达预定 次数,则启动关机,并且等待一预定时间,令主机板充分放电之后,再重新开机(步骤310)。 [00 42] 由于信息处理平台未能开机成功的原因众多,除了中央处理器故障,还包括电源 供应的电压不稳等问题。因此,吾人设定一重新开机的预定次数,以尝试排除此类因电源供 应电压不稳而导致未能开机成功的情况。
[0043] 于第二实施例中,是以如下方式计算重新开机的次数。若判断第一及第二处理器 皆为故障,则将此时所执行的重新开机计数为一次(当执行至步骤310时,计数一次),以此 类推。然而,应了解的是,计算重新开机次数及判断重新开机是否已达一预定次数,可由程 序自动或以手动方式完成,惟本发明不应以此为限。此外,吾人可视实际状况而定义重新开 机次数,例如,侦测到第一处理器故障之后的重新开机,即计数为一次(当执行至步骤120 时,即计数一次),且侦测到第二处理器故障之后的重新开机,亦计数为一次(当执行至步 骤310时,亦计数一次)。或者,对于侦测到第一处理器及第二处理器皆故障之后的重新开 机,方才计数为一次(当执行至步骤310时,总共计数一次)。
[0044] 图4是根据本发明的第四具体实施例的多中央处理单元侦错切换的方法的步骤 流程图。
[0045] 如图4所示,首先执行步骤400的开机程序,于此实施例中,开机程序泛指一般开 机程序,例如包括但不限于冷启动(cold boot)及热启动(warm boot)。
[0046] 接着,利用微控制器模块,侦测第一处理器是否连接至电源(步骤405),其中微控 制器模块与第一及第二处理器相连接。在此步骤中,微控制器模块由第一处理器读取是否 能成功连接至电源的讯号。假设此讯号的默认值为高准位,若可成功连接至电源,则此讯号 会被更改成低准位,因此,若微控制器模块接收到的讯号为低准位,表示第一处理器可成功 连接至电源,且由第一处理器执行开机程序;相反的,若讯息为高准位,则表示第一处理器 并未成功连接至电源。
[0047]接着,在步骤410中,微控制器模块通过一通用型输入输出模块,以判断第一处理 器是否开机成功。通用型输入输出模块与微控制器模块及一 PCH(Platf〇rm Orntrolle!· Hub)芯2组相连接,此PCH芯片组可于开机成功时发出一开机成功讯号。假设此讯号的默 认值为闻准位,若开机成功,则此讯号会被更改成低准位,因此若微控制器模块接收到低准 位的讯号,表不开机成功;相反的,若微控制器模块接收到高准位的讯号,则表示开机失败, 此时确认第一处理器故障。
[0048]或者,在步骤410中,微控制器模块亦可通过一定时器,以确认第一处理器是否开 机成功。此定时器可例如设置于微控制器模块内,且分别连接至第一处理器及第二处理器。 在此状况下,第一处理器以一预定时间间隔重置定时器,当定时器倒数至零时,则表示第一 处理器开机失败,可确认第一处理器故障。若否,则表示第一处理器开机成功。
[0049]于步骤410中,若侦测到第一处理器并未故障,则由第一处理器完成开机程序(步 骤415);若侦测到第一处理器并未连接到电源或故障,则微控制器模块通过一切换器模块, 将预设处理器切换为第二处理器(步骤420)。切换器模块连接至第一及第二处理器,亦通过 通用型输入输出模块连接至微控制器模块。因此,当微控制器侦测到第一处理器并未连接 至电源或故障,即发出一讯号,此讯号通过通用型的输入输出模块,而传输至切换器模块, 切换器模块在接收讯号后,便将预设处理器由第一处理器切换至第二处理器。
[0050]在步骤425中,启动关机,并且等待一预定时间,令主机板充分放电之后,重新开 机。
[0051] 接着,微控制器模块侦测第二处理器是否连接至电源(步骤430)。此时,微控制器 模块由第二处理器读取是否成功连接至电源的讯号,假设此讯号的默认值为高准位,若成 功连接至电源,则此讯号会被更改成低准位。因此,若微控制器模块接收到的讯号为低准 位,表示第二处理器可成功连接至电源;相反的,若讯息为高准位,则表示第二处理器并未 成功连接至电源。
[0052]于步骤430中,若侦测到第二处理器已成功连接至电源,则微控制器模块通过一 通用型输入输出模块,以判断第二处理器是否开机成功(在步骤435)。通用型输入输出模 块与微控制器模块及一 PCH(Platform Controller Hub)芯片组相连接,此PCH芯片组用以 于开机成功时发出一开机成功讯号。假设此讯号默认值为高准位,若开机成功,则此讯号会 被更改成低准位,因此若微控制器模块接收到低准位的讯号,表示开机成功;相反的,若接 收到高准位的讯号,则表示开机失败,此时确认第二处理器故障。
[0053]或者,同步骤435,微控制器模块可通过一定时器,以确认第二处理器是否开机成 功。此定时器位于微控制器模块的内部,且分别连接至第一处理器及第二处理器,第二处理 器以一预定时间间隔重置定时器,当定时器倒数至零时,则表示第二处理器开机失败,可确 认第二处理器故障。若否,则表示第二处理器开机成功。
[0054] 于步骤435中,若侦测到第二处理器并未故障,则接着由第二处理器完成开机程 序(步骤440)。若侦测到第二处理器故障,则接着判断重新开机的次数是否已达一预定次数 的步骤(图3步骤300)。倘若已达一预定次数,则进行关机(图3步骤305);倘偌位达预 定次数,则启动关机,并且等待一预定时间,令主机板充分放电之后,再重新开机(图3步骤 310) 〇
[0055]在上述具体实施例中,主要通过微控制器模块以及切换器模块,再搭配其它的必 要组件,使得两中央处理器皆可作为预设处理器,执行开机及其它运算。因此,在多中央处 理器的信息处理系统中,可利用此方法以侦测预设处理器是否故障。若是,则切换到其它处 理器并执行开机及其它运算,如此便可维持此信息处理系统的功能。
[0056]由于计算机的运算日趋复杂,商用的信息处理系统大多使用数目为两个以上的中 央处理器,例如4, 6,或8个。尽管本发明是以2及4个CPU的系统为例说明如上,然应注 意者,本发明并不限制于此。换言之,本发明的方法可使用于多个中央处理器的信息处理系 统,而在不同的中央处理器之间进行切换。如此一来,即使其中一中央处理器故障,系统仍 能正常运作,如此可将损失降至最低。
【权利要求】
1. 一种多中央处理单元侦错切换的方法,所述多中央处理单元至少包含一第一及一第 二处理器,而以所述第一处理器为预设处理器,所述方法包含: (a) 利用一微控制器模块,侦测所述第一及第二处理器是否连接至电源; (b) 利用一微控制器模块,侦测所述第一处理器是否能够正常开机,若否,则表示所述 第一处理器故障; (c) 当侦测到所述第一处理器未连接至电源或故障,且所述第二处理器有连接至电源 时,所述微控制器模块发出一讯号,并将所述讯号传输至一切换器模块,以令所述切换器模 块将所述预设处理器由所述第一处理器切换至所述第二处理器;以及 (d) 利用一微控制器模块,侦测所述第二处理器是否能够正常开机,若否,则表示所述 第二处理器故障,当所述第二处理器故障时,则执行重新开机程序。
2. 如请求项1的多中央处理单元侦错切换的方法,其中,在步骤(b)及(d)中,所述微 控制器模块通过一通用型输入输出模块而判断所述第一或第二处理器是否能够正常开机, 所述通用型输入输出模块与一PCH(Platform Controller Hub)芯片组连结,用以于开机成 功时发出一开机成功讯号。
3. 如请求项1的多中央处理单元侦错切换的方法,其中,在步骤(b)及(d)中,所述微 控制器模块通过一定时器而判断所述第一或第二处理器是否能够正常开机,所述第一或第 二处理器以一预定时间间隔重置所述定时器,当所述定时器倒数至零时,则判断所述第一 或第二处理器故障。
4. 如请求项1或2的多中央处理单元侦错切换的方法,其中,在步骤(c)中,所述微控 制器模块通过所述通用型输入输出模块,进而连接至一切换器模块,令所述切换器模块将 所述预设处理器切换至所述第二处理器。
5. 如请求项1的多中央处理单元侦错切换的方法,其中,在所述步骤(d)中的重新开机 包含使主机板充分放电。
6. 如请求项1的多中央处理单元侦错切换的方法,还包含重复步骤(a)-(d) -预定次 数。
7. 如请求项1的多中央处理单元侦错切换的方法,还包含当所述第一处理器故障时, 由所述微控制器模块发出一讯号,通过所述通用型的输入输出模块,传输至所述切换器模 块,令其将所述预设处理器由所述第一处理器改为所述第二处理器。
【文档编号】G06F11/07GK104252396SQ201310264240
【公开日】2014年12月31日 申请日期:2013年6月28日 优先权日:2013年6月28日
【发明者】李怡明, 廖峻德, 栗宇平 申请人:技嘉科技股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1