资讯的建立方法及分析方法与流程

文档序号:27308100发布日期:2021-11-09 20:52阅读:74来源:国知局
1.本发明涉及一种资讯的建立方法及分析方法,特别是指一种提供快速诊断与分析异常情况的设定与状态资讯的建立方法及分析方法。
背景技术
::2.在数据中心中,服务器包含各种硬件如中央处理器(cpu)、芯片组(chipset)与pci装置,及各种对应的固件(firmware),所述服务器具有所述固件及所述硬件的配置(configurations)及状态(status),如固件配置、固件状态、控制设定(controlsetting)暂存器、工作状态(workingstatus)暂存器、及错误状态(errorstatus)暂存器所对应的数值。随着科技的进步与发展,所述固件及所述硬件的所述配置及所述状态的复杂性正在日益增长。当异常情形,也就是错误(error)发生时,很难使用许多不同的硬件配置来分析海量数据。例如,某些服务器安装许多存储设备,或某些服务器安装多个网络设备,或某些服务器具有许多中央处理器。当工程师要调试(debug)错误问题时,需要检查所述固件及所述硬件的所述配置及所述状态的其中每一者,导致相当耗费时间且不具效率。因此,存有改善的空间。技术实现要素:3.本发明的目的在于提供一种能够快速诊断与分析异常情况的资讯的建立方法及分析方法。4.于是,本发明之一个观点,提供一种资讯的建立方法,适用于服务主机,所述服务主机包含多个硬件、多个固件、基板管理控制器及对应所述基板管理控制器的储存单元,其特征在于:所述资讯的建立方法包含步骤s1~s4。5.于步骤s1,通过所述基板管理控制器接收所述硬件及所述固件在正常执行过程中所产生的多个状态,并根据预先设定的筛选条件,选择所述状态的其中部分者。6.于步骤s2,通过所述基板管理控制器将步骤s1所选择的所述状态,分类为硬件类别及固件类别,并储存于所述储存单元。7.于步骤s3,通过所述基板管理控制器接收所述硬件及所述固件在异常情况发生时所产生的所述状态,并根据所述筛选条件,选择所述状态的其中所述部分者。8.于步骤s4,通过所述基板管理控制器将步骤s3所选择的所述状态,分类为所述硬件类别及所述固件类别,并储存于所述储存单元。9.在一些实施方式中,其中,在步骤s1中,所述基板管理控制器还接收所述硬件及所述固件在正常执行过程中所预先设定的多个配置,及所述硬件及所述固件在正常执行过程中所产生的多个执行记录,并根据所述筛选条件,选择所述配置及所述执行记录的其中部分者。10.在步骤s2中,所述基板管理控制器还将步骤s1所选择的所述配置及所述执行记录,分类为硬件类别及固件类别,并储存于所述储存单元。11.在步骤s3中,所述基板管理控制器还接收所述硬件及所述固件在异常情况发生时所预先设定的所述配置,及所述硬件及所述固件在异常情况发生时所产生的所述执行记录,并根据所述筛选条件,选择所述配置及所述执行记录的其中所述部分者。12.在步骤s4中,所述基板管理控制器还将步骤s3所选择的所述配置及所述执行记录,分类为所述硬件类别及所述固件类别,并储存于所述储存单元。13.在一些实施方式中,其中,在步骤s1及s3中,所述配置包含所述固件的多个固件配置所对应的数值,及所述硬件的多个控制设定暂存器所对应的数值,所述状态包含所述固件的多个固件状态、所述硬件的多个工作状态暂存器、及所述硬件的多个错误状态暂存器所对应的数值,所述执行记录对应所述固件。14.在一些实施方式中,其中,在步骤s2及s4中,所述基板管理控制器将步骤s1及s3所选择的所述固件配置、所述控制设定暂存器、所述固件状态、所述工作状态暂存器、所述错误状态暂存器、及所述执行记录属于所述硬件或所述固件的其中哪一者,各自分开且对应储存。15.在一些实施方式中,其中,在步骤s2及s4中,所述硬件类别包括芯片组子类别及中央处理器子类别,所述固件类别包括统一可延伸固件接口(uefi)子类别及基板管理控制器子类别,所述基板管理控制器进一步分类为所述芯片组子类别、所述中央处理器子类别、所述统一可延伸固件接口子类别、及所述基板管理控制器子类别,以储存于所述储存单元。16.于是,本发明之另一个观点,提供一种资讯的分析方法,适用于服务主机及电脑主机,所述服务主机包含多个硬件、多个固件、基板管理控制器及对应所述基板管理控制器的储存单元,其特征在于:所述资讯的分析方法包含步骤s1~s5。17.于步骤s1,通过所述基板管理控制器接收所述硬件及所述固件在正常执行过程中所产生的多个状态,并根据预先设定的筛选条件,选择所述状态的其中部分者。18.于步骤s2,通过所述基板管理控制器将步骤s1所选择的所述状态,分类为硬件类别及固件类别,并储存于所述储存单元而成为正常版错误记录收集(elc)资讯。19.于步骤s3,通过所述基板管理控制器接收所述硬件及所述固件在异常情况发生时所产生的所述状态,并根据所述筛选条件,选择所述状态的其中所述部分者。20.于步骤s4,通过所述基板管理控制器将步骤s3所选择的所述状态,分类为所述硬件类别及所述固件类别,并储存于所述储存单元而成为异常版错误记录收集资讯。21.于步骤s5,通过所述电脑主机读取所述储存单元的所述正常版错误记录收集资讯及所述异常版错误记录收集资讯,并作比对以标记所述正常版错误记录收集资讯及所述异常版错误记录收集资讯的数值相异处。22.在一些实施方式中,其中,在步骤s1中,所述基板管理控制器还接收所述硬件及所述固件在正常执行过程中所预先设定的多个配置,及所述硬件及所述固件在正常执行过程中所产生的多个执行记录,并根据所述筛选条件,选择所述配置及所述执行记录的其中部分者。23.在步骤s2中,所述基板管理控制器还将步骤s1所选择的所述配置及所述执行记录,分类为硬件类别及固件类别,并储存于所述储存单元而成为正常版错误记录收集(elc)资讯。24.在步骤s3中,所述基板管理控制器还接收所述硬件及所述固件在异常情况发生时所预先设定的所述配置,及所述硬件及所述固件在异常情况发生时所产生的所述执行记录,并根据所述筛选条件,选择所述配置及所述执行记录的其中所述部分者。25.在步骤s4中,所述基板管理控制器还将步骤s3所选择的所述配置及所述执行记录,分类为所述硬件类别及所述固件类别,并储存于所述储存单元而成为异常版错误记录收集资讯。26.在一些实施方式中,其中,在步骤s1及s3中,所述配置包含所述固件的多个固件配置所对应的数值,及所述硬件的多个控制设定暂存器所对应的数值,所述状态包含所述固件的多个固件状态、所述硬件的多个工作状态暂存器、及所述硬件的多个错误状态暂存器所对应的数值,所述执行记录对应所述固件。27.在另一些实施方式中,其中,在步骤s2及s4中,所述基板管理控制器将步骤s1及s3所选择的所述固件配置、所述控制设定暂存器、所述固件状态、所述工作状态暂存器、所述错误状态暂存器、及所述执行记录属于所述硬件或所述固件的其中哪一者,各自分开且对应储存。28.在另一些实施方式中,其中,在步骤s2及s4中,所述硬件类别包括芯片组子类别及中央处理器子类别,所述固件类别包括统一可延伸固件接口(uefi)子类别及基板管理控制器子类别,所述基板管理控制器进一步分类为所述芯片组子类别、所述中央处理器子类别、所述统一可延伸固件接口子类别、及所述基板管理控制器子类别,以储存于所述储存单元。29.于是,本发明之另一个观点,提供一种资讯的分析方法,包含步骤s1~s3。30.于步骤s1,通过服务主机的基板管理控制器将所述服务主机的硬件及固件在正常执行过程中的正常版错误记录收集(elc)资讯按照硬件类别及固件类别分开储存于所述服务主机的储存单元,所述错误记录收集资讯包含配置、状态、及执行记录其中至少一种;31.于步骤s2,通过所述基板管理控制器将所述硬件及固件在异常情况发生时的异常版错误记录收集资讯按照所述硬件类别及固件类别分开储存于所述储存单元;及32.于步骤s3,通过所述服务主机或远程电脑主机读取所述储存单元的所述正常版错误记录收集资讯及所述异常版错误记录收集资讯,并作比对以获得所述正常版错误记录收集资讯及所述异常版错误记录收集资讯的相异处。33.于是,本发明之另一个观点,提供一种资讯的分析方法,包含步骤s1~s3。34.于步骤s1,将所述服务主机的硬件及固件在正常执行过程中的正常版状态按照硬件类别及固件类别分开储存于所述服务主机的储存单元,所述硬件类别及固件类别分别包含多种硬件及固件;35.于步骤s2,将所述硬件及固件在异常情况发生时的异常版状态按照所述硬件类别及固件类别分开储存于所述储存单元;及36.于步骤s3,通过所述服务主机或远程电脑主机读取所述储存单元的所述正常版状态及所述异常版状态,并作比对以获得所述正常版状态及所述异常版状态的相异处。37.本发明的有益的效果在于:通过所述基板管理控制器接收并筛选来自所述硬件及所述固件分别在正常执行过程中及异常状态发生时的所述配置、所述状态、及所述执行记录,再加以分类为所述硬件类别及所述固件类别,并分别储存为所述正常版错误记录收集资讯及所述异常版错误记录收集资讯。使得工程师要调试错误问题时,能够更快速地作异常情况的诊断与分析。附图说明38.图1是一个示意图,说明本发明资讯的建立方法及分析方法所适用的一个服务主机及一个电脑主机;39.图2是一个流程图,说明本发明资讯的建立方法的一个实施例;40.图3是一个流程图,说明本发明资讯的分析方法的一个实施例;及41.图4是一个示意图,说明所述实施例所储存的资讯的分类效果。具体实施方式42.下面结合附图及实施例对本发明进行详细说明。43.在本发明被详细描述的前,应当注意在以下的说明内容中,类似的元件是以相同的编号来表示。44.参阅图1与图2,本发明资讯的建立方法的一个实施例,适用于一个服务主机1及一个电脑主机2,所述服务主机1包含一个基板管理控制器(baseboardmanagementcontroller,bmc)11、对应所述基板管理控制器11的一个储存单元12、多个硬件、及多个固件。所述服务主机1例如是设置于数据中心的多个服务器(server)的其中任一个。所述储存单元12例如是快闪存储器(flash)或其他种类的非挥发性存储器(non-volatilememory),并电连接所述基板管理控制器11,以提供所述基板管理控制器11存取使用。45.所述硬件例如是一个芯片组(chipset)、电连接所述芯片组的至少一个sata装置、至少一个usb装置、一个实时时钟(realtimeclock,rtc)、至少一个lpc(lowpincount)汇流排装置、至少一个espi(enhancedserialperipheralinterface)装置、至少一个pcie装置、至少一个网路控制器、至少一个smbus(hostsystemmanagementbuscontroller)装置、至少一个电源管理控制器或至少一个heci(hostsystemmanagementbuscontroller)装置、一个中央处理器(cpu)、电连接所述中央处理器的至少一个dmi(directmediainterface)装置、至少一个pcie装置、至少一个cha(cachingandhomeagent)装置、至少一个imc(integratedmemorycontroller)控制器、至少一个pcu(powercontrolunit)装置或至少一个msr(modelspecificregisters)装置。所述固件例如是统一可延伸固件接口(unifiedextensiblefirmwareinterface,uefi)固件及基板管理控制器固件。46.所述资讯的建立方法包含步骤s1~s4。47.于步骤s1,通过所述基板管理控制器11接收所述硬件及所述固件在正常执行过程中所预先设定的多个配置(configurations)及所产生的多个状态(status)及多个执行记录(log),并根据预先设定的筛选条件,选择所述配置、所述状态、及所述执行记录的其中部分者。48.于步骤s2,通过所述基板管理控制器11将步骤s1所选择的所述配置、所述状态、及所述执行记录,分类为一个硬件类别及一个固件类别,且再分类为属于所述硬件类别的一个芯片组子类别及一个中央处理器子类别,及属于所述固件类别的一个统一可延伸固件接口(uefi)子类别及一个基板管理控制器子类别,并储存于所述储存单元12而成为一个正常版错误记录收集(errorlogcollection,elc)资讯。49.于步骤s3,通过所述基板管理控制器11接收所述硬件及所述固件在异常情况发生时预先设定的所述配置、所述状态、及所述执行记录,并根据所述筛选条件,选择所述配置、所述状态、及所述执行记录的其中所述部分者。也就是说,在步骤s3所选择的对象与步骤s1相同。50.其中,在步骤s1及s3中,所述配置包含所述固件的多个固件配置(configurations)所对应的数值,及所述硬件的多个控制设定(controlsetting)暂存器所对应的数值。所述状态包含所述固件的多个固件状态(status)、所述硬件的多个工作状态(workingstatus)暂存器、及所述硬件的多个错误状态(errorstatus)暂存器所对应的数值。所述执行记录对应所述固件,并例如是开机记录。51.于步骤s4,通过所述基板管理控制器11将步骤s3所选择的所述配置、所述状态、及所述执行记录,分类为所述硬件类别及所述固件类别,且再分类为属于所述硬件类别的所述芯片组子类别及所述中央处理器子类别,及属于所述固件类别的所述统一可延伸固件接口(uefi)子类别及所述基板管理控制器子类别,并储存于所述储存单元12而成为一个异常版错误记录收集资讯。52.其中,在步骤s2及s4中,所述基板管理控制器11将步骤s1及s3所选择的所述固件配置、所述控制设定暂存器、所述固件状态、所述工作状态暂存器、所述错误状态暂存器、及所述执行记录属于所述硬件或所述固件的其中哪一者,各自分开且对应储存。53.再参阅图4,图4示例性说明所述储存单元12所储存的所述正常版错误记录收集资讯或所述异常版错误记录收集资讯的分类效果,并举例所述筛选条件所选择的所述配置、所述状态、及所述执行记录。54.举例来说,图4中属于所述芯片组子类别的第i控制设定暂存器、第i工作状态暂存器、及第i错误状态暂存器是对应前述的所述sata装置、所述usb装置、所述实时时钟(rtc)、所述lpc汇流排装置、所述espi装置、所述pcie装置、所述网路控制器、所述smbus装置、所述个电源管理控制器或所述heci装置的其中一个,i=1、2、3…。55.所述sata装置的所述第i控制设定暂存器例如是portcontrol的portxenablebit、globalhbacontrol的ahcienable(ae)与hbareset(hr)。所述usb装置的所述第i控制设定暂存器例如是memorybaseaddress(mbar)的baseaddress(ba)、prefetchable、type与resourcetypeindicator(rte)、usbcommand(usbcmd)的enablewrapevent(ewe)、hostcontrollerreset(hcrst)与run/stop(rs)。56.所述sata装置的所述第i工作状态暂存器例如是portstatus的portxpresentbit、hbacapabilities的supportsstaggeredspin-up与interfacespeedsupport(iss)。所述usb装置的所述第i工作状态暂存器例如是powermanagementcontrol/status(pm_cs)的pme_status与powerstste、usbstatus(usbsts)的portchangedetect(pcd)与eventinterrupt(eint)。57.所述sata装置的所述第i错误状态暂存器例如是devicestatus(sts)的detectedparityerror(dpe)与signaledsystemerror(sse)、portxserialataerror的diagnostics(diag)与error(err)。所述usb装置的所述第i错误状态暂存器例如是xhcsystembusconfiguration1(xhcc1)的master/targetabortserr(rmtaserr)与unsupportedrequestdetected(urd)、usbstatus(usbsts)的hostcontrollererror(hce)与save/restoreerror(sre)。58.举例来说,图4中属于所述中央处理器子类别的第i控制设定暂存器、第i工作状态暂存器、及第i错误状态暂存器是对应前述的所述dmi装置、所述pcie装置、所述cha装置、所述imc控制器、所述pcu装置或所述msr装置的其中一个。59.所述dmi装置的所述第i控制设定暂存器例如是dmicontrolregister(dmictrl)的auto_complete_pm与abort_inbound_requests、dmivcxresourcecontrol的virtualchannelxenable。所述pcie装置的所述第i控制设定暂存器例如是i/obase(iobase)的i/obaseaddressbits(ioba)、devicecontrol(devctl)的maximumpayloadsize(mps)、fatalerrorreportingenable(fere)、non-fatalerrorreportingenable(nfere)与correctableerrorreportingenable(cere)。60.所述dmi装置的所述第i工作状态暂存器例如是dmistatusregister(dmists)的received_cpu_reset_done_ack、dmivcxresourcestatus的vcxnp(processofflowcontrolinitialization)。所述pcie装置的所述第i工作状态暂存器例如是memorybase(membase)的memorybase(mb)、slotstatus(slotsts)的presencedetectstate(pds)、commandcompleted(ccs)与presencedetectchanged(pdcs)。61.所述dmi装置的所述第i错误状态暂存器例如是rootporterrorstatus的fatal_error_received、non_fatal_error_received与correctable_error_received。所述pcie装置的所述第i错误状态暂存器例如是rootporterrorstatus的fatal_error_received、non_fatal_error_received与correctable_error_received、devicestatus(devsts)的correctableerrordetected(ced)、non-fatalerrordetected(nfed)与fatalerrordetected(fed)。62.举例来说,图4中属于所述统一可延伸固件接口(uefi)子类别的第i固件配置及第i固件状态例如是对应所述统一可延伸固件接口(uefi)固件的smbios(systemmanagementbios)、systemconfiguration(variable)、systemresetlog、或inventory的其中一个。63.所述第i固件配置例如是smbios的typexinformation、systemconfiguration的eachsystemconfigurationvariable、pch、memory与pcie、systemresetlog的resettypeandtimestamp、inventory的memoryslotmapout、cpucoredisable、pcieslotdisbled与storageenable。所述第i固件状态例如是inventory的memorytopological、cpuinformation、pcietopological、storagetopological与networkdevicetopological。所述执行记录例如是smbios的smbiostablelog、systemconfiguration的debugmessage、inventory的debugmessage。64.举例来说,图4中属于所述基板管理控制器子类别的第i固件配置及第i固件状态例如是sdr(sensordatarecord)、temperature、ledstatus、或powerinformation的其中一个。65.所述第i固件配置例如是temperature的temperaturelimit与alarmsetting。所述第i固件状态例如是sdr的fan、cpu、dimm与psu、temperature的cpu、pch、fanrpm与dimm、ledstatus的errororwarningledstatus、powerinformation的p12v_aux、p3v3与p1v5。所述执行记录例如是systemerrorlog(sel)、bmcsystemlog、bmcdebugmessage。66.通过所述储存单元12所储存的所述正常版错误记录收集资讯及所述异常版错误记录收集资讯,使得当所述服务主机1在异常情况发生后,工程师要调试错误问题时,能够通过所述电脑主机2而更快速地据以作异常情况的诊断与分析,进而能改善现有技术的耗时与效率不佳的问题。另外要特别补充说明的是:在本实施例中,所述基板管理控制器11是接收、选择、分类、并储存所述配置、所述状态、及所述执行记录。而在其他的实施例中,所述基板管理控制器11也可以是接收、选择、分类、并储存所述配置、所述状态、及所述执行记录之其中至少一种。67.参阅图1与图3,本发明资讯的分析方法的一个实施例,包含步骤s1~s6,其中,步骤s1~s4与所述资讯的建立方法的步骤s1~s4相同。68.于步骤s5,通过所述电脑主机2读取所述储存单元12的所述正常版错误记录收集资讯及所述异常版错误记录收集资讯,并作比对以标记所述正常版错误记录收集资讯及所述异常版错误记录收集资讯的数值相异处。另外要特别强调的是:在其他的实施例中,当所述服务主机1仍然能够运作时,也可以是通过所述服务主机1读取所述储存单元12的所述正常版错误记录收集资讯及所述异常版错误记录收集资讯,并作比对及标记。69.于步骤s6,通过所述电脑主机2的一个显示单元(如荧幕)显示所述正常版错误记录收集资讯及所述异常版错误记录收集资讯,并还显示在所述数值相异处所作的标记。70.综上所述,通过所述基板管理控制器11接收并筛选来自所述硬件及所述固件分别在正常执行过程中及异常状态发生时的所述配置、所述状态、及所述执行记录,再加以分类为所述硬件类别及所述固件类别,甚至在细分为所述芯片组子类别、所述中央处理器子类别、所述统一可延伸固件接口(uefi)子类别、及所述基板管理控制器子类别,并分别储存为所述正常版错误记录收集资讯及所述异常版错误记录收集资讯。使得工程师要调试错误问题时,能够更快速地作异常情况的诊断与分析,所以确实能达成本发明的目的。71.惟以上所述者,仅为本发明的实施例而已,当不能以此限定本发明实施的范围,即大凡依本发明权利要求书及专利说明书内容所作的简单的等效变化与修饰,皆仍属本发明专利涵盖的范围内。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1