高速有线接收器中的链路质量估计和异常检测的制作方法

文档序号:31122747发布日期:2022-08-13 02:00阅读:47来源:国知局
高速有线接收器中的链路质量估计和异常检测的制作方法
高速有线接收器中的链路质量估计和异常检测
1.相关申请的交叉引用
2.本技术要求2021年1月29日提交的美国临时专利申请63/143,577的权益,其公开内容通过引用并入本文。
技术领域
3.本公开一般涉及高速接收器,并且尤其涉及用于高速有线接收器中的链路质量估计的方法和系统。


背景技术:

4.高速接收器,并且特别是并入高速解串器(serdes)的接收器,可以包括估计链路质量的电路装置。


技术实现要素:

5.本文描述的实施例提供了一种引用在网络设备中使用的集成电路(ic)。ic包括接收器和链路质量估计电路(lqec)。接收器被配置为在链路上接收信号并且被配置为处理接收到的信号。lqec被配置为通过分析接收器的电路装置的至少一个或多个设置来预测指示未来在链路上的通信质量的链路质量测量,并且根据所预测的链路质量测量来发起响应动作。
6.在一个实施例中,lqec被配置为通过至少部分地发起后续通信的转移来从链路到另一链路发起响应动作。在公开的实施例中,通过分析接收器的电路装置随时间变化的设置,lqec被配置为预测链路质量测量的未来值或趋势,并且被配置为根据预测的未来值或趋势发起响应动作。在示例实施例中,lqec被配置为响应于确定链路质量测量被预测为下降到质量阈值以下而发起响应动作。
7.在一些实施例中,lqec被配置为通过联合分析(i)接收器的电路装置的一个或多个设置以及(ii)接收信号的一个或多个参数,来预测链路质量测量。在公开的实施例中,lqec被配置为通过至少在接收器的电路装置的一个或多个设置上操作预训练的机器学习(ml)模型来预测链路质量测量。
8.在一个实施例中,lqec被配置为通过发起信号的数据速率的降低来发起响应动作。在另一个实施例中,lqec被配置为通过发起用于编码信号的编码方案的改变来发起响应动作。在示例实施例中,lqec被配置为通过随时间分析接收器的电路装置的至少一个设置来预测链路质量测量,所述设置选自以下项之中:(i)时钟数据恢复(cdr)电路的增益,(ii)cdr电路的带宽,(iii)模拟均衡滤波器的响应,(iv)模数转换器(adc)的设置,(v)数字均衡器的抽头值,(vi)自动增益控制(agc)设置,以及(vii)限幅器阈值。
9.在一些实施例中,ic还包括:一个或多个附加接收器,被配置为接收、处理和解调在一个或多个附加链路上的一个或多个附加信号;以及一个或多个附加lqec,被配置为基于对一个或多个附加链路的链路质量测量的分析来预测用于一个或多个附加链路上的通
信的一个或多个附加链路质量测量。在一个实施例中,所述ic还包括处理器,所述处理器被配置为基于所述链路质量测量和所述一个或多个附加链路质量测量来计算针对网络系统或所述网络系统的一部分的系统级健康量测,并且响应于所计算的系统级健康量测来管理业务分配。
10.在一些实施例中,接收器设置在解串器中。
11.根据本文描述的实施例,还提供了一种用于在网络设备中使用的方法。该方法包括使用接收器通过链路接收信号且并处理接收到的信号。通过分析接收器的电路装置的至少一个或多个设置来预测指示未来在链路上的通信质量的链路质量测量。根据所预测的链路质量测量来发起响应动作。
12.从以下结合附图对本发明实施例的详细描述中将更全面地理解本发明,在附图中:
附图说明
13.图1是根据本文描述的实施例示意性示出具有链路质量估计电路(lqec)的高速有线接收器的框图;
14.图2是根据本文描述的实施例示意性地示出用于模拟图1的接收器和链路的数据传输模拟环境的结构的框图,该数据传输模拟环境生成用于链路质量估计机器学习(ml)模型的输入数据;
15.图3是根据本文描述的实施例示意性示出用于生成图1的lqec的ml参数的链路质量估计ml训练环境的框图;
16.图4是根据本文描述的实施例,示意性地示出由图1的lqec进行的链路质量预测的波形图;
17.图5a是根据本文描述的实施例示意性示出具有主路由路径的分布式系统的框图;
18.图5b是根据本文描述的实施例示意性地示出具有响应于低链路质量预测而选择的辅路由路径的分布式系统的框图;
19.图6是示意性地示出根据本文描述的实施例的被配置为响应于链路质量预测来优化通信性能的网络设备的框图;
20.图7a是根据本文描述的实施例,示意性地示出用于生成基于ml的链路质量估计和预测模型的方法的流程图;
21.图7b是根据本文描述的实施例示意性示出用于估计和预测链路质量的方法的流程图;以及
22.图7c是示意性地示出根据本文描述的实施例的用于利用链路质量估计和链路质量预测来改善网络设备的性能的方法的流程图。
具体实施方式
23.快速接收器,特别是串行器-解串器(serdes)接收器是用于在联网、计算和存储应用中高速串行链路的关键构件块。随着信令速度增加,用于所需物理到达的信道损耗增加,并且链路容限降低。因此,需要更精密的接收器设计来满足给定的误码率(ber)要求。因此,serdes接收器已经从具有简单升压滤波器的输入端口发展到具有高级均衡结构(例如
多抽头前馈均衡器(ffe)和判决反馈均衡器(dfe))的复杂接收器。
24.向更高速度的移动,包括采用诸如pam4的更高阶编码方案,导致更复杂的接收器体系结构和实现方式。在一些应用中,使用盲适配(无训练模式)来调谐通常可以具有高达40或50个操作参数的接收器,从而导致在适配运行之间的变化。准确的链路质量量测和异常链路以及操作条件的检测对于确保采用高速serdes输入的系统的高度可靠的操作是至关重要的。
25.接收器可以使用诸如限幅器信噪比(snr),误码率(ber),诸如竖直眼图张开度和水平眼图张开度等眼图裕度的测量作为链路质量指示符;然而,这些量测由于电路变化(例如,晶体管尺寸中的制造相关变化)和自适应变化(例如,链路质量指示符的计算中的变化)而具有固有的可变性,并且因此对于诸如非最佳适配的异常的高精度链路容限测量或鲁棒检测来说不一定足够。
26.例如,高agc增益设置可以指示高链路衰减,但是也可以与低逻辑电平符号的突发相关联,因此,如果不由其它设置支持增益设置,则增益设置不可以用作可靠的链路质量指示符。此外,这样的指示符不预测未来的链路质量,并且通常不能预测链路趋向于故障或者它将要故障,直到太晚而不能采取补救措施来防止数据丢失。
27.本文公开的实施例通过分析接收器的一个或多个设置来提供高度精确的链路质量估计和链路质量预测。在一些实施例中,接收器设置与接收信号的一个或多个参数被联合分析,以产生期望的链路质量估计和/或预测。在实施例中,在时间域中跟踪接收器参数的联合分析,以生成预测链路未来质量的量测。在其他实施例中,使用机器学习(ml)以及序列检测和分类技术来执行分析。
28.通过预测给定链路的链路质量趋向于下降到针对链路质量的最小需求之下,可以在适当的时间采取补救措施以将恶化链路上的一些或全部数据业务转向到不同的链路。相反,通过预测给定链路的链路质量趋向于超过指定的链路质量量测,在该链路上的数据业务可以增加到指定的最大容量之上,以便针对网络提供增加的数据承载容量。
29.在一个实施例中,接收器包括:子模块,子模块包括自动增益控制(agc)、连续时间线性均衡器(ctle)、模数转换器(adc)、前馈均衡器(ffe)、判决反馈均衡器(dfe)和多级解码限幅器。接收器试图为了更好的性能(例如,更好的信噪比(snr),更宽的眼界(eye margin)和更好的误码率(ber))而优化各种子模块的设置。在一个实施例中,接收器还包括链路质量估计电路(lqec),其被配置为基于子模块的设置的当前和历史来估计链路质量和/或预测未来链路质量。
30.在一些实施例中,lqec包括机器学习(ml)推理模型,其使用子模块的设置的当前和历史作为输入,并且利用由ml训练会话预设的权重和激活函数来估计和预测未来链路质量。在一个实施例中,使用全数据传输路径模拟环境来产生ml输入。在一些实施例中,模拟环境包括发射器,具有连接器的电缆和接收器的模型。
31.在实施例中,当产生ml输入时,计算机(或多个耦合的计算机)改变模拟参数,参数包括(但不限于)经受过程电压温度(pvt)变化的发射器相位和增益噪声、发射器非线性度、抖动、电缆衰减、电缆串扰、电缆反射和接收器参数。接收器的设置、信号的参数和链路质量被监测,然后针对获得最小的链路质量估计误差来训练ml模型。然后,响应于接收器设置和信号参数,包括权重和激活函数的优化参数(其在一些实施例中可以包括参数的历史)可以
用于设置ml推断模型(即,lqec)参数,以准确地估计和预测链路质量。
32.在一些实施例中,连接到通信网络的分布式系统中的网络设备包括处理器和一个或多个接收器,每个接收器包括lqec(在实施例中,多个接收器可以共享lqec)。网络设备通过网络和通过耦合到第一输入端口的接收器从对等网络设备接收数据。当lqec预测到对应的链路即将失效(例如,预测的链路质量的测量将低于预设阈值)时,处理器(也称为“主机处理器”)向对等网络设备发送重新路由消息,对等网络设备然后可以向第二端口(并且因此通过第二链路向第二接收器)发送进一步的数据。如果预测足够早,则可以保持数据完整性。
33.在一些实施例中,lqec生成链路质量量测,该链路质量量测可以与来自系统中的其它接收器的链路质量量测聚集并且联合分析,以生成与系统级容限相关的附加预测量测。在这些实施例中,机器学习(ml)和深度学习(dl)技术被用于来自大量端口的链路质量测量的联合分析(我们将在下面使用术语机器学习(ml)作为术语深度学习(dl)的包含性表示)。在一些实施例中,该联合分析将结合除了链路质量量测之外的其它系统级量测,以增强预测的准确性。本发明的这个特定实施例对于利用这种高速有线接收器的大量实例的应用是可应用的和有价值的。
34.最后,在一些实施例中,比特率可能需要随着链路质量改变而改变。在这样的实施例中,处理器可以响应于链路质量估计和预测来增加或减少接收器数据比特率。
35.在这里描述的实施例中,使用机器学习(ml)和深度学习(dl)技术来可靠地估计和预测高速serdes接收器中的链路质量。
36.图1是示意性地示出根据本文描述的实施例的具有链路质量估计电路的高速有线接收器100的框图。在非限制性示例实施例中,接收器100是网络设备的端口中的解串器的一部分。
37.在一个实施例中,接收器100包括自动增益控制(agc)电路102、连续时间线性均衡器(ctle)104、模数转换器(adc)106、前馈均衡器(ffe)108、判决反馈均衡器(dfe)110、高阈值限幅器112、中阈值限幅器114和低阈值限幅器116。在其它实施例中,可以有更少的信号处理电路或本文没有讨论的附加信号处理电路。
38.在实施例中,agc 102是自动设置施加到输入信号的增益的电路。关于高速可变增益放大器和自动增益控制电路的教程可以在模拟设备“高速可变增益放大器”mt-073教程(rev.0,10/08)中找到。
39.ctle 104是用于信号均衡的有线接收器前端的核心模拟构建块。基于反相器的ctle的示例可以在美国专利申请公开2021/0288590中找到。
40.adc 106将高速输入模拟信号转换为数字表示,以允许在其它级中进行更好准确度的数字处理。在一些实施例中,adc 106包括闪烁型adc,其将输入信号与多个参考电压进行比较。
41.ffe 108和dfe 110分别是前馈均衡器和判决反馈均衡器;包括ffe和dfe的高速均衡技术的描述可以在例如a.suleiman的mit硕士论文中找到,其题为“model predictive control equalization for high-speed io links”,麻省理工学院,6月2013。
42.在一个实施例中,限幅器112、114和116将均衡的输入信号与三个阈值-dl、dz和dh进行比较。在脉冲振幅调制-4(pam4)中,有四个标称信号电平-v0、v1、v2和v3。理想地,
dl可以被设置为v0和v1的平均值;dz可以被设置为v1和v2的平均值;并且dh可以被设置为v2和v3的平均值。因此,通过审查三个限幅器的输出,可以确定发送的pam4值。在实施例中,限幅器连续地改变阈值电压,以针对输入信号中的dc变化(包括dc噪声)调整。
43.虽然包括agc 102、ctle 104、adc 106、ffe 108和限幅器112、114、116的一些(或全部)信号处理电路可以调整相应的操作参数以改善性能,但是通过系统级参数优化可以获得更好的结果。在实施例中,有线接收器100还包括适配控制电路117。适配控制电路接收链路质量测量,包括ber,并且包括来自一些或所有信号处理电路的质量测量。作为响应,适配控制电路可以设置信号处理电路的一些或全部操作参数(在一些实施例中,一些信号处理电路可以响应适配控制电路发送的指示以及信号处理电路执行的信号质量估计来设置操作参数)。
44.高速有线接收器100还包括链路质量估计电路(lqec)120,在一个实施例中,链路质量估计电路120又包括用于存储接收器参数历史的参数历史存储器122和ml/深度学习(dl)推理引擎124。在一个实施例中,lqec被配置为响应于接收器参数和接收器参数的历史来估计链路质量的测量并且预测链路质量测量的未来值。在一些实施例中,lqec的ml/dl推理引擎是预训练的推理机器学习(ml)模型,并且lqec响应于预训练的推理模型参数(例如,权重和决策函数)并且响应于lqec ml/dl推理引擎从接收器的子模块以及从参数历史存储器接收的参数而输出链路质量指示。
45.lqec从接收器的子模块接收的参数可以包括例如:
46.i.agc 102的增益设置。
47.ii.选择的ctle 104曲线特征(例如,在美国专利申请2021/0288590中描述的ctle的g1和g2)。
48.iii.在数据路径中的不同点处测量的偏移
49.iv.adc 106的偏移,全范围设置和限幅比。
50.v.cdr(时钟和数据恢复)电路的带宽、峰值和适配值
51.vi.限幅器112、114和116的阈值电压(dl、dz、dh)。
52.vii.链路误码率(ber)测量(例如,当链路数据包括检错码时)。
53.viii.信噪比(snr),其可以例如由限幅器112、114和116测量。
54.ix.被用于调谐接收器块的用于适配环路的参数
55.在实施例中,lqec在初始设置时接收初始ml参数,并且可以在操作期间接收更新的参数(例如,如果用包括附加操作参数和操作参数历史的附加数据来训练ml模型)。
56.在上文中,我们指的是链路故障预测;在当前上下文中,链路故障被定义为链路质量测量低于预设阈值。
57.在一些实施例中,lqec仅输出链路质量估计;在其他实施例中,lqec可以输出近期未来的链路质量预测(例如,在下一个1毫秒内的故障几率);在一个实施例中,lqec可输出可在系统级聚集的链路质量测量。如下所述,在一些实施例中,具有链路可能发生故障的早期指示可以防止数据丢失,相反,链路质量将超过预设阈值的早期指示可以用于增加链路带宽,从而优化计算性能。在实施例中,可以响应于链路质量指示和预测以及其他准则(例如,队列拥塞)来增加和减少链路带宽。
58.在图1中示出并在上文中描述的接收器100的配置通过示例的方式被引用。在备选
实施例中可以使用其它接收器配置。例如,在一些实施例中,可以使用nrz接收器,消除了对三个限幅器的需要;在一个实施例中,ffe 108是模拟的(并因此连接在ctle104和adc106之间);在另一个实施例中,adc可以不存在,导致均衡功能的全模拟实现。
59.在一些实施例中,训练ml模型以响应于高速有线接收器100的参数(静态和/或历史)来估计和预测链路质量测量。通过模拟获得ml模型的训练数据。
60.图2是根据本文描述的实施例示意性地示出用于模拟接收器链路的数据传输模拟环境200的配置的框图,接收器链路生成用于链路质量估计ml模型的输入数据。模拟模型200例如可以用诸如c/c++、python、matlab等高级编程语言来编写,并且包括发射器模型202、链路模型204和接收器模型206。
61.数据传输模拟模型200包括通信路径的软件模型。在实施例中,数据传输模拟模拟了从将数据传输到接收器100(图1)的发射器通过由链路模型204建模的典型链路(包括电缆和连接器)到与参照图1描述的接收器的结构相匹配的接收器模型的完整路径。模拟的操作由模拟控制软件(scsw)208管理并且由计算机210执行。
62.为了生成一组ml训练数据,scsw通常将随机数据序列输入到发射器模型输入(例如,具有随机有效载荷的通信分组);作为响应,发射器模型生成输入到链路模型的输出信号。链路模型将链路传递函数应用于发射器输出,并且将结果信号发送到接收器模型。
63.在实施例中,scsw在多个模拟中改变通信路径模型的参数,以模拟实际通信路径中的可能变化。例如,在发射器模型中,scsw可以添加相位、增益和偏移误差以及各种发射器级的非线性。在链路模型中,scsw可以改变链路的频率响应以表示各种电缆长度,波动电缆参数(例如,衰减和特性阻抗)以表示老化、弯曲、温度等,添加返回信号以模拟不匹配的终止,以及添加线间串扰。在接收器模型中,scsw可以改变过程电压温度(pvt)、增加噪声和增加串扰。
64.scsw监测各种接收器参数,以及指示对应于诸如snr和ber的不同接收器参数的链路质量的测量。然后可以使用所监测的参数来训练ml模型。
65.在图2中示出并且在上文中描述的数据传输模拟环境200的结构是为了概念上清楚而引用的示例。在可选实施例中可以使用其它结构。例如,在一些实施例中,模拟可以由ml训练模型引导,从而强调针对ml模型预测准确率的变化低。
66.图3是根据本文描述的实施例示意性示出用于生成链路质量估计电路的ml参数的链路质量估计ml训练环境300的框图。ml训练环境包括机器学习预测模型302、输入特征集合304,训练数据输入集合306和比较器308。训练由计算机310管理。
67.在一个实施例中,机器学习预测模型302是多层深度学习模型,其被训练以通过调整ml模型节点中的至少一些节点的权重和激活函数来预测链路质量。在实施例中,机器学习预测模型302可以是例如自动回归深度学习模型,或任何其他合适的机器学习或深度学习模型(对于自回归技术背景,参见例如“deep autoregressive networks”,k。gregor等人al,第31届国际机器学习会议论文集,北京,中国,2014。)
68.输入特征集304是通常由模拟(例如,使用图2的数据传送模拟环境200)生成的输入列表。输入可以包括设备pvt和诸如agc增益的接收器参数(参见参考图1描述的lqec输入的列表)。
69.比较器308被配置为将机器学习预测模型预测的链路质量与在模拟期间计算的实
际链路质量(例如,snr和ber)进行比较,并且将误差梯度反馈回机器学习预测模型;然后,机器学习预测模型可以修改模型参数以最小化误差。
70.在实施例中,机器学习预测模型尝试在预设时间(例如,1ms)内预测链路故障;比较器308将链路质量的未来值与预测的链路质量进行比较,使得该差值将表示未来链路质量预测中的误差。
71.在图3中示出并且在上文中描述的ml训练环境300的配置是仅为了概念上清楚而引用的示例。在备选实施例中可以使用其它配置。例如,在一些实施例中,可以使用其它链路质量测量,诸如由时钟数据恢复(cdr)电路生成的丢失同步信号。
72.图4是根据本文描述的实施例的通过lqec示意性示出故障预测的波形图400。根据图4所示的曲线图,lqec监测一组接收器参数,包括数字参数a 402和模拟参数b 404。
73.在一些情况下,随着时间的推移,对接收器参数(可能与信号参数组合)的检查可以揭示指示未来链路质量的趋势。lqec输出当前链路质量的预测和未来链路质量的预测。根据图4的简化示例,lqec的预测限于链路在预设时间间隔(例如,1ms)内失效的概率。
74.曲线406是lqec输出的故障预测,以百分比表示。曲线408是链路质量,以误码率(ber)表示,以对数尺度表示。如可以观察到的,链路质量最初是良好的,具有10
-10
到10
-8
的错误率,直到在某个点链路故障并且ber急剧上升到10
-0
(错误在所有位中)。(上面引用的ber数仅是一个示例;实际上,可接受的错误率根据应用和所应用的错误控制编码方案而变化。
75.当lqec被适当地训练时,可以通过监测和跟踪接收器参数的轨迹来预测链路故障。如可以观察到的,根据图4所示的示例实施例,lqec预测在链路失效之前网络将基本上以75%的置信度失效。如下所述,处理器可以使用该“早期警报”采取适当的措施,确保数据完整性。
76.在图4中示出并且在上文中描述的波形图400是仅为了概念上清楚而引用的示例。其它波形可以表示备选实施例。例如,在一些实施例中,ber也是lqec的输入,改善了预测精度。
77.在实施例中,处理器可以接收链路质量预测并且采取适当的测量。下面将参照图5a、图5b和6讨论两个实施例。实施例涉及通过通信网络连接到对等网络设备的网络设备。
78.图5a是根据本文描述的实施例示意性示出具有主路由路径的分布式系统500的框图。分布式系统500例如可以是分布式计算系统。
79.数据汇502通过通信网络506从数据源504接收数据。数据汇502和数据源504可以是例如被配置为与通信网络对接的网络设备。网络506可以是例如以太网或infiniband
tm
或任何其它合适的通信网络。
80.数据汇包括处理器508,其被配置为执行计算任务;处理器通过第一入口端口510和第二入口端口512耦合到网络506。通过网络506从数据源到数据汇的数据通过主路径514横穿到第一入口端口510,并且从入口端口到处理器。入口端口510和512包括预测链路质量的基于机器学习的推理电路,例如图1的lqec电路120,并且每个入口端口向处理器输出链路质量预测(lqp)信号。(路径514不应与上述链路混淆-路径514可以包括多个交换节点,并且上述链路是路径的最后滞后。
81.根据图5a所示的示例实施例,入口端口510的lqec预测输入链路即将失效。如上所
述,lqec已被训练成响应于入口端口接收器的参数来预测链路故障;因此,处理器在实际链路故障之前接收链路故障指示。响应于故障预测,处理器可以向数据源发送消息(例如,通过网络506),请求数据源重新路由数据源发送到数据汇的其它数据。
82.图5b是示意性地示出根据本文描述的实施例的具有响应于低链路质量预测而选择的辅路由路径的分布式系统550的框图。除了使用数据源504和数据汇502之间的不同路径之外,分布式系统550与分布式系统500相同。当数据源504从数据汇接收到重新路由消息时,数据源向相同的目的地地址但向不同的目的地端口发送另外的数据。然后,网络通过辅路径552将另外的数据重新路由到入口端口512。由于链路故障预测发生在实际链路故障之前,因此可以保持数据完整性。
83.在图5a,5b中示出并且在上文中描述的分布式系统500,550的配置是为了概念上清楚而引用的示例。在备选实施例中可以使用其它配置。例如,在一些实施例中,当链路的质量降低时,链路可以不再传送pam4数据,但是仍然可以使用nrz。响应于链路故障预测,处理器508将向数据源发信号通知nrz应当用于进一步的数据传输。如果lqec仍然预测失败,则处理器可以请求重新路由。
84.图6是示意性地示出根据本文描述的实施例的被配置为响应于链路质量预测来优化通信性能的网络设备600的框图。网络设备600包括耦合到一个或多个入口端口604的处理器602。一些(或所有)入口端口可以包括lqec并且输出链路质量测量和/或链路故障预测。在一个实施例中,处理器600处于系统级;处理器将来自所有端口的lqec测量与其它系统级质量测量一起聚集,以生成系统级以及端口级质量测量。
85.系统级质量测量有时也被称为“系统健康测量”或“系统级健康测量”。在一个实施例中,处理器计算网络系统(例如,网络设备)或网络系统的一部分的系统级健康测量。处理器可以根据这样计算的系统级健康测量来管理业务分配。
86.在一些实施例中,当传输速率降低时,链路质量可以改善。根据图6所示的示例实施例,网络设备602被配置为通过向对等网络设备发信号通知拥塞状态来控制数据输入速率,对等网络设备作为响应降低传输速率。当入口端口向处理器602指示链路质量差(或被预测为减小)时,处理器可以控制入口端口减小带宽(这又将导致向对等网络设备发送拥塞通知,以及通信带宽的相应减小)。如果链路质量良好,则处理器可以控制相应的入口端口以增加数据速率(在实施例中,对等网络设备在没有拥塞通知的情况下可以增加传输速率)。因此,在实施例中,网络设备可以使用链路质量指示符和预测来优化通信带宽。
87.图6所示和上述的网络设备600的配置作为示例被引用。在可选实施例中可以使用其它合适的配置。例如,在一些实施例中,处理器设置入口端口的带宽(而不是控制带宽的增加和减少)。
88.图7a是根据本文描述的实施例的流程图700,其示意性地示出了用于生成基于ml的链路质量估计和预测模型的方法。该流程图由计算机(在实施例中可以是多处理器计算系统)执行。
89.该流程图开始于构建模拟模型操作702,其中计算机构建环境以模拟目标数据路径,包括高速有线发射器(tx)、链路和高速有线接收器(rx)(以上参考图2描述了示例模拟模型)。
90.接下来,在运行模拟操作704,计算机在模拟模型上运行具有各种条件的多个模
拟,包括:i)随机输入模式;ii)发射器中的信号畸变(例如,相位噪声、增益噪声、非线性畸变);iii)改变链路条件(例如,增益和相位响应);iv)串扰噪声;v)所述接收器的pvt变化;和vi)随机附加噪声。计算机监测ber,snr和接收器参数。
91.在训练ml模型操作706处,计算机使用例如自动回归机制来训练ml模型,应用所监测的模拟值,并且尝试找到将使预测误差最小化的一组权重和激活函数(以上参考图3描述了训练过程)。
92.接下来,在生成推断模型708处,计算机生成要在接收器中实现的推断模型,包括所有权重和激活函数。在一些实施例中,推理模型在嵌入在每个接收器内的低功率推理处理器上运行;在其它实施例中,系统级cpu聚集来自多个接收器实例化的量测并且运行推理模型。在实施例中,可以在更新权重操作710处“现场”改进推断模型,其中计算机用新获取的数据运行进一步的模拟(例如,如果用新类型替换一些或所有网络电缆)。
93.因此,根据图7a所示并在上文中描述的示例方法,为了避免数据丢失(并且在一个实施例中,为了增加总通信容量),可以使用由具有变化条件的完整通信路径模拟导出的一组参数来构建和训练ml链路质量估计器/预测器。
94.在图7a中示出并在上文中描述的流程图700的配置被引用作为示例。在备选实施例中可以使用其它配置。例如,在一些实施例中,可以调整模拟以优选预测误差高的条件;例如,如果在高接收器温度下预测误差较高,则可以在高接收器温度下运行更多的模拟。
95.图7b是根据本文描述的实施例示意性示出用于估计和预测链路质量的方法的流程图720。该流程图是由lqec 120(图1)执行的连续循环。在监测rx参数操作722,lqec监测各种接收器参数(上面参考图1描述了监测的接收器参数的示例列表)。
96.接着,在存储历史操作723中,lqec存储rx参数的历史。在各种实施例中,可以针对各种参数单独地预设所存储的历史的深度。在一个实施例中,链路质量估计和预测需要参数的历史以及参数。
97.然后,在运行ml推理模型操作724中,lqec在监测的接收器参数上(以及在实施例中,在参数的历史上)运行ml推理模型,应用预置权重和激活函数。然后,在发送链路质量估计操作726,lqec发送链路质量估计(例如,到处理器);并且,在发送链路质量预测操作728,发送预测的链路质量。在操作728之后,lqec循环回到操作722。
98.在图7b中示出并且在上文中描述的流程图720的配置是为了概念上清楚而引用的示例。在备选实施例中可以使用其它配置。例如,在实施例中,同时执行所有操作或一些操作;在一个实施例中,链路质量预测包括各种时延的预测,包括没有时延的预测(并且在这种情况下,可以跳过操作726)。
99.在其它实施例中,lqec仅输出链路质量预测而不输出当前链路质量(处理器可通过观察ber来估计链路质量)。
100.图7c是根据本文描述的实施例的流程图740,其示意性地示出了用于利用链路质量估计和链路质量预测来改善网络设备的性能的方法。该流程图由处理器(例如,图6的处理器602)执行。
101.该流程图开始于接收链路质量和链路质量预测操作742,其中处理器接收属于一个或多个入口端口的链路质量和链路质量预测。接下来,在发起输入重新路由操作744处,处理器可以响应于链路质量估计和预测并根据预设的重新路由标准,发起将入口数据路由
到不同的(未使用的)入口端口(参考图5a,5b,上面描述了重新路由机制)。
102.然后,处理器进入降低带宽操作746,其中处理器可以响应于低链路质量估计或低链路质量预测,并且根据预设的带宽降低标准来降低入口端口的带宽。在实施例中,处理器可以使用一种或多种技术来减小带宽,包括例如将一些业务转向其它链路,改变编码方案(例如从pam4到nrz)等。
103.最后,在增加带宽操作748,处理器可以响应于高链路质量估计或高链路质量预测并根据预设的带宽增加标准(上面参考图6描述了带宽减少和带宽增加)来增加入口端口的带宽。
104.在图7c中示出并且在上文中描述的流程图740的配置被引用作为示例。在可选实施例中可以使用其它合适的配置。例如,在一些配置中,仅在减小带宽未能显著改变链路故障预测时才进行重新路由。
105.接收器100的配置,包括:leqc120;模拟环境200,训练环境300,分布式系统500和网络装置600的配置;流程图700、720和740的方法是仅为了概念清楚起见而示出的示例配置和方法。在替代实施例中可以使用任何其他合适的配置和方法。
106.在各种实施例中,上文描述的各种ml训练,ml推断和网络设备元件任务可以由硬件、软件或硬件和软件的组合来执行。
107.在各种实施例中,lqec120可以使用适当的硬件来实现,诸如一个或多个专用集成电路(asic)或现场可编程门阵列(fpga),或asic和fpga的组合。
108.处理器508和602,计算机210和计算机310中的任一个或全部通常包括一个或多个通用处理器,它们以软件编程以执行本文描述的功能。例如,可以通过网络以电子形式将软件下载到处理器,或者可选地或附加地,可以将软件提供和/或存储在诸如磁、光或电子存储器的非瞬态有形介质上。
109.尽管这里描述的实施例主要针对高速有线接收器中的链路质量估计和预测,但是这里描述的方法和系统也可以用于利用适配均衡接收器来恢复所发送的消息的其它有线通信应用中,例如汽车应用,利用pcie/cxl链路层的计算应用;并且,比照适用于无线应用。
110.因此,应当注意,上述实施例是以示例的方式引用的,并且本发明不限于上文具体示出和描述的内容。相反,本发明的范围包括上文描述的各种特征的组合和子组合,以及本领域技术人员在阅读前述描述时将想到的并且未在现有技术中公开的其变化和修改。通过引用并入本专利申请的文献被认为是本技术的整体部分,除了在这些并入的文献中以与本说明书中明确或隐含的定义冲突的方式定义任何术语的程度上,仅应考虑本说明书中的定义。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1