本申请属于计算机,具体涉及一种算力分配方法和电子设备
背景技术:
1、为了向用户提供匹配的服务,服务器常需要依赖计算资源进行一系列的计算。例如,为了向用户提供个性化的推荐服务,服务器需要运行推荐模型进行相关计算。
2、受服务器有限算力的制约,在业务流量上涨的情况下,服务器可能无法满足所有流量的业务需求。因此,需要对服务器的算力进行合理的分配。
3、目前,遇到流量上涨情况时,服务器要么采用限流加默认降级服务兜底的方式进行算力分配,要么针对每一业务流量降低服务召回量。这两种方式虽然可以保证实际处理的业务流量不超过算力范围,但会降低重要用户的服务效果。
4、申请内容
5、本申请实施例的目的是提供一种算力分配方法和电子设备,以提升服务器对重要用户的服务效果。
6、为了解决上述技术问题,本申请是这样实现的:
7、第一方面,本申请实施例提供了一种算力分配方法,由服务器执行,该方法包括:
8、接收第一用户的业务请求;
9、基于所述第一用户的重要性和所述服务器的状态信息,确定针对所述第一用户的算力分配策略;
10、基于所述第一用户的算力分配策略处理所述业务请求。
11、第二方面,本申请实施例提供了一种算力分配装置,由服务器执行,所述装置包括:
12、请求接收模块,用于接收第一用户的业务请求;
13、策略确定模块,用于基于所述第一用户的重要性和所述服务器的状态信息,确定针对所述第一用户的算力分配策略;
14、请求处理模块,用于基于所述第一用户的算力分配策略处理所述业务请求。
15、第三方面,本申请实施例提供了一种电子设备,该电子设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面所述的方法的步骤。
16、第四方面,本申请实施例提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面所述的方法的步骤。
17、第五方面,本申请实施例提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现如第一方面所述的方法。
18、在本申请实施例中,在接收到第一用户的业务请求后,不但根据服务器自身的状态信息,还根据第一用户的重要性确定针对所述第一用户的算力分配策略,因此,可以使得确定出的算力分配策略与第一用户的重要性相匹配,从而能够更好地保证服务器对重要用户的服务效果。
技术实现思路
1.一种算力分配方法,其特征在于,由服务器执行,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述算力分配策略包括全局算力分配策略和局部算力分配策略,所述基于所述第一用户的重要性和所述服务器的状态信息,确定针对所述第一用户的算力分配策略,包括:
3.根据权利要求2所述的方法,其特征在于,所述基于所述第一用户的算力分配策略处理所述业务请求,包括:
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
5.根据权利要求4所述的方法,其特征在于,还包括:
6.一种算力分配装置,其特征在于,由服务器执行,所述装置包括:
7.根据权利要求6所述的装置,其特征在于,所述算力分配策略包括全局算力分配策略和局部算力分配策略,所述策略确定模块包括:
8.根据权利要求7所述的装置,其特征在于,请求处理模块包括:
9.根据权利要求8所述的装置,其特征在于,还包括:
10.根据权利要求9所述的装置,其特征在于,还包括:
11.一种电子设备,其特征在于,包括处理器,存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如权利要求1-5任一项所述的算力分配方法的步骤。
12.一种可读存储介质,其特征在于,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如权利要求1-5任一项所述的算力分配方法的步骤。