1.一种服务配置方法,包括:
解析用于人工智能服务的人工智能模型,以获取所述人工智能模型的模型参数信息;
基于所述人工智能模型的模型参数信息,计算所述人工智能服务的推荐计算资源配置;以及
基于所述推荐计算资源配置,确定所述人工智能服务的服务配置。
2.如权利要求1所述的服务配置方法,其中,模型参数信息包括以下至少一项:模型类型信息、模型结构信息、以及结构参数信息。
3.如权利要求1所述的服务配置方法,其中,所述基于人工智能模型的模型参数信息计算人工智能服务的推荐计算资源配置还包括:
基于所述人工智能模型的模型参数信息,计算执行所述人工智能模型所需的计算量和内存访问量,
基于所述计算量和内存访问量计算所述人工智能服务所需的处理配置参数作为所述推荐计算资源配置。
4.如权利要求1所述的服务配置方法,还包括:
获取计算资源配置调整信息;
基于所述计算资源配置调整信息,调整所述推荐计算资源配置;
基于调整后的推荐计算资源配置,确定所述人工智能服务的服务配置。
5.如权利要求4所述的服务配置方法,其中,所述计算资源配置调整信息包括所述人工智能服务的运行情况。
6.如权利要求2所述的服务配置方法,其中,
所述模型结构信息包括以下各项中的一项或多项:所述人工智能模型的隐藏层层数、输入层的神经元数量、输出层的神经元数量、一个或多个隐藏层中的神经元数量、多个神经元之间的连接关系、卷积层的通道数;以及
所述结构参数信息包括以下各项中的一项或多项:多个神经元之间的连接关系与权重、神经元的偏置值、激活函数、卷积层的通道数、卷积核大小。
7.如权利要求6所述的服务配置方法,其中,
在所述人工智能模型是包含全连接层的神经网络模型的情况下,其中,所述全连接层所需的计算量为所述全连接层的输入参数的数量与输出参数的数量的乘积。
8.一种用于服务配置的客户端,包括:
处理器,
存储器,存储有计算机指令,所述计算机指令被处理器执行时实现如下操作:
产生人工智能模型获取框,所述人工智能模型获取框用于输入用于人工智能服务的人工智能模型的存储地址或用于上传所述人工智能模型;
产生推荐资源配置框,所述推荐资源配置框用于显示所述人工智能服务的推荐计算资源配置;
产生部署按钮,所述部署按钮在被激活后触发用于基于所述推荐计算资源配置确定所述人工智能服务的服务配置的操作;
其中,所述推荐计算资源配置是基于所述人工智能模型的模型参数信息而计算的。
9.如权利要求8所述的用于服务配置的客户端,其中,所述计算机指令被处理器执行时还实现如下操作:
产生自定义配置框,所述自定义配置框用于获取计算资源配置调整信息,所述计算资源配置调整信息用于调整所述推荐计算资源配置;
其中,所述部署按钮在被激活后,触发基于所述调整后的推荐计算资源配置确定所述人工智能服务的服务配置的操作。
10.如权利要求8所述的用于服务配置的客户端,其中,所述计算机指令被处理器执行时还实现如下操作:
产生运行调整按钮,所述运行调整按钮用于接收调整所述人工智能服务的服务配置的操作,其中所述人工智能服务的服务配置是根据所述人工智能服务的运行情况的调整的。
11.一种服务配置设备,包括:
解析模块,被配置为解析用于人工智能服务的人工智能模型,以获取所述人工智能模型的模型参数信息;
计算模块,被配置为基于所述人工智能模型的模型参数信息,计算所述人工智能服务的推荐计算资源配置;以及
部署模块,被配置为基于所述推荐计算资源配置,确定所述人工智能服务的服务配置。
12.如权利要求11所述的服务配置设备,其中,模型参数信息包括以下至少一项:模型类型信息、模型结构信息、以及结构参数信息。
13.如权利要求11所述的服务配置设备,其中,所述计算模块还被配置为:
基于所述人工智能模型的模型参数信息,计算执行所述人工智能模型所需的计算量和内存访问量,
基于所述计算量和内存访问量计算所述人工智能服务所需的处理配置参数作为所述推荐计算资源配置。
14.一种用于服务配置的电子设备,包括:
微处理器;
存储器,存储器存储有计算机指令,所述计算机指令被微处理器执行时实现如权利要求1-7中任一项所述的方法。
15.一种计算机可读存储介质,其上存储有计算机指令,所述计算机指令被处理器执行时实现如权利要求1-7中的任一项所述的方法。