一种基于GPU合并访存的模板计算二维线程块选择方法

文档序号:35196854发布日期:2023-08-21 19:38阅读:来源:国知局

技术特征:

1.一种基于gpu合并访存的模板计算二维线程块选择方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的一种基于gpu合并访存的模板计算二维线程块选择方法,其特征在于,所述s1进一步包括以下内容:假设一个模板计算在二维平面内的半径为rx和ry,则模板计算过程中一个bx×by二维线程块所需的数据形状为(bx+2rx)×(by+2ry),其中,bx×by的部分称为内部,周围的部分表示模板半径内的数据。

3.根据权利要求1所述的一种基于gpu合并访存的模板计算二维线程块选择方法,其特征在于,s2中所述基于合并访存技术的二维线程块的数据读取次数为整数,且每个二维线程块的数据读取次数均相同;计算二维线程块的数据读取次数时,在数据外侧增加冗余,所述冗余和模板计算半径内的数据一起称为halo区域,将扩充过的数据区域大小记为(bx+2hx)×(by+2hy),具体计算公式为:

4.根据权利要求1所述的一种基于gpu合并访存的模板计算二维线程块选择方法,其特征在于,s2中所述浮点精度包括有单精度或双精度;所述计算环境相关信息包括有:

5.根据权利要求1所述的一种基于gpu合并访存的模板计算二维线程块选择方法,其特征在于,s2中所述线程块的筛选条件,具体为:

6.根据权利要求1所述的一种基于gpu合并访存的模板计算二维线程块选择方法,其特征在于,s4中所述开销指标具体包括以下内容:


技术总结
本发明公开了一种基于GPU合并访存的模板计算二维线程块选择方法,属于高性能计算与算法技术领域;本发明包括如下步骤:S1、给定一个模板计算在二维平面内的半径,确定模板计算过程中一个二维线程块所需的数据形状;S2、基于合并访存技术,计算二维线程块的数据读取次数;给定浮点数精度,获取计算环境的相关信息,确定线程块的筛选条件;S3、依据S2中所述的筛选条件筛选出一个或多个合并访存技术需要的线程块,称为候选线程块;S4、给定开销指标并对其进行排序,依据开销指标从候选线程块中选出理论上最好的线程块,用于实际的GPU计算。本发明综合考虑了合并访存、bank冲突、负载平衡等影响因素,能够选择出计算性能较高的线程块。

技术研发人员:胡长军,汪岸,李嘉莉,李建江
受保护的技术使用者:北京科技大学
技术研发日:
技术公布日:2024/1/14
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1