1.一种基于gpu合并访存的模板计算二维线程块选择方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的一种基于gpu合并访存的模板计算二维线程块选择方法,其特征在于,所述s1进一步包括以下内容:假设一个模板计算在二维平面内的半径为rx和ry,则模板计算过程中一个bx×by二维线程块所需的数据形状为(bx+2rx)×(by+2ry),其中,bx×by的部分称为内部,周围的部分表示模板半径内的数据。
3.根据权利要求1所述的一种基于gpu合并访存的模板计算二维线程块选择方法,其特征在于,s2中所述基于合并访存技术的二维线程块的数据读取次数为整数,且每个二维线程块的数据读取次数均相同;计算二维线程块的数据读取次数时,在数据外侧增加冗余,所述冗余和模板计算半径内的数据一起称为halo区域,将扩充过的数据区域大小记为(bx+2hx)×(by+2hy),具体计算公式为:
4.根据权利要求1所述的一种基于gpu合并访存的模板计算二维线程块选择方法,其特征在于,s2中所述浮点精度包括有单精度或双精度;所述计算环境相关信息包括有:
5.根据权利要求1所述的一种基于gpu合并访存的模板计算二维线程块选择方法,其特征在于,s2中所述线程块的筛选条件,具体为:
6.根据权利要求1所述的一种基于gpu合并访存的模板计算二维线程块选择方法,其特征在于,s4中所述开销指标具体包括以下内容: