基于内容寻址存储器的不规则数据存储访问方法、装置

文档序号:38025209发布日期:2024-05-17 12:59阅读:11来源:国知局
基于内容寻址存储器的不规则数据存储访问方法、装置

本发明涉及存储访问领域,尤其涉及一种基于内容寻址存储器的不规则数据存储访问方法、装置。


背景技术:

1、文献“liang t,xie h,yu k,et al.bevfusion:a simple and robust lidar-camera fusion framework[j].advances in neural information processing systems,2022,35:10421-10434.”公开了一种基于鸟瞰图变换的图像、点云融合神经网络算法。该算法显式地通过相机、雷达之间的坐标变换矩阵将正视角下的图像点云特征变换到鸟瞰图视角下进行融合。传统的基于正视图融合存在“近大远小”等物体畸变问题,而基于鸟瞰图的融合能更好地描述物体的3d形状和物体与物体之间的相对位置信息。因此该方法在waymo等自动驾驶数据集上取得了更加明显的精度优势。然而,该算法中的模态变换、稀疏卷积等算子中存在频繁的不规则存储访问,为该算法在实际场景中的应用带来了较大的存储访问功耗和延时,需要设计专用的高能效存储访问架构。

2、针对上述提到的不规则存储访问,文献“sun w,feng x,tang c,et al.a 28nm2d/3d unified sparse convolution accelerator with block-wise neighborsearcher for large-scaled voxel-based point cloud network[c]//2023ieeeinternational solid-state circuits conference(isscc).ieee,2023:328-330.”提出了一种面向3d点云稀疏数据不规则访问的高能效加速架构。该文献提出一种基于编码器-解码器架构的存储管理方案。该工作首先生成一个全局0-1比特图指示非零点位置,编码器部分通过一个多路选择器将全局比特图转换成当前计算点的局部比特图。接着解码器会通过一个优先编码器解析出每个1对应的非零数据点在存储器中的地址,从而保证该架构能够在一个周期内生成出一个有效的非零数据点地址,进而保证了整个架构的存储访问效率。然而,该框架直接使用非零数据点坐标作为数据在存储中的索引地址,这导致存储中需要存储大量的零数据,从而带来了存储空间的严重浪费。


技术实现思路

1、本发明提供了一种基于内容寻址存储器的不规则数据存储访问方法、装置,解决了现有技术中不规则存储访问存在空间严重浪费、功耗高、耗时多等问题。

2、一种基于内容寻址存储器的不规则数据存储访问方法,包括:

3、将数据点的编码值存放到内容寻址存储器cam中,将所述数据点坐标和数据点特征分别存放到两个静态随机存取存储器sram中;

4、对于每一个待计算的数据点,根据所述数据点的坐标查询cam并返回比特图;

5、根据所述比特图确定检索所述数据点坐标和所述数据点特征的索引;

6、根据检索出的坐标或特征通过相应的计算阵列执行相关运算,将运算结果存储到sram中;

7、继续查询下一个待计算的数据点,直至所有待计算的点都计算完成。

8、在本发明的一种实施例中,所述将数据点的编码值存放到内容寻址存储器cam中,将所述数据点坐标和数据点特征分别存储到两个静态随机存取存储器sram中,具体包括:获取输入的点云中的每个点云点或者图像中的每个像素点作为数据点;将输入的每个数据点按照其坐标进行编码,将编码后的结果存放在内容寻址存储器cam中,将每个数据点的坐标以及每个数据点的特征分别存储在两个静态随机存取存储器sram中;其中,所述cam和每个sram中的数据逐行对应。

9、在本发明的一种实施例中,所述对于每一个待计算的数据点,根据所述数据点的坐标查询cam并返回比特图,具体包括:对于每一个待计算的数据点,获取每个待计算的数据点坐标的编码结果,将所述坐标的编码结果作为检索值输入到所述cam中进行比较;若所述cam中某一行存储的编码值与所述检索值相同则返回1,否则返回0;根据比较的返回结果得到一个长度为n的0-1比特图;其中,n为cam的行数。

10、在本发明的一种实施例中,所述根据所述比特图确定检索所述数据点坐标和所述数据点特征的索引,具体包括:将所述比特图输入到一个优先编码器,每个编码周期内输出一个1在所述比特图中的位置;将所述位置作为检索所述数据点坐标和所述数据点特征的索引。

11、在本发明的一种实施例中,所述根据检索出的坐标或特征通过相应的计算真阵列执行相关运算,将运算结果存储到sram中,具体包括:若执行的算子为稀疏卷积算子,则获取计算所需的权重;根据所述权重通过计算阵列执行矩阵向量乘运算,将运算结果存储到sram中;若执行的算子为模态变换算子,则直接通过计算阵列执行累加运算,将运算结果存储到sram中。

12、在本发明的一种实施例中,所述获取计算所需的权重,具体包括:根据检索出的数据点的第一坐标和待计算的数据点的坐标之间的差值作为索引,根据所述索引检索计算所需的权重。

13、一种应用于上述基于内容寻址存储器的不规则数据存储访问方法的存储访问系统,包括:

14、存储访问单元,包括内容寻址存储器cam和静态随机存取存储器sram,所述cam用于存储每个数据点按照其坐标进行编码的编码值;所述sram用于存放每个数据点坐标和数据点特征;

15、优先编码器,用于对所述cam中的数据进行编码,返回待计算的数据点的存储地址;

16、计算阵列,用于根据所述存储访问单元中的数据执行相应运算。

17、一种基于内容寻址存储器的不规则数据存储访问装置,包括:

18、数据存储模块,用于将数据点的编码值存放到内容寻址存储器cam中,将所述数据点坐标和数据点特征分别存放到两个静态随机存取存储器sram中;

19、数据查询模块,用于对于每一个待计算的数据点,根据所述数据点的坐标查询cam并返回比特图;

20、索引获取模块,用于根据所述比特图确定检索所述数据点坐标和所述数据点特征的索引;

21、运算模块,用于根据检索出的坐标或特征通过相应的计算阵列执行相关运算,将运算结果存储到sram中;

22、循环跳转模块,用于继续查询下一个待计算的数据点,直至所有待计算的点都计算完成。

23、一种基于内容寻址存储器的不规则数据存储访问设备,包括:

24、至少一个处理器;以及,

25、与所述至少一个处理器通过总线通信连接的存储器;其中,

26、所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被执行,以实现如上述各实施例任一项所述的方法。

27、一种非易失性存储介质,存储有计算机可执行指令,所述计算机可执行指令由处理器执行,以实现如上述各实施例任一项所述的方法。

28、本发明提供了一种基于内容寻址存储器的不规则数据存储访问方法、装置,至少包括以下有益效果:通过本发明提供的基于内容寻址存储器cam存放数据点坐标的编码值,基于静态随机存取存储器sram存放数据点的坐标和特征等数据,基于存储器中存放的数据对应关系以及根据数据的检索方法形成的比特图进行有效数据的查询,保证了只在存储器中存放非零的数据点,从而避免存放零数据点导致的存储空间浪费的情况,实现了数据的高能效查询,缩短了数据的访问时间。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1