一种词云图的生成方法、装置、设备及存储介质与流程

文档序号:34703200发布日期:2023-07-07 06:52阅读:33来源:国知局
一种词云图的生成方法、装置、设备及存储介质与流程

本申请涉及数据处理领域,具体涉及一种词云图的生成方法、装置、设备及存储介质。


背景技术:

1、词云图是一种工具类图表,用于对文本中出现频率较高的“关键词”进行视觉化的展现。词云图作为一种新兴的图表工具,能够对文本中的“关键词”进行视觉上的突出,起到较好的传播效果。

2、在生成词云图的过程中,需要检测每个单词是否与其他单词发生碰撞,也就是出现重叠。目前的检测方法复杂度较高,计算量较大,难以满足检测的需要。


技术实现思路

1、有鉴于此,本申请提供一种词云图的生成方法、装置、设备及存储介质,能够减少词云图的生成过程的复杂程度,降低计算量。

2、为解决上述问题,本申请提供的技术方案如下:

3、第一方面,本申请实施例提供一种词云图的生成方法,所述方法包括:

4、获取至少两个待排放文本;

5、在画布区域内生成文本排放线,所述文本排放线用于确定放置所述待排放文本的位置;

6、按照所述文本排放线,确定所述待排放文本的位置,得到词云图,所述相邻的待排放文本所占的栅格相互不重叠,所述栅格是将所述画布区域划分得到的,每个栅格包括多个像素。

7、第二方面,本申请实施例提供一种词云图的生成装置,所述装置包括:

8、获取单元,用于获取至少两个待排放文本;

9、生成单元,用于在画布区域内生成文本排放线,所述文本排放线用于确定放置所述待排放文本的位置;

10、确定单元,用于按照所述文本排放线,确定所述待排放文本的位置,得到词云图,所述相邻的待排放文本所占的栅格相互不重叠,所述栅格是将所述画布区域划分得到的,每个栅格包括多个像素。

11、第三方面,本申请实施例提供一种电子设备,包括:

12、一个或多个处理器;

13、存储装置,其上存储有一个或多个程序,

14、当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面所述的词云图的生成方法。

15、第四方面,本申请实施例提供一种计算机可读介质,其上存储有计算机程序,其中,所述程序被处理器执行时实现如第一方面所述的词云图的生成方法。

16、由此可见,本申请具有如下有益效果:

17、本申请提供的一种词云图的生成方法、装置、设备及存储介质,通过获取多个待排放文本,并在画布区域生成文本排放线;基于文本排放线依次确定待排放文本的位置,得到词云图。相邻的待排放文本所占的栅格相互不重叠。基于画布区域划分得到的栅格,能够检测待排放文本是否出现碰撞。栅格的粒度较大,每个栅格包括多个像素。基于栅格检测待排放文本是否碰撞的复杂度较低,能够简化生成词云图的计算量。



技术特征:

1.一种词云图的生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述文本排放线包括至少两个放置点,所述按照所述文本排放线,确定所述待排放文本的位置,得到词云图,包括:

3.根据权利要求1所述的方法,其特征在于,所述待排放文本具有对应的权重。

4.根据权利要求3所述的方法,其特征在于,所述按照所述文本排放线,确定所述待排放文本的位置,得到词云图,包括:

5.根据权利要求3所述的方法,其特征在于,所述待排放文本的字号是基于所述待排放文本的权重确定的。

6.根据权利要求1或2所述的方法,其特征在于,所述待排放文本所占的栅格为所述待排放文本的包围矩阵所占的栅格,所述包围矩阵是基于所述待排放文本的宽度和高度确定的。

7.根据权利要求6所述的方法,其特征在于,所述待排放文本的宽度是测量确定的,所述待排放文本的长度是根据所述待排放文本的字体和字号确定的。

8.根据权利要求1或2所述的方法,其特征在于,所述栅格是将所述画布区域划分为大小相同的矩形得到的。

9.根据权利要求1所述的方法,其特征在于,所述栅格的大小是基于所述待排放文本的排放的疏密程度确定的。

10.根据权利要求1所述的方法,其特征在于,所述文本排放线基于函数生成,或者基于图像形状生成。

11.一种词云图的生成装置,其特征在于,所述装置包括:

12.一种电子设备,其特征在于,包括:

13.一种计算机可读介质,其特征在于,其上存储有计算机程序,其中,所述程序被处理器执行时实现如权利要求1-10中任一所述的词云图的生成方法。


技术总结
本申请公开了一种词云图的生成方法、装置、设备及存储介质,该词云图的生成方法、装置、设备及存储介质适用于数据处理领域,通过获取多个待排放文本,并在画布区域生成文本排放线;基于文本排放线依次确定待排放文本的位置,得到词云图。相邻的待排放文本所占的栅格相互不重叠。基于画布区域划分得到的栅格,能够检测待排放文本是否出现碰撞。栅格的粒度较大,每个栅格包括多个像素。基于栅格检测待排放文本是否碰撞的复杂度较低,能够简化生成词云图的计算量,能够解决目前的词云图中文本重叠的检测方法复杂度较高并且计算量较大的问题。

技术研发人员:李文胜
受保护的技术使用者:北京有竹居网络技术有限公司
技术研发日:
技术公布日:2024/1/13
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1