本申请涉及计算机,尤其涉及数据处理方法、系统、服务器及介质。
背景技术:
1、在股票中,往往通过主题指数全面了解某一类型公司整体指数情况。然而,主题指数的构建过程比较繁琐,需要充分了解该公司的产品构成。尤其一些大型公司,所涉及的产品内容和类型都很复杂。想要准确确定该公司的主题类型,需要很多专业人员对该公司产品构成进行充分解读后确定。此外,由于公司多元化产品发展需求,各项产品占比会根据市场行情进行动态调整,那么调整后该公司对应的主题也会发生相应变化,则需要专业人员对主题做相应调整。
技术实现思路
1、为解决或改善现有技术中存在的问题,本申请各实施例提供了数据处理方法、系统、服务器及介质。
2、第一方面,在本申请的一个实施例中,提供了一种数据处理方法。该方法包括:
3、获取用于为同一类上市公司构建股票主题指数的主题信息、用于描述所述主题信息的主题关键词以及待构建所述主题指数的目标上市公司相关的目标文档;其中,所述主题关键词是预先从已创建所述主题指数的参考上市公司相关的参考文档中抽取出的;
4、将所述目标文档和所述主题关键词输入预训练的打分模型,得到所述主题信息对应的主题分值;
5、根据各所述主题信息对应的主题分值,确定用于构建所述目标上市公司对应的主题指数的主题信息。
6、第二方面,本申请的一个实施例中,提供了一种数据处理系统,该系统包括:
7、服务端,用于执行第一方面所述的方法;
8、客户端,用于获取至少一个目标上市公司分别对应的目标文档,并将所述目标上市公司对应的目标文档发送给所述服务端。
9、第三方面,在本申请的一个实施例中,提供了一种云服务器,包括存储器及处理器;其中,
10、所述存储器,用于存储程序;
11、所述处理器,与所述存储器耦合,用于执行所述存储器中存储的所述程序,以用于实现第一方面所述的数据处理方法。
12、第四方面,在本申请的一个实施例中,提供了一种非暂时性机器可读存储介质,所述非暂时性机器可读存储介质上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器执行如第一方面所述的数据处理方法。
13、本申请实施例提供的技术方案,当有目标上市公司需要确定或者更新主题指数的时候,需要获取该目标上市公司相关的目标文档,以及主题信息和用于描述主题信息的主题关键词。进而,将目标文档和主题关键词输入到训练得到的打分模型当中,根据目标文档中所记载的文本内容,以及主题关键词对目标上市公司对应的主题信息进行打分,得到目标上市公司分别对应的至少一个主题信息的主题分值。进而,基于主题分值构建主题指数。其中,在构建主题指数的时候,根据主题分值的大小将至少一目标上市公司聚合得到主题指数。从而可以通过主题指数了解到同类目标上市公司的相关信息。通过上述方案,在构建主题指数的时候,利用预先得到的主题关键词,以及与目标上市公司相关的目标文档来对目标上市公司对应的主题信息进行打分,从而,根据主题分值大小确定目标上市公司所对应的至少一个主题信息,并根据分值大小构建目标上市公司对应的主题指数。可以利用打分模型根据目标上市公司提供的多个目标文档实现快速、准确的确定目标上市公司对应的至少一个主题信息。能够有效提高主题指数构建的工作效率,降低人工成本。
1.一种数据处理方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,获取用于为同一类上市公司构建股票主题指数的主题信息、用于描述所述主题信息的主题关键词以及待构建主题指数的目标上市公司相关的目标文档之前,还包括:
3.根据权利要求1或2所述的方法,其特征在于,所述目标文档包括:目标上市公司的财报文档、公告文档和研报文档中至少一个。
4.根据权利要求1所述的方法,其特征在于,获取用于为同一类上市公司构建股票主题指数的主题信息、用于描述所述主题信息的主题关键词以及待构建主题指数的目标上市公司相关的目标文档之前,还包括:
5.根据权利要求4所述的方法,其特征在于,所述根据目标文档的文档类型,确定对所述目标文档的预处理方式,包括:
6.根据权利要求5所述的方法,其特征在于,根据所述主题关键词与所述主题信息的对应关系,确定所述目标上市公司的至少一个主题信息分别对应的主题分值,包括:
7.根据权利要求1所述的方法,其特征在于,根据各所述主题信息对应的主题分值,确定用于构建所述目标上市公司对应的主题指数的主题信息之后,还包括:
8.一种数据处理系统,其特征在于,所述系统包括:
9.一种云服务器,包括存储器及处理器;其中,
10.一种非暂时性机器可读存储介质,所述非暂时性机器可读存储介质上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器执行如执行权利要求1至7中任一项所述的方法。