本发明涉及数据清洗,具体涉及一种公司行动数据的清洗方法、装置、计算机设备和计算机可读存储介质。
背景技术:
1、公司行动指的是上市公司进行一些会影响公司或股东的行动,例如派息、拆股、配股、更改股票名称、更改股票代码、选股选息和要约收购等。公司行动会导致客户持仓资金等资金变动,同时也会影响客户交易,因此准确的公司行动对公司运营、用户体验有直接且巨大的影响。
2、目前,随着公司在各个市场的展业,接入的上手券商越来越多,公司行动接入的数据源也越来越多。发明人研究发现,现有技术在接入数据源后会直接使用数据源中的公司行动数据,由于有些数据源中的公司行动数据不太准确,因此直接使用不准确的公司行动数据会产生一系列问题,如,提高结算处理成本、影响客户交易、加大客户咨询或者投诉数量等等。
3、因此,如何提高公司行动数据的准确性成为目前亟需解决的技术问题。
技术实现思路
1、本发明的目的在于提供了一种公司行动数据的清洗方法、装置、计算机设备和计算机可读存储介质,能够提高公司行动数据的准确性。
2、本发明的一个方面提供了一种公司行动数据的清洗方法,所述方法包括:
3、连接多个公司行动数据源;
4、将各个公司行动数据源中的公司行动数据同步至预设的公司行动数据库;
5、根据所述公司行动数据源以及所述公司行动数据中用于表征数据分类的参数对同步至所述公司行动数据库内的公司行动数据进行清洗,以获得有效的公司行动数据。
6、进一步地,所述根据所述公司行动数据源以及所述公司行动数据中用于表征数据分类的参数对同步至所述公司行动数据库内的公司行动数据进行清洗,以获得有效的公司行动数据,包括:
7、提取所述公司行动数据库中每条公司行动数据中的公司代码、公司行动类型以及公司行动执行日期;
8、根据所述公司代码、所述公司行动类型以及所述公司行动执行日期对所述5公司行动数据库内的公司行动数据进行分组;
9、分别根据每个分组内的公司行动数据所属的公司行动数据源对应的对每个分组内的公司行动数据进行清洗,以获得有效的公司行动数据。
10、进一步地,所述根据所述公司代码、所述公司行动类型以及所述公司行动执行日期对所述公司行动数据库内的公司行动数据进行分组,包括:0当所述公司行动类型属于特定类型时,将所述公司行动数据库内公司代码一致、公司行动类型一致以及公司行动执行日期位于预设日期范围内的公司行动数据划分为同一分组;
11、当所述公司行动类型属于非特定类型时,将所述公司行动数据库内公司代码一致、公司行动类型一致以及公司行动执行日期一致的公司行动数据划分为5同一分组。
12、进一步地,所述分别根据每个分组内的公司行动数据所属的公司行动数据源对应的对每个分组内的公司行动数据进行清洗,以获得有效的公司行动数据,包括:
13、判断所述分组内每条公司行动数据所属的公司行动数据源是否均相同;0若是,判定该分组内的每条公司行动数据均为无效公司行动数据,并继续判断下一分组内每条公司行动数据所属的公司行动数据源是否均相同;
14、若否,判断所述分组内是否存在相同的公司行动数据;
15、若所述分组内的每条公司行动数据均相同或均不同,从所述分组内筛选出所属公司行动数据源的优先级最高的公司行动数据,作为有效的公司行动数据;5若所述分组内的部分公司行动数据相同,从所述分组内提取出数量最多的公司行动数据,并从提取出的公司行动数据中筛选出所属公司行动数据源的优先级最高的公司行动数据,作为有效的公司行动数据。
16、进一步地,所述判断所述分组内每条公司行动数据所属的公司行动数据源是否均相同,包括:
17、0当所述分组内每条公司行动数据中的公司行动类型均为特定类型时,判断所述分组内是否存在所属公司行动数据源相同、且所包含的参数中除公司行动执行日期以外其他参数均相同的公司行动数据;
18、若存在,将所述分组内所属公司行动数据源相同、且所包含的参数中除公司行动执行日期以外其他参数均相同的公司行动数据合并为一条,并判断合并后的分组内每条公司行动数据所属的公司行动数据源是否均相同。
19、进一步地,所述方法还包括:
20、接收目标公司行动数据管理指令,从所述公司行动数据库内有效的公司行动数据中筛选出目标公司行动数据;
21、判断所述目标公司行动数据的属性;
22、当所述目标公司行动数据的属性为强制行动属性时,调取所述强制行动属性所关联的第一界面并通过所述第一界面展示所述目标公司行动数据;
23、当所述目标公司行动数据的属性为可选行动属性时,调取所述可选行动属性所关联的第二界面并通过所述第二界面展示所述目标公司行动数据。
24、本发明的另一个方面提供了一种公司行动数据的清洗装置,所述装置包括:
25、连接模块,用于连接多个公司行动数据源;
26、同步模块,用于将各个公司行动数据源中的公司行动数据同步至预设的公司行动数据库;
27、清洗模块,用于根据所述公司行动数据源以及所述公司行动数据中用于表征数据分类的参数对同步至所述公司行动数据库内的公司行动数据进行清洗,以获得有效的公司行动数据。
28、进一步地,所述清洗模块具体用于:
29、提取所述公司行动数据库中每条公司行动数据中的公司代码、公司行动类型以及公司行动执行日期;
30、根据所述公司代码、所述公司行动类型以及所述公司行动执行日期对所述公司行动数据库内的公司行动数据进行分组;
31、分别根据每个分组内的公司行动数据所属的公司行动数据源对应的对每个分组内的公司行动数据进行清洗,以获得有效的公司行动数据。
32、本发明的再一个方面提供了一种计算机设备,所述计算机设备包括:存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任一实施例所述的公司行动数据的清洗方法。
33、本发明的又一个方面提供了一种计算机可读存储介质,其上存储有计算机程序,上述计算机程序被处理器执行时实现上述任一实施例所述的公司行动数据的清洗方法。
34、本发明提供的公司行动数据的清洗方法,在接入公司行动数据源且将公司行动数据源中的公司行动数据同步至公司行动数据库之后,并未直接使用同步后的公司行动数据,而是基于公司行动数据源以及公司行动数据中用于表征数据分类的参数对这些公司行动数据进行清洗,从而使公司行动数据库中的公司行动数据为有效数据。当需要使用这些公司行动数据时,由于这些公司行动数据为准确的数据,因此可避免现有技术中因使用不准确的公司行动数据而导致的一系列问题。
1.一种公司行动数据的清洗方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述根据所述公司行动数据源以及所述公司行动数据中用于表征数据分类的参数对同步至所述公司行动数据库内的公司行动数据进行清洗,以获得有效的公司行动数据,包括:
3.根据权利要求2所述的方法,其特征在于,所述根据所述公司代码、所述公司行动类型以及所述公司行动执行日期对所述公司行动数据库内的公司行动数据进行分组,包括:
4.根据权利要求2所述的方法,其特征在于,所述分别根据每个分组内的公司行动数据所属的公司行动数据源对应的对每个分组内的公司行动数据进行清洗,以获得有效的公司行动数据,包括:
5.根据权利要求4所述的方法,其特征在于,所述判断所述分组内每条公司行动数据所属的公司行动数据源是否均相同,包括:
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
7.一种公司行动数据的清洗装置,其特征在于,所述装置包括:
8.根据权利要求7所述的装置,其特征在于,所述清洗模块具体用于:
9.一种计算机设备,所述计算机设备包括:存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器在执行所述计算机程序时实现权利要求1~6任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1~6任一项所述的方法。