1.本发明属于数据处理技术领域,尤其涉及一种安全性高的旅游景区综合数据处理方法。
背景技术:2.随着人们生活水平的提高,人们对于生活的享受度也逐步提升,现如今人们的生活娱乐方式有许多中,其中旅游是许多人群选择的享受生活的方式,旅游可丰富人们的生活,提高人们的见识,为了跟进旅游产业的发展,许多地方都开发了旅游景区,旅游景区可有效带动周边县市的经济发展,也可大力促进当地的经济发展水平。
3.旅游景区在开放后,会产生各种各样的数据,这些数据往往代表了旅游景气的整体的发展水平,为了更好的对于景区的发展方向进行把控,亟待需要一种安全性高的旅游景区综合数据处理方法。
技术实现要素:4.本发明的目的在于:为了解决上述的问题,而提出的一种安全性高的旅游景区综合数据处理方法。
5.为了实现上述目的,本发明采用了如下技术方案:一种安全性高的旅游景区综合数据处理方法,包括如下步骤:
6.s1、选择一个时间段,对于旅游景区综合数据进行获取,获取的数据种类包括旅游景区人数数据、旅游景区内的消费数据与ota消费数据;
7.s2、将数据导入数据库内;
8.s3、对于数据进行清洗,具体步骤为:
9.h1、对于数据进行全面审查;
10.h2、补全或去除有缺失的数据信息;
11.h3、去除或修改格式与内容有错误的数据信息;
12.h4、去除或修改逻辑有错误的信息;
13.h5、去除一些杂乱无序、无关的数据;
14.h6、进行数据的关联性验证;
15.s4、对于数据进行预处理,先提取数据的特征,抽象出数据的模型;
16.s5、对于数据进行分解,分解为若干组数据的特征集合,根据数据的特征,对数据进行分类,对不同类型的数据采用不同的编码速率进行压缩编码;
17.s6、对于数据进行分类提炼,提炼出有价值的数据信息;
18.s7、利用机器学习算法对数据进行再处理;
19.s8、对于处理后数据进行分析;
20.s9、生成旅游景区评估意见;
21.s10、利用加密算法将生成的数据进行加密,发送至景区接收终端。
22.作为上述技术方案的进一步描述:
23.所述s1中,对于旅游景区综合数据进行获取时,选择时间段为旅游黄金假期时间段。
24.作为上述技术方案的进一步描述:
25.所述s2中,将数据导入sql数据库内,有数据需要写入sql数据库时,判断数据是否已经存在指定的sql数据库中,存在则不写入,不存在则根据数据的类型情况,把数据写入相应的地方。
26.作为上述技术方案的进一步描述:
27.所述s6中,利用数据挖掘算法,对于数据进行分类提炼,提炼出有价值的数据信息。
28.作为上述技术方案的进一步描述:
29.所述s7中,利用机器学习算法对数据进行再处理,机器学习算法为分类、回归与聚类算法中的一种或多种。
30.作为上述技术方案的进一步描述:
31.所述s9中,生成旅游景区评估意见,旅游景区评估意见可用于景区决策支持、景区商业智能与景区景点智能推荐系统。
32.作为上述技术方案的进一步描述:
33.所述s10中,利用加密算法将生成的数据进行加密,发送至景区接收终端,加密算法为md5算法与rsa算法中的一种或多种。
34.综上所述,由于采用了上述技术方案,本发明的有益效果是:
35.1、本发明中,通过在方法内设置有对于数据的预处理过程,提取数据的特征,抽象出数据的模型后进行数据分解,可有效使特征比较计算相似度变得方便,通过在方法内设置有数据的分类提炼过程,可对于数据内的有用信息进行提取,避免了对于后续数据再处理过程产生的干扰,保证数据处理精准度与有效性,同时在最后生成了旅游景区评估意见,旅游景区评估意见可用于景区决策支持、景区商业智能与景区景点智能推荐系统可使旅游景区变得更加智能化,进一步提高景区客流量,提升景区名气,同时具有生成数据的加密过程,可对于生成数据进行加密传输,避免数据泄露,具有极高的安全性与保密性。
36.2、本发明中,抽象出数据的模型后,分解为若干组数据的特征集合,根据数据的特征,对数据进行分类,对不同类型的数据采用不同的编码速率进行压缩编码,保证数据传输时的质量,有效减少大量数据的存储空间,分类压缩编码还可以加快后续数据处理速率。
附图说明
37.图1为一种安全性高的旅游景区综合数据处理方法的流程图。
具体实施方式
38.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
39.实施例1
40.本发明提供一种技术方案:一种安全性高的旅游景区综合数据处理方法,包括如下步骤:
41.s1、选择一个时间段,对于旅游景区综合数据进行获取,选择时间段为旅游黄金假期时间段,获取的数据种类包括旅游景区人数数据、旅游景区内的消费数据与ota消费数据;
42.s2、将数据导入sql数据库内,有数据需要写入sql数据库时,判断数据是否已经存在指定的sql数据库中,存在则不写入,不存在则根据数据的类型情况,把数据写入相应的地方,提高数据存储效率;
43.s3、对于数据进行清洗,具体步骤为:
44.h1、对于数据进行全面审查;
45.h2、补全或去除有缺失的数据信息;
46.h3、去除或修改格式与内容有错误的数据信息;
47.h4、去除或修改逻辑有错误的信息;
48.h5、去除一些杂乱无序、无关的数据;
49.h6、进行数据的关联性验证;
50.s4、对于数据进行预处理,先提取数据的特征,抽象出数据的模型;
51.s5、对于数据进行分解,,分解为若干组数据的特征集合,根据数据的特征,对数据进行分类,对不同类型的数据采用不同的编码速率进行压缩编码,保证数据传输时的质量,有效减少大量数据的存储空间,分类压缩编码还可以加快后续数据处理速率;
52.s6、利用数据挖掘算法,对于数据进行分类提炼,提炼出有价值的数据信息;
53.s7、利用机器学习算法对数据进行再处理,机器学习算法为分类算法;
54.s8、对于处理后数据进行分析;
55.s9、生成旅游景区评估意见,旅游景区评估意见可用于景区决策支持、景区商业智能与景区景点智能推荐系统;
56.s10、利用加密算法将生成的数据进行加密,发送至景区接收终端,加密算法为md5算法。
57.本实施例中,通过在方法内设置有对于数据的预处理过程,提取数据的特征,抽象出数据的模型后进行数据分解,可有效使使特征比较计算相似度变得方便,之后需要针对特征的压缩编码,有效减少大量数据的存储空间,加快后续数据处理速率。
58.实施例2
59.本发明提供一种技术方案:一种安全性高的旅游景区综合数据处理方法,包括如下步骤:
60.s1、选择一个时间段,对于旅游景区综合数据进行获取,选择时间段为旅游黄金假期时间段,获取的数据种类包括旅游景区人数数据、旅游景区内的消费数据与ota消费数据;
61.s2、将数据导入sql数据库内,有数据需要写入sql数据库时,判断数据是否已经存在指定的sql数据库中,存在则不写入,不存在则根据数据的类型情况,把数据写入相应的地方,提高数据存储效率;
62.s3、对于数据进行清洗,具体步骤为:
63.h1、对于数据进行全面审查;
64.h2、补全或去除有缺失的数据信息;
65.h3、去除或修改格式与内容有错误的数据信息;
66.h4、去除或修改逻辑有错误的信息;
67.h5、去除一些杂乱无序、无关的数据;
68.h6、进行数据的关联性验证;
69.s4、对于数据进行预处理,先提取数据的特征,抽象出数据的模型;
70.s5、对于数据进行分解,分解为若干组数据的特征集合,根据数据的特征,对数据进行分类,对不同类型的数据采用不同的编码速率进行压缩编码,保证数据传输时的质量,有效减少大量数据的存储空间,分类压缩编码还可以加快后续数据处理速率;
71.s6、利用数据挖掘算法,对于数据进行分类提炼,提炼出有价值的数据信息;
72.s7、利用机器学习算法对数据进行再处理,机器学习算法为分类与回归算法;
73.s8、对于处理后数据进行分析;
74.s9、生成旅游景区评估意见,旅游景区评估意见可用于景区决策支持、景区商业智能与景区景点智能推荐系统;
75.s10、利用加密算法将生成的数据进行加密,发送至景区接收终端,加密算法为rsa算法。
76.本实施例中,通过在方法内设置有数据的分类提炼过程,可对于数据内的有用信息进行提取,避免了对于后续数据再处理过程产生的干扰,保证数据处理精准度与有效性。
77.实施例3
78.本发明提供一种技术方案:一种安全性高的旅游景区综合数据处理方法,包括如下步骤:
79.s1、选择一个时间段,对于旅游景区综合数据进行获取,选择时间段为旅游黄金假期时间段,获取的数据种类包括旅游景区人数数据、旅游景区内的消费数据与ota消费数据;
80.s2、将数据导入sql数据库内,有数据需要写入sql数据库时,判断数据是否已经存在指定的sql数据库中,存在则不写入,不存在则根据数据的类型情况,把数据写入相应的地方,提高数据存储效率;
81.s3、对于数据进行清洗,具体步骤为:
82.h1、对于数据进行全面审查;
83.h2、补全或去除有缺失的数据信息;
84.h3、去除或修改格式与内容有错误的数据信息;
85.h4、去除或修改逻辑有错误的信息;
86.h5、去除一些杂乱无序、无关的数据;
87.h6、进行数据的关联性验证;
88.s4、对于数据进行预处理,先提取数据的特征,抽象出数据的模型;
89.s5、对于数据进行分解,分解为若干组数据的特征集合,根据数据的特征,对数据进行分类,对不同类型的数据采用不同的编码速率进行压缩编码,保证数据传输时的质量,
有效减少大量数据的存储空间,分类压缩编码还可以加快后续数据处理速率;
90.s6、利用数据挖掘算法,对于数据进行分类提炼,提炼出有价值的数据信息;
91.s7、利用机器学习算法对数据进行再处理,机器学习算法为分类、回归与聚类算法;
92.s8、对于处理后数据进行分析;
93.s9、生成旅游景区评估意见,旅游景区评估意见可用于景区决策支持、景区商业智能与景区景点智能推荐系统;
94.s10、利用加密算法将生成的数据进行加密,发送至景区接收终端,加密算法为md5算法与rsa算法。
95.本实施例中,在最后生成了旅游景区评估意见,旅游景区评估意见可用于景区决策支持、景区商业智能与景区景点智能推荐系统可使旅游景区变得更加智能化,进一步提高景区客流量,提升景区名气,同时具有生成数据的加密过程,可对于生成数据进行加密传输,避免数据泄露,具有极高的安全性与保密性。
96.实施例1-3中,需要说明的是:
97.首先进行信息填充,md5在处理明文时采用512位分组,每一个分组由16个32位的子分组组成,经过信息加密,输出四个32位的分组,32个分组的组合即为md5值,是一个128位的散列值。由于md5输出值为一个定长值,其字节长度对512求余的结果等于448。因此明文的信息长度被扩展为n*512+448比特。完成信息填充需要在信息后面填充若干个0比特位直到满足以上条件停止。再加入一个64位信息长度的后缀,此时信息字节长度为n*512+448+64=(n+1)*512比特,正好是512比特的整数倍。md5算法进行四轮循环运算,需要设置四个32位的整数参数,定义为链接变量,分别为a=0x01234567;b=0x89abcdef;c=0xfedcba98;d=0x76543210,每轮循环都很相似,对a,b,c,d的其中三个做一次非线性函数变换,所得结果同第四个变量做加法运算。
98.rsa算法的加密过程为:
①
任选两个大素数p和q,其中p和q为强素数;
②
计算乘积n=p*q;
③
任选一数e满足gcd(e,(p-1)(q-1))=1;
④
计算d=e-1mod(p-1)(q-1);
⑤
公钥为(e,n),私钥为d;
⑥
计算密文c=memodn;
⑦
解密计算明文:m=cdmodn。
99.以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。