本发明涉及数据处理,特别是涉及基于正态分布的高考报考专业冲稳保区间的预测方法。
背景技术:
1、近年来,针对高考志愿填报的发展,许多公司开发相关产品。然而,目前一些产品仍然依赖简单的统计学原理,如线差法:将考生的分数减去今年考生所属批次、科类分数线与近几年考生所属批次、科类分数线的差值,找出分数满足的分布函数,预测录取概率。位次法:将考生的分数对应到最新年一分一段表所在排名,将近年专业的录取最低分对应到对应年份一分一段表所在排名,找出排名满足的分布函数,预测录取概率。
2、但在上述方法在预测录取概率时忽视了诸多重要因素,导致这些产品的录取概率精准度并不理想,并且没有划分录取难易度区间,或难易度区间划分不够科学,这对考生在志愿填报过程中可能产生一定的误导。
3、为了提升高考志愿填报的合理性,使考生分数更加保值,也就是减少考生分数与专业录取最低分的差值,应当结合先进的数据分析和建模方法,综合考虑多个维度的数据。通过更细致的数据分析和建模,可以准确预测考生在不同专业的录取概率,并划分到科学、合理的录取难易度区间。
技术实现思路
1、本发明的目的是提供基于正态分布的高考报考专业冲稳保区间的预测方法,对录取概率预测精准,冲稳保难易度区间划分科学合理。
2、为实现上述目的,本发明提供了基于正态分布的高考报考专业冲稳保区间的预测方法,
3、s1、数据统计:获取的数据包括历史招生中的批次名称、科类名称、学校名称、专业名称、专业需求、专业计划人数、去年录取分数、前年录取分数,高考分数线中的年份、省份、批次名称、科类名称、批次线、批次线上人数,一分一段表中的年份、科类、累计人数、分数;
4、s2、数据处理:选择s1中的数据建立数据库,并进行排名转换和排名比转换;
5、s3、均值转换:比较当年批次线上人数是否大于去年批次线上人数,若是,则去年分数选择为去年排名转换分、前年分数选择为前年排名转换分;
6、若否,则去年分数选择为去年排名比转换分,前年分数选择为前年排名比转换分;
7、根据选择后的去年分数和前年分数计算变换后的均值;
8、s4、计算专业概率p(a≤x≤b):
9、
10、
11、μ=h-6
12、其中,μ代表正态分布的期望,σ代表正态分布的标准差,b是积分区间的上限,a是积分区间的下限,h为s3中变换后的均值,x在积分区间内,x为x的取值;
13、s5、计算最终录取概率:根据s4中的步骤计算分数在所选专业的专业概率,根据专业概率和专业计划人数确定最优发生概率,专业概率与最优发生概率相乘即可得到录取概率;
14、s6、确定冲稳保区间:通过对历史年份录取概率模拟及真实录取结果进行对比分析,确定冲区间、稳区间和保区间。
15、优选的,s2中,数据库包括s1中的批次名称、科类名称、今年批次线上人数、去年批次线上人数、前年批次线上人数及由s1中的数据得到的可报考分数区间。
16、优选的,s2中,根据数据库提取各专业可报考的分数区间,根据高考分数线和一分一段表对历史年份专业录取分数进行排名转换和排名比转换,
17、排名转换为:将历史年份的专业录取分数在历史年份的一分一段表中的排名,对应到最新年份一分一段表中所在排名的分数;
18、排名比转换为:
19、
20、其中,r为历史年份的专业录取分数在当年的排名,k为历史年份的专业录取分数在历史年份的排名,m为当年所在批次科类的线上人数,n为历史年份所在批次科类的线上人数。
21、优选的,s3中,判断选择后的去年分数和前年分数是否均不为0,若是,再判断选择后的前年分数减选择后的去年分数是否小于等于5,若是,则均值为去年分数,若否,判断选择后的前年分数减选择后的去年分数是否大于5且小于等于45,若是,则均值为选择后的去年分数和选择后的前年分数的平均值,若否,则均值为选择后的前年分数;
22、判断选择后的去年分数和前年分数是否均不为0,若否,当选择后的去年分数不为0,选择后的前年分数为0时,均值为选择后的去年分数;当选择后的去年分数为0,选择后的前年分数不为0时,均值为选择后的前年分数。
23、优选的,s6中,录取概率大于等于85%时为保区间,录取概率大于等于71%,且小于85%为稳区间,录取概率大于等于55%,且小于71%为冲区间。
24、因此,本发明采用上述步骤的基于正态分布的高考报考专业冲稳保区间的预测方法,其有益效果为:
25、1、本发明提供的方法对录取概率预测精准,冲稳保难易度区间划分科学合理;
26、2、本发明提供的方法在满足考生地区偏好、专业喜好等个性化报考需求的基础上,使得分数更加保值;
27、3、本发明所提供的方法充分考虑到高考录取分数线、大小年、排名变化、专业计划人数对专业录取分数线的影响,对正态分布的概率密度函数进行积分得到专业概率,可计算出相同专业,可报考分数区间中不同分数的录取概率,并将录取概率划分到冲稳保录取难易度区间。
28、下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
1.基于正态分布的高考报考专业冲稳保区间的预测方法,其特征在于:
2.根据权利要求1所述的基于正态分布的高考报考专业冲稳保区间的预测方法,其特征在于:s2中,数据库包括s1中的批次名称、科类名称、今年批次线上人数、去年批次线上人数、前年批次线上人数及由s1中的数据得到的可报考分数区间。
3.根据权利要求1所述的基于正态分布的高考报考专业冲稳保区间的预测方法,其特征在于:s2中,根据数据库提取各专业可报考的分数区间,根据高考分数线和一分一段表对历史年份专业录取分数进行排名转换和排名比转换,
4.根据权利要求1所述的基于正态分布的高考报考专业冲稳保区间的预测方法,其特征在于:s3中,判断选择后的去年分数和前年分数是否均不为0,若是,再判断选择后的前年分数减选择后的去年分数是否小于等于5,若是,则均值为去年分数,若否,判断选择后的前年分数减选择后的去年分数是否大于5且小于等于45,若是,则均值为选择后的去年分数和选择后的前年分数的平均值,若否,则均值为选择后的前年分数;
5.根据权利要求1所述的基于正态分布的高考报考专业冲稳保区间的预测方法,其特征在于:s6中,录取概率大于等于85%时为保区间,录取概率大于等于71%,且小于85%为稳区间,录取概率大于等于55%,且小于71%为冲区间。