一种抽样调查的方法及系统的制作方法

文档序号:6534810阅读:208来源:国知局
一种抽样调查的方法及系统的制作方法
【专利摘要】本发明实施例公开了一种抽样调查的方法,该方法包括:选择抽样样本范围,得到抽样样本业务类型以及各业务类的样本数目;根据业务类型以及样本数目,设置抽样调查成本和样本分配方法,估算出抽样样本总量以及各业务类的抽样样本量;选择业务类型,得到该业务的抽样样本量,并设置抽样方法,得到该业务的样本抽取量;根据样本分配方法及抽样方法,确定总体推算算法,并根据算法、该业务的抽样样本量及样本抽取量,计算出该业务的抽样样本量的总体估计均值和估计方差。本发明实施例还公开了一种抽样调查的系统。本发明实施例,解决了现有技术中专业人员素质要求高、抽样方式复杂且低效率手动操作以及不适合用于周期性抽样调查业务的问题。
【专利说明】一种抽样调查的方法及系统
【技术领域】
[0001]本发明涉及电力系统测量【技术领域】,尤其涉及一种抽样调查的方法及系统。
【背景技术】
[0002]抽样调查已广泛应用于社会经济、科技、自然等领域,是研究人员获取统计数据的重要手段之一。研究人员通常使用通用的统计软件的抽样模块来进行抽样调查分析。传统的操作方式是先将业务数据导入到统计软件,再通过通用统计软件的抽样模块进行抽样,最后将调查结果数据导入到统计软件进行统计推断。
[0003]这种方式有以下几个缺点:(I)该方式对具体操作人员的统计知识及软件编程知识要求较高,任何一个环节的一个代码失误都将引起推断偏误;(2)该方式无法实时获得复杂抽样涉及的许多辅助变量,而这些变量常常需要实时查询业务数据库才能获取;(3)该方式处理数据记录在百万级别以上的业务数据时效率较低,需要手动操作并且浪费大量的时间用于数据传输;(4)该方式为低效率手动操作方法,不适合用于周期性抽样调查业务。

【发明内容】

[0004]本发明实施例的目的在于提供一种抽样调查的方法及系统,可以解决现有技术中专业人员素质要求高、抽样方式复杂且低效率手动操作以及不适合用于周期性抽样调查业务的问题。
[0005]为了解决上述技术问题,本发明实施例提供了一种抽样调查的方法,所述方法包括:
[0006]选择所需的抽样样本范围,得到抽样样本的多个业务类型以及每一业务类型对应的样本数目;
[0007]根据所述得到的多个业务类型以及每一业务类型对应的样本数目,设置抽样调查成本和样本分配方法,估算出抽样样本总量以及各业务类型的抽样样本量;
[0008]选择所述抽样样本的业务类型,得到所选业务类型的抽样样本量,并设置抽样方法对所述得到的所选业务类型的抽样样本量进行样本的抽取,得到所选业务类型的样本抽
取量;
[0009]根据所述设置的样本分配方法及抽样方法,确定总体推算算法,并根据所述确定的总体推算算法、所述得到的所选业务类型的抽样样本量及所选业务类型的样本抽取量,计算出所选业务类型的抽样样本量的总体估计均值和估计方差。
[0010]其中,所述抽样样本范围包括抽样样本的时间、抽样样本的业务类型以及抽样调查部门。
[0011]其中,所述抽样调查成本包括抽样调查人数、抽样调查总天数以及每一抽样调查天数各抽样调查部门中各业务类型的抽样调查时间。
[0012]其中,所述估算出抽样样本总量以及各业务类型的抽样样本量是基于抽样成本估算或基于考虑成本的Neyman分层估算而获得的。
[0013]其中,所述样本分配方法包括比例分配方法、不考虑成本的Neyman分层分配方法、考虑成本的Neyman分层分配方法以及多阶段分配方法。
[0014]其中,所述抽样方法包括随机抽样方法以及PPS抽样方法。
[0015]本发明实施例还提供了一种抽样调查的系统,所述系统包括:
[0016]一业务数据库接口模块,用于构建含有抽样样本范围的业务数据库,并提供可选的抽样样本,得到所述抽样样本的多个业务类型以及每一业务类型对应的样本数目;
[0017]一抽样样本量估算模块,用于根据所述得到的多个业务类型以及每一业务类型对应的样本数目,设置抽样调查成本和样本分配方法,估算出抽样样本总量以及各业务类型的抽样样本量;
[0018]一抽样方案设定模块,用于选择所述抽样样本的业务类型,得到所选业务类型的抽样样本量,并设置抽样方法对所述得到的所选业务类型的抽样样本量进行样本的抽取,得到所选业务类型的样本抽取量;
[0019]一总体推断模块,用于根据所述设置的样本分配方法及抽样方法,确定总体推算算法,并根据所述确定的总体推算算法、所述得到的所选业务类型的抽样样本量及所选业务类型的样本抽取量,计算出所选业务类型的抽样样本量的总体估计均值和估计方差。
[0020]其中,所述抽样调查成本包括抽样调查人数、抽样调查总天数以及每一抽样调查天数各抽样调查部门中各业务类型的抽样调查时间。
[0021]其中,所述估算出抽样样本总量以及各业务类型的抽样样本量是基于抽样成本估算或基于考虑成本的Neyman分层估算而获得的。
[0022]其中,所述样本分配方法包括比例分配方法、不考虑成本的Neyman分层分配方法、考虑成本的Neyman分层分配方法以及多阶段分配方法。
[0023]实施本发明实施例,具有如下有益效果:
[0024]1、与用户业务系统及业务数据库无缝链接,并根据用户业务需要设定复杂抽样算法实现统计抽样推断的自动化,解决了通用统计软件抽样模块无法解决的问题;
[0025]2、在抽样样本选择方面,用户可以结合实际业务选择需要调查的抽样样本的时间、抽样样本的业务类型及调查部门;在抽样分配方法及抽样方法,囊括了目前主流的比例分配方法、不考虑成本的Neyman (尼曼)分层分配方法、考虑成本的Neyman分层分配方法以及多阶段分配方法等分配方法,还包括随机抽样方法、PPS (Probability Proportionateto Size Sampling,按规模大小成比例)抽样方法等抽样方法,并可以根据业务特性选择适合的抽样分配方法及抽样方法;在总体推断方面,根据抽样方法实现自动化,降低手动操作比例,提升效率;
[0026]3、在软件构架设计方面,基于B/S的构架大大提升的操作人员的工作的便捷性,无论是抽样阶段还是调查阶段的数据录入都可以随时随地进行,在现场调查时还可以使用手持终端进行数据录入与查询。
【专利附图】

【附图说明】
[0027]为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,根据这些附图获得其他的附图仍属于本发明的范畴。
[0028]图1为本发明实施例提供的抽样调查的方法的流程图;
[0029]图2为本发明实施例提供的抽样样本范围的结构示意图;
[0030]图3为本发明实施例提供的样本分配方法与抽样方法组合的结构示意图;
[0031]图4本发明实施例提供的抽样调查的系统的结构示意图。
【具体实施方式】
[0032]为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0033]如图1所示,本发明实施例中,提出一种抽样调查的方法,所述方法包括:
[0034]步骤S101、选择所需的抽样样本范围,得到抽样样本的多个业务类型以及每一业务类型对应的样本数目;
[0035]如图2所示,抽样样本范围包括抽样样本的时间、抽样样本的业务类型以及抽样调查部门,业务人员可在抽样样本范围中选择所需的抽样样本(如图2中“V”所选),得到多个抽样样本,该抽样样本包括多个业务类型,每个业务类型对应有不同的样本数目。例如:选择Al所、A3所2013年12月营业稽查,得到2个抽样样本,Al、A3所中有2个业务类型(1、j),其中,第i种业务中Al所对应有30万个样本数目,A3所对应有50万个样本数目,第j种业务中Al所对应有100万个样本数目,A3所对应有40万个样本数目。
[0036]步骤S102、根据所述得到的多个业务类型以及每一业务类型对应的样本数目,设置抽样调查成本和样本分配方法,估算出抽样样本总量以及各业务类型的抽样样本量;
[0037]抽样调查成本包括抽样调查人数、抽样调查总天数以及每一抽样调查天数各抽样调查部门中各业务类型的抽样调查时间;
[0038]例如:在Al所、A3所2013年12月营业稽查中,设置的抽样调查成本为抽样调查人数2人,抽样调查总天数20天,第一天Al所第i种业务调查时间5分钟、第j种业务调查时间30分钟,A3所第i种业务调查时间15分钟、第j种业务调查时间20分钟,第二天Al所第i种业务调查时间5分钟、第j种业务调查时间10分钟,A3所第i种业务调查时间25分钟、第j种业务调查时间20分钟等等,依次类推进行抽样调查成本的设置。
[0039]样本分配方法包括比例分配方法、不考虑成本的Neyman分层分配方法、考虑成本的Neyman分层分配方法以及多阶段分配方法。
[0040]综上,业务人员根据得到的抽样样本的多个业务类型以及每一业务类型对应的样本数目,按需或固定设置抽样调查成本和样本分配方法,估算出抽样样本总量以及各业务类型的抽样样本量。
[0041]本发明实施例中提供两种估算出抽样样本总量以及各业务类型的抽样样本量的方法:一、基于抽样成本估算方法;二、基于考虑成本的Neyman分层估算方法。
[0042]在第一种基于抽样成本估算方法中,统计某个类型业务(第i种业务)的样本数目总量(例如,每个月投入2个工作人员进行调查,调查天数为20天,每天各抽样调查部门中不同抽样调查时间内的样本数目:第一天Al所时间5分钟得到的样本数目5000个,A3所时间15分钟得到的样本数目12000个,第二天Al所时间5分钟得到的样本数目3000个,A3所时间25分钟得到的样本数目18000个等等,直到设置的20天内Al所与A3所样本数目的总和),记为Ti ;平均抽样调查时间(例如,Al所与A3所这20天内调查总时间的平均值),
记为t,抽样样本量Iii为
【权利要求】
1.一种抽样调查的方法,其特征在于,所述方法包括: 选择所需的抽样样本范围,得到抽样样本的多个业务类型以及每一业务类型对应的样本数目; 根据所述得到的多个业务类型以及每一业务类型对应的样本数目,设置抽样调查成本和样本分配方法,估算出抽样样本总量以及各业务类型的抽样样本量; 选择所述抽样样本的业务类型,得到所选业务类型的抽样样本量,并设置抽样方法对所述得到的所选业务类型的抽样样本量进行样本的抽取,得到所选业务类型的样本抽取量; 根据所述设置的样本分配方法及抽样方法,确定总体推算算法,并根据所述确定的总体推算算法、所述得到的所选业务类型的抽样样本量及所选业务类型的样本抽取量,计算出所选业务类型的抽样样本量的总体估计均值和估计方差。
2.如权利要求1所述的方法,其特征在于,所述抽样样本范围包括抽样样本的时间、抽样样本的业务类型以及抽样调查部门。
3.如权利要求1所述的方法,其特征在于,所述抽样调查成本包括抽样调查人数、抽样调查总天数以及每一抽样调查天数各抽样调查部门中各业务类型的抽样调查时间。
4.如权利要求1所述的方法,其特征在于,所述抽样样本总量以及各业务类型的抽样样本量是基于抽样成本估算或基于考虑成本的Neyman分层估算而获得的。
5.如权利要求1所述的方法,其特征在于,所述样本分配方法包括比例分配方法、不考虑成本的Neyman分层分配方法、考虑成本的Neyman分层分配方法以及多阶段分配方法。
6.如权利要求1所述的方法,其特征在于,所述抽样方法包括随机抽样方法以及PPS抽样方法。
7.—种抽样调查的系统,其特征在于,所述系统包括: 一业务数据库接口模块,用于构建含有抽样样本范围的业务数据库,并提供可选的抽样样本,得到所述抽样样本的多个业务类型以及每一业务类型对应的样本数目; 一抽样样本量估算模块,用于根据所述得到的多个业务类型以及每一业务类型对应的样本数目,设置抽样调查成本和样本分配方法,估算出抽样样本总量以及各业务类型的抽样样本量; 一抽样方案设定模块,用于选择所述抽样样本的业务类型,得到所选业务类型的抽样样本量,并设置抽样方法对所述得到的所选业务类型的抽样样本量进行样本的抽取,得到所选业务类型的样本抽取量; 一总体推断模块,用于根据所述设置的样本分配方法及抽样方法,确定总体推算算法,并根据所述确定的总体推算算法、所述得到的所选业务类型的抽样样本量及所选业务类型的样本抽取量,计算出所选业务类型的抽样样本量的总体估计均值和估计方差。
8.如权利要求7所述的系统,其特征在于,所述抽样调查成本包括抽样调查人数、抽样调查总天数以及每一抽样调查天数各抽样调查部门中各业务类型的抽样调查时间。
9.如权利要求7所述的系统,其特征在于,所述抽样样本总量以及各业务类型的抽样样本量是基于抽样成本估算或基于考虑成本的Neyman分层估算而获得的。
10.如权利要求7所述的系统,其特征在于,所述样本分配方法包括比例分配方法、不考虑成本的Neyman分层分配方法、考虑成本的Neyman分层分配方法以及多阶段分配方法。
【文档编号】G06Q50/00GK103729796SQ201410003122
【公开日】2014年4月16日 申请日期:2014年1月3日 优先权日:2014年1月3日
【发明者】钟聪, 罗陆宁, 李炳要, 罗智超, 金毅, 戴斌, 曹礼华, 张志闻, 叶国雄, 刘启彬, 张斌, 林尧铭 申请人:深圳供电局有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1