一种对电视节目评估调研样本数据的处理方法

文档序号:6431932阅读:220来源:国知局
专利名称:一种对电视节目评估调研样本数据的处理方法
技术领域
本发明涉及一种数据的处理方法,尤其是涉及一种对电视节目评估调研样本数据的处理方法。
背景技术
在对电视节目评估的调研中,合理精确地对整体样本群进行样本筛选及管理是完成科学调研的基础和前提,也是实现调研数据有效的根本保障。电视节目评估调研样本筛选及管理技术是一种可以实现多条件、多定义样本筛选;手动标签增设与软件自动筛选相结合;样本多级管理的技术应用,实现便捷、快速、高效的样本抽取工作。近年来,随着各类调研工作对分层样本精确管理需求的发展,样本筛选及管理技术的应用领域不断扩大,广泛应用于媒介调研、商业调研及各专业科研调研当中。·从电视节目评估样本抽取效果来看,样本筛选及管理技术经历了人工抽取、计算机辅助筛选抽取等发展阶段。人工抽取样本通过对样本人工排序和编号,形成样本抽样框,再按照一定规律及比例抽取样本,该方式耗时长、费人力,当对符合分层要求的样本进行筛选时核算样本在各分层中所占比例存在一定困难,对样本变动、调整及替补时难以进行适时跟踪,容易造成误差及疏漏;计算机辅助抽取,通常采用EXCEL电子表格软件设定公式及筛选条件对样本进行筛选及管理,辅助完成抽样工作,一般都提供固定个数的条件筛选,而且当条件取值发生变化或条件发生变化时都需要重新进行数据筛选的程序设计,若要从2000个有20个以上属性的样本数据,筛选出各种属性以及属性值相交的样本,并且还要考虑属性的变化,这样的筛选条件是无法穷尽的;虽然该技术相对于人工抽取样本更为简易、快捷,但无法实现对分层样本各元素的多重定义抽取,无法对样本进行跟踪、筛选、推送,从而达到有效管理。

发明内容
本发明的目的就是为了克服上述现有技术存在的不足而提供一种能够实现任意多条件的样本任意组合的筛选功能,具有较好的完全性、易扩展性和可移植性的对电视节目评估调研样本数据的处理方法。本发明的目的可以通过以下技术方案来实现一种对电视节目评估调研样本数据的处理方法,该方法包括以下步骤(I)DSL生成器轮询设置在控制端的界面控件状态,生成条件序列,并将其发送给解析器;(2)解析器将第一个谓词表达式设为“真” ;(3)解析器判断当前DSL条件是否为“空”,如果为是,则执行步骤(4);如果为否,则执行步骤(8) ;(4)解析器判断当前条件序列的连接符是否为“与”;如果为是,执行步骤(5);否则执行步骤
(6);(5)解析器将当前条件序列转换为谓词表达式,和前一个谓词表达式“与”连接,生成表达式树,然后转到步骤(7) ;(6)解析器将当前条件序列转换为谓词表达式,和前一个谓词表达式“或”连接,生成谓词表达式树,然后转到步骤(7) ;(7)重复步骤(I) (6),如果界面控件状态没有变化,解析器将最后生成的谓词表达式树发送给执行器;(8)执行器将谓词表达式树应用到限制运算的条件子句;(9)执行器输出源数据的相应子集,并通过呈现端显示出来。所述的步骤(I)中的生成条件序列的每个条件都是一个四分量的元组t = (C,P,V,O),C是连接符,支持AND、0R ;P是属性,取自被筛选对象的筛选指标,V是值域,支持单值和多值,视运算符决定;O是运算符,支持 = ,<>,>,> = ,<,< = , in, not in。当使用in和not in时,值域V可以包含多个值,并以谓词OR连接,其他情况都只能使用单值。与现有技术相比,本发明对电视节目评估调研样本数据采用计算机程序设定抽取技术进行处理,可根据不同分层元素设定样本取值,实现多条件多定义样本筛选,具有较好的完全性、易扩展性和可移植性,为样本选取工作提供了很大的自由度。对于样本调研,其查询需求无法穷尽,故采用DSL定义用户的查询需求,所谓DSL即本领域专用语言(DomainSpecific Language/DSL),是采用结构化数据描述无歧义需求方法的通称,可让用户定义任意需求。本发明通过计算机程序设定抽取技术进行处理,可根据不同分层元素设定样本取 值,实现多条件多定义样本筛选、手动标签增设与计算机程序自动筛选相结合、样本多级管理等功能,依据科学人口数据进行分层比例数据计算,并根据调研需要设定样本规模,设置不同组别抽样数额,统计抽取人数及差额样本值。计算机程序抽取样本技术直观、科学地实现了对样本的抽取及管理工作,为确定、调整、替换样本创造了精确手段,具有更加广泛的适用性,可对于每个特定的项目,按照样本属性进行符合调查需求的抽样处理。


图I为本发明的处理方法流程图;图2为本发明处理方法中表达式树I的示意图;图3为本发明处理方法中表达式树II的示意图;图4为本发明的系统结构示意图。
具体实施例方式下面结合附图和具体实施例对本发明进行详细说明。实施例本实施例先做如下设定设有任意数量和属性的样本集合——例如有2000条样本数据,每条数据均有编号、名称、学历、收入、联系方式等任意多个属性。调查人员希望找到其中居住在卢湾/徐汇两区且受过硕士教育的样本。类似这样的查询条件无法一一穷尽,因此采用DSL方法。原始数据的前7条如下
权利要求
1.一种对电视节目评估调研样本数据的处理方法,该方法包括以下步骤 (1)DSL生成器轮询设置在控制端的界面控件状态,生成条件序列,并将其发送给解析器; (2)解析器将第一个谓词表达式设为“真”; (3)解析器判断当前DSL条件是否为“空”,如果为是,则执行步骤(4);如果为否,则执行步骤⑶; (4)解析器判断当前条件序列的连接符是否为“与”;如果为是,执行步骤(5);否则执行步骤⑶; (5)解析器将当前条件序列转换为谓词表达式,和前一个谓词表达式“与”连接,生成表达式树,然后转到步骤(7); (6)解析器将当前条件序列转换为谓词表达式,和前一个谓词表达式“或”连接,生成谓词表达式树,然后转到步骤(7); (7)重复步骤(I) ¢),如果界面控件状态没有变化,解析器将最后生成的谓词表达式树发送给执行器; (8)执行器将谓词表达式树应用到限制运算的条件子句; (9)执行器输出源数据的相应子集,并通过呈现端显示出来。
2.根据权利要求I所述的一种对电视节目评估调研样本数据的处理方法,其特征在于,所述的步骤(I)中的生成条件序列的每个条件都是一个四分量的元组t= (C,P,V,0),C是连接符,支持AND、OR ;P是属性,取自被筛选对象的筛选指标,V是值域,支持单值和多值,视运算符决定;O是运算符,支持 = ,<>,>,> = ,<,< = , in, not in。当使用in和not in时,值域V可以包含多个值,并以谓词OR连接,其他情况都只能使用单值。
全文摘要
本发明涉及一种对电视节目评估调研样本数据的处理方法,该方法采用DSL领域语言描述样本筛选的条件,然后通过解析器将条件序列转换为复合谓词表达式树,接着将表达式树和原数据加载到执行器中进行限制运算,最后输出相应的关系数据子集。与现有技术相比,本发明能够实现根据任意多个条件筛选样本的功能,以及具有较好的完全性、易扩展性和可移植性等优点。
文档编号G06F17/30GK102955823SQ20111025340
公开日2013年3月6日 申请日期2011年8月30日 优先权日2011年8月30日
发明者方方, 雷雯, 黄昊天, 季隽, 叶海松, 沙扬 申请人:方方
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1