基于大数据挖掘技术的投资测算方法与流程

文档序号:14870899发布日期:2018-07-06 23:37阅读:218来源:国知局

本发明属于大数据技术领域,具体涉及基于大数据挖掘技术的投资测算方法。



背景技术:

地产行业为我国经济支柱产业,仅住宅地产市场每年交易额超10万亿元。是否能够获取好的项目关系到房地产企业的生死存亡。投资测算用于计算拟获取项目的收入与支出,进而获得项目的预期收益,是企业做出项目获取决策的必备工具。

然而,目前的项目投资测算采用手工测算的方式,耗时较长导致测算效率低、人为进行详细测算易造成测算结果错误、对测算人员要求高。在地产项目开发过程中,海量成本数据及项目经营指标得到积累。然而,这些本可以为专业管理和经营管理贡献突出价值的海量成本数据呈无序、分散、格式不规范的状态,未得到整合和利用。



技术实现要素:

针对现有技术中的缺陷,本发明提供基于大数据挖掘技术的投资测算方法,提高了测算效率,缩短了测算耗时。

本发明提供了一种基于大数据挖掘技术的投资测算方法,包括::

获取企业各业务系统中的业务数据,以得到第一数据源;

通过自行开发的解析程序,对线下业务文档进行解析,以得到第二数据源;

根据预设的数据清洗模型对所述第一数据源和第二数据源的数据进行清洗整理,以得到清洗数据;

整合所述清洗数据,以得到数据仓库;

搭建分析应用平台;

接收用户的操作,在分析应用平台上新建测算任务;

根据预设的测算模型,对所述测算任务进行分析,以得到测算结果。

进一步地,所述清洗数据包括历史项目唯一编码、历史项目所在地行政区划、历史项目成本数据、历史项目规划指标、历史项目产品指标、全国各行政区划的行政事业性费用标准、全国各行政区划的费率标准和税率标准。

进一步地,所述数据仓库包括5个子数据仓库:项目基础数据库、项目历史成本数据库、产品规划指标数据库、报批报建费数据库和费率税率数据库;

所述项目基础数据库存储所述历史项目唯一编码和历史项目所在地行政区划;

所述项目历史成本数据库存储所述历史项目成本数据;

所述产品规划指标数据库存储所述历史项目规划指标及历史项目产品指标;

所述报批报建费数据库存储所述全国各行政区划的行政事业性费用标准;

所述费率税率数据库存储所述全国各行政区划的费率标准和税率标准。

进一步地,所述接收用户的操作,在分析应用平台上新建测算任务具体为:

接收用户的登录指令,供用户注册或登录分析应用平台;

接收用户的新建指令,在所述分析应用平台上新建测算任务;

接收用户输入的特征指标,将特征指标填入测算任务中,所述特征指标包括地块信息、规划指标、销售计划和专项成本;

根据用户输入的特征指标和预设的投资测算逻辑,在所述数据仓库中搜索并调用与所述特征指标相匹配的数据,作为计算参数;保存并提交测算任务。

进一步地,该方法还包括:

接收用户的发起协同操作,新建协同任务;

接收用户输入的至少一个协同人员名单,将协同人员名单填入所述协同任务中;

根据协同任务的协同人员名单依次将测算任务分配给对应的协同人员操作。

进一步地,所述地块信息包括以下数据的一种或多种组合:区域名称、行政区划、项目名称、土地出让金总价、土地转让金总价、无票土地价款合计、规划用地、拆迁补偿费、利润分配比例和土地款支付额;

所述规划指标包括以下数据的一种或多种组合:设计值绿地率、设计值建筑密度、示范区/货量区绿化比例、示范区/货量区园建比例、产品类型、产品业态、涉及户型、计容面积、地上建筑面积、地下建筑面积、可售面积、栋数、层数、户数和装修标准;

所述销售计划包括以下数据的一种或多种组合:推盘批次、当次推售产品类别、当次推售比例、含税售价、货值、开工时间、开盘时间和交楼时间;

所述专项成本包括以下数据的一种或多种组合:土石方工程、桩基础、红线外供水工程、红线外供电工程、人防易地建设费和场地平整。

进一步地,所述在所述数据仓库中搜索并调用与所述特征指标相匹配的数据,作为计算参数具体为:

设置多个搜索区域,并将搜索区域按照区域行政等级从低到高排列;

按照区域行政等级从低到高的顺序,根据所述特征指标在数据仓库依次搜索处在每个搜索区域内的数据;

当数据仓库中每个搜索区域内存在与用户录入的特征指标匹配的数据,得到所述计算参数;

当数据仓库中每个搜索区域内不存在与用户录入的特征指标匹配的数据时,接收用户手动输入的数据,并填入所述测算任务中。

进一步地,该方法在当数据仓库中每个搜索区域内不存在与用户录入的特征指标匹配的数据时,接收用户手动输入的数据,并填入所述测算任务中之后,还包括:

根据所述特征指标在数据仓库搜索处在同片区内的数据;

当数据仓库中同片区内不存在与用户录入的特征指标匹配的数据,根据所述特征指标在数据仓库搜索处在同集团内的数据;

当数据仓库中存在与用户录入的特征指标匹配的数据,得到所述计算参数。

进一步地,所述根据所述特征指标在数据仓库依次搜索处在每个搜索区域内的数据包括:

设定搜索区域内初级搜索区域,在数据仓库中搜索处初级搜索区域内的数据,判断初级搜索区域内是否存在至少两组与用户录入的特征指标匹配的数据;

如果存在,判定匹配成功,计算计算参数的组数;如果组数为奇数,调取数据仓库中数值位于平均值的数据;如果组数为偶数,调取数据仓库中数值最大的数据;

如果不存在,扩大搜索区域范围,以得到次级搜索区域,在数据仓库中搜索处次级搜索区域内的数据,判断次级搜索区域内是否存在与用户录入的特征指标匹配的数据;

如果存在,判定匹配成功计算计算参数的组数;如果组数为1,调取数据仓库中的数据;如果组数为奇数,调取数据仓库中数值位于平均值的数据;如果组数为偶数,调取数据仓库中数值最大的数据。

进一步地,所述测算模型包括如下净利润模型:

净利润=收入-成本;

收入=α1β1+α2β2+…+αnβn;

成本=x1y1+x2y2+…+x13y13;

其中,αi为产品i的单价,单位为元/m2;βi为产品i的可售面积,单位为m2

x1为土地成本单价,x2为行政事业性费用,x3为主体建筑安装工程费,x4为景观环境工程,x5为社区管网工程,x6为公共配套设施,x7为工程建设其他费用,x8为开发间接费用,x9为营销费率,x10为财务费率,x11为管理费率,x12为税率,x13为所得税可售单方;

y1为项目占地面积,y2、y3、y5、y7、y8均为建筑面积,y4为室外占地面积,y6为可售面积,y9、y10、y11均为销售收入,y12为税金,y13为可售面积。

由上述技术方案可知,本发明提供的基于大数据挖掘技术的投资测算方法,利用应用进行分析可使投资测算效率得到极大提高,由应用分析代替人工分析,可使工作耗时缩短至原来的1/30,提高了测算效率,缩短了测算耗时。利用真实历史业务数据,分析结果质量可以得到保证,该投资测算方法是房地产项目重要投资决策工具。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。在所有附图中,类似的元件或部分一般由类似的附图标记标识。附图中,各元件或部分并不一定按照实际的比例绘制。

图1为实施例一中基于大数据挖掘技术的投资测算方法的流程图。

图2为实施例一中项目基础数据库的构建图。

图3为实施例一中项目历史成本数据库的构建图。

图4为实施例一中产品规划指标数据库的构建图。

图5为实施例一中报批报建费数据库的构建图。

图6为实施例一中费率税率数据库的构建图。

图7为实施例二中测算任务的流程图。

图8为实施例三中成本取数优先级别的逻辑流程图。

图9为实施例三中成本取数优先级别中区、集团搜索的逻辑流程图。

图10为实施例五中基于大数据挖掘技术的投资测算系统的框架图。

具体实施方式

下面将结合附图对本发明技术方案的实施例进行详细的描述。以下实施例仅用于更加清楚地说明本发明的技术方案,因此只作为示例,而不能以此来限制本发明的保护范围。需要注意的是,除非另有说明,本申请使用的技术术语或者科学术语应当为本发明所属领域技术人员所理解的通常意义。

应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。

实施例一:

参见图1,本实施例提供了一种基于大数据挖掘技术的投资测算方法,包括:

s1:获取企业各业务系统中的业务数据,以得到第一数据源;通过自行开发的解析程序,对线下业务文档进行解析,以得到第二数据源;

具体地,业务数据包括历史项目的所有数据。线下系统文档可以是历史项目的文档数据,对文档数据的模板进行拆分解析,得到第二数据源。

s2:根据预设的数据清洗模型对所述第一数据源和第二数据源的数据进行清洗整理,以得到有价值可用于分析的清洗数据;

具体地,数据清洗主要用于排除低质量数据,起到数据过滤的功能。所述清洗数据包括历史项目唯一编码、历史项目所在地行政区划、历史项目成本数据、历史项目规划指标、历史项目产品指标、全国各行政区划的行政事业性费用标准、全国各行政区划的费率标准和税率标准。

s3:整合所述清洗数据,以得到数据仓库;

具体地,所述数据仓库包括5个子数据仓库:项目基础数据库(参见图2)、项目历史成本数据库(参见图3)、产品规划指标数据库(参见图4)、报批报建费数据库(参见图5)和费率税率数据库(参见图6);

所述项目基础数据库存储所述历史项目唯一编码和历史项目项目行政区划;项目行政区划颗粒度至区/县/县级市,从企业主数据系统接入。

所述项目历史成本数据库存储所述历史项目成本数据;从本地目标成本文档解析进入数据仓库,包括土地成本、前期工程费、主图建筑安装工程、景观环境工程、社区管网工程、公共配套设备、工程建设其他费用、开发间接费、营销费、财务费、管理费等等。

所述产品规划指标数据库存储所述历史项目规划及历史项目产品指标,可用于识别项目特征,从本地项目信息文档解析进入数据仓库,包括产品业态、涉及户型、面积指标、栋数、层数、户数、装修标准等等。

所述报批报建费数据库存储所述全国各行政区划的行政事业性费用,从本地数据搜集成果解析进入数据仓库,包括基础设施建设配套费、人防易地建设费、城市建设基金、散装水泥专项资金费、新型墙体基金等。

所述费率税率数据库存储所述全国各行政区划的费率标准和税率标准,从本地目标成本文档解析进入数据仓库,包括增值税预征率、城建税及附加税率、企业所得说预增毛利率、堤围费率等。

s4:搭建分析应用平台,研发界面友好应用;接收用户的操作,在分析应用平台上新建测算任务;

s5:根据预设的测算模型,对所述测算任务进行分析,以得到测算结果。

所述测算模型包括如下净利润模型:

净利润=收入-成本;

收入=α1β1+α2β2+…+αnβn;

成本=x1y1+x2y2+…+x13y13;

其中,αi为产品i的单价,单位为元/m2;βi为产品i的可售面积,单位为m2

x1为土地成本单价,x2为行政事业性费用,x3为主体建筑安装工程费,x4为景观环境工程,x5为社区管网工程,x6为公共配套设施,x7为工程建设其他费用,x8为开发间接费用,x9为营销费率,x10为财务费率,x11为管理费率,x12为税率,x13为所得税可售单方;

y1为项目占地面积,y2、y3、y5、y7、y8均为建筑面积,y4为室外占地面积,y6为可售面积,y9、y10、y11均为销售收入,y12为税金,y13为可售面积。

具体地,测算模型为房地产开发公司实际使用的测算算法,包括土地成本、报检费成本、建筑费等等。

投资测算方法,利用应用进行分析可使投资测算效率得到极大提高,由应用分析代替人工分析,可使工作耗时缩短至原来的1/30,提高了测算效率,缩短了测算耗时。利用真实历史业务数据,分析结果质量可以得到保证,该投资测算方法是房地产项目重要投资决策工具。

实施例二:

参见图7,实施例二在其他实施例的基础上,提供了测算任务的新建方法,包括:

s11:接收用户的登录指令,供用户注册或登录在分析应用平台上;

具体地,对首次登陆的用户,需要注册。为了保护数据安全,注册过程中,还需要管理人员授予注册的用户权限。用户必须成功登录后,才能完成登录。

s12:接收用户的新建指令,在所述分析应用平台上新建测算任务;

具体地,所述分析应用平台还统计平台累计已完成测算次数、以及平台累计生产目标成本套表份数,方便用户查看该平台的使用情况。

s13:接收用户输入的特征指标,将特征指标填入测算任务中,所述特征指标包括地块信息、规划指标、销售计划和专项成本;

所述地块信息包括以下数据的一种或多种组合:区域名称、行政区划、项目名称、土地出让金总价、土地转让金总价、无票土地价款合计、规划用地、拆迁补偿费、利润分配比例和土地款支付额。地块信息可以保存在基础数据库中,可以接企业主数据终端。当输入项目名称时,可以直接生成对应的区域名称和行政区划。

具体地,土地款支付额可以是分批支付,所述地块信息还包括支付批次,每个批次的支付日期和支付比例。所述地块信息还包括是否合作开发、合作方是否参与成就双享。地块信息还包括不确定工程,例如:红线外景观工程、场地平整、线路迁移等。

所述规划指标包括以下数据的一种或多种组合:设计值绿地率、设计值建筑密度、示范区/货量区绿化比例、示范区/货量区园建比例、产品类型、产品业态、涉及户型、计容面积、地上建筑面积、地下建筑面积、可售面积、栋数、层数、户数和装修标准。

具体地,规划指标还包括是否自建人防工程。产品类型包括住宅、商业、有产权物业等。产品业态包括中高层洋房、高层洋房、双拼别墅、小高层洋房、底商等。装修标准包括精装和毛坯。规划指标还包括每个产品是否采用桩基础。所述产品类型、产品业态、涉及户型、计容面积、地上建筑面积、地下建筑面积、可售面积、栋数、层数、户数和装修标准保存在产品数据库中,产品数据库包含历史项目的规划及产品指标,可用于识别项目特征。

所述销售计划包括以下数据的一种或多种组合:推盘批次、当次推售产品类别、当次推售比例、含税售价、货值、开工时间、开盘时间和交楼时间。

具体地,销售计划包括有多个推盘批次,销售计划包括所有推盘批次,以及每个推盘批次的当次推售产品类别、当次推售比例、含税售价、货值、开工时间、开盘时间和交楼时间。

所述专项成本包括以下数据的一种或多种组合:土石方工程、桩基础、红线外供水工程、红线外供电工程、人防易地建设费和场地平整。

具体地,所述专项成本还包括其他成本录入,例如三通工程费、基坑支护、降水费用、地基处理等。专项成本输入后,为了保证测算的准确度,还需要进行专项成本复核:生成复核页面,复核页面上显示填入的地块信息、规划指标、销售计划和专项成本,在用户完成复核后,才进入下一步测算。该专项成本可存储在成本数据库中,成本数据库还包括历史成本数据,包含历史项目所有可用于未来投资测算的成本数据,也方便用户查询对比。

s14:根据用户输入的特征指标和预设的投资测算逻辑,在所述数据仓库中搜索并调用与所述特征指标相匹配的数据,作为计算参数;

s15:保存并提交测算任务。

另外,本实施例的方法还增加协同功能,可以通过一人或多人完成协同操作。在所述接收用户输入的特征指标,将特征指标填入测算任务中之间还包括:

s21:接收用户的发起协同操作,新建协同任务;

s22:接收用户输入的至少一个协同人员名单,将协同人员名单填入所述协同任务中;

s23:根据协同任务的协同人员名单依次将测算任务分配给对应的协同人员操作。

另外,该方法在根据测算任务和预设的测算算法完成测算之后,还包括:

s31:接收用户的预览操作,对所述测算结果进行预览;

s32:接收用户的下载操作,下载所述测算结果。

具体地,用户根据自身需求预览或下载测算结果。

实施例三:

参见图8、9,实施例二在实施例二的基础上,增加了成本取数优先级别的确定方法:所述在所述数据仓库中搜索并调用与所述特征指标相匹配的数据,作为计算参数具体为:

设置多个搜索区域,并将搜索区域按照区域行政等级从低到高排列;

具体地,可以按照与用户录入的项目地址处于同一个县、同一个市、同一个省或直辖市的顺序进行搜索。如果同一个县没有匹配的项目,在同一个市内搜索,以此类推。

按照区域行政等级从低到高的顺序,根据所述特征指标在数据仓库依次搜索处在每个搜索区域内的数据;

当数据仓库中每个搜索区域内存在与用户录入的特征指标匹配的数据,得到所述计算参数;

当数据仓库中每个搜索区域内不存在与用户录入的特征指标匹配的数据时,接收用户手动输入的数据,并填入所述测算任务中。

进一步地,该方法在当数据仓库中每个搜索区域内不存在与用户录入的特征指标匹配的数据时,接收用户手动输入的数据,并填入所述测算任务中之后,还包括区、集团搜索步骤,具体为:

根据所述特征指标在数据仓库搜索处在同片区(例如华南片区、华东片区、华中片区、西南片区、东北片区、华北片区、西北片区)内的数据;

当数据仓库中同片区内不存在与用户录入的特征指标匹配的数据,根据所述特征指标在数据仓库搜索处在同集团内的数据;

当数据仓库中存在与用户录入的特征指标匹配的数据,得到所述计算参数。

进一步地,所述根据所述特征指标在数据仓库依次搜索处在每个搜索区域内的数据包括:

设定搜索区域内初级搜索区域,在数据仓库中搜索处初级搜索区域内的数据,判断初级搜索区域内是否存在至少两组与用户录入的特征指标匹配的数据;

如果存在,判定匹配成功,计算计算参数的组数;如果组数为奇数,调取数据仓库中数值位于平均值的数据;如果组数为偶数,调取数据仓库中数值最大的数据;

如果不存在,扩大搜索区域范围,以得到次级搜索区域,在数据仓库中搜索处次级搜索区域内的数据,判断次级搜索区域内是否存在与用户录入的特征指标匹配的数据;

如果存在,判定匹配成功计算计算参数的组数;如果组数为1,调取数据仓库中的数据;如果组数为奇数,调取数据仓库中数值位于平均值的数据;如果组数为偶数,调取数据仓库中数值最大的数据。

实施例四:

实施例四在其他实施例的基础上,还提供历史项目查询功能,包括:

接收用户输入的查询因素;

读取测算任务,分别根据每个查询因素生成对应的单独推荐列表,每个单独推荐列表中存储有根据对应的查询因素进行排序的测算任务;

具体地,单独推荐列表中的测算任务根据各自的查询因素从大到小或从小到大进行排序,例如,根据土地出让金总价从大到小进行排序,根据拆迁补偿费从小到大进行排序。

该方法还提供筛选功能,包括:

接收用户输入的筛选因素,并设置各个筛选因素占的百分比;

读取满足所述各个筛选因素所占百分比的测算任务,生成筛选列表;

接收用户的筛选参数选择操作,以得到排序参数,将筛选列表中的测算任务按照排序参数进行排序;排序参数为筛选因素中的一个。

可以通过以下方法输入筛选因素的百分比:平台上设有进度条,所述进度条上设有至少一个滑动按钮;平台接收到n个筛选因素,并在所述进度条上生成n-1个滑动按钮;所述进度条被n-1个滑动按钮划分为n个进度段;每个进度段关联一个筛选因素,平台接收用户的操作,通过滑动进度条上的滑动按钮,调整各个进度段的长度,从而调整各个筛选因素占的百分比,并在调整完毕后输入所述各个筛选因素占的百分比。

具体实施时,进度段的长度越长,说明其筛选因素占的百分比越大,通过滑动进度条上的滑动按钮来调节筛选因素占的百分比,方便使用。当调整完毕时,根据进度段的长度确定筛选因素占的百分比。为了让用户准确地知道调整时,各筛选因素的百分比,所述每个进度段上显示对应筛选因素所占的百分比。

平台上还设有输入确定按钮,当输入确定按钮按下时,判定筛选因素所占百分比调整完毕,输入所述各个筛选因素占的百分比。

实施例五:

参见图10,实施例五提供了一种基于大数据挖掘技术的投资测算系统,分析应用平台采用双机集群技术,web服务器、报表服务器、数据库服务器分别采用2台服务器进行部署。负载均衡服务器采用f5/nginx技术。用户通过客户端访问通过分析应用平台进行登录认证,然后单点登录进入测算使用相关功能。数据库部署etl作业,读取数据仓库相关基础数据。

分析应用平台的用户包括企业各业务系统、成本管理中心和集团决策层。可以完成即席查询、固定报表、仪表盘、多维分析、移动bi、数据填报和数据挖掘。

实施例六:

实施例六在实施例五的基础上,还增加了信息录入的功能,客户端可以加载在移动终端上,客户端还执行以下方法:

接收用户的录入指令,打开录入界面;

接收用户的滑动指令,选择所述测算任务的编辑框;

接收用户的停止指令,确定用户最终选择的编辑框;

接收用户输入的数据,将该数据填入最终选择的编辑框中;

其中,用户的录入指令为点击投资测算终端屏幕的动作,当处理器检测到用户点击投资测算终端屏幕,且点击时间超过预设的点击时间时,判定为接收到用户的录入指令。录入界面可以是整个屏幕的显示界面,也可以是部分屏幕的显示界面,主要用于在终端屏幕上划分出滑动指令的输入范围,即只有用户在录入界面内输入滑动指令才有效。所述终端在录入数据时,还显示光标,用于方便用户看到数据录入的编辑框。

滑动指令包括上滑动指令、下滑动指令、左滑动指令和右滑动指令。当处理器检测到用户在录入界面内向上滑动屏幕时,判定为接收到用户的上滑动指令,则光标向上移动一个编辑框。当处理器检测到用户在录入界面内向下滑动屏幕时,判定为接收到用户的下滑动指令,则光标向下移动一个编辑框。当处理器检测到用户在录入界面内向左滑动屏幕时,判定为接收到用户的左滑动指令,则光标向左移动一个编辑框。当处理器检测到用户在录入界面内向右滑动屏幕时,判定为接收到用户的右滑动指令,则光标向右移动一个编辑框。具体地,测算任务中包含有多个编辑框,测算任务在新建时,设置了行间距和列间距。其中光标在移动时,按照行间距和列间距移动,即当光标向上、下、左或右移动时,光标移动至上一行、下一行、左一列或右一列中相应的位置。

投资测算终端的录入界面内还可以设有确定按键,当用户按下确定按键时,认为接收用户的停止指令。停止指令也可以是用户点击屏幕的动作,例如当处理器检测到用户连续两次点击屏幕时,认为接收用户的停止指令。停止指令也可以是用户停止点击屏幕,当用户手指脱离屏幕时间超过预设的停止时间时,认为接收用户的停止指令。当停止指令时,光标停留在当前的编辑框中。

所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1