农产品价格趋势预测方法

文档序号:6518226阅读:319来源:国知局
农产品价格趋势预测方法
【专利摘要】本发明公开了一种农产品价格趋势预测方法,其特征在于,包括如下步骤:步骤一:通过计算机采集与农产品价格相关的且带有专家预测性观点的文章;步骤二:对采集的文章进行去重;步骤三:提取并保存文章要素;步骤四:对文章中描述的农产品所属区域进行识别;步骤五:利用文本挖掘技术分析出专家对农产品的预测性观点,并将所述预测性观点进行量化和保存;步骤六:根据文章发表时间、农产品所属区域、农产品种类以及量化的趋势预测观点进行计算机建模,利用建立的模型对农产品价格进行趋势预测。本发明相较于现有技术来说,数据搜集周期更短,收集成本几乎为零,能够对未来一段时间的农产品价格的整体趋势进行预测,预测的准确性和可靠性更高。
【专利说明】农产品价格趋势预测方法
【技术领域】
[0001]本发明涉及一种农产品价格趋势预测方法,具体涉及一种利用计算机技术对农产品价格的长期趋势进行预测的方法,本发明属于计算机【技术领域】。
【背景技术】
[0002]我国是一个农业大国,农业人口众多,农作物种类繁杂。在过去的十几年里,国家投入了大量的人力和物力来支持农业和农村的经济发展,取得了显著的效果。作为农业和农村经济发展的一个组成部分,农业信息化在发展中起着举足轻重的作用。农业信息化领域中,监测农产品的价格走势并进行有效预测对政府进行宏观调控以及农业生产者制定生产策略都具有十分重要的意义。
[0003]趋势,表示事物的发展动向。趋势预测,通常意义下指的是对于某种物体的发展动向进行有规律地预测。对农产品价格的预测包括对农产品的价格进行短期的离散数据预测和长期的走势预测。例如,对未来5天的西红柿价格的具体数字的预测属于短期预测,而对未来I个月的西红柿价格的整体走势预测属于长期预测。对农产品价格进行长期的走势预测,也称为农产品价格趋势预测。农产品价格的预测趋势分为三种:看涨(预测的未来趋势为上升)、看跌(预测的未来趋势为下降)、看平(预测的未来趋势为平稳)。通过搜集和分析互联网上发布的权威的专家预测观点进而对农产品的未来价格趋势进行有效预测,是本发明的主要目标和创新之处。
[0004]影响农产品价格波动的因素有很多,例如季节性因素、气候性因素、农产品的供需变化和流通成本因素等等,这导致了对农产品的价格进行预测是一项具有挑战性的任务。目前,国内外对农产品的价格预测主要集中于定性和定量两种预测方法。定性预测方法主要借助于专家的经验知识对农产品的未来走势给出个人主观预测,该类方法的主观随意性大,预测的精确性往往受限于专家经验的丰富程度。定量预测方法主要通过对农产品的市场价格建立数学模型,利用建立的模型对未来的价格进行预测。该类方法都是以农产品价格数据为中心建模,精确度往往受限于所搜集的农产品价格数据的准确性,而在现实情形中,搜集准确的农产品价格数据需要耗费大量的人力、物力以及较长的时间周期,这往往制约了该类方法的普遍适用性。此外,该类方法的另外一个缺点是,只能对未来的离散的价格数据进行预测,不能对未来的整体的价格趋势进行预测,而在实际应用中,人们往往更关心农产品价格的整体波动趋势。
[0005]综上所述,对于农产品的价格预测问题,虽然已经出现了不少的解决方法,也取得了一定的成果,然而上述问题的存在大大限制了这些方法的普遍适用性。

【发明内容】

[0006]为解决现有技术的不足,本发明的目的在于提供一种农产品价格趋势预测方法。
[0007]为了实现上述目标,本发明采用如下的技术方案:
[0008]农产品价格趋势预测方法,其特征在于,包括如下步骤:[0009]步骤一:通过计算机自动采集程序从互联网网站定时采集与农产品价格相关的且带有专家预测性观点的文章;
[0010]步骤二:对采集的文章进行去重;
[0011]步骤三:从去重后的文章中提取并保存文章要素,所述文章要素包括文章标题、文章正文内容、文章来源、文章发表时间、文章中带有专家预测性观点的语句;
[0012]步骤四:根据文章标题和文章正文内容对文章中描述的农产品所属区域进行识别;
[0013]步骤五:根据文章中带有专家预测性观点的语句,利用文本挖掘技术分析出专家对农产品的预测性观点,并将所述预测性观点进行量化和保存;
[0014]步骤六:根据文章发表时间、农产品所属区域、农产品种类以及量化的趋势预测观点进行计算机建模,利用建立的模型对农产品价格进行趋势预测。
[0015]前述的农产品价格趋势预测方法,其特征在于,所述步骤一包括:
[0016]步骤Ia:设置采集定时器;
[0017]步骤Ib:设定要采集的互联网网站所对应的入口 URL,并将入口 URL进行保存,根据采集定时器为所述入口 URL分配定时采集任务;
[0018]步骤Ic:对设定要采集的互联网网站所对应的入口 URL进行网页内容下载;
[0019]步骤Id:根据网页内容中的HTML标签,定位需要采集的文章对应的URL ;
[0020]步骤Ie:根据需要采集的文章对应的URL,对文章对应的网页内容进行下载并保存。
[0021]前述的农产品价格趋势预测方法,其特征在于,所述步骤2b包括:将入口 URL保存到本地的XML文件或本地数据库。
[0022]前述的农产品价格趋势预测方法,其特征在于,所述步骤二包括:
[0023]步骤2a:对每一篇文章对应的URL字符串利用MD5算法进行加密,计算得到所述文章对应的URL的信息指纹;
[0024]步骤2b:进行指纹比对,对于信息指纹相同的文章,只保留其中的一篇;
[0025]步骤2c:对步骤2b处理后保留的文章按照发表时间的先后进行排序,选择时间最靠前的文章作为基点文章,将基点文章和剩余的文章分别进行两两比对,依次计算基点文章与剩余的文章之间的标题相似度;如果标题相似度大于阈值,则认为二者标题相似,赋予该篇文章与基点文章相同的相似度标识,否则,取其余剩余文章继续与基点文章进行比较,直到剩余全部文章与基点文章比较结束;
[0026]步骤2d:比较结束后,若还有未赋予相似度标识的文章,则选择时间最靠前的文章为新的基点文章,并为该篇文章赋予新的相似度标识,剩余的未赋予相似度标识的文章依次与其进行比较;
[0027]步骤2e:重复步骤2d,直至不存在未赋予相似度标识的文章;
[0028]步骤2f:对于相似度标识相同的文章,只保留其中的一篇。
[0029]前述的农产品价格趋势预测方法,其特征在于,所述步骤2c包括:通过相似度计
算公式:
【权利要求】
1.农产品价格趋势预测方法,其特征在于,包括如下步骤: 步骤一:通过计算机自动采集程序从互联网网站定时采集与农产品价格相关的且带有专家预测性观点的文章; 步骤二:对采集的文章进行去重; 步骤三:从去重后的文章中提取并保存文章要素,所述文章要素包括文章标题、文章正文内容、文章来源、文章发表时间、文章中带有专家预测性观点的语句; 步骤四:根据文章标题和文章正文内容对文章中描述的农产品所属区域进行识别;步骤五:根据文章中带有专家预测性观点的语句,利用文本挖掘技术分析出专家对农产品的预测性观点,并将所述预测性观点进行量化和保存; 步骤六:根据文章发表时间、农产品所属区域、农产品种类以及量化的趋势预测观点进行计算机建模,利用建立的模型对农产品价格进行趋势预测。
2.根据权利要求1所述的农产品价格趋势预测方法,其特征在于,所述步骤一包括: 步骤Ia:设置采集定时器; 步骤Ib:设定要采集的互联网网站所对应的入口 URL,并将入口 URL进行保存,根据采集定时器为所述入口 URL分配定时采集任务; 步骤Ic:对设定要采集的互联网网站所对应的入口 URL进行网页内容下载; 步骤Id:根据网页内容中的HTML标签,定位需要采集的文章对应的URL ; 步骤Ie:根据需要采集的文章对应的URL,对文章对应的网页内容进行下载并保存。
3.根据权利要求2所述的农产品价格趋势预测方法,其特征在于,所述步骤2b包括:将入口 URL保存到本地的XML文件或本地数据库。
4.根据权利要求3所述的农产品价格趋势预测方法,其特征在于,所述步骤二包括: 步骤2a:对每一篇文章对应的URL字符串利用MD5算法进行加密,计算得到所述文章对应的URL的信息指纹; 步骤2b:进行指纹比对,对于信息指纹相同的文章,只保留其中的一篇; 步骤2c:对步骤2b处理后保留的文章按照发表时间的先后进行排序,选择时间最靠前的文章作为基点文章,将基点文章和剩余的文章分别进行两两比对,依次计算基点文章与剩余的文章之间的标题相似度;如果标题相似度大于阈值,则认为二者标题相似,赋予该篇文章与基点文章相同的相似度标识,否则,取其余剩余文章继续与基点文章进行比较,直到剩余全部文章与基点文章比较结束; 步骤2d:比较结束后,若还有未赋予相似度标识的文章,则选择时间最靠前的文章为新的基点文章,并为该篇文章赋予新的相似度标识,剩余的未赋予相似度标识的文章依次与其进行比较; 步骤2e:重复步骤2d,直至不存在未赋予相似度标识的文章; 步骤2f:对于相似度标识相同的文章,只保留其中的一篇。
5.根据权利要求4所述的农产品价格趋势预测方法,其特征在于,所述步骤2c包括:通过相似度计算公式:次工,力=¥计算所述标题相似度,其中Sxy表示基点文章与剩余的 M,y文章之间的标题相似度,Nx’y表示基点文章与剩余的文章两者标题中含有的相同的字符数目,Nx表示基点文章标题中含有的字符的总数目;所述阀值为0.9。
6.根据权利要求5所述的农产品价格趋势预测方法,其特征在于,所述步骤三包括: 步骤3a:读取保存的网页内容; 步骤3b:根据网页字符编码对网页内容中的HTML标签进行解析; 步骤3c:根据文章标题、文章正文内容、文章来源、文章发表时间在网页HTML标签中的位置进行相应的提取; 步骤3d:根据文章正文内容和专家观点关键词对文章中带有专家预测性观点的语句进行提取;步骤3e:保存提取的相关文章要素。
7.根据权利要求6所述的农产品价格趋势预测方法,其特征在于,所述步骤四包括: 步骤4a:读取区域数据库; 步骤4b:根据区域数据库建立区域映射规则; 步骤4c:读取保存的文章标题和文章正文内容; 步骤4d:从文章标题中搜索县区、市区或省份所对应的关键词;若搜索到,则通过映射规则定位并保存所述县区、市区或省份所对应的省份;若没有搜索到,进一步读取保存的文章正文内容,从文章正文内容中搜索县区、市区或省份对应的关键词;若搜索到,则通过映射规则定位并保存所述县区、市区或省份所对应的省份,否则,将该篇文章所属区域设定为全国。
8.根据权利要求7所述的农产品价格趋势预测方法,其特征在于,所述步骤五包括: 步骤5a:读取文章中带有专家预测性观点的语句; 步骤5b:利用文本挖掘技术中的成分句法分析方法对文章中带有专家预测性观点的语句进行分析; 步骤5c:读取农产品种类关键词和趋势关键词; 步骤5d:根据文章中带有专家预测性观点的语句中句子的成分、农产品种类关键词、趋势关键词分析出文章中带有专家预测性观点的语句所描述的农产品种类及专家对农产品的预测性观点; 步骤5e:根据趋势映射规则将专家对农产品的预测性观点进行量化; 步骤5f:保存农产品种类及专家对农产品的预测性观点。
【文档编号】G06F17/30GK103577581SQ201310551702
【公开日】2014年2月12日 申请日期:2013年11月8日 优先权日:2013年11月8日
【发明者】张伟, 欧吉顺, 周楚新 申请人:南京绿色科技研究院有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1