一种基于创投领域精准数据化推荐匹配方法与流程

文档序号:14870808发布日期:2018-07-06 23:29阅读:173来源:国知局

本发明涉及一种基于创投领域精准数据化推荐匹配方法。



背景技术:

创投是创业投资的简称。创业投资是指专业投资人员(创业投资家)为以高科技为基础的创新公司提供融资的活动。与一般的投资家不同,创业投资家不仅投入资金,而且用他们长期积累的经验、知识和信息网络帮助企业管理人员更好地经营企业。

创业者将项目推荐给投资人的途径非常重要。创业者在投递项目的过程中,并不了解哪些投资人会对自己的项目感兴趣,盲目的投递项目,效率低下;而对于投资人来说,收到大量其不感兴趣的项目,需要浪费大量的时间对这些项目进行筛选和处理,投资人主动去查找项目,面对海量的项目,筛选也是一个耗费精力的事情。目前,还没有一种高效的方法将创业者的项目与投资人的需求进行对接。



技术实现要素:

本发明的目的在于克服现有技术中存在的上述不足,而提供一种设计合理的基于创投领域精准数据化推荐匹配方法,可以高效地将创业者的项目与投资人的需求进行对接。

本发明解决上述问题所采用的技术方案是:一种基于创投领域精准数据化推荐匹配方法,其特征在于:步骤为:

一、创业者通过客户端向服务器上传项目的结构化信息,结构化信息包括项目的所属城市、融资阶段、融资金额、项目材料,服务器收集这些结构化信息;

投资人通过客户端向服务器上传投资偏好信息,投资偏好信息包括投资领域、投资城市、投资阶段、投资金额;服务器收集这些投资偏好信息;

二、服务器从项目材料中提取项目的文字内容;

三、服务器将提取的所有文字内容拼接;

四、服务器将拼接后的内容打散形成关键词,关键词根据在拼接后内容中的词频从高到底排列;

五、循环每一个步骤四中的关键词,查找其出现在通用词库中的词频,关键词在通用词库中的词频称之为逆词频;

六、关键词的词频除以逆词频,得出该关键词在项目中重要性分值,按重要性分值从高到低,取靠前的数个关键词;

七、将关键词跟领域进行关联;

八、通过领域和关键词的关联关系,得出投资人分词分值;

九、将关键词在项目中重要性分值和投资人分词分值组成向量,然后进行向量余弦夹角计算得出领域分值;

十、将项目的所属城市设为一固定分值,将投资人的投资城市设为某一分值,将两个分值组成向量,并进行向量余弦夹角计算得出城市分值;将项目的融资阶段设为一固定分值,与投资人的投资阶段设为某一分值,将两个分值组成向量,并进行向量余弦夹角计算得出融资分值,再计算投资人最终对项目分值=领域分值×a%+城市分值×b%+融资阶段分值×c%;

十一、根据各投资人最终对项目分值进行从高到低排序,得出排名靠前的投资人,就是匹配到的结果,再将匹配结果中投资金额大于融资金额的投资人反馈给创业者。

本发明所述的项目材料包括简介、一句话介绍、商业计划书。

本发明所述的a为70,b为20,c为10。

本发明与现有技术相比,具有以下优点和效果:帮助创业者快速发现对自己项目感兴趣的投资人,提高对接效;帮助投资人挖掘感兴趣的项目,提高工作效率;实现了精准数据化的推荐匹配。

具体实施方式

下面通过实施例对本发明作进一步的详细说明,以下实施例是对本发明的解释而本发明并不局限于以下实施例。

实施例。

本实施例步骤为:

一、创业者通过app等客户端向服务器上传项目的结构化信息,结构化信息包括项目的所属城市、融资阶段、融资金额、项目材料,项目材料包括简介、一句话介绍、商业计划书等文字材料;服务器收集这些结构化信息;

投资人通过app等客户端向服务器上传投资偏好信息,投资偏好信息包括投资领域、投资城市、投资阶段、投资金额;服务器收集这些投资偏好信息;

二、服务器使用apache的pdfbox库提取项目材料中商业计划书的文字内容;

三、服务器将简介、一句话介绍和商业计划书这些项目材料里提取的所有文字内容拼接,拼接方法为按页提取,串行拼接;

四、服务器将上面拼接后的内容通过汉语言处理库hanlp中的textrank关键词方法打散成大于2个字、小于5个字的关键词,关键词根据在拼接后内容中的词频从高到底排列;

五、循环每一个步骤四中的关键词,查找其出现在通用词库(如google搜索结果)中的词频,关键词在通用词库中的词频称之为逆词频;

六、关键词的词频除以逆词频,得出该关键词在项目中重要性分值,按重要性分值从高到低,取靠前的10个关键词;

七、将步骤六取出的关键词跟领域进行关联,通过人工审核,判断该关键词是否属于当前领域,建立一对一的关联关系;

八、通过领域和关键词的关联关系,计算出投资人对关键词的喜好程度的分值,如果领域和关键词有关联关系,则投资人对领域的喜好程度的分值则为投资人对关键词的喜好程度的分值,比如:投资人对领域a的喜好程度是8分,而领域a跟关键词b有关联关系,则得出投资人对关键词b的喜好程度也为8分;投资人对关键词的喜好程度的分值即为投资人分词分值;投资人对某领域的喜好程度的分值是对投资人偏好某个领域程度的一个数字量化,由投资人自己填写或者ir人员维护得出,或者通过系统对投资人对某领域的关注度进行加权计算得出;

九、将步骤六取出的关键词在项目中重要性分值和投资人分词分值组成向量,然后进行向量余弦夹角计算得出领域分值;

十、将项目的所属城市设为一固定分值,将投资人的投资城市设为某一分值,将两个分值组成向量,并进行向量余弦夹角计算得出城市分值;将项目的融资阶段设为一固定分值,与投资人的投资阶段设为某一分值,将两个分值组成向量,并进行向量余弦夹角计算得出融资分值,再计算投资人最终对项目分值=领域分值×a%+城市分值×b%+融资阶段分值×c%;投资城市和投资阶段由人工进行维护调整;

十一、根据各投资人最终对项目分值进行从高到低排序,得出排名靠前的投资人,就是匹配到的结果,再将匹配结果中投资金额大于融资金额的投资人反馈给创业者。

此外,需要说明的是,本说明书中所描述的具体实施例,其零、部件的形状、所取名称等可以不同,本说明书中所描述的以上内容仅仅是对本发明结构所作的举例说明。凡依据本发明专利构思所述的构造、特征及原理所做的等效变化或者简单变化,均包括于本发明专利的保护范围内。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,只要不偏离本发明的结构或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。



技术特征:

技术总结
本发明提供一种基于创投领域精准数据化推荐匹配方法,可以高效地将创业者的项目与投资人的需求进行对接。创业者通过客户端向服务器上传项目的结构化信息,投资人通过客户端向服务器上传投资偏好信息;服务器将提取的所有文字内容拼接后的内容打散成关键词;将关键词的词频除以逆词频,得出该关键词在项目中重要性分值;通过领域和关键词的关联关系,得出投资人分词分值;将关键词在项目中重要性分值和投资人分词分值组成向量,然后进行向量余弦夹角计算得出领域分值;计算投资人最终对项目分值=领域分值×a%+城市分值×b%+融资阶段分值×c%;根据各投资人最终对项目分值进行从高到低排序,得出排名靠前的投资人,就是匹配到的结果。

技术研发人员:蔡华
受保护的技术使用者:杭州传送门网络科技有限公司
技术研发日:2017.12.21
技术公布日:2018.07.06
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1