1.一种基于语义分量的词向量学习方法,其特征在于包括以下步骤:
2.如权利要求1所述一种基于语义分量的词向量学习方法,其特征在于在步骤a中,所述中文文本语料采用sogout网页语料,该语料包括来自互联网各种类型的1.3亿个原始网页,压缩前的大小超过5tb。
3.如权利要求1所述一种基于语义分量的词向量学习方法,其特征在于在步骤b中,所述对文本语料和知网处理包括以下子步骤:
4.如权利要求1所述一种基于语义分量的词向量学习方法,其特征在于在步骤c中,所述生成语义分量表进一步包括以下子步骤:
5.如权利要求1所述一种基于语义分量的词向量学习方法,其特征在于在步骤d中,所述生成初始词嵌入包括以下子步骤:
6.如权利要求1所述一种基于语义分量的词向量学习方法,其特征在于在步骤e中,所述已有模型包括cbow、skip-gram和glove模型。