技术总结
本发明公开了一种微博情感分类器的构建方法及构建装置,其中,方法包括以下步骤:获取多条微博数据;对微博文本进行分词得到词语集合;根据海量无标注的微博文本数据得到词语‑词语情感关联关系和词语‑情感关联关系;对预设数量的微博文本数据进行人工标注,以赋予情感标签得到有标注的微博情感数据集;将词语‑词语情感关联关系、词语‑情感关联关系和有标注的微博情感数据集融合得到多源异构情感信息,并建立数学模型,以得到微博情感分类器。该方法可以通过融合多源异构情感信息得到微博情感分类器,从而对微博消息所表达的情感倾向性进行分类,提高了分类器的鲁棒性和准确率,成本低,简单易实现。
技术研发人员:黄永峰;吴方照;刘佳伟;袁志刚;吴思行;杨忠良
受保护的技术使用者:清华大学
文档号码:201610824487
技术研发日:2016.09.13
技术公布日:2017.02.22