技术总结
本发明公开了一种基于表格数据的FAQ知识库自动构建方法和装置,该方法包括:将表格数据区分为规范化表格和非规范化表格;利用预先训练得到的SQL语句生成器和第一问题生成器,根据所述规范化表格生成第一问答对;利用预先训练得到的自然语句生成器和第二问题生成器,根据所述非规范化表格生成第二问答对;对生成的第一问答对和第二问答对进行筛选,根据筛选出的问答对构建FAQ知识库。不仅节省了大量的人力和时间成本,而且在自动问答系统冷启动阶段生成了有效覆盖的FAQ知识库。另外,该方法能够利用规范化的表格数据和非规范化表格数据生成问答对,因此,适用于利用政务领域表格数据构建FAQ知识库。据构建FAQ知识库。据构建FAQ知识库。
技术研发人员:郭司绪 杨玉树 钱泓锦 刘占亮 窦志成 曹岗 文继荣
受保护的技术使用者:北京智源人工智能研究院
技术研发日:2021.02.24
技术公布日:2021/5/14