技术特征:
技术总结
本发明提供一种表格信息提取方法、装置和存储介质。该方法包括:确定待提取表格的表格类型,表格类型包括单实体类型和/或多实体类型;根据待提取表格的表格类型,提取待提取表格中的主体信息、客体信息以及主体和客体之间的关联信息。本实施例提供的表格信息提取方法、装置和存储介质,首先识别待提取信息的表格的类型,然后根据表格类型在表格中提取信息,可准确提取网页表格中的内容,避免了需为不同结构的网页配置不同提取模板,降低了网页表格信息提取的成本,提高了表格信息提取效率,具有广泛的适用范围。
技术研发人员:李双婕;黄昉;梁海金;张扬;朱勇
受保护的技术使用者:北京百度网讯科技有限公司
技术研发日:2018.10.30
技术公布日:2019.05.03