专利名称:表格信息提取方法、装置和存储介质专利类型:发明专利
发明人:李双婕,黄昉,梁海金,张扬,朱勇申请号:CN201811280729.3申请日:20181030公开号:CN109710771A公开日:20190503
摘要:本发明提供一种表格信息提取方法、装置和存储介质。该方法包括:确定待提取表格的表格类型,表格类型包括单实体类型和/或多实体类型;根据待提取表格的表格类型,提取待提取表格中的主体信息、客体信息以及主体和客体之间的关联信息。本实施例提供的表格信息提取方法、装置和存储介质,首先识别待提取信息的表格的类型,然后根据表格类型在表格中提取信息,可准确提取网页表格中的内容,避免了需为不同结构的网页配置不同提取模板,降低了网页表格信息提取的成本,提高了表格信息提取效率,具有广泛的适用范围。
申请人:北京百度网讯科技有限公司
地址:100085 北京市海淀区上地十街10号百度大厦2层
国籍:CN
代理机构:北京同立钧成知识产权代理有限公司
更多信息请下载全文后查看
因篇幅问题不能全部显示,请点此查看更多更全内容