专利名称:文本处理方法、装置、电子设备及可读存储介质专利类型:发明专利发明人:张文刚
申请号:CN201911237688.4申请日:20191205公开号:CN111008528A公开日:20200414
摘要:本申请提供一种文本处理方法、装置、电子设备及可读存储介质,涉及计算机数据处理技术领域。方法包括:将获得的第一文本数据输入与第一指定任务对应的目标分词器;通过目标分词器对第一文本数据进行预处理,得到第二文本数据,第二文本数据包括与第一指定任务对应的标签;根据去除标签后的得到第二文本数据对第一语言模型进行训练,得到训练后的第二语言模型,第一语言模型为经过训练的语言模型;基于第一指定任务将未去除标签的第二文本数据输入第二语言模型,得到与第一指定任务对应的处理结果。本方案能够简化文本数据分析处理的操作步骤,从而提高分析处理的效率。
申请人:北京知道智慧信息技术有限公司
地址:100000 北京市朝阳区阜通东大街1号院5号楼1单元311506室
国籍:CN
代理机构:北京超凡宏宇专利代理事务所(特殊普通合伙)
代理人:唐正瑜
更多信息请下载全文后查看
因篇幅问题不能全部显示,请点此查看更多更全内容