(12)发明专利申请
(21)申请号 CN201911352915.8 (22)申请日 2019.12.25
(71)申请人 北京海天瑞声科技股份有限公司
地址 100083 北京市海淀区成府路28号优盛大厦D801
(10)申请公布号 CN110750980A
(43)申请公布日 2020.02.04
(72)发明人 杨萌萌;郝玉峰;黄宇凯;邵志明;曹琼;李科 (74)专利代理机构 北京钲霖知识产权代理有限公司
代理人 李英艳
(51)Int.CI
权利要求说明书 说明书 幅图
(54)发明名称
短语语料获取方法及短语语料获取装置
(57)摘要
本发明涉及语音合成技术领域,提供一种
短语语料获取方法及短语语料获取装置。短语语料获取方法,包括:获取待处理长句语料。拆分待处理长句语料,得到至少一个子句语料。将子句语料的字数与预设句长阈值进行对比。若子句语料的字数小于或等于预设句长阈值,则保留子句语料作为短句语料。通过本公开提供的获取短语语料方法,将待处理长句语料拆分成独立的子句语料进行处理,有助于提高语料清洗句子利用
率,减少待处理长句语料中有用语料的损失,进而节省人工校对的成本。
法律状态
法律状态公告日
2020-02-04 2020-02-04 2020-02-04 2020-02-28 2020-02-28 2020-05-05
法律状态信息
公开 公开 公开
实质审查的生效 实质审查的生效 授权
法律状态
公开 公开 公开
实质审查的生效 实质审查的生效 授权
权利要求说明书
短语语料获取方法及短语语料获取装置的权利要求说明书内容是....请下载后查看
说明书
短语语料获取方法及短语语料获取装置的说明书内容是....请下载后查看
因篇幅问题不能全部显示,请点此查看更多更全内容