搜索
您的当前位置:首页正文

短语语料获取方法及短语语料获取装置

来源:六九路网
(19)中华人民共和国国家知识产权局

(12)发明专利申请

(21)申请号 CN201911352915.8 (22)申请日 2019.12.25

(71)申请人 北京海天瑞声科技股份有限公司

地址 100083 北京市海淀区成府路28号优盛大厦D801

(10)申请公布号 CN110750980A

(43)申请公布日 2020.02.04

(72)发明人 杨萌萌;郝玉峰;黄宇凯;邵志明;曹琼;李科 (74)专利代理机构 北京钲霖知识产权代理有限公司

代理人 李英艳

(51)Int.CI

权利要求说明书 说明书 幅图

(54)发明名称

短语语料获取方法及短语语料获取装置

(57)摘要

本发明涉及语音合成技术领域,提供一种

短语语料获取方法及短语语料获取装置。短语语料获取方法,包括:获取待处理长句语料。拆分待处理长句语料,得到至少一个子句语料。将子句语料的字数与预设句长阈值进行对比。若子句语料的字数小于或等于预设句长阈值,则保留子句语料作为短句语料。通过本公开提供的获取短语语料方法,将待处理长句语料拆分成独立的子句语料进行处理,有助于提高语料清洗句子利用

率,减少待处理长句语料中有用语料的损失,进而节省人工校对的成本。

法律状态

法律状态公告日

2020-02-04 2020-02-04 2020-02-04 2020-02-28 2020-02-28 2020-05-05

法律状态信息

公开 公开 公开

实质审查的生效 实质审查的生效 授权

法律状态

公开 公开 公开

实质审查的生效 实质审查的生效 授权

权利要求说明书

短语语料获取方法及短语语料获取装置的权利要求说明书内容是....请下载后查看

说明书

短语语料获取方法及短语语料获取装置的说明书内容是....请下载后查看

因篇幅问题不能全部显示,请点此查看更多更全内容

Top