搜索
您的当前位置:首页正文

一种融合聚类算法的维汉机器翻译系统[发明专利]

来源:六九路网
专利内容由知识产权出版社提供

专利名称:一种融合聚类算法的维汉机器翻译系统专利类型:发明专利

发明人:艾山·吾买尔,刘文其,斯拉吉艾合麦提·如则麦麦提,西

热艾力·海热拉,早克热·卡德尔,买合木提·买买提,汪烈军,刘胜全

申请号:CN202010140937.4申请日:20200303公开号:CN111368563A公开日:20200703

摘要:本发明公开了一种融合聚类算法的维汉机器翻译系统,由使用gensim中的Doc2vec训练维吾尔语句子向量模型;使用k‑means方法实现维吾尔语的文本聚类;使用transformer结构训练维汉机器翻译模型;使用微调的方法将聚类后的每一类数据分别微调机器翻译模型得到k个子翻译模型,融合以上方法实现了对维吾尔语的向量化,聚类并训练维汉翻译模型,其特征在于:由于长度较短的句子很难有丰富的语义信息。该发明根据句子长度和k‑means聚类的方法更加细分了语料中的各种特征,从而提高了维汉机器翻译的翻译质量。

申请人:新疆大学

地址:830046 新疆维吾尔自治区乌鲁木齐市天山区胜利路666号

国籍:CN

代理机构:北京汇捷知识产权代理事务所(普通合伙)

代理人:张丽

更多信息请下载全文后查看

因篇幅问题不能全部显示,请点此查看更多更全内容

Top