搜索
您的当前位置:首页正文

一种文档向量生成方法[发明专利]

来源:六九路网
专利内容由知识产权出版社提供

专利名称:一种文档向量生成方法专利类型:发明专利发明人:金霞,杨红飞,张庭正申请号:CN201911025383.7申请日:20191025公开号:CN110852070A公开日:20200228

摘要:本发明公开了一种文档向量生成方法,该方法首先将文档中的每句话的字转换为一个列表,再将每句话的列表构成该文档的列表,最后将文档列表中的每个文字映射到唯一的整型数字,然后将窗口在文档列表中进行滑动,得到层级注意力网络的训练样本;其次构建包括词级编码器、词级注意力层、句级编码器、句级注意力层和文档注意力的层级注意力网络;然后构建语言模型框架,层级注意力网络和语言模型框架构成语言模型,对语言模型进行训练,模型中待训练的参数得以拟合,语言模型训练完后,将预测数据输入到模型中,可得到其文档向量。本发明方法在使用时,不需要每篇不同的文档都再次训练部分变量,极大降低了使用成本。

申请人:杭州费尔斯通科技有限公司

地址:310051 浙江省杭州市滨江区西兴街道阡陌路482号B楼第7层

国籍:CN

代理机构:杭州求是专利事务所有限公司

代理人:刘静

更多信息请下载全文后查看

因篇幅问题不能全部显示,请点此查看更多更全内容

Top