专利名称:一种视觉场景描述方法及系统专利类型:发明专利发明人:张旻晋,许达文申请号:CN202110174352.9申请日:20210209公开号:CN112801017A公开日:20210514
摘要:本发明公开的一种视觉场景描述方法及系统,先对视频当前帧图像进行连续性要素处理后,将视频历史帧图像描述语句与连续性要素结果分别进行转换操作获得两组特征向量,将两组特征向量合并后推理运算生成图像描述词汇信息;再对图像描述词汇信息进行一系列处理后得到当前帧图像的最优描述语句;最后以当前帧图像的最优描述语句为下一帧图像的历史帧图像描述语句,循环处理下一帧图像;根据连续性要素处理对视频的图像进行包含多种特征的描述,同时以视频当前帧图像与历史帧图像描述语句来结合推理,具有极大的视觉刻画能力;不仅使视频的上一帧图像与下一帧图像建立连续性关系,而且减少了计算量和内存占用,减少边缘设备工作量。
申请人:成都视海芯图微电子有限公司
地址:610000 四川省成都市中国(四川)自由贸易试验区成都高新区世纪城南路599号6栋5层505号
国籍:CN
代理机构:成都行之专利代理事务所(普通合伙)
代理人:张超
更多信息请下载全文后查看
因篇幅问题不能全部显示,请点此查看更多更全内容