场景自适应的在线多视图融合视频摘要算法

针对视频场景动态多变导致模型精度降低、复杂环境下模型收敛困难的问题,提出场景自适应的在线多视图融合视频摘要算法,利用语义、图像熵、视觉信息等融合的域无关特征对模型奖励进行奖励设计,同时降低特征空间以加速模型微调的收敛速度。

针对视频场景动态多变导致模型精度降低、复杂环境下模型收敛困难的问题,提出场景自适应的在线多视图融合视频摘要算法,利用语义、图像熵、视觉信息等融合的域无关特征对模型奖励进行奖励设计,同时降低特征空间以加速模型微调的收敛速度。 

  算法基于python3.6+环境下的torch、numpy、cv2等依赖库开发。算法输入为多摄像头拍摄的监控视频,输出为输入视频的内容摘要视频。该算法支持在Office、Campus等数据集上进行多视图视频摘要的检测,同时也支持在线多视图视频摘要检测。


算法名称

场景自适应的在线多视图融合视频摘要算法

算法接口

python3 main.py 

输入

多摄像头拍摄的监控视频

输出

输入视频的内容摘要视频

支持数据集

Office、Campus等

依赖库

torch、numpy、cv2等

Gitlab链接:ACK · GitLab (crowdhmt.com)

你可能感兴趣的文章

相关问题

0 条评论

请先 登录 后评论
LH
LH

14 篇文章

作家榜 »

  1. Panda-admin 37 文章
  2. 解弘艺 17 文章
  3. 高曾谊 16 文章
  4. 旺仔牛奶opo 15 文章
  5. 胡中天 14 文章
  6. LH 14 文章
  7. 罗柏荣 13 文章
  8. 林晨 12 文章