针对视频场景动态多变导致模型精度降低、复杂环境下模型收敛困难的问题,提出场景自适应的在线多视图融合视频摘要算法,利用语义、图像熵、视觉信息等融合的域无关特征对模型奖励进行奖励设计,同时降低特征空间以加速模型微调的收敛速度。
算法基于python3.6+环境下的torch、numpy、cv2等依赖库开发。算法输入为多摄像头拍摄的监控视频,输出为输入视频的内容摘要视频。该算法支持在Office、Campus等数据集上进行多视图视频摘要的检测,同时也支持在线多视图视频摘要检测。
算法名称 | 场景自适应的在线多视图融合视频摘要算法 |
算法接口 | python3 main.py |
输入 | 多摄像头拍摄的监控视频 |
输出 | 输入视频的内容摘要视频 |
支持数据集 | Office、Campus等 |
依赖库 | torch、numpy、cv2等 |
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!