项目介绍:
新媒体时代,网络视频呈爆炸式增长,已经成为人们工作、生活、娱乐必不可少的媒体资源,在带来丰富信息的同时,也引发了检索难、识别难、自动分析程度低等问题,导致视频所携带的大量信息难以高效利用,视频监管更因视频内容中的不良信息难以判断而陷入困局。鉴于此,本项目面向视频中特定事件的识别与理解,从事件语义定义、视频流特征空间描述入手,利用基于视频帧变化过程中的同源连续性原理,开展了视觉感知特性的仿生图像处理方法、融合数据驱动和知识驱动的联合学习以及典型事件的多样性与小样本学习等关键技术研究,通过模拟视觉皮层感受和量化同源连续性规律,建立了结合视觉感知特性的卷积神经网络模型和面向视频流的拓扑积神经网络模型。