博云视觉出席第116次ISO/MPEG国际标准会议

博云视觉 2016-10-25 15:57 工具软件 来源:思达派 查看原文

116ISO/IEC JTC1运动图像专家组MPEGMoving Picture Experts Group)国际标准会议,于20161014日至21日,在中国成都召开。

WechatIMG16.jpeg

博云视觉公司作为代表参加了本次会议,并联合北京大学、新加坡南洋理工大学针对“面向视频分析的紧凑视觉描述子CDVACompact Descriptors for Video Analysis)”标准提交了提案。


MPEG是国际标准化组织(ISO)和国际电工委员会(IEC)第一联合技术组(JTC11988年成立的运动图像专家组(Moving Picture Expert Group)的简称,全称为ISO/IEC JTC129分委会第11工作组(ISO/IEC JTC1/SC29/WG11),负责数字视频、音频和其他媒体的压缩、解压缩、处理和表示等国际技术标准的制定工作。从1988年开始,MPEG专家组每年召开4次左右的国际会议,讨论收到的各种技术提案,起草标准及相关文件,制定、修订、发展MPEG系列多媒体标准。视音频编码标准MPEG-1(1992)MPEG-2(1994)、基于视听媒体对象的多媒体编码标准MPEG-4(1999)、多媒体内容描述标准MPEG-7(2001)、多媒体框架标准MPEG-21等,目前,MPEG系列国际标准已经成为影响最大的多媒体技术标准,对数字电视、视听消费电子产品、多媒体通信等信息产业的重要产品产生了深远影响。

WechatIMG15.jpeg

本次会议上,共有来自中国、美国、德国、韩国等20多个国家,包括来自华为、高通、苹果、三星等400多名业界代表出席参加,共收到692份提案。


MPEG CDVA标准目的在于规范面向视频的紧凑视觉特征表示,使得基于高效的紧凑视觉特征,能够支持对视频内容的分析,包括

1)目标对象的检索;

2)对象和事件的检测;

3)视频场景分类。


当前该标准主要关注面向海量视频数据中搜索目标物体或场景的紧凑特征表示技术的规范化。CDVA标准需求于20138月的第105次维也纳会议上正式提出,经历需求讨论、数据集收集、评价框架制定后,于20162月的第112次华沙会议上发布CfPCall for Proposals),此后经过113114115和本次会议的核心技术实验(Core Experiment),形成了CDVA标准的实验模型CXM1.0Experiment Model)。


WechatIMG18.jpeg

本次会上,博云视觉公司与北京大学、新加坡南洋理工大学联合提交的提案《Improved retrieval and matching with CNN feature for CDVA》在CXM0.2的基础上,引入了当前工业界热门的深度学习技术,提取语义特征,结合CXM0.2所采用的底层生物视觉特征表达,在约1600小时视频数据和9000多个查询测试评价框架下,将视频目标对象搜索的平均准确率从72%提升至83%。通过大量实验和实际应用表明,融合深度学习语义特征和底层生物视觉特征,能够获得比单独使用任何一种特征都要好的搜索效果。会议中,各国专家对该提案给予了高度评价,反响热烈,并针对融合深度学习特征与底层视觉特征专门设立核心实验,期望未来进一步解决深度学习模型压缩和深度学习特征编码等问题,以此作为未来CDVA技术路线探索的新方向。


MPEG CDVA是多媒体内容描述标准MPEG-7体系下的面向视频分析的国际标准,该体系下的上一代国际标准面向视觉搜索的紧凑描述子(Compact Descriptor for Visual Search, CDVS已于2015年颁布。博云视觉主要技术骨干曾参MPEG CDVA标准的制定,并贡献了一半以上的专利技术。

图片 1.png

为您推荐: