计算机视觉方向的顶级学术会议之一国际计算机视觉大会(ICCV)近日在韩国首尔落幕。会议期间举办的视频描述竞赛(VATEX Captioning Challenge)结果也同时揭晓。中科院自动化所视频内容安全团队和人民中科智能技术有限公司组成的联合团队在中英文描述两个赛道均获冠军。
“人民中科”是人民网与被称为“人工智能国家队”的中科院自动化所强强联合,共同发起设立的人工智能科技公司。人民中科融合了人民网的内容风控能力和中科院自动化所的人工智能技术储备,人民中科作为人民网的“人工智能技术引擎”,将围绕“人工智能+内容安全”,深耕行业需求,攻克核心关键技术,研发一系列内容风控产品。
据了解,ICCV会议由电气和电子工程师协会(IEEE)主办,每两年召开一次,被中国计算机学会等机构评为最高级别学术会议,在业内具有极高的评价。本次比赛由国际计算机视觉大会ICCV和美国加州大学圣巴巴拉分校UCSB联合举办,分为中文描述和英文描述两个赛道,吸引了来自美国、欧洲、亚洲等世界各地20多支代表队,包括英国帝国理工大学、澳大利亚阿德莱德大学、北京大学、人民大学等知名高校都派出代表队参赛。
冠军联队由中科院自动化所研究员、人民中科首席科学家胡卫明,中科院自动化所研究员、人民中科董事长李兵,以及中科院自动化所副研究员原春锋带队指导,团队成员包括研究生张子琦、史雅雅和魏久桐。
“视频描述,简单来讲就是给出一段视频,让机器自动用文字进行描述,类似于‘看视频说话’。”李兵告诉人民网记者,视频描述涉及到计算机视觉和自然语言处理两个领域,而且视频中有表观、运动、语义属性甚至语音等多个模态。“因此如何更好地融合多模态信息,成为本次比赛的最大挑战。此外,在没有大量样本训练的前提下,还需要采取恰当的训练方式。”
李兵说,团队坚实的技术积累是获胜的重要基础。他表示,视频内容安全团队是中国科学院自动化研究所模式识别国家重点实验室中以互联网内容理解与安全为主要研究方向的研究组。团队深耕视频理解与内容安全近20年,已在人工智能权威国际学术期刊和会议上发表论文200余篇。近年来作为第一完成单位获得北京市科学技术一等奖、北京市发明专利一等奖、吴文俊人工智能科学技术奖一等奖等多项奖励。主持了国家自然科学基金重点项目、重大国际合作项目、联合基金重点支持项目、国家杰出青年基金项目,国家863重点专项项目、北京市自然科学基金重点项目等三十余项重大科研项目。