蒙少华 中青报·中青网记者 孙海华
随着5G、AI及移动互联技术的发展,各类在线视频应用已融入人们的日常生活。海量多元的视听内容跨应用、跨平台、跨终端成功传输的背后,离不开统一的视觉媒体通信标准。
鲜为人知的是,西安电子科技大学(以下简称“西电”)通信工程学院多媒体通信实验室,从2006年起即聚焦视频编码标准、优化及沉浸视觉媒体通信等领域,联合我国多家头部企业深度参与国际视觉媒体通信标准的研制,为提升全球用户稳定清晰的视觉体验、提升我国在国际通信标准领域的影响力作出重要贡献。
勇往直前,“西电技术”融入“世界标准”
“第一次参与视频编码标准技术研究,起源于与华为的合作。”多媒体通信实验室负责人杨付正回忆。那是21世纪初,随着互联网技术的发展,用户对视频交互、清晰度的需求不断增长,网络带宽资源有限、视觉数据流量消耗过大成为逐渐显现的矛盾。
2003年5月,在视频编码领域国际影响力最强的国际标准化组织ISO和国际电信联盟ITU联合制定的H.264/AVC视频编码标准落地。
彼时,视频编码标准几乎由欧美和日韩等国家把持,标准技术背后的专利也主要掌握在他们手中。这样的现状,使包括中国在内的多个国家的众多企业面临尴尬局面:要布局自身视频应用业务,就必须使用H.264/AVC视频编码标准,而这要付出的代价就是——每年要来自欧美等国的相关机构缴纳专利费数十亿美金。
2005年,为将自研视频编码技术融入标准,在全球竞争环境中拥有更多主动权,华为与西电在成立联合实验室的基础上,共同开展技术攻关。西电也因此在视觉媒体编码领域,成为国内最早参与国际标准研制的高校。
摆在多媒体通信实验室面前的,除了克服未知的技术难题,还要面临紧张严苛的竞争流程:其一,国际标准化组织的工作以国家为单位展开,西电在多媒体通信方面提出的技术新提案,只有通过归口单位中国电子技术标准化研究院进行备案后,才能以中国代表团的身份出现在国际标准会议上。其二,在国际标准会议会场上,要面对的是全球数百名领域内的知名专家对提案的多轮审议,只有专家们一致认为优秀的算法才能进入代码公开和核心实验环节,并在经过多轮性能验证、多单位方案性能PK等流程胜出后,全场专家无异议的条件下,方能被相应的国际标准采纳。
过程严苛又艰辛,但研究者们并非毫无准备。早在1999年,西电就已开始进行视觉媒体编码和通信核心理论研究,积累了大量相关研究经验,在成像、编码、传输、质量评估等领域取得了多项理论突破和技术落地应用。
2006年10月,经过充分准备,多媒体通信实验室提出的运动信息共享机制,终于第一次出现在国际标准会议的会场上。经过曲折的验证、优化和技术比拼,最终被H.264/AVC视频编码标准采纳。
“刚开始提出的技术,因为缺乏芯片设计经验,缺少对内存控制的考量,虽然技术性能优异,但对硬件设计不够友好而被要求改进,好在经过与华为硬件设计技术专家的沟通,成功优化了算法,我们的初步尝试取得了成功。”杨付正激动地说道。
贯通巧思,“西电智慧”在国际舞台上获得认可
首次尝试成功,给了多媒体通信实验室团队更大的信心。
2018年4月,ISO/ITU国际标准会议现场,德国弗劳恩霍夫学会(欧洲最大的应用科学研究机构)作为视频编码研究的世界权威机构,首次将人工智能技术引入标准的研制,设计出一套基于神经网络的视频编码技术。由于该方案一直存在存储空间占用过大、计算资源开销过高等弊端,经过长期推进仍未被标准采纳。
多媒体通信实验室师生潜心分析视频特性,尝试解构HHI编码技术背后的设计逻辑,并给出自己的优化方案。
2019年7月,日内瓦ITU(国际电信联盟)总部会场,实验室老师霍俊彦郑重提出了对HHI方案的重大改进——“我们的改进方案能够在提高原方案性能的基础上,解决其实用性问题。”提案讲解结束后,会场经历短暂的沉寂,来自HHI的专家开口说道:“I support you!(我支持你!)”
这和以往在场专家相继举手质疑、批评声音占据主流的情境不同,一时间让霍俊彦的心里打起了鼓。
惊喜、忐忑,夹杂着紧张和难以置信,走出会场的霍俊彦给杨付正拨出了电话:“在国际标准会场上,HHI一直就像一个‘学霸’,他们的‘I support you’到底是什么意思啊?”
在随后收到的邮件中,霍俊彦确认了HHI对西电方案的认可,“他们惊讶于我们对这项技术更为深入的理解,主动寻求我们的帮助来解决他们的难题。”最终,西电与HHI联合将人工智能技术首次引入到H.266/VVC视频编码标准框架中,有效提升了编码性能,“西电智慧”在国际舞台上得到充分肯定。
聚沙成塔,“西电声音”响彻国际标准舞台
西电多媒体通信实验室的技术水平迅速得到学术和工业界的认可。国家多家头部企业及海外顶级公司纷纷主动上门,寻求研发合作。
2010年开始,实验室全程参与H.265/HEVC视频编码标准研制,与高通合作为H.265/HEVC提供一整套视频+深度的高效编码平台;H.266/VVC时期,作为提案的主要贡献方,直面全球竞争,提交了80余项技术提案,将11项核心算法推入H.266/VVC标准。
伴随着新兴沉浸视觉应用的加速涌现,以三维点云和网格为代表的下一代视觉媒体成为国际标准化组织关注的重点。西电多媒体通信实验室团队也面向未来三维沉浸媒体的技术及标准,持续发起技术攻关,先后在沉浸式场景描述、三维点云和动态网格编码领域提出多项先进技术,并被相应标准采纳。
截至目前,团队累计向标准化组织提交技术提案300余项,采纳100余项,成为领域内国际标准提案接收数量最多的国内学术团体,在国际标准会场发出了强有力的西电声音。
2023年4月28日,多媒体通信实验室教师张伟和邹文杰分别收到国际标准化组织的任职通知,这也是国家信息技术标准化委员会派出的专家,首次在沉浸媒体编码标准研制中担任标准软件负责人的职务。
至此,西电已从国际标准制定过程中的被动跟随、融入的角色,变成审议、评判标准技术的一方。在国际标准会场上,西电的话语权正不断提升。
2023年4月,西电通信工程学院大四学生王俊杰,第一次出现在土耳其安塔利亚全球标准会场第142次会议上。5天的会议,他近距离接触到张伟和邹文杰老师的工作实况,“超过100家科研机构代表阐述提案;专家现场审议2000多个技术提案,每天连续工作16小时以上是常态”。
多媒体通信实验室的杨鹤杰、孙喆、李程程等多名学生,也都曾前往现场,近距离感受国际标准会议的高规格、高标准、高质量。
这是西电人才培养理论基础和实践能力“两手抓”的体现。“感受到了标准研制工作的严谨,也坚定了自己在标准领域继续深耕的决心。”王俊杰说。