腾讯科技讯 12月13-14日,由LiveVideoStack音视频技能社区携手CSDN建议的LiveVideoStackCon 2019在深圳正式举行。会上,来自腾讯多媒体实验室的李松南总监带来了题为 《图画视频降噪的今日与未来:从经典办法到深度学习》的主题讲演,对图画视频降噪技能的现状及开展前途进行了浅显易懂的阐释。
(腾讯多媒体实验室总监李松南)
作为多媒体技能范畴的盛会,LiveVideoStackCon音视频技能大会聚集音频、视频、图画、AI等技能的最新探究与运用实践,掩盖交际、游戏、智能设备等职业范畴,面向工程师、技能担任人等职业相关人士共享技能创新与最佳实践。本次大会,聚集了60余名海内外技能专家和150余家参会企业环绕前沿技能开展进行讨论。
关于喜爱赏识老电影的用户来说,图画视频中的噪声其实是十分了解的事物。在将胶片办法的内容转化为数字格局存储时,由传感器、扫描仪电路所发生的图画亮度或颜色的随机动摇被称为视频噪声——在赏识电影时呈现的闪耀、含糊、颜色不均匀等现象均是由此导致的。无独有偶,在运用数码相机进行相片拍照时,当相机的感光度被调到较高的数值时,拍照到的画面中很简略呈现噪点。噪点的呈现极度影响了相片的观赏性,为了处理这一问题,图画视频降噪技能便应运而生。
腾讯多媒体实验室,交融经典办法和深度学习技能,在图画视频降噪范畴现已堆集多年,研究成果现已在腾讯云、全民K歌、微视等腾讯内外部产品、场景中大规模的运用。
探究图画视频降噪技能,经典办法+深度学习左右开弓
据李松南介绍,腾讯多媒体实验室在图画视频降噪范畴现已堆集多年。以数码相机拍照发生的噪点为例:噪声主要是因为感光元器件接纳光子的随机性发生,而单位面积内均匀接纳到的光子越多,信号的信噪比越大,人眼感受到的噪声就越小。因而可以终究靠增大感光元件的尺度,进步单位感光面积来进步信噪比,这也便是为什么数码相机范畴素有“底大一级压死人”的说法。“咱们还可以运用更先进的感光元件技能以及像素交融(多个像素组组成一个像素,进步单位像素内的光信息量)的办法来处理这一问题,这也是现在图画视频降噪技能范畴常见的硬件手法。”
因为制作工艺的约束,在同一技能框架下,硬件不可能做到无止境的进步,为了进一步处理噪声问题,需求凭借软件。根据核算模型的单帧降噪是可选项之一,它具有速度快、作用好的特色。与之相对的,为了补偿单帧降噪运用场景的局限性,多帧降噪也是现在常见的降噪办法。简略来说,多帧降噪经过对齐和交融的过程,将接连的多帧图画组成一帧图画,增加了图画的信噪比,克服了长期曝光带来的图画含糊。
为了进一步进步降噪的质量和功率,近年来运用广泛的深度学习办法也被运用在了图画视频降噪范畴。李松南表明,根据深度学习的降噪算法,在核算复杂度方面还存在较大问题,但随着硬件才能的晋级以及异构核算的运用,复杂度问题现已渐渐开端得到处理。 此外,大规模的实在噪声数据库、模仿实在噪声等技能手法的呈现,也让深度学习办法的功率和质量获得了进一步的进步。现在腾讯多媒体实验室在该范畴的研究成果已大规模的运用于腾讯云、全民K歌、微视等腾讯旗下的产品之中。
展望未来,图画视频降噪技能大有可为
在建国70周年纪念日之际,高清重制的《开国大典》横扫各大交际渠道,圈粉很多,而图画视频降噪技能在重制的过程中扮演了极为重要的人物。现在,图画视频降噪技能呈现出硬件化、智能化以及多功能化三个开展的新趋势,经过数据收集端的专用硬件,辅以更高的深度学习比重以及构建可以一起处理多种失真的模型的办法,完成愈加高效、愈加快捷的图画视频降噪处理。
腾讯多媒体实验室,专心于多媒体技能范畴的前沿技能探究、研制、运用和落地,包括音视频编解码、网络传输和实时通讯,根据信号处理和深度学习的多媒体内容处理、剖析、了解和质量评价,互动沉溺式媒体(VR、AR、点云等)体系规划和端到端处理方案;一起担任国际国内职业标准拟定,包括多媒体数据压缩,网络传输协议,多媒体体系和开源渠道等。
李松南介绍说,“咱们将在未来进一步发力图画视频降噪技能,将渐渐的变多如《开国大典》一般具有着重要意义的印象材料以高清晰度重现在咱们面前。未来,咱们还将看到这一技能在更多的范畴大放异彩。”