acm-header
登录

ACM通信

研究突出了

技术角度:图像处理回归基础


近年来,数码相机中的图像传感器在很多方面都有了改进。空间分辨率的提高是众所周知的。同样重要但不那么明显的是,噪声水平和动态范围的改善。在这一点上,数码相机已经变得如此之好,以至于显示其图像数据的全部丰富性是一个挑战。低噪声成像仪可以捕捉细微变化的细节,只有将显示对比度调高到不自然的高度才能看到。高动态范围(HDR)成像仪则有相反的问题:如果不使对比度不自然地低,它的数据就无法显示。为了向人类观察者传达视觉信息,通常需要呈现一幅物理上不正确的图像,但它揭示了所有在视觉上重要的颜色和强度变化。这门学科被称为计算摄影已经出现在摄影、计算机视觉和计算机图形学的交汇处,而细节增强和HDR范围压缩(也称为色调映射)这两个问题已经成为公认的重要课题。

对于单独的图像patch,找到能够有效传递局部视觉信息的显示参数并不困难。问题是这个补丁必须与它周围的所有其他图像补丁共存,这些补丁必须合并成一个单一的、全局一致的图像。人们提出了许多技术来寻找一幅既能清晰显示所有内容,又看起来像自然图像的图像。在努力实现所有局部约束之间的全局妥协时,这些技术往往会引入视觉上令人不安的伪影,例如强边缘周围的光晕,或明显的对比度、锐度和局部特征位置的扭曲。

通过使用越来越复杂的图像处理技术,性能得到了提高,可以在多个空间尺度上平滑地处理信息,同时保持尖锐边缘的完整性。“边缘感知”处理的最新进展建立在各向异性扩散、正则化和稀疏图像编码等主题的工作的基础上。利用鲁棒估计的思想,设计了新的边缘感知滤波器。新形式的小波分解已被引入,特别是处理挑战处理尖锐的边缘在多尺度表示。然而,没有一种方法被证明是完全令人满意的,其中一些是相当复杂的。

在接下来的论文中,Paris等人做出了令人惊讶的举动。他们选择在拉普拉斯金字塔上建立一个系统,这是一个非常简单的多尺度表示,早于小波。它缺乏一个令人印象深刻的数学谱系,但仍被广泛使用,因为它的简单和可靠性;它是许多图像处理方案的基本构建块。与此同时,拉普拉斯金字塔似乎不适合任何涉及边缘特殊处理的任务。它的基本功能是平滑的、重叠的和非定向的,而边缘是尖锐的局部化和定向的。

两位作者也避开了广泛的现代技术。事实上,这篇论文最引人注目的地方在于它所缺少的东西:没有统计图像模型,没有机器学习,没有偏微分方程,没有花哨的小波,也没有目标函数。相反,作者回到了今天很少看到的老式风格:在像素和补丁级别上仔细考虑问题,并以最直接的方式指定需求。应该指出的是,这些作者完全有能力在他们需要的时候开发复杂的机器,但他们选择在这里避免使用它。他们想从头开始重新思考这个问题,设定他们所希望的关于边缘、纹理和平滑区域的行为的基本原则。

他们的新方向完全出乎意料。打个比方,这几乎就像一些3D制造专家决定放弃他们的CAD系统和3D打印机,以用锤子和凿子雕刻大理石。有时,花哨的工具会妨碍你,最好的办法就是回到材料的直接接触。

这个案子的结果令人震惊。作者能够实现极端水平的细节增强和HDR范围压缩。几乎没有可见的人工制品。很难相信还有人能做得更好,从这个意义上说,问题已经解决了。

那么,这篇论文是最后的结论吗?不,因为漂亮的图片是不够的。将这项工作置于图像处理和计算摄影的更大世界中仍然是很重要的。这些技术如何与许多其他方法的细节增强和HDR范围压缩有关?如何将这篇论文的见解整合到其他语言表达的方法中,如小波或图像统计?更一般地说,这篇论文告诉我们关于边缘感知图像处理的潜在问题是什么?正如Paris等人在这里提出的修订研究所指出的,这些问题已经取得了进展。随着人们消化这篇新颖的论文的结果,我们可以期待更多的见解。

回到顶部

作者

爱德华·阿德尔森adelson@csail.mit.edu)是麻省理工学院大脑和认知科学系视觉科学的约翰和多萝西威尔逊教授。

回到顶部

脚注

查看所附文件,请访问doi.acm.org/10.1145/2723694


版权归作者所有。

数字图书馆是由计算机协会出版的。版权所有©2015 ACM股份有限公司


没有发现记录

登录为完全访问
»忘记密码? *创建ACM Web帐户
文章内容:
Baidu
map