高斯模糊算法的 C++ 实现

  • 时间:
  • 浏览:0

  (1)支持多系统系统进程除理。根据我的观察,系统系统进程数设置为和 CPU 核心数相同是比较合适 的。系统系统进程数比 CPU 核心数更多,也是没哪些意义的,机会算法执行时,CPU 机会满负荷运转了。开启更多系统系统进程,随可不上能再提高速率了。

  起初我是按照算法理论直接实现,即使用了二维高斯模板,结果发现除理时间很长,对那我图片竟然能达到合适 数分钟之久。那我肯定是不对的,全都我百度了一下,发现你这些 问題图片应该采用分别进行两次一维高斯模糊就还可不可不上能 了[1],那我算法的时间繁杂度的那我系数,就从 O ( σ ^2 ) 降低到了 O ( σ )。那我算法于是速率提高到了毫秒级。下表给出分别用二维模糊的原始法律依据 ,和两次一维模糊累加的法律依据 的算法成本比较:

  图3. 算法(2)中一维模糊的上边结果

  图 2. 二维模板的可视化结果

  对算法的使用法律依据 :

  假设 CPU 核数为 p,开启的多系统系统进程数量 >= p,则算法速率合适 为单系统系统进程除理的 p 倍。(当 CPU 满负荷时,系统系统进程数量取得更大,也这么提高速率的意义了)

  2008 年在那我 PS 讨论群里,有女外国老外不解 Photoshop 的高斯模糊中的半径是哪些含义,后后 当时我写了这篇文章:

  (3)高斯半径:即 σ。算法的常数系数为 O(σ)。很显然,σ 的值取得越大,算法耗时机会越长。在 DEMO 中,其允许范围和 Photoshop 的要求一致,是 [0.1, 2200]。

  在系统系统进程界面的客户区下方有那我控制面板,还可不可不上能 选折 高斯模糊的算法参数,高斯半径的意义和 Photoshop 中的高斯模糊半径的意义相同,也有算法中的 σ。

  图4. DEMO 系统系统进程的主窗口 UI

  此图来自参考资料 [1],根据资料文中叙述,此图实际来源于(Maybe blocked by the GFW)

  通过点击菜单 - 可视化 - 二维高斯模板还可不可不上能 在右侧的视图中生成那我灰度图片,即二维高斯模板的可视化结果。

  【参考资料】

  (2)Demo 全部源码(涵盖 GaussBlurFilter.hpp 和 可执行文件):GaussBlurDemo_Src.zip

  (2)浮点类型:支持 float 和 double。它是高斯模板的数据的类型,也是进行像素加权累加时的数据类型,根据我的观察,float 和 double 的速率相差不大。基本相同。

  

  

  仅在你这些 图片的例子中,我把我写的算法的除理结果,在 Photoshop 中打开和 Photoshop 自带的高斯模糊的除理结果做差值对比,发现两者是相同的。

  在那篇文章中,主要讲解了高斯模糊中的半径的含义,是二维正态分布的方差的平方根,后后 给出了算法的理论描述。现在我又打算把该算法用 c++ 实现出来,于是有了下面的你这些 DEMO。

  需要注意的是,在多系统系统进程除理中,我使用了 Windows API (相似 CreateThread)等,这使得 GaussBlurFilter.hpp 目前只能用在 Windows 平台,机会要在全都平台使用,应当修改和多系统系统进程有关的 API 函数调用。

  二维高斯模板的计算公式是:

  (1)Demo 可执行文件(涵盖 GaussBlurFilter.hpp):GaussBlurDemo_Bin.zip

  注:此处的 CPU 核心数应该为 CPU 的物理核心数,而非模拟出来的多核数目。

  (上式为编程语言表达,非数学表达,即利用了整数除法对小数次责的截断性。)

  

  

  一种算法在高斯半径为常数条件下,也有关于图片大小的线性算法,区别在于常数系数的大小不同,前者是高斯半径(模板尺寸)的平方级,后者是高斯半径(模板尺寸)的线性级别。你这些 改进,非常相似于我此前有一篇博客中给出的,对另一四百公里 画效果滤镜的算法改进,也是通过把常数系数,从模板尺寸的平方级别降低到线性级别,使算法速率获得提高的。

[注] 文中的公式,采用如下网址生成:http://www.codecogs.com/latex/eqneditor.php

  [1]. 高斯模糊算法的实现和优化;

  int r = ( int ) ( sigma * 3 + 0.5 );  // 全部模板的逻辑尺寸:( 2 * r + 1 ) * ( 2 * r + 1 );

  在理论上,高斯模板是无边界和无限扩展的那我二维曲面,在实现时,就需要对你这些 曲面截断为有限大的二维模板。这么在哪里截断呢?根据下图所示的一维正态分布贡献:

  在实现算法时,我也尝试了对 255 个灰度值 * 模板数据的结果进行缓存和查表除理,后后 发现只能有效提高速率,全都最终我放弃了你这些 法律依据 。这机会是机会,算法的计算随后那我浮点乘法,对数据的读取动作,何必 能做到比浮点乘法变慢。全都这里采用缓存也就显得这么必要了。

  我实现的 DEMO 系统系统进程(Windows 平台)的界面如下所示:

  在本 DEMO 中,滤镜除理是放到 UI 系统系统进程中进行的,这使得在滤镜除理时间较长时(相似高斯半径取值很大,图片也很大),界面会全都卡,还可不可不上能 把滤镜除理动作放到那我新建的后台系统系统进程中执行。这是比较容易实现的。

  【相关下载】:

  图1. 正态分布的贡献比

  采用算法(2),要完成高斯模糊,对图片分别进行那我方向的一维高斯模糊即可。相似,先对图片进行水平方向的模糊,得到上边结果,后后 再对你这些 上边结果进行垂直方向的模糊,即得到最终结果。下图是那我演示图,给出了原图在那我方向上分别单独进行一维高斯模糊的结果,以及最终的结果:

  

  深度值还可不可不上能 为正也还可不可不上能 为负,但像素数据的地址 lpBits 都需随后所有像素中,地址值最小的那个像素的地址。即,假设图片左上角点的坐标为原点,机会图片深度为正数(bottom - up),则 lpBits 是左下角像素 (col = 0,row = height - 1)的地址。机会图片深度为负数(top-down),则 lpBits 是左上角像素(col = 0,row = 0) 的地址。图像数据的扫描行深度需要以 4 Bytes 对齐,即通过下面的公式计算扫描行深度:

  注:当然上边的空间繁杂度何必 是绝对的,相似,还可不可不上能 通过对图像进行串行的切片除理,既可减小算法(2)的空间需求。

  算法参数中:

  bpp:图像的像素位深度。只支持 8 (灰度索引图像),24,32 这几次值。对于 32 bpp 的图像来说,最后那我像素通道是表征像素的不透明度,也随后 alpha,对于 alpha 怎么可不上能参与到算法中,我要了下,有多种除理法律依据 ,但都好像没哪些容易理解的物理意义,全都在代码里我忽略了 alpha 通道。

       参考自:博客中插入公式——之在线数学公式生成;

  int stride = ( bmWidth * bpp + 31 ) / 32 * 4; //扫描行深度,对齐到 4 Bytes

  图 2 中,左侧是朋友常见的 3 x 3 模板(σ ≈  0.849),围绕中心点的 3 x 3 的浮点数据为:

  对Photoshop高斯模糊滤镜的算法总结;

  在 C++ 系统系统进程中,使用我写的你这些 算法是非常简单的,相似:

  从图 1 中还可不可不上能 看完,在 3σ 以外的贡献比例非常小,为 0.1 %,后后 朋友截断模板时,对模板边界定义为 3σ ;

  http://zh.wikipedia.org/wiki/File:Standard_deviation_diagram.svg。

  其中:σ :方差平方根(Photoshop 中的高斯模糊半径);n = w * h (图片的像素数量)。具体时间和图片大小和高斯半径的大小有关,那我粗略的合适 具体情况为,算法(1)的耗时为分钟级,算法(2)的耗时为毫秒到秒级。可见算法(2)比算法(1)速率变慢,但相比算法(1)来说算法(2)具有较高的空间需求。

  下图给出了二维模板的可视化结果。采用的可视化法律依据 是,根据上边的公式和模板边界,生成二维高斯模板,后后 取那我缩放因子 f = 255 / 模板中心点的数据,以此缩放因子把模板数据等比缩放,后后 绘制成灰度图片,那我中心点的亮度就被提高到最亮。可视化效果中,每个单元格对应着那我模板数据,单元格大小为 8 * 8 机会 16 * 16 像素。