SIMD or Algorithm - 0010

时间：2019-10-10 14:59:56 阅读：93 评论：0 收藏：0 [点我收藏+]

传统方法+OpenMP

使用OpenMP对传统方法进行优化。感谢OpenMP，实现多线程优化方便多了!多核时代，OpenMP将成为我们的利器!

float test_Normal_OMP_Filter() {
  BYTE* buf = (BYTE *)malloc(1024 * 1024 * sizeof(int));  //分配内存
  BYTE* ptr = buf; // 内存指针

  //背景色，用于和前景色进行溶合
  int background_R = 0xF8, background_G = 0xF8, background_B = 0xF8;
  int dr, dg, db; // 过滤比值分量

  BEGIN_PERF() // 计时开始

  // 内外层都使用默认的OMP，指定不同的线程数会得出特定于机器的结果
  #pragma omp parallel for

  for ( int h = 0; h < 1024; h++ ) {
    //内层的线程
    #pragma omp parallel for
    for (int w = 0; w < 1024; w++ ) {
      // 具体操作过程与传统方法一样
      if ( (*(int *)ptr & 0x00070707) != 0 ) {
          dr = (int)*(ptr + 2) << 8;
          dg = (int)*(ptr + 1) << 8;
          db = (int)*(ptr + 0) << 8;

          *(ptr + 2) = ((int)*(ptr + 2) * (65535 - dr) + background_R * dr) >> 16;
          *(ptr + 1) = ((int)*(ptr + 1) * (65535 - dg) + background_R * dg) >> 16;
          *(ptr + 0) = ((int)*(ptr + 0) * (65535 - db) + background_R * db) >> 16;
      } // if

      ptr += 4; // next pixel
    } // for
  } // for

  END_PERF() // 结束计时
  free(buf); // 释放内存
  return GET_PERF();  //返回计时结果
}

使用OpenMP这个利器，即使使用默认设定，也能得到比非OMP方法快17%-23%的结果。看来，多核时代OpenMP必将大行其道!

SIMD or Algorithm - 0010

原文：https://www.cnblogs.com/igame2000/p/11647774.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)