二、操纵像素

在本章中，我们将介绍：

访问像素值
用指针扫描图像
使用迭代器扫描图像
编写有效的图像扫描循环
使用邻居访问扫描图像
执行简单的图像算术
定义兴趣区域

简介

为了构建计算机视觉应用，您必须能够访问图像内容，并最终修改或创建图像。本章将教您如何操作图像元素（又称像素）。您将学习如何扫描图像并处理其每个像素。您还将学习如何有效地执行此操作，因为即使尺寸适中的图像也可能包含数万个像素。

从根本上讲，图像是数值矩阵。这就是为什么 OpenCV 2 使用cv::Mat数据结构来操作它们的原因。矩阵的每个元素代表一个像素。对于灰度图像（“黑白”图像），像素为无符号的 8 位值，其中 0 对应于黑色，而 255 对应于白色。对于彩色图像，每个像素需要三个这样的值才能代表通常的三个原色通道（红绿蓝）。因此，在这种情况下，矩阵元素由值的三元组组成。

如上一章所述，OpenCV 还允许您创建具有不同类型（例如，整数（CV_8U）和浮点数[CV_32F）的像素值的矩阵（或图像）。这些对于在某些图像处理任务中存储例如中间值非常有用。大多数操作可以应用于任何类型的矩阵，其他操作则需要特定类型的矩阵，或者仅适用于给定数量的通道。因此，对函数或方法的先决条件有充分的了解对于避免常见的编程错误至关重要。

在本章中，我们使用以下彩色图像作为输入（请参见本书的网站以彩色方式查看该图像）：

Introduction

访问像素值

为了访问矩阵的每个单独元素，您只需要指定其行号和列号即可。将返回对应的元素，在多通道图像的情况下，该元素可以是单个数值或值的向量。

准备

为了说明对像素值的直接访问，我们将创建一个简单的函数，在图像中添加椒盐噪声。顾名思义，椒盐噪声是一种特殊类型的噪声，其中某些像素被白色或黑色像素代替。当某些像素的值在传输过程中丢失时，这种类型的噪声可能会出现在错误的通信中。在我们的例子中，我们将简单地随机选择一些像素并将其分配为白色。

操作步骤

我们创建一个接收输入图像的函数。这是将由我们的函数修改的图像。为此，我们使用了传递引用机制。第二个参数是我们要覆盖白色值的像素数：

void salt(cv::Mat &image, int n) {

   for (int k=0; k<n; k++) {

      // rand() is the MFC random number generator
      // try qrand() with Qt
      int i= rand()%image.cols;
      int j= rand()%image.rows;

      if (image.channels() == 1) { // gray-level image

         image.at<uchar>(j,i)= 255; 

      } else if (image.channels() == 3) { // color image

         image.at<cv::Vec3b>(j,i)[0]= 255; 
         image.at<cv::Vec3b>(j,i)[1]= 255; 
         image.at<cv::Vec3b>(j,i)[2]= 255; 
      }
   }
}

该函数由单个循环组成，该循环将n乘以255值乘以随机选择的像素。在此，使用随机数生成器选择像素列i和行j。请注意，我们通过检查与每个像素关联的通道数来区分灰度图像和彩色图像的两种情况。在灰度图像的情况下，将的数字255分配给单个 8 位值。对于彩色图像，需要为三个原色通道分配255，以获得白色像素。

您可以通过向其传递先前打开的图像来调用此函数：

   // open the image
   cv::Mat image= cv::imread("boldt.jpg");

   // call function to add noise
   salt(image,3000);

   // display image
   cv::namedWindow("Image");
   cv::imshow("Image",image);

生成的图像如下所示：

How to do it...

工作原理

类cv::Mat包括几种访问图像不同属性的方法。公共成员变量cols和rows为您提供图像中的列数和行数。对于元素访问，cv::Mat具有方法at(int y, int x)。但是，必须在编译时知道方法返回的类型，并且由于cv::Mat可以保存任何类型的元素，因此程序员需要指定期望的返回类型。这就是at方法已被实现为模板方法的原因。因此，在调用它时，必须指定图像元素类型，如下所示：

         image.at<uchar>(j,i)= 255;

重要的是要注意，确保指定的类型与矩阵中包含的类型匹配是程序员的责任。 at方法不执行任何类型转换。

在彩色图像中，每个像素与三个分量相关联：红色，绿色和蓝色通道。因此，包含彩色图像的cv::Mat将返回三个 8 位值的向量。 OpenCV 具有针对此类短向量的定义类型，称为cv::Vec3b。它是 3 个unsigned char的向量。这就解释了为什么元素访问彩色像素的像素写为：

         image.at<cv::Vec3b>(j,i)[channel]= value;

索引channel指定三个颜色通道之一。

2 元素和 4 元素向量（cv::Vec2b和cv::Vec4b）以及其他元素类型也存在类似的向量类型。在此后一种情况下，最后一个字母由short的s，int的i，float的f和double的d替换。所有这些类型都是使用模板类cv::Vec<T,N>定义的，其中T是类型，N是向量元素的数量。

另见

“编写高效的图像扫描循环”秘籍可讨论此方法的效率。

用指针扫描图像

在大多数图像处理任务中，需要扫描图像的所有像素才能执行计算。考虑到将需要访问的大量像素，以有效的方式执行此任务至关重要。本秘籍以及下一篇秘籍，将向您展示实现图像扫描循环的不同方法。该秘籍使用指针算法。

准备

我们将通过完成一个简单的任务来说明图像扫描过程：减少图像中的颜色数量。

彩色图像由 3 通道像素组成。这些通道中的每一个对应于三种原色（红色，绿色，蓝色）之一的强度值。由于这些值均为 8 位unsigned char，因此颜色总数为256x256x256，超过 1600 万种颜色。因此，为减少分析的复杂性，有时减少图像中的颜色数量很有用。一种简单的方法可以将 RGB 空间细分为相等大小的多维数据集。例如，如果将每个尺寸的颜色数量减少 8，那么您将获得总共32x32x32的颜色。然后，原始图像中的每种颜色在色彩缩减图像中被分配一个新的颜色值，该值对应于其所属的多维数据集中心的值。

因此，基本的色彩缩减算法很简单。如果N是缩小因子，则对于图像中的每个像素以及该像素的每个通道，将值除以N（整数除法，因此会丢失提示）。然后将结果乘以N，这将为您提供N在输入像素值以下的倍数。只需加N / 2，即可获得N的两个相邻倍数之间的间隔的中心位置。如果对每个 8 位通道值重复此过程，则总共将获得256 / N x 256 / N x 256 / N可能的颜色值。

操作步骤

我们的色彩缩减函数的签名如下：

void colorReduce(cv::Mat &image, int div=64);

用户提供图像和每个通道的缩小系数。此处，在原位中完成**处理，即通过该函数修改了输入图像的像素值。请参见“本秘籍的更多内容”部分提供了具有输入和输出参数的更通用的函数签名。

通过创建遍历所有像素值的双循环即可简单地完成处理：

void colorReduce(cv::Mat &image, int div=64) {

     int nl= image.rows; // number of lines
     // total number of elements per line
     int nc= image.cols * image.channels(); 

     for (int j=0; j<nl; j++) {

        // get the address of row j
        uchar* data= image.ptr<uchar>(j);

        for (int i=0; i<nc; i++) {

            // process each pixel ---------------------

                  data[i]=    data[i]/div*div + div/2;

            // end of pixel processing ----------------

        } // end of line                   
     }
}

可以使用以下代码片段测试此函数：

   // read the image
   image= cv::imread("boldt.jpg");
   // process the image
   colorReduce(image);
   // display the image
   cv::namedWindow("Image");
   cv::imshow("Image",image);

例如，这将为您提供以下图像（请参见本书的网站以彩色查看此图像）：

How to do it...

工作原理

在彩色图像中，图像数据缓冲区的前 3 个字节给出左上像素的 3 个颜色通道值，接下来的 3 个字节是第一行第二个像素的值，依此类推（请注意，OpenCV 使用，默认情况下，BGR 通道顺序，因此蓝色通常是第一个通道）。宽度为W且高度为H的图像将需要WxHx3个uchar的存储块。但是，出于效率原因，可以用很少的额外像素来填充行的长度。这是因为某些多媒体处理器芯片（例如 Intel MMX 架构）在行数为 4 或 8 的倍数时可以更有效地处理图像。值将被忽略。 OpenCV 将填充行的长度指定为关键字。显然，如果未用多余像素填充图像，则有效宽度将等于实际图像宽度。数据属性cols为您提供图像宽度（即列数），属性rows为您提供图像高度，而step数据属性为您提供有效宽度。字节数。即使您的图像不是uchar的类型，step仍会为您提供连续的字节数。像素元素的大小由方法elemSize给出（例如，对于 3 通道短整数矩阵（CV_16SC3），elemSize将返回 6）。图像中的通道数由nchannels方法给出（对于灰度图像为 1，对于彩色图像为 3）。最后，方法total返回矩阵中像素的总数（即矩阵项）。

然后，每行的像素值数量由下式给出：

     int nc= image.cols * image.channels();

为了简化指针算术的计算，cv::Mat类提供了一种直接为您提供图像行地址的方法。这是ptr方法。这是一个模板方法，返回行号j的地址：

        uchar* data= image.ptr<uchar>(j);

注意，在处理语句中，我们可以等效地使用指针算法在列之间移动。所以我们可以这样写：

        *data++= *data/div*div + div2;

另见

“编写高效的图像扫描循环”秘籍用于讨论此处介绍的扫描方法的效率。

使用迭代器扫描图像

在面向对象的编程中，通常使用迭代器完成对数据集合的循环。迭代器是专门构建的类，用于遍历集合的每个元素，隐藏了如何针对给定的集合专门对每个元素进行迭代。信息隐藏原理的这种应用使扫描集合变得更加容易。此外，无论使用哪种类型的集合，它的形式都相似。标准模板库（STL）具有与其每个集合类关联的迭代器类。然后，OpenCV 提供一个cv::Mat迭代器类，该类与 C++ STL 中的标准迭代器兼容。

准备

在此秘籍中，我们再次使用先前秘籍中描述的色彩缩减示例。

操作步骤

可以通过首先创建cv::MatIterator_对象来获得cv::Mat实例的迭代器对象。与cv::Mat_子类的情况一样，下划线表示这是模板方法。实际上，由于使用了图像迭代器来访问图像元素，因此必须在编译时就知道返回类型。然后，将迭代器声明如下：

     cv::MatIterator_<cv::Vec3b> it;

另外，您还可以使用Mat_模板类中定义的iterator类型：

     cv::Mat_<cv::Vec3b>::iterator it;

然后，您可以使用常规的begin和end迭代器方法遍历像素，但这些方法又是模板方法。因此，我们的色彩缩减函数现在编写如下：

void colorReduce(cv::Mat &image, int div=64) {

     // obtain iterator at initial position
     cv::Mat_<cv::Vec3b>::iterator it= 
               image.begin<cv::Vec3b>();
     // obtain end position
     cv::Mat_<cv::Vec3b>::iterator itend= 
               image.end<cv::Vec3b>();

     // loop over all pixels
     for ( ; it!= itend; ++it) {

        // process each pixel ---------------------

       (*it)[0]= (*it)[0]/div*div + div/2;
       (*it)[1]= (*it)[1]/div*div + div/2;
       (*it)[2]= (*it)[2]/div*div + div/2;

        // end of pixel processing ----------------
     }
}

请记住，这里的迭代器返回cv::Vec3b，因为我们正在处理彩色图像。使用解引用operator[]访问每个颜色通道元素。

工作原理

使用迭代器，无论扫描哪种集合，都始终遵循相同的模式。

首先，使用适当的专用类（在我们的示例中为cv::Mat_<cv::Vec3b>::iterator（或cv::MatIterator_<cv::Vec3b>））创建迭代器对象。

然后，您将获得一个在起始位置（在我们的示例中为图像的左上角）初始化的迭代器。这是使用begin方法完成的。对于cv::Mat实例，您将其获取为image.begin<cv::Vec3b>()。您还可以在迭代器上使用算术。例如，如果您希望从图像的第二行开始，则可以在image.begin<cv::Vec3b>()+image.rows处初始化cv::Mat迭代器。可以使用end方法类似地获得收藏的结束位置。但是，如此获得的迭代器就在您的集合之外。这就是为什么您的迭代过程到达最终位置时必须停止的原因。您还可以在此迭代器上使用算术，例如，如果希望在最后一行之前停止，则最终迭代将在迭代器达到image.end<cv::Vec3b>()-image.rows时停止。

初始化迭代器后，您将创建一个遍历所有元素的循环，直到到达末尾为止。典型的while循环如下所示：

     while (it!= itend) {

        // process each pixel ---------------------
         ...

        // end of pixel processing ----------------

        ++it;
     }

operator++是用于移至下一个元素的那个。您还可以指定更大的步长。例如，it+=10将每 10 个像素处理一次。

最后，在处理循环内部，使用解引用operator*来访问当前元素，您可以使用该元素读取（例如element= *it;）或写入（例如*it= element;）。请注意，如果收到对const cv::Mat的引用，或者希望表示当前循环不修改cv::Mat实例，则也可以创建使用的常量迭代器。这些声明如下：

     cv::MatConstIterator_<cv::Vec3b> it;

或者：

     cv::Mat_<cv::Vec3b>::const_iterator it;

另见

“编写高效的图像扫描循环”秘籍讨论了扫描图像时迭代器的效率。

另外，如果您不熟悉面向对象编程中迭代器的概念以及如何在 ANSI C++ 中实现迭代器，则应阅读有关 STL 迭代器的教程。您只需用关键字“STL 迭代器”在网络上搜索，就可以找到许多关于该主题的参考。

编写有效的图像扫描循环

在本章的先前秘籍中，我们介绍了扫描图像以处理其像素的不同方法。在本秘籍中，我们将比较这些不同方法的效率。

当您编写图像处理函数时，效率通常是一个问题。在设计函数时，经常需要检查代码的计算效率，以发现可能会减慢程序速度的任何瓶颈。

但是，必须注意的是，除非有必要，否则不应以降低程序清晰度为代价进行优化。简单的代码的确总是更容易调试和维护。只有对程序效率至关重要的代码部分才应进行严重优化。

操作步骤

为了测量一个函数或部分代码的执行时间，存在一个非常方便的称为cv::getTickCount()的 OpenCV 函数。此函数为您提供自上次启动计算机以来发生的时钟周期数。由于我们希望以毫秒为单位给出代码部分的执行时间，因此我们使用了另一种方法cv::getTickFrequency() 。这给了我们每秒的循环数。为了获得给定函数（或部分代码）的计算时间而使用的常用模式将是：

double duration;
duration = static_cast<double>(cv::getTickCount());

colorReduce(image); // the function to be tested

duration = static_cast<double>(cv::getTickCount())-duration;
duration /= cv::getTickFrequency(); // the elapsed time in ms

持续时间结果应在函数的多次调用中取平均值。

在colorReduce函数的测试中，我们还实现了使用at方法进行像素访问的函数版本。然后，此实现的主循环将读为：

      for (int j=0; j<nl; j++) {
          for (int i=0; i<nc; i++) {

           // process each pixel ---------------------

           image.at<cv::Vec3b>(j,i)[0]=
               image.at<cv::Vec3b>(j,i)[0]/div*div + div/2;
           image.at<cv::Vec3b>(j,i)[1]=    
              image.at<cv::Vec3b>(j,i)[1]/div*div + div/2;
           image.at<cv::Vec3b>(j,i)[2]=    
              image.at<cv::Vec3b>(j,i)[2]/div*div + div/2;

           // end of pixel processing ----------------

           } // end of line                   
      }

工作原理

在此报告本章中colorReduce函数的不同实现的执行时间。一台机器的绝对运行时数会有所不同（这里我们使用的是奔腾双核 2.2GHz）。看看它们的相对差异是很有趣的。我们的测试报告减少分辨率为4288x2848像素的图像的颜色所需的平均时间。下表中汇总了结果，并在下面进行了讨论：

方法	平均时间
`data[i]= data[i]/div*div + div/2` `;`	`37ms`
`data++= data/div*div + div/2;`	`37ms`
`*data++= v - v%div + div/2;`	`52ms`
`data++= data&mask + div/2;`	`35ms`
`colorReduce(input, output);`	`44ms`
`i<image.cols*image.channels();`	`65ms`
`MatIterator`	`67ms`
`.at(j,i)`	`80ms`
`3-channel loop`	`29ms`

首先，我们比较通过指针扫描图像的“更多内容”部分中介绍的三种计算色彩缩减的方法（第 1-4 行）。不出所料，使用按位运算符的版本最快，执行时间为35ms。使用整数除法的版本取37ms，而取模的版本取52ms。最快与最慢之间相差近 50%！因此，重要的是要花一些时间来确定在图像循环中计算结果的最有效方法，因为净影响可能非常显着。注意，当指定需要重新分配的输出图像而不是原地处理（第 5 行）时，执行时间变为44ms。额外的持续时间代表内存分配的开销。

在循环中，应避免重复计算可能会预先计算的值。这显然会浪费时间。例如，如果您替换颜色减少函数的以下内部循环：

 int nc= image.cols * image.channels(); 
 ...
      for (int i=0; i<nc; i++) {

与此：

      for (int i=0; i<image.cols * image.channels(); i++) {

那是一个循环，您需要一次又一次地计算一行中的元素总数。您将获得65ms的运行时，比35ms的原始版本（第 6 行）慢 80%。

使用迭代器（第 7 行）的色彩缩减函数版本（如秘籍“使用迭代器扫描图像”所示），在67ms处的结果较慢。迭代器的主要目的是简化图像扫描过程，并减少出错的可能性。不一定要优化此过程。

使用上一节末尾介绍的at方法的实现要慢得多（第 8 行）。获得80ms的运行时。然后，应将这种方法用于图像像素的随机访问，但在扫描图像时绝对不要使用。

即使处理的元素总数相同，使用较少语句的较短循环通常比使用单个语句的较长循环更有效地执行。同样，如果您要对一个像素应用N个不同的计算，请全部执行一个循环，而不要编写N个连续的循环，每次计算一次。然后，您应该偏爱循环，在较长的循环中进行更多的工作，而较长的循环会减少计算量。举例来说，我们可以处理内部循环中的所有三个通道，并在列数上进行迭代，而不是使用原始版本，其中循环遍历元素总数（即像素数的 3 倍）。然后将颜色减少函数编写如下（这是最快的版本）：

void colorReduce(cv::Mat &image, int div=64) {

     int nl= image.rows; // number of lines
     int nc= image.cols ; // number of columns

     // is it a continous image?
     if (image.isContinuous())  {
        // then no padded pixels
        nc= nc*nl; 
        nl= 1;  // it is now a 1D array
      }

     int n= static_cast<int>(
              log(static_cast<double>(div))/log(2.0));
     // mask used to round the pixel value
     uchar mask= 0xFF<<n; // e.g. for div=16, mask= 0xF0

     // for all pixels         
     for (int j=0; j<nl; j++) {

          // pointer to first column of line j
          uchar* data= image.ptr<uchar>(j);

          for (int i=0; i<nc; i++) {

            // process each pixel ---------------------

            *data++= *data&mask + div/2;
            *data++= *data&mask + div/2;
            *data++= *data&mask + div/2;

            // end of pixel processing ----------------

          } // end of line                   
     }
}

通过此修改，执行时间现在为29ms（第 9 行）。我们还添加了连续性测试，该连续性测试在连续图像的情况下会产生一个循环，而不是对行和列进行常规的双循环。对于非常大的图像（如我们在测试中使用的图像），这种优化并不重要，但总的来说，使用此策略始终是一种很好的做法，因为它可以大大提高速度。

另见

看看“执行简单图像算术”秘籍，了解使用 OpenCV 2 算术图像运算符的色彩缩减方法的实现。

使用邻居访问扫描图像

在图像处理中，通常具有基于相邻像素的值来计算每个像素位置处的值的处理函数。当该邻域包含上一行和下一行的像素时，则需要同时扫描图像的几行。此秘籍向您展示如何做。

准备

为了说明这一秘籍，我们将应用处理函数以使图像清晰。它基于拉普拉斯算子（将在第 6 章中进行讨论）。在图像处理中确实是众所周知的结果，如果从图像中减去其拉普拉斯算子，则会放大图像边缘，从而获得更清晰的图像。该锐化运算符的计算如下：

sharpened_pixel= 5*current-left-right-up-down;

其中left是当前像素左侧的像素，up是前一行对应的像素，依此类推。

操作步骤

这次，处理无法原地完成。用户需要提供输出图像。图像扫描是通过使用三个指针完成的，一个指针用于当前行，一个指针用于上一行，另一个指针用于下一行。另外，由于每个像素计算都需要访问相邻像素，因此无法为图像的第一行和最后一行的像素以及第一列和最后一列的像素计算值。然后可以将循环编写如下：

void sharpen(const cv::Mat &image, cv::Mat &result) {

    // allocate if necessary
    result.create(image.size(), image.type()); 

    for (int j= 1; j<image.rows-1; j++) { // for all rows 
                                // (except first and last)

      const uchar* previous= 
         image.ptr<const uchar>(j-1); // previous row
      const uchar* current= 
         image.ptr<const uchar>(j);     // current row
      const uchar* next= 
         image.ptr<const uchar>(j+1); // next row

      uchar* output= result.ptr<uchar>(j); // output row

      for (int i=1; i<image.cols-1; i++) {

         *output++= cv::saturate_cast<uchar>(
                       5*current[i]-current[i-1]
                       -current[i+1]-previous[i]-next[i]); 
      }
   }

   // Set the unprocess pixels to 0
   result.row(0).setTo(cv::Scalar(0));
   result.row(result.rows-1).setTo(cv::Scalar(0));
   result.col(0).setTo(cv::Scalar(0));
   result.col(result.cols-1).setTo(cv::Scalar(0));
}

如果我们将此函数应用于测试图像的灰度版本，则会获得以下示例：

How to do it...

工作原理

为了访问上一行和下一行的相邻像素，必须简单定义共同增加的其他指针。然后，您可以在扫描循环中访问这些行的像素。

在输出像素值的计算中，对运算结果调用模板函数cv::saturate_cast。这是因为经常发生这样的情况：对像素应用数学表达式会导致结果超出允许的像素值范围（小于 0 或大于 255）。然后的解决方案是恢复该 8 位范围内的值。这是通过将负值更改为 0 并将值更改为 255 至 255 来完成的。这正是cv::saturate_cast<uchar>函数所做的。此外，如果输入参数是浮点数，则结果将四舍五入到最接近的整数。您显然可以将此函数与其他类型一起使用，以确保结果将保持在此类型定义的范围内。

由于邻域未完全定义而无法处理的边界像素需要单独处理。在这里，我们将它们简单地设置为 0。在其他情况下，可以对这些像素执行一些特殊的计算，但是在大多数情况下，花费时间来处理这些很少的像素是没有意义的。在我们的函数中，使用两种特殊方法将这些边界像素设置为 0。第一个是row及其对偶的col。它们返回一个特殊的cv::Mat实例，该实例由参数中指定的单行（或单列）组成。这里没有进行复制，因为如果修改此一维矩阵的元素，它们也将在原始图像中被修改。这就是调用方法setTo时所做的事情。此方法为矩阵的所有元素分配一个值。因此声明：

   result.row(0).setTo(cv::Scalar(0));

将值 0 分配给结果图像第一行的所有像素。对于 3 通道彩色图像，可以使用cv::Scalar(a,b,c)指定三个值以分配给像素的每个通道。

另见

第 6 章，“过滤图像”对图像过滤的概念进行了更多说明。

执行简单的图像运算

图像可以以不同的方式组合。由于它们是规则矩阵，因此可以相加，相减，相乘或相除。 OpenCV 提供了各种图像算术运算符，本秘籍中将讨论它们的用法。

准备

让我们处理第二个图像，使用算术运算符将其合并到输入图像中。以下是第二张图片：

Getting ready

操作步骤

在这里，我们添加两个图像。当需要创建一些特殊效果或将信息覆盖在图像上时，此函数很有用。我们通过调用cv::add函数，或更精确地说是cv::addWeighted函数来实现此目的，因为我们需要加权和，即：

   cv::addWeighted(image1,0.7,image2,0.9,0.,result);

该操作将产生一个新图像，如以下屏幕截图所示：

How to do it...

工作原理

所有二进制算术函数的工作方式均相同。提供了两个输入，第三个参数指定了输出。在某些情况下，可以指定在操作中用作标量乘数的权重。这些函数中的每一个都有几种风格。 cv::add是多种形式的可用函数的典范：

   // c[i]= a[i]+b[i];
   cv::add(imageA,imageB,resultC); 
   // c[i]= a[i]+k;
   cv::add(imageA,cv::Scalar(k),resultC); 
   // c[i]= k1*a[1]+k2*b[i]+k3; 
   cv::addWeighted(imageA,k1,imageB,k2,k3,resultC);
   // c[i]= k*a[1]+b[i]; 
   cv::scaleAdd(imageA,k,imageB,resultC);

对于某些函数，您还可以指定一个掩码：

   // if (mask[i]) c[i]= a[i]+b[i];    
   cv::add(imageA,imageB,resultC,mask);

如果应用遮罩，则仅对遮罩值不为null的像素（遮罩必须为 1 通道）执行该操作。看看cv::subtract，cv::absdiff， cv::multiply和cv::divide函数的不同形式。还可以使用按位运算符：cv::bitwise_and，cv::bitwise_or，cv::bitwise_xor和cv::bitwise_not。查找每个元素的最大或最小像素值的运算符cv::min和cv::max也非常有用。

在所有情况下，始终使用函数cv::saturate_cast（请参见前面的秘籍）以确保结果保持在定义的像素值域内（即避免上溢或下溢）。

图像必须具有相同的尺寸和类型（如果输出图像与输入尺寸匹配，则将重新分配输出图像）。而且，由于操作是按元素执行的，因此输入图像之一可以用作输出。

也可以使用将单个图像作为输入的几种运算符：cv::sqrt，cv::pow，cv::abs，cv::cuberoot，cv::exp和cv::log。实际上，几乎所有需要对图像执行的操作都具有 OpenCV 函数。

定义兴趣区域

有时，仅需要在图像的一部分上应用处理函数。该秘籍将教您如何在图像内定义兴趣区域。

准备

假设我们要组合两个大小不同的图像。例如，假设我们要在测试图像中添加以下小徽标：

Getting ready

但是函数cv::add需要两张相同大小的图像。在这种情况下，可以定义兴趣区域（ROI），可以在其上应用cv::add。只要 ROI 与我们徽标图像的大小相同，这将起作用。 ROI 的位置将确定徽标将在图像中插入的位置。

操作步骤

第一步包括定义 ROI。定义后，可以将 ROI 作为常规cv::Mat实例进行操作。关键是 ROI 指向与其父映像相同的数据缓冲区。然后，将徽标插入如下：

   // define image ROI
   cv::Mat imageROI;
   imageROI= image(cv::Rect(385,270,logo.cols,logo.rows));

   // add logo to image 
   cv::addWeighted(imageROI,1.0,logo,0.3,0.,imageROI);

然后获得以下图像：

How to do it...

由于徽标的颜色已添加到图像的颜色中（还可能应用了饱和度），因此视觉效果将不总是令人满意的。因此，最好将图像的像素值简单地设置为该图像出现的徽标值。为此，您可以使用遮罩将徽标复制到 ROI：

   // define ROI
   imageROI= image(cv::Rect(385,270,logo.cols,logo.rows));

   // load the mask (must be gray-level)
   cv::Mat mask= cv::imread("logo.bmp",0);

   // copy to ROI with mask
   logo.copyTo(imageROI,mask);

然后，结果图像为：

How to do it...

工作原理

定义 ROI 的一种方法是使用cv::Rect实例。顾名思义，它通过指定左上角的位置（构造器的前两个参数）和矩形的大小（后两个参数给出的宽度和高度）来描述矩形区域。

还可以使用行和列范围来描述 ROI。范围是从开始索引到结束索引的连续序列（不包括在内）。 cv::Range结构用于表示此概念。因此，可以从两个范围定义 ROI，例如，在我们的示例中，ROI 可以等效地定义如下：

cv::Mat imageROI= image(cv::Range(270,270+logo.rows), 
                        cv::Range(385,385+logo.cols))

cv::Mat的operator()返回另一个cv::Mat实例，该实例随后可用于子序列调用中。 ROI 的任何变换都会影响相应区域中的原始图像，因为图像和 ROI 共享相同的图像数据。由于 ROI 的定义不会复制数据，因此无论 ROI 的大小如何，它都将在固定时间内执行。

如果要定义由图像的某些行组成的 ROI，可以使用以下调用：

cv::Mat imageROI= image.rowRange(start,end) ;

同样，对于由某些图像列组成的 ROI：

cv::Mat imageROI= image.colRange(start,end) ;

秘籍“使用访问邻居扫描图像”中使用的方法row和col是这些后来方法的特殊情况，其中开始索引和结束索引相等，以便定义一个在线或单列 ROI。

我们一直在努力

apachecn/AiLearning

二、操纵像素

简介

访问像素值

准备

操作步骤

工作原理

更多

另见

用指针扫描图像

准备

操作步骤

工作原理

更多

其他颜色缩减秘籍

具有输入和输出参数

高效扫描连续图像

低级指针算法

另见

使用迭代器扫描图像

准备

操作步骤

工作原理

更多

另见

编写有效的图像扫描循环

操作步骤

工作原理

更多

另见

使用邻居访问扫描图像

准备

操作步骤

工作原理

更多

另见

执行简单的图像运算

准备

操作步骤

工作原理

更多

重载的图像运算符

分割图像通道

定义兴趣区域

准备

操作步骤

工作原理