每个图像是由一个个点组成的,而这些点可以表示为像素值的形式。
这篇博客里我们将学会:
对于图像的基本操作我们需要对numpy知识的了解,不需要很多,只知道基本用法即可。这里暂不赘述,读者可查阅其余资料进行学习。
让我们先加载彩色图像:
我们可以通过行和列坐标来访问像素值。对于 BGR 图像,它返回一个由蓝色、绿色和红色值组成的数组。而如果是灰度图像的话,它只返回相应的灰度。我们也可以用相同的方式来对像素值进行修改。
Numpy是用于快速数组计算的优化库。因此,简单地访问每个像素值并对其进行修改将非常慢,因此不建议使用。对于单个像素访问,Numpy数组方法array.item()和array.itemset())被认为更好,但是它们始终返回标量。如果要访问所有B,G,R值,则需要分别调用所有的array.item()。
比如我们可以用下面的方法来进行像素的访问和编辑:
图像属性包括行数,列数,通道数,图像数据类型,像素数等等。
图像的形状可通过 img.shape 访问。它返回行,列和通道数的元组(如果图像是彩色的)
注意:如果图像是灰度的,则返回的元组仅包含行数和列数,因此这是检查加载的图像是灰度还是彩色的好方法。
像素总数可通过访问 img.size :
图像数据类型通过 img.dtype 获得:
注意:img.dtype在调试时非常重要,因为OpenCV-Python代码中的大量错误是由无效的数据类型引起的。
有时候,我们不得不处理一些特定区域的图像。比如对于图像中的眼睛检测,首先对整个图像进行人脸检测。在获取人脸图像时,我们只选择人脸区域,搜索其中的眼睛,而不是搜索整个图像。它提高了准确性和性能。
这里我们直接使用numpy的切片即可,比如:
不规则形状的ROI区域的设置,我们将在以后的文章里再详细阐述。
4.拆分和合并图像通道
有时我们需要分别处理图像的B,G,R通道。在这种情况下,我们需要将BGR图像拆分为单个通道。我们可以这样做:
但是cv.split() 是一项耗时的操作(就时间而言)。因此,仅在必要时才这样做。我们一般采用Numpy索引的方法。比如我们要将所有的红色像素都设置为0:
如果我们要在图像周围创建边框(如相框),那可以使用 cv.copyMakeBorder() 。它在以后对图像进行高级处理的时候,比如卷积运算,零填充等方面将有更多应用。此函数采用以下参数:
下面我们来看一下各个边框类型在图片显示上的结果。注意因为图像是基于matplotlib一起显示的。所以红色和蓝色通道将会互换。
结果如下:
?
opencv入门系列教学(五)图像的基本操作(像素值、属性、ROI和边框)
原文:https://www.cnblogs.com/huangs16/p/15206901.html